Les posteurs les plus actifs de la semaine
joyeux_lapin13
 
Pchalix
 
victornitho
 
c@ssoulet
 
zezima
 
Eric Wajnberg
 
schlebe
 


Aide à la compréhenstion d'un problème de reg. linéaire

Voir le sujet précédent Voir le sujet suivant Aller en bas

Aide à la compréhenstion d'un problème de reg. linéaire

Message par me443 le Mar 7 Jan 2014 - 19:27

Bonjour,

Je souhaite obtenir votre avis sur la compréhension d’un problème de statistiques que je dois résoudre. Or, je ne demande bien entendu pas à ce que l’on réalise le travail à ma place.


Je possède les variables suivantes relatives à une grande entreprise (environ 500 observations)


  • Sexe (0=femmes 1=homme)
  • Ancienneté (depuis combien de temps l’employé est dans l’entreprise: exprimé en variable continue)
  • Taux d’activité (50,60,70,80 ,90,100 %)
  • Salaire (annuel)
  • Position hiérarchique (de 1 à 20 où 20=le plus gradé [PDG] variable discret)


La question du travail est la suivante

«Est-ce que la rémunération de l’ancienneté diffère entre homme et femmes?»

Je trouve la question mal formulée. Or, l'enseignant ne répond à aucune question.


Pour répondre à cette question, je souhaitais simplement faire une régression linéaire ou

Outcome = salaire
Predictor = ancienneté + sexe

Est-ce que c’est à votre sens la bonne manière de procéder?

Ou pensez-vous peut-être que je dois faire différemment comme utiliser le salaire comme outcome et le reste des variables comme prédicateur?


Ou bien devrais-je faire les 2? Par exemple dire que la méthode une est insuffisante car d'autres variables sont significatives?

Bref, je sais comment réaliser une regression et comment elles fonctionnent (économétrie et algébre linéaire). Mais mon problème réside dans la question. C'est pour cela que je souhaite obtenir votre avis. Cool 

P.-S. Bien entendu selon l’analyse des résidus certaines variables seront transformées comme le fait de mettre un log au salaire par exemple...

me443

Nombre de messages : 5
Date d'inscription : 07/01/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Aide à la compréhenstion d'un problème de reg. linéaire

Message par droopy le Mer 8 Jan 2014 - 8:29

Bonjour,

Moi je ferais le test de l'interaction entre l'ancienneté et la rémunération :
Outcome = salaire
Predictor = ancienneté + sexe + ancienneté:sexe

Si tu fais juste ancienneté + sexe, tu ne testes pas s'il y a un effet du sexe sur la rémunération à l'ancienneté. Pour une ancienneté identique tu testeras juste si les hommes et les femmes ont des niveaux de rémunérations différentes et tu vas considérer que l’écart homme femme est constant quelque soit l'ancienneté. Si tu intègres l'interaction, tu prendras en compte le fait que l'écart homme femme peut varier avec l'ancienneté, que l'écart peut par exemple grandir avec l'ancienneté.

Cdlt

droopy

Nombre de messages : 985
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Aide à la compréhenstion d'un problème de reg. linéaire

Message par me443 le Mer 8 Jan 2014 - 15:55

Hello,

Merci beaucoup pour le conseil je l'ai suivi et j'obtient:

Code:

> test<-  lm(logWage~anciennete+sexe+anciennete:sexe, data=data)
> summary(test)

Call:
lm(formula = logWage ~ anciennete + sexe + anciennete:sexe, data = data)



                      Estimate Std. Error t value Pr(>|t|)    
(Intercept)          11.619661   0.037567 309.304  < 2e-16 ***
anciennete            0.021921   0.004892   4.481 9.38e-06 ***
sexehomme             0.296175   0.052735   5.616 3.38e-08 ***
anciennete:sexehomme  0.009022   0.006730   1.341    0.181    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Multiple R-squared:  0.2761,   Adjusted R-squared:  0.2714

Autrement dit:

  • Toute choses égale par ailleurs, les hommes ont un salaire plus élevé que les femmes.
  • Toute choses égale par ailleurs, plus les employés sont anciens, plus ils ont un salaire élevé.
  • L'écart homme-femme ne varie pas avec l'ancienneté (est-ce une bonne interprétation??)


Toutefois, j'ai un faible R2 ajusté donc il y a probablement pas mal d'information non-comprise dans le terme d'erreur.

Par conséquent, si je rajoute toutes les données devrais je également faire  Question  Question :

Outcome = salaire
Predictor = sexe+age+ancienneté+positionH+TxActivité +
                sexe:age + sexe:ancienneté + sexe:positionH + sexe:TxActivité +
                age:ancienneté+age:positionH+age:TxActivité +
                ancienneté: positionH+ancienneté:TxActivité +
                positionH:TxActivité

Si oui sais tu si c'est possible de demander a R de faire les combinaisons automatiquement?

me443

Nombre de messages : 5
Date d'inscription : 07/01/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Aide à la compréhenstion d'un problème de reg. linéaire

Message par droopy le Ven 10 Jan 2014 - 9:27

le test de l'effet de l'intéraction se fait via une analyse de variance :
Code:
test<-  lm(logWage~anciennete+sexe+anciennete:sexe, data=data)
test2 <- lm(logWage~anciennete+sexe, data=data)
anova(test2, test)

Pour faire toutes les interactions :
Code:
lm(logWage ~ (sexe+age+ancienneté+positionH+TxActivité)^2, data=data)

droopy

Nombre de messages : 985
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Aide à la compréhenstion d'un problème de reg. linéaire

Message par Contenu sponsorisé Aujourd'hui à 21:48


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum