Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Aide à la compréhenstion d'un problème de reg. linéaire
2 participants
Page 1 sur 1
Aide à la compréhenstion d'un problème de reg. linéaire
Bonjour,
Je souhaite obtenir votre avis sur la compréhension d’un problème de statistiques que je dois résoudre. Or, je ne demande bien entendu pas à ce que l’on réalise le travail à ma place.
Je possède les variables suivantes relatives à une grande entreprise (environ 500 observations)
La question du travail est la suivante
«Est-ce que la rémunération de l’ancienneté diffère entre homme et femmes?»
Je trouve la question mal formulée. Or, l'enseignant ne répond à aucune question.
Pour répondre à cette question, je souhaitais simplement faire une régression linéaire ou
Outcome = salaire
Predictor = ancienneté + sexe
Est-ce que c’est à votre sens la bonne manière de procéder?
Ou pensez-vous peut-être que je dois faire différemment comme utiliser le salaire comme outcome et le reste des variables comme prédicateur?
Ou bien devrais-je faire les 2? Par exemple dire que la méthode une est insuffisante car d'autres variables sont significatives?
Bref, je sais comment réaliser une regression et comment elles fonctionnent (économétrie et algébre linéaire). Mais mon problème réside dans la question. C'est pour cela que je souhaite obtenir votre avis.
P.-S. Bien entendu selon l’analyse des résidus certaines variables seront transformées comme le fait de mettre un log au salaire par exemple...
Je souhaite obtenir votre avis sur la compréhension d’un problème de statistiques que je dois résoudre. Or, je ne demande bien entendu pas à ce que l’on réalise le travail à ma place.
Je possède les variables suivantes relatives à une grande entreprise (environ 500 observations)
- Sexe (0=femmes 1=homme)
- Ancienneté (depuis combien de temps l’employé est dans l’entreprise: exprimé en variable continue)
- Taux d’activité (50,60,70,80 ,90,100 %)
- Salaire (annuel)
- Position hiérarchique (de 1 à 20 où 20=le plus gradé [PDG] variable discret)
La question du travail est la suivante
«Est-ce que la rémunération de l’ancienneté diffère entre homme et femmes?»
Je trouve la question mal formulée. Or, l'enseignant ne répond à aucune question.
Pour répondre à cette question, je souhaitais simplement faire une régression linéaire ou
Outcome = salaire
Predictor = ancienneté + sexe
Est-ce que c’est à votre sens la bonne manière de procéder?
Ou pensez-vous peut-être que je dois faire différemment comme utiliser le salaire comme outcome et le reste des variables comme prédicateur?
Ou bien devrais-je faire les 2? Par exemple dire que la méthode une est insuffisante car d'autres variables sont significatives?
Bref, je sais comment réaliser une regression et comment elles fonctionnent (économétrie et algébre linéaire). Mais mon problème réside dans la question. C'est pour cela que je souhaite obtenir votre avis.
P.-S. Bien entendu selon l’analyse des résidus certaines variables seront transformées comme le fait de mettre un log au salaire par exemple...
me443- Nombre de messages : 5
Date d'inscription : 07/01/2014
Re: Aide à la compréhenstion d'un problème de reg. linéaire
Bonjour,
Moi je ferais le test de l'interaction entre l'ancienneté et la rémunération :
Outcome = salaire
Predictor = ancienneté + sexe + ancienneté:sexe
Si tu fais juste ancienneté + sexe, tu ne testes pas s'il y a un effet du sexe sur la rémunération à l'ancienneté. Pour une ancienneté identique tu testeras juste si les hommes et les femmes ont des niveaux de rémunérations différentes et tu vas considérer que l’écart homme femme est constant quelque soit l'ancienneté. Si tu intègres l'interaction, tu prendras en compte le fait que l'écart homme femme peut varier avec l'ancienneté, que l'écart peut par exemple grandir avec l'ancienneté.
Cdlt
Moi je ferais le test de l'interaction entre l'ancienneté et la rémunération :
Outcome = salaire
Predictor = ancienneté + sexe + ancienneté:sexe
Si tu fais juste ancienneté + sexe, tu ne testes pas s'il y a un effet du sexe sur la rémunération à l'ancienneté. Pour une ancienneté identique tu testeras juste si les hommes et les femmes ont des niveaux de rémunérations différentes et tu vas considérer que l’écart homme femme est constant quelque soit l'ancienneté. Si tu intègres l'interaction, tu prendras en compte le fait que l'écart homme femme peut varier avec l'ancienneté, que l'écart peut par exemple grandir avec l'ancienneté.
Cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Aide à la compréhenstion d'un problème de reg. linéaire
Hello,
Merci beaucoup pour le conseil je l'ai suivi et j'obtient:
Autrement dit:
Toutefois, j'ai un faible R2 ajusté donc il y a probablement pas mal d'information non-comprise dans le terme d'erreur.
Par conséquent, si je rajoute toutes les données devrais je également faire :
Outcome = salaire
Predictor = sexe+age+ancienneté+positionH+TxActivité +
sexe:age + sexe:ancienneté + sexe:positionH + sexe:TxActivité +
age:ancienneté+age:positionH+age:TxActivité +
ancienneté: positionH+ancienneté:TxActivité +
positionH:TxActivité
Si oui sais tu si c'est possible de demander a R de faire les combinaisons automatiquement?
Merci beaucoup pour le conseil je l'ai suivi et j'obtient:
- Code:
> test<- lm(logWage~anciennete+sexe+anciennete:sexe, data=data)
> summary(test)
Call:
lm(formula = logWage ~ anciennete + sexe + anciennete:sexe, data = data)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11.619661 0.037567 309.304 < 2e-16 ***
anciennete 0.021921 0.004892 4.481 9.38e-06 ***
sexehomme 0.296175 0.052735 5.616 3.38e-08 ***
anciennete:sexehomme 0.009022 0.006730 1.341 0.181
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared: 0.2761, Adjusted R-squared: 0.2714
Autrement dit:
- Toute choses égale par ailleurs, les hommes ont un salaire plus élevé que les femmes.
- Toute choses égale par ailleurs, plus les employés sont anciens, plus ils ont un salaire élevé.
- L'écart homme-femme ne varie pas avec l'ancienneté (est-ce une bonne interprétation??)
Toutefois, j'ai un faible R2 ajusté donc il y a probablement pas mal d'information non-comprise dans le terme d'erreur.
Par conséquent, si je rajoute toutes les données devrais je également faire :
Outcome = salaire
Predictor = sexe+age+ancienneté+positionH+TxActivité +
sexe:age + sexe:ancienneté + sexe:positionH + sexe:TxActivité +
age:ancienneté+age:positionH+age:TxActivité +
ancienneté: positionH+ancienneté:TxActivité +
positionH:TxActivité
Si oui sais tu si c'est possible de demander a R de faire les combinaisons automatiquement?
me443- Nombre de messages : 5
Date d'inscription : 07/01/2014
Re: Aide à la compréhenstion d'un problème de reg. linéaire
le test de l'effet de l'intéraction se fait via une analyse de variance :
Pour faire toutes les interactions :
- Code:
test<- lm(logWage~anciennete+sexe+anciennete:sexe, data=data)
test2 <- lm(logWage~anciennete+sexe, data=data)
anova(test2, test)
Pour faire toutes les interactions :
- Code:
lm(logWage ~ (sexe+age+ancienneté+positionH+TxActivité)^2, data=data)
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» Comparer résultats régression linéaire et non linéaire
» régression linéaire multiple: problème vif
» A l'aide...regression log-lineaire
» problème avec la "tapply" ==aide SVP
» Aide pour comprendre ce problème
» régression linéaire multiple: problème vif
» A l'aide...regression log-lineaire
» problème avec la "tapply" ==aide SVP
» Aide pour comprendre ce problème
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum