Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Régression logistique
2 participants
Page 1 sur 1
Régression logistique
Bonjour,
Je suis actuellement en master 1 de psychologie sociale et je fais un mémoire de recherche.
J'ai fait des statistiques pendant les 3 années de licence plus l'année de master, mais je n'ai pas eu l'occasion d'utiliser la régression logistique.
J'ai une petite connaissance du logiciel R et j'ai suivi dernièrement un MOOC qui y était consacré.
Je suis aujourd'hui confrontée à l'analyse de mes données et je ne voudrais pas partir sur de mauvaises bases.
Ma variable à expliquer est binaire (coupable = 0/non coupable = 1). Mes variables explicatives sont au nombre de deux : Test ADN négatif = 1/pas de test ADN = 0, ainsi que Présence d'un expert = 1, pas de présence d'un expert = 0.
J'ai utilisé la fonction "glm" sous R et j'ai obtenu les résultats suivants :
glm(formula = Culpabilite ~ ADN + Expert, family = binomial(logit),
data = essais3)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.2848 -0.5452 -0.4294 -0.1549 2.2043
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.4176 0.9814 -4.501 6.75e-06 ***
ADN 2.0803 0.7433 2.799 0.00513 **
Expert 2.5863 0.8375 3.088 0.00202 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 80.064 on 79 degrees of freedom
Residual deviance: 57.986 on 77 degrees of freedom
AIC: 63.986
Number of Fisher Scoring iterations: 6
Rcmdr> GLM.2 <- glm(Culpabilite ~ ADN*Expert, family=binomial(logit), data=essais3)
Rcmdr> summary(GLM.2)
Call:
glm(formula = Culpabilite ~ ADN * Expert, family = binomial(logit),
data = essais3)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.26373 -0.57012 -0.45904 -0.00008 2.14597
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -19.57 2404.67 -0.008 0.994
ADN 17.37 2404.67 0.007 0.994
Expert 17.83 2404.67 0.007 0.994
ADN:Expert -15.43 2404.67 -0.006 0.995
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 80.064 on 79 degrees of freedom
Residual deviance: 57.437 on 76 degrees of freedom
AIC: 65.437
Number of Fisher Scoring iterations: 18
> exp(coefficients(mod1))
(Intercept) ADN Expert
0.01206335 8.00672440 13.27997835
Ci-dessous l'interprétation que je fais de ces résultats.
En ce qui concerne la première régression : le p est inférieur à 0.05 ce qui signifie que les deux variables (ADN et EXPERT) sont associées à un verdict "non coupable". Les coefficients "estimate" sont respectivement 2.0803 et 2.5863 ; ils sont positifs ce qui confirme qu'un test ADN négatif est statistiquement associé à un verdict "Non coupable" et que la présence d'un expert est statistiquement associé à un verdict "Non coupable".
Enfin, le calcul de l'exponentiel des coefficients montre que la présence d'un test ADN négatif multiplie par 8 (8.0067) la possibilité d'un verdict "non coupable" et la présence d'un expert multiplie cette possibilité par 13 (13,2799).
Par contre si on regarde la 2ème régression logistique où il y a une possible interaction entre ADN et expert, on constate que le p est supérieur à 0.05, on ne peut donc pas déduire qu'il y a une synergie entre ADN et EXPERT.
Si quelqu'un parmi vous pouvait me dire si le choix de la régression logistique est le bon choix et si mon interprétation des résultats semble acceptable pour la rédaction d'un mémoire, cela me rendrait un fier service.
Merci d'avance à ceux ou celles qui auront le temps de se pencher sur mon message.
Cordialement.
Michèle
Je suis actuellement en master 1 de psychologie sociale et je fais un mémoire de recherche.
J'ai fait des statistiques pendant les 3 années de licence plus l'année de master, mais je n'ai pas eu l'occasion d'utiliser la régression logistique.
J'ai une petite connaissance du logiciel R et j'ai suivi dernièrement un MOOC qui y était consacré.
Je suis aujourd'hui confrontée à l'analyse de mes données et je ne voudrais pas partir sur de mauvaises bases.
Ma variable à expliquer est binaire (coupable = 0/non coupable = 1). Mes variables explicatives sont au nombre de deux : Test ADN négatif = 1/pas de test ADN = 0, ainsi que Présence d'un expert = 1, pas de présence d'un expert = 0.
J'ai utilisé la fonction "glm" sous R et j'ai obtenu les résultats suivants :
glm(formula = Culpabilite ~ ADN + Expert, family = binomial(logit),
data = essais3)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.2848 -0.5452 -0.4294 -0.1549 2.2043
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.4176 0.9814 -4.501 6.75e-06 ***
ADN 2.0803 0.7433 2.799 0.00513 **
Expert 2.5863 0.8375 3.088 0.00202 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 80.064 on 79 degrees of freedom
Residual deviance: 57.986 on 77 degrees of freedom
AIC: 63.986
Number of Fisher Scoring iterations: 6
Rcmdr> GLM.2 <- glm(Culpabilite ~ ADN*Expert, family=binomial(logit), data=essais3)
Rcmdr> summary(GLM.2)
Call:
glm(formula = Culpabilite ~ ADN * Expert, family = binomial(logit),
data = essais3)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.26373 -0.57012 -0.45904 -0.00008 2.14597
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -19.57 2404.67 -0.008 0.994
ADN 17.37 2404.67 0.007 0.994
Expert 17.83 2404.67 0.007 0.994
ADN:Expert -15.43 2404.67 -0.006 0.995
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 80.064 on 79 degrees of freedom
Residual deviance: 57.437 on 76 degrees of freedom
AIC: 65.437
Number of Fisher Scoring iterations: 18
> exp(coefficients(mod1))
(Intercept) ADN Expert
0.01206335 8.00672440 13.27997835
Ci-dessous l'interprétation que je fais de ces résultats.
En ce qui concerne la première régression : le p est inférieur à 0.05 ce qui signifie que les deux variables (ADN et EXPERT) sont associées à un verdict "non coupable". Les coefficients "estimate" sont respectivement 2.0803 et 2.5863 ; ils sont positifs ce qui confirme qu'un test ADN négatif est statistiquement associé à un verdict "Non coupable" et que la présence d'un expert est statistiquement associé à un verdict "Non coupable".
Enfin, le calcul de l'exponentiel des coefficients montre que la présence d'un test ADN négatif multiplie par 8 (8.0067) la possibilité d'un verdict "non coupable" et la présence d'un expert multiplie cette possibilité par 13 (13,2799).
Par contre si on regarde la 2ème régression logistique où il y a une possible interaction entre ADN et expert, on constate que le p est supérieur à 0.05, on ne peut donc pas déduire qu'il y a une synergie entre ADN et EXPERT.
Si quelqu'un parmi vous pouvait me dire si le choix de la régression logistique est le bon choix et si mon interprétation des résultats semble acceptable pour la rédaction d'un mémoire, cela me rendrait un fier service.
Merci d'avance à ceux ou celles qui auront le temps de se pencher sur mon message.
Cordialement.
Michèle
Babou18- Nombre de messages : 2
Date d'inscription : 05/06/2014
Re: Régression logistique
Bonjour,
L'interaction ne se teste pas directement avec la valeur de coefficients, elle se teste en comparant des modèles dit emboités (l'un étant une simplification de l'autre, ici mod1 est une simplification du modèle avec interaction). Dans le cas d'un glm on compare les différences de déviances des deux modèles et on les testes avec un Chi² à n ddl. Ici ça revient à tester 57.986-57.437 par rapport à un Chi² à 1 ddl (p>0.05 donc non significatif). Ça veut donc dire que le modèle sans interaction suffit, ce qui a le mérite de simplifier les interprétations. Pour tester si les deux variables ADN et Expert expliquent significativement au risque alpha ta variable non_coupable/coupable alors pareil il te faut t'orienter vers des analyses de déviance, anova(mod1, test="Chisq") et aussi drop1(mod1, test="Chisq"). Pour ce qui est de l'interprétation de la valeur de ces coefficients alors je conclurais de cette manière : Il y a 8 fois plus de chance d'avoir un acquittement en l'absence d'ADN et 13 fois plus de chance d'avoir un acquittement en présence d'un expert.
cdlt
L'interaction ne se teste pas directement avec la valeur de coefficients, elle se teste en comparant des modèles dit emboités (l'un étant une simplification de l'autre, ici mod1 est une simplification du modèle avec interaction). Dans le cas d'un glm on compare les différences de déviances des deux modèles et on les testes avec un Chi² à n ddl. Ici ça revient à tester 57.986-57.437 par rapport à un Chi² à 1 ddl (p>0.05 donc non significatif). Ça veut donc dire que le modèle sans interaction suffit, ce qui a le mérite de simplifier les interprétations. Pour tester si les deux variables ADN et Expert expliquent significativement au risque alpha ta variable non_coupable/coupable alors pareil il te faut t'orienter vers des analyses de déviance, anova(mod1, test="Chisq") et aussi drop1(mod1, test="Chisq"). Pour ce qui est de l'interprétation de la valeur de ces coefficients alors je conclurais de cette manière : Il y a 8 fois plus de chance d'avoir un acquittement en l'absence d'ADN et 13 fois plus de chance d'avoir un acquittement en présence d'un expert.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Régression logistique
Merci beaucoup de m'avoir répondu si vite.
Je suis très contente de voir que mon interprétation concernant les probabilités d'obtenir un verdict non coupable sont celles que j'avais trouvées (8 et 13).
Une dernière question : est-ce qu'il est possible que deux variables agissent en addition, mais par en interaction ? Cela veut-il dire que ces deux variables ne sont pas médiatrices l'une de l'autre ? mais qu'elles sont en quelque sorte indépendante.
Cordialement.
Michèle
Je suis très contente de voir que mon interprétation concernant les probabilités d'obtenir un verdict non coupable sont celles que j'avais trouvées (8 et 13).
Une dernière question : est-ce qu'il est possible que deux variables agissent en addition, mais par en interaction ? Cela veut-il dire que ces deux variables ne sont pas médiatrices l'une de l'autre ? mais qu'elles sont en quelque sorte indépendante.
Cordialement.
Michèle
Babou18- Nombre de messages : 2
Date d'inscription : 05/06/2014
Sujets similaires
» régression multiple et régression logistique
» Régression Logistique vs Régression Linéaire
» Régression logistique
» Regression logistique
» régression logistique
» Régression Logistique vs Régression Linéaire
» Régression logistique
» Regression logistique
» régression logistique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|