Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Réaliser une régression logistique en épidémio
2 participants
Page 1 sur 1
Réaliser une régression logistique en épidémio
Bonjour
Suite à un message précédent je souhaite réaliser une régression logistique. J'ai du mal à comprendre les tuto trouvés sur internet pour R, par manque des bases en stat.
J'ai commes variables :
Je voudrais trouver quelles sont les variables de contrôle qui expliquent une surmortalité des ouvriers vs les autres catégories socio-professionnelles.
Si j'ai bien compris, je peux affirmer que :
* pour chaque variable : si "Value/SE" > 2 alors il y a un lien statistique, et on peut calculer l'OR par l'exponentielle
Mais :
1/ comment répondre à ma question de départ avec ces résultats ?
2/ comment trouver le meilleur modèle (avec AIC le plus bas si j'ai compris), et comment préselectionner mes variables de contrôle parmis la tentaine dont je dispose suite à mon analyse univariée ?
Merci, et désolé si la question parait brouillonne
Suite à un message précédent je souhaite réaliser une régression logistique. J'ai du mal à comprendre les tuto trouvés sur internet pour R, par manque des bases en stat.
J'ai commes variables :
- variable critère : deces.J30 = mortalité (1 - 0)
- variable explicative : est.ouvrier = profession ouvrier (1) ou autre (0)
- variables de contrôle : une centaine, ici je vais prendre comme exemple :
- ---- tabagisme.actif : 1 ou 0
- ----- age = numérique en années
Je voudrais trouver quelles sont les variables de contrôle qui expliquent une surmortalité des ouvriers vs les autres catégories socio-professionnelles.
- Code:
> MLM.1 <- multinom(factor(etude$deces.J30) ~
+ est.ouvrier + age + tabagisme.actif, data=etude,
+ trace=FALSE)
> summary(MLM.1, cor=FALSE, Wald=TRUE)
Call:
multinom(formula = factor(etude$deces.J30) ~ est.ouvrier + age + tabagisme.actif, data = etude, trace = FALSE)
Coefficients:
Values Std. Err. Value/SE
(Intercept) -7.9450057 1.62987374 -4.8746142
est.ouvrier [T.TRUE] 1.0866139 0.38126613 2.8500143
age 0.0680789 0.02741086 2.4836472
tabagisme.actif[T.TRUE] 0.3175654 0.35840711 0.8860467
Residual Deviance: 347.5544
AIC: 355.5544
Si j'ai bien compris, je peux affirmer que :
* pour chaque variable : si "Value/SE" > 2 alors il y a un lien statistique, et on peut calculer l'OR par l'exponentielle
Mais :
1/ comment répondre à ma question de départ avec ces résultats ?
2/ comment trouver le meilleur modèle (avec AIC le plus bas si j'ai compris), et comment préselectionner mes variables de contrôle parmis la tentaine dont je dispose suite à mon analyse univariée ?
Merci, et désolé si la question parait brouillonne
buliwyf- Nombre de messages : 18
Date d'inscription : 09/08/2010
Re: Réaliser une régression logistique en épidémio
Bonjour,
ce forum contient plusieurs topics crées au sujet de la régression logistique, notemment l'un des derniers avec pas mal d'informations et d'explications littérales.
"Je voudrais trouver quelles sont les variables de contrôle qui expliquent une surmortalité des ouvriers vs les autres catégories socio-professionnelles."
Pour moi ta problématique comporte deux questions, la première est: quel combinaison de variables expliquant au mieux la variable critère, et la seconde: quels sont les risques de tel ou tel variable par rapport aux autres.
Dans le premier cas il te faut t'orienter vers les approches FORWARD/BACKWARD/STEPWISE et dans le second cas une simple régression logistique et étude des OR devrait suffir en regroupant par catégories à opposer.
Aprés c'est ce que j'ai compris.
Je te conseil vivement de fouiller ce forum, ça peut paraitre rébarbatif pour certaines personnes de reprendre à 0 un débat déjà fait ou encore répéter pour une énième fois des informations... tu n'auras pas de mal à trouver beaucoup d'infos, si jamais tu as des questions qui n'y sont pas (ce qui n'est pas le cas pour le moment), n'hésite pas.
ce forum contient plusieurs topics crées au sujet de la régression logistique, notemment l'un des derniers avec pas mal d'informations et d'explications littérales.
"Je voudrais trouver quelles sont les variables de contrôle qui expliquent une surmortalité des ouvriers vs les autres catégories socio-professionnelles."
Pour moi ta problématique comporte deux questions, la première est: quel combinaison de variables expliquant au mieux la variable critère, et la seconde: quels sont les risques de tel ou tel variable par rapport aux autres.
Dans le premier cas il te faut t'orienter vers les approches FORWARD/BACKWARD/STEPWISE et dans le second cas une simple régression logistique et étude des OR devrait suffir en regroupant par catégories à opposer.
Aprés c'est ce que j'ai compris.
Je te conseil vivement de fouiller ce forum, ça peut paraitre rébarbatif pour certaines personnes de reprendre à 0 un débat déjà fait ou encore répéter pour une énième fois des informations... tu n'auras pas de mal à trouver beaucoup d'infos, si jamais tu as des questions qui n'y sont pas (ce qui n'est pas le cas pour le moment), n'hésite pas.
Sujets similaires
» régression multiple et régression logistique
» Régression Logistique vs Régression Linéaire
» régression logistique
» Régression logistique
» REGRESSION LOGISTIQUE
» Régression Logistique vs Régression Linéaire
» régression logistique
» Régression logistique
» REGRESSION LOGISTIQUE
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum