Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -20%
-20% sur le Lot de 2 écrans PC GIGABYTE ...
Voir le deal
429 €

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

3 participants

Page 1 sur 2 1, 2  Suivant

Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Dim 18 Oct 2009 - 19:12

Bonjour,
j'aimerais avoir de l'aide pour interpréter une régression logistique sur xlstat.
C'est la première fois que j'en réalise une et je rencontre des difficultés à l'analyse des tableaux.
J'ai déjà posté un msg sous le nom "Quelle analyse en fct de mon objectif?".
Merci pour votre aide. URGENT

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Lun 19 Oct 2009 - 7:18

C'est toujours difficile de répondre à ce genre de questions. Comme toute analyse, la régression logistique nécessite une étude au préalable des données que tu intègres, puis une analyse à la fois des sorties classiques de ton modèle de régression mais aussi une analyse des résidus, du pouvoir explicatif de ton analyse (AUC, kappa), de la pertinence du lien, de l'analyse de déviance, etc ... autrement dit pour te donner une info fiable c'est pas évident. Je te conseille de lire si tu y as accès le livre :
modelling binary data de Collett, qui est vachement bien foutu pour tout ce qui touche de l'analyse d'une variable aléatoire binaire.

Au final le mieux est encore d'aller voir quelqu'un avec tes données qui prendra le temps de répondre à tes questions. Je suis sur que dans les environs ou tu es tu dois pouvoir prendre contact avec des stateux ou des bio-stateux.

Un apperçu du bouquin :
http://books.google.fr/books?id=LMRAIBEbdqsC&printsec=frontcover&dq=modelling+binary+data&hl=en#v=onepage&q=&f=false
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 21 Oct 2009 - 12:28

Bonjour droopy,
comme étude prélable, j'ai réalisé les tris à plat de mes varibles et les tris croisés sur ces variables (en fonction de ma variable catégorielle). J'ai donc un certain nombre d'information sur les gens qui sont aidés et ceux qui ne le sont pas. Bon, jusque là, c'est basique et justement le croisement de ttes ces infos est difficile à analyser, d'ouù l'intérêt de faire la reg logistique. Evidemment, mon résultat dépend des variables disponibles.
Par rapport aux autres analyses dont tu fais référence, j'avoue que ca me déboussole pour ne pas dire effrayé. Je comptais seulement me contenter de l'analyse de la reg log qui en principe me donne une équation. Ensuite, je n'aurai qu'à rentrer mes infos sur les var explicatives du modèle et cela me dit si oui j'aide ou non. Je ne veux pas une analyse ultra sophistiqué.
Merci de tes remarques.

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mer 21 Oct 2009 - 12:51

si tu te contentes d'interpréter les coefficients tu n'auras aucune idée du pouvoir prédictif de ton analyse. C'est comme si tu faisais une régression linéaire et que tu disais Y = 2 + 3*X donc X explique bien Y --> mais ici tu ne sais la part de variance de Y expliquée par X, elle peut-être proche de 100% comme elle peut être proche de 0.

Tu as la même chose avec la régression logisitque et tout autre modèle d'ailleurs. Ce qu'il faut que tu vois aussi ici c'est la dichotomie de ta variable : tu peux avoir un modèle très bon pour prédire le succès (aide) et très mauvais pour prédire l'échec (pas d'aide) et vice et versa. Il te faut donc apprécier la qualité prédictive de ton modèle.

Un autre problème peut aussi venir du nombre de variables que tu rentres dans ton modèle. Plus tu vas rentrer de variables dans ton modèle et plus tu vas prédire correctement les données que tu as utilisées dans le modèle mais plus tu vas faire d'erreur quand tu vas faire des prédictions sur des données indépendantes (que tu n'as pas utilisées dans le modèle). Il existe pas mal de méthode pour sélectionner les variables une des plus utilisées reste la stepwise (avec ces qualités et ces défauts).

Après ce que tu cherches a faire n'est pas forcément très simple alors il va te falloir un minimum d'investissement ou entrer en contact avec quelqu'un qui s'y connaisse.

Je ne cherchais pas çà t'effrayer mais au contraire à te mettre en garde contre une éventuelle interprétation erronée des choses si tu ne faisais pas attention.

voici quelques liens concernant la régression logistique qui ont été posté sur un autre forum par Pierre Bady (rendons à César ...)

http://www.chuv.ch/cepic/Cours_regression_logistique.PDF



http://www.iumsp.ch/Unites/us/Alfio/polybiostat/4_Regression.pdf (chapitre 22, page 41)



http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf



http://cran.r-project.org/doc/contrib/Alzola+Harrell-Hmisc-Design-Intro.pdf



http://www.inra.fr/mia/ftp/T/FPstat/module10/POLYCOP/Collett.ps.gz



https://home.comcast.net/~lthompson221/Splusdiscrete2.pdf (chapitre 6, page 110)
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 21 Oct 2009 - 13:16

Finalement une régression linéaire multiple ne serait-elle pas plus simple à faire dans mon cas??? et plus simple à interpréter? à moins que reg log=reg multiple...

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mer 21 Oct 2009 - 13:26

le problème c'est que la régression linéaire multiple n'est pas adaptée aux données binaires. Mais tu peux très bien utiliser plusieurs variables dans ta régression logistique bien sur.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 21 Oct 2009 - 14:03

ok d'accord. puis-je tenvoyer ma petite base et me faire des préconisations?...tu as deja fait une reg log? merci

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mer 21 Oct 2009 - 14:06

non, je file juste un coup de main pour expliquer certains trucs aux gens ou les orienter mais je ne fais pas leur job à leur place.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 21 Oct 2009 - 14:10

je comprends tout à fait, no problem. c'était pas ds ce sens ma demande.

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 21 Oct 2009 - 14:25

merci pr la doc (en anglais, c encore plus simple, mdr).

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Jeu 22 Oct 2009 - 8:49

Bonjour,
j'ai une petite question. Pr ma reg log, j'ai 5-6 var explicatives dont 3 sur les revenus (2006-2007-2008). Ma question est :
1) est-il plus judicieux de créer une var quantitative d'intervalle (par exemple 0-5000, 50000-10000...) ou de laisser les revenus bruts tels quels? dans ce cas (données brutes), cela peut il "nuire" a la qualité du modèle?
2) mes autres var peuvent elles être binaires également?
merci par avance.

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Jeu 22 Oct 2009 - 9:13

1) moi j'aurai tendance à laisser la variable en continue pas forcément brute tels quels (ça dépend de la tête de la distribution). Après ça dépend aussi des pratiques qui se font dans ton domaine mais tu peux avoir une perte d'information en transformant une variable quantitative en qualitative. Effectivement ça peut nuire à la qualité du modèle, surtout si l'effet de cette variable est linéaire. Si c'est un effet à seuil : exemple au dessus de X ou en dessous de Y on prête ou pas alors la, la transformation à un sens. Moi je commencerais par regarder la distribution de ma variable avec un histogramme par exemple, ensuite je l'intégrerais au modèle (et ferai ce que nos amis les anglo-saxons appellent un 'constructive variable plot') et seulement après je regarderai ce que t'apporte la transformation

2) tout à fait.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Jeu 22 Oct 2009 - 9:27

Bonjour droopy,
effectivement il y a quelque part un effet à seuil (genre revenu annuel inf à 10 000 ou 20 000=tenté de préter mais aussi revenu à 80 000=on peut preter aussi si réelles difficultés du demandeur). Et donc difficile de trancher.
De même, j'ai crée des classes arbitraires pour l'age mais ds mon modèle final (équation), ce sera un coeff béta pour un age donné (et non pas pour une classe donnée!)?
merci encore droopy

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Jeu 22 Oct 2009 - 9:43

si tu utilises des classes, le coeff associée sera celui de la classe ... et non pas d'un age donné.

Si tu définis 3 classes d'age : 18-25, 25-30 et plus de 30 le coefficient sera celui de la classe, ton modele sera schématiquement de la forme :
Y = alpha + beta1*classe1 + beta2+classe2 + beta3*classe3

donc si tu as 26 ans tu es dans la classe 2 donc tu as 0 pour la classe 1 et 3 et l'estimation de ta valeur pour la classe 2 devient :
Y = alpha + beta1*0 + beta2*1 + beta3*0
Y = alpha + beta2

Alors que si tu gardes l'age en continue tu vas être capable d'estimer une valeur pour n'importe quelle age en multipliant l'age et le coefficient associé à l'âge (comme dans une regression linéaire simple) :
Y = alpha + beta*Age

La structure de tes modèles n'est pas la même et l'interprétation de tes coefficients est aussi différente. Il faut bien voir que quand tu crées des classes, chaque catégorie de tes classes va être ensuite transformée en une variable (on parle d'indicatrice). Si ton individus fait partie de la catégorie alors il aura un pour cette variable sinon il aura 0.

Ici le Y est bien sur le logit.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Jeu 22 Oct 2009 - 9:54

Très clairement expliqué, merci!

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Ven 23 Oct 2009 - 9:42

Bonjour,
j'ai bien noté que dans la reg log, les variables ne doivent pas être corrélées. Je me suis dit que ce serait donc intéresant de faire une acm pour justement voir "graphiquement" les var corrélées (kelke part l'acm fait une segmentation) et ainsi choisir pour la reg, mes var. est ce que l'idée est pertinente?

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Ven 23 Oct 2009 - 10:04

oui, car l'acm te permettra de toute façon d'avoir une idée un peu plus précise du lien entre tes variables donc une meilleure connaissance de ton jeu de données. Ce qui peut être intéressant aussi c'est de faire l'acm sans la variable que tu cherches a modéliser et ensuite de la projetter en variable supplémentaire sur les plans factoriels obtenus.
Ca ne t'emêche pas aussi de faire des tableaux croisés entre tes variables.

L'analyse de hill & Smith permet aussi d'analyser simultanément des données catégorielles et continues (par exemple l'âge). mais je ne sais pas si cette analyse est implémentée dans tout les logiciels.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Ven 23 Oct 2009 - 11:45

oui bien sur je comptais mettre ma var catégorielle en supllémentaire. je ne connaissais pas du tout cette analyse de "hill & smith", j'y jettrai un oeil. en ts cas, merci encore pour ces pistes de travail.

ps : évidemment, ma première étape a été de faire les tab croisés avc ttes mes variables en fct de ma var catégorielle. j'ai kelkes infos mais qui restent inévitablement basiques et insuffisantes pr en tirer des conclusions.

merci droopy

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mar 27 Oct 2009 - 10:27

Bonjour,
j'ai réalisé avant ma reg log une acm qui me donne 54% sur les axes1-2, avec ma var catégorielle en supplémentaire. Sur ma rep graphique, ttes mes var sont proches de l'origine donc profils moyens sur ces var. Pas assez d'"oppositions", quoique par exemple la var sexe (h/f) est située de part et d'autre sur les axes, de mm pr ma var catégo, csp.
Le problème c'est que cette rep graph contredit un peu les tris croisés. Pourquoi? ya til un effet??
merci par avance

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mar 27 Oct 2009 - 10:49

Tout simplement parce que si tu as fait ton ACM sans avoir incorporée la variable que tu cherches a modéliser alors tu regardes le lien entre tes variables explicatives seulement. Après quand tu as des variables dichotomiques comme le sexe il est normal qu'elle s'oppose sur les axes, puisque si tu es un homme tu n'es pas une femme et vice et versa.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mar 27 Oct 2009 - 10:56

alors justement lorsque j'incorpore ma var catég, j'ai 58% d'inertie totale (plan1-2). ici, la rep graf est plus "éclatée".
Donc clairement, les points proches sont ceux qui ont une certaine corrélation (proximité et interprétation simultanée): par exemple, ma var "accord" est proche de ma var sexe Homme dc je peux dire que j'accorde plus aux hommes qu'aux femmes. est- ce juste de dire cela?
celles qui sont à l"écart" sont celles que je peux enlever ds mon modèle de reg??
merci encore droopy

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mar 27 Oct 2009 - 12:35

kazy13/75 a écrit:alors justement lorsque j'incorpore ma var catég, j'ai 58% d'inertie totale (plan1-2). ici, la rep graf est plus "éclatée".
Donc clairement, les points proches sont ceux qui ont une certaine corrélation (proximité et interprétation simultanée): par exemple, ma var "accord" est proche de ma var sexe Homme dc je peux dire que j'accorde plus aux hommes qu'aux femmes. est- ce juste de dire cela?
Tu pourrais aussi dire que l'on accorde moins aux femmes qu'aux hommes ... il est difficile de trancher dans quel sens varie les choses avec une variable dichotomique. Mais en tout cas il semblerait y avoir un lien (justifié ou non) avec le sexe.
kazy13/75 a écrit:celles qui sont à l"écart" sont celles que je peux enlever ds mon modèle de reg??
tout dépend de ce que tu entends par à l'écart, une variable qui est diamétralement opposée est intéressante car ça montre un lien négatif entre les deux.
L'acm reste une aide pour explorer tes données et voir le lien entre tes variables. Il est clair que si aucune des modalités d'une de tes variables est liée avec le succès ou l'échec alors il n'y a a priori aucune raison de la conserver.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 28 Oct 2009 - 10:07

Bonjour,
"forward LR" signifie bien "méthode ascendante pas à pas : rapport de vraisemblance" (reg log sous spss)...
merci

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par droopy Mer 28 Oct 2009 - 10:18

google is your friend ... j'avais oublié pas d'anglais ... pourtant en tapant forward LR spss dans google je dirais que dans les 4 premiers liens tu trouves ta réponse ... mais en anglais ... bonne lecture.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par kazy13/75 Mer 28 Oct 2009 - 10:21

Si une variable explicative binaire est à plus de 90% "non" (dc très peu de oui), je suppose qu'elle suppose très explicative ds mon modèle final. Puis je dire : je ne l'intègre pas dans ma reg mais dans l'interprétation finale, en expliquant mon modèle, je préciserai que le fait d'"être non" sur cette variable est important dans la décision.
Je pose cette question car effectivement, après plusieurs recodages de mes autres variables, je constate qu'au step1, c'est tjrs cette var qui est la plus significative...
merci par avance

kazy13/75

Nombre de messages : 40
Date d'inscription : 09/10/2009

Revenir en haut Aller en bas

Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE Empty Re: Besoin d'aide INTERPRETATION REGRESSION LOGISTIQUE

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Page 1 sur 2 1, 2  Suivant

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum