Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
tracer régression logistique [RESOLU]
2 participants
Page 1 sur 1
tracer régression logistique [RESOLU]
Bonjour,
tout est dans le titre je pense, je voulais juste savoir si la proc LOGISTIC offrait une option permettant de tracer la droite de régression dans le plan de mes individus.
Merci d'avance.
tout est dans le titre je pense, je voulais juste savoir si la proc LOGISTIC offrait une option permettant de tracer la droite de régression dans le plan de mes individus.
Merci d'avance.
Dernière édition par joyeux_lapin13 le Lun 4 Oct 2010 - 17:55, édité 1 fois
Re: tracer régression logistique [RESOLU]
Bonjour,
je me permet de réup mon sujet afin d'être plus précis.
En fait j'ai fait une régression logistique sur un lot de variable via méthode asc/desc -endante et il m'est rester que 2 variables V1 et V2.
J'ai donc plotter V1*V2 et je cherche à superposer la courbe de régression dont les coeffs sont evidemment ceux obtenu lors de la régression logistique précédente.
Mais je me rend compte que même à la main je sais pas faire aussi à défaut de me dire l'option sous SAS quelqu'un pourrait m'expliquer comment le faire?
Mon souci étant évidemment l'échelle, j'ai mes deux variables divisés en 4 modalité, j'ai donc une équation logistique à 9 variables variant de 0 à 1 et je vois pas comment retrouver l'échelle du plan V1*V2 qui lui varie de 0 à 90. Je pense en fait qu'il faut passer par la forme logit mais ce qui me titille c'est que j'ai du mal à voir les points, ils varient entre 0 et 1 en fonction de la modalité dans laquelle on est...
En vous remerciant d'avance.
je me permet de réup mon sujet afin d'être plus précis.
En fait j'ai fait une régression logistique sur un lot de variable via méthode asc/desc -endante et il m'est rester que 2 variables V1 et V2.
J'ai donc plotter V1*V2 et je cherche à superposer la courbe de régression dont les coeffs sont evidemment ceux obtenu lors de la régression logistique précédente.
Mais je me rend compte que même à la main je sais pas faire aussi à défaut de me dire l'option sous SAS quelqu'un pourrait m'expliquer comment le faire?
Mon souci étant évidemment l'échelle, j'ai mes deux variables divisés en 4 modalité, j'ai donc une équation logistique à 9 variables variant de 0 à 1 et je vois pas comment retrouver l'échelle du plan V1*V2 qui lui varie de 0 à 90. Je pense en fait qu'il faut passer par la forme logit mais ce qui me titille c'est que j'ai du mal à voir les points, ils varient entre 0 et 1 en fonction de la modalité dans laquelle on est...
En vous remerciant d'avance.
Re: tracer régression logistique [RESOLU]
je n'utilise pas SAS donc je ne peux pas t'aider pour le code. Par contre si j'ai bien compris tu cherches a représenter comment varie ta proba de succès en fonction de tes deux variables ? Sachant que tu as que des variables qualitatives ? Si tel est le cas alors tu ne pourras pas calculer de surface de réponse mais juste une valeur par classes croisées de variable, soit 4*4 16 valeurs. tu peux faire une représentation en 3d avec sur l'axe des z la proba calculée pour le croisement de tes deux variables, ou sur un plan 2d représentée des points de taille proportionnelles à la proba estimée par exemple.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: tracer régression logistique [RESOLU]
Voilà exactement!
En fait que mes variables soient au final qualitative ou quantitave n'est pas grave en soit vue que SAS va coder de la façon suivante (si j'ai bien compris...):
Y = INTERCEPT + MOD1_VAR1 * P + MOD2_VAR1 * P + MOD3_VAR1 * P + MOD4_VAR1 * P + MOD1_VAR2 * P + MOD2_VAR2 * P + MOD3_VAR2 * P + MOD4_VAR2 * P. Ou P est l'individu étudié et sera codé en fait 0 ou 1 en fonction de la modalité à laquelle il appartient.
Donc en fait l'idée serait de coder mes patients en fonction de leur appartenance au deux classes?
En fait ça serait logique de faire une représentation tel quel plutot qu'une en fonction de la population complète.
Et là d'en parler je crois que justement j'ai vue l'option mais que, sans que je comprenne pourquoi, j'ai eu que le retour de ces points sans la courbe de régression.
Merci Droopy, je crois savoir ou chercher maintenant!
En fait que mes variables soient au final qualitative ou quantitave n'est pas grave en soit vue que SAS va coder de la façon suivante (si j'ai bien compris...):
Y = INTERCEPT + MOD1_VAR1 * P + MOD2_VAR1 * P + MOD3_VAR1 * P + MOD4_VAR1 * P + MOD1_VAR2 * P + MOD2_VAR2 * P + MOD3_VAR2 * P + MOD4_VAR2 * P. Ou P est l'individu étudié et sera codé en fait 0 ou 1 en fonction de la modalité à laquelle il appartient.
Donc en fait l'idée serait de coder mes patients en fonction de leur appartenance au deux classes?
En fait ça serait logique de faire une représentation tel quel plutot qu'une en fonction de la population complète.
Et là d'en parler je crois que justement j'ai vue l'option mais que, sans que je comprenne pourquoi, j'ai eu que le retour de ces points sans la courbe de régression.
Merci Droopy, je crois savoir ou chercher maintenant!
Re: tracer régression logistique [RESOLU]
Je repost...
Eventuellement j'aurais aimé savoir si le graphe renvoyé via l'option (PLOTS = EFFECT) intitulé "Predicted Probabilities for _REF_ = 1" représente la population que je recherche, par contre je comprend pas pourquoi je n'obtiens pas le tracé de ma courbe directement dessus...
Par conséquent comme avec ce graphe j'ai en ordonné les probabilités et en abscisse les croisements de modalités faisant office d'identifiant de ma population, j'ai pris mes estimateurs et ma forme logit afin de tirer les deux points par lesquelles ma droite pourrait passer.
En résumé j'ai pris mon equation: Y = Intercept + B_VAR1 * X1 + B_VAR2 * X2. Je n'ai plus que deux coefficients car les 6 autre ont une p-valeur > 5% et ne sont donc pas significatifs. J'ai alors un point en (0,exp(Intercept)/1+exp(Intercept)) et un second en ([B_VAR1*B_VAR2], exp(Intercept + B_VAR1 + B_VAR2)/1+exp(Intercept + B_VAR1 + B_VAR2)) et j'ai tracé ma droite.
Mon souci c'est que je suis pas moi-même convaincu de ce que j'ai fait... j'ai bien envie de tester voir si la séparation est en logique avec mes prédictions... mais bon...
Merci d'avance à celui qui prendre le temps de me dire si ce que j'ai fait est exactement ce que je recherche à la base (nuage des individus + droite de régression logistique).
EDIT: en fait ça marche pas vue que, comme l'a dit Droopy, on est en modalité et non en continue. En fait ce que t'as suggéré Droopy est interessant et permet de sortir une courbe séparatrice, mais bon SAS donne un graphe qui répertorie tous les cas et leur probabilité de donnée la variable de référence de la valeur à expliquer donc finalement c'est assez perspicace comme sortie.
Eventuellement j'aurais aimé savoir si le graphe renvoyé via l'option (PLOTS = EFFECT) intitulé "Predicted Probabilities for _REF_ = 1" représente la population que je recherche, par contre je comprend pas pourquoi je n'obtiens pas le tracé de ma courbe directement dessus...
Par conséquent comme avec ce graphe j'ai en ordonné les probabilités et en abscisse les croisements de modalités faisant office d'identifiant de ma population, j'ai pris mes estimateurs et ma forme logit afin de tirer les deux points par lesquelles ma droite pourrait passer.
En résumé j'ai pris mon equation: Y = Intercept + B_VAR1 * X1 + B_VAR2 * X2. Je n'ai plus que deux coefficients car les 6 autre ont une p-valeur > 5% et ne sont donc pas significatifs. J'ai alors un point en (0,exp(Intercept)/1+exp(Intercept)) et un second en ([B_VAR1*B_VAR2], exp(Intercept + B_VAR1 + B_VAR2)/1+exp(Intercept + B_VAR1 + B_VAR2)) et j'ai tracé ma droite.
Mon souci c'est que je suis pas moi-même convaincu de ce que j'ai fait... j'ai bien envie de tester voir si la séparation est en logique avec mes prédictions... mais bon...
Merci d'avance à celui qui prendre le temps de me dire si ce que j'ai fait est exactement ce que je recherche à la base (nuage des individus + droite de régression logistique).
EDIT: en fait ça marche pas vue que, comme l'a dit Droopy, on est en modalité et non en continue. En fait ce que t'as suggéré Droopy est interessant et permet de sortir une courbe séparatrice, mais bon SAS donne un graphe qui répertorie tous les cas et leur probabilité de donnée la variable de référence de la valeur à expliquer donc finalement c'est assez perspicace comme sortie.
Re: tracer régression logistique [RESOLU]
Je me permet de réup car aprés avoir creuser j'ai cru comprendre que l'on pouvait faire une régression logistique sur des variables continues si on a l'hypothèse de log-linéarité qui est vérifié.
Aussi je voulais savoir si certain aurait des informations car j'ai rien trouver de spécialement concret là dessus.
Merci d'avance.
Aussi je voulais savoir si certain aurait des informations car j'ai rien trouver de spécialement concret là dessus.
Merci d'avance.
Re: tracer régression logistique [RESOLU]
Des variables continues en variables indépendantes ?
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: tracer régression logistique [RESOLU]
Euh... ben elles sont continues et indépendantes entre elles, enfin je sais pas si c'est ça que tu me demandais.
En fait, si j'ai bien compris, l'hypothèse de log linéarité dit que plus on augmente la valeur de X plus la pente de l'odd ratio augmente, enfin il y a une relation plus ou moins proportionnelle.
Mais outre le fait que je vois pas comment on vérifie ça, je vois pas spécialement comment on fait une régression logistique sur des variables continues... à moins de passer par des méthodes GLM...
Tout ce que je sais, c'est que sur un bouquin j'ai vu des données continues plottées avec la droite de la régression logistique pour les séparer, le but était même de comparer un séparateur linéaire, discrimant linéaire (pas sur que ça soit correctement dit) et logistique.
En fait, si j'ai bien compris, l'hypothèse de log linéarité dit que plus on augmente la valeur de X plus la pente de l'odd ratio augmente, enfin il y a une relation plus ou moins proportionnelle.
Mais outre le fait que je vois pas comment on vérifie ça, je vois pas spécialement comment on fait une régression logistique sur des variables continues... à moins de passer par des méthodes GLM...
Tout ce que je sais, c'est que sur un bouquin j'ai vu des données continues plottées avec la droite de la régression logistique pour les séparer, le but était même de comparer un séparateur linéaire, discrimant linéaire (pas sur que ça soit correctement dit) et logistique.
Re: tracer régression logistique [RESOLU]
j'avoue que plus je te lis et moins je te comprends.
Il est évident que tu peux utiliser des variables continues comme variable indépendantes dans une regression logistique. L'âge en continu est couramment utilisé comme variable indépendante notamment dans les études sur la prévalence des cancers. Il te faut bien voir que la régression logistique est un GLM ! au même titre qu'une regression de poisson ou une regression linéaire multiple.
Pour ce qui est du calcul de l'odd ration. Si on prend le cas ou la prévalence de cancer dans la population augmente avec l'âge et que le coefficient associé à l'âge est de 0.1059588, alors les chances d'avoir un cancer sont multipliées de exp(0.1059588) = 1.112 par an.
Je ne sais pas si tu as accès à une BU la ou tu es mais je te conseille vivement d'aller jetter un oeil dans l'un des livres suivant :
Agresti 2002. Categorical Data Analysis. - John Wiley & Sons, Inc.
Collett, D. 2002. Modelling Binary Data. - Champman & Hall/CRC.
Hosmer, D. W. and Lemeshow, S. 2000. Applied Logistic Regression. - John Wiley & Sons, Inc.
Il est évident que tu peux utiliser des variables continues comme variable indépendantes dans une regression logistique. L'âge en continu est couramment utilisé comme variable indépendante notamment dans les études sur la prévalence des cancers. Il te faut bien voir que la régression logistique est un GLM ! au même titre qu'une regression de poisson ou une regression linéaire multiple.
Pour ce qui est du calcul de l'odd ration. Si on prend le cas ou la prévalence de cancer dans la population augmente avec l'âge et que le coefficient associé à l'âge est de 0.1059588, alors les chances d'avoir un cancer sont multipliées de exp(0.1059588) = 1.112 par an.
Je ne sais pas si tu as accès à une BU la ou tu es mais je te conseille vivement d'aller jetter un oeil dans l'un des livres suivant :
Agresti 2002. Categorical Data Analysis. - John Wiley & Sons, Inc.
Collett, D. 2002. Modelling Binary Data. - Champman & Hall/CRC.
Hosmer, D. W. and Lemeshow, S. 2000. Applied Logistic Regression. - John Wiley & Sons, Inc.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» [R] Régression logistique PLS [RESOLU]
» Régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» intéraction lors d'une régression logistique [RESOLU]
» Estimation des coefficients de la régression log [RESOLU]
» Régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» intéraction lors d'une régression logistique [RESOLU]
» Estimation des coefficients de la régression log [RESOLU]
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum