Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
intéraction lors d'une régression logistique [RESOLU]
2 participants
Page 1 sur 1
intéraction lors d'une régression logistique [RESOLU]
Bonjour,
voilà j'essaye de faire une régression logistique (sous SAS) sur un modèle de type:
Y = VAR1 VAR2 VAR3 VAR1*VAR2 VAR2*VAR3 VAR3*VAR1
Mon souci est que lorsque je lance ma procédure on me renvoi le warning suivant:
There is possibly a quasicomplete separation of data points in step 3. The maximum likelihood estimate may not exist.
WARNING: The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood
iteration. Validity of the model fit is questionable.
[/color][/size][/font][/color][/size][/font][/color][/size][/font]
Ce que je sais c'est que le souci vient de mes variables croisés, or je me demande si, plus précisément, lors qu'on a une trop petite intéraction l'estimation du maximum de vraisemblance devient difficile.
Ma question est: est ce que le problème vient bien de là? et si oui est ce qu'il faut y pallier en mettant dans le modèle uniquement les trés trés fortes intéractions (ex: coeff de corrélation > 0.7)
Merci d'avance de votre réponse parce que là je bloque depuis 2 jours...
voilà j'essaye de faire une régression logistique (sous SAS) sur un modèle de type:
Y = VAR1 VAR2 VAR3 VAR1*VAR2 VAR2*VAR3 VAR3*VAR1
Mon souci est que lorsque je lance ma procédure on me renvoi le warning suivant:
There is possibly a quasicomplete separation of data points in step 3. The maximum likelihood estimate may not exist.
WARNING: The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood
iteration. Validity of the model fit is questionable.
[/color][/size][/font][/color][/size][/font][/color][/size][/font]
Ce que je sais c'est que le souci vient de mes variables croisés, or je me demande si, plus précisément, lors qu'on a une trop petite intéraction l'estimation du maximum de vraisemblance devient difficile.
Ma question est: est ce que le problème vient bien de là? et si oui est ce qu'il faut y pallier en mettant dans le modèle uniquement les trés trés fortes intéractions (ex: coeff de corrélation > 0.7)
Merci d'avance de votre réponse parce que là je bloque depuis 2 jours...
Dernière édition par joyeux_lapin13 le Lun 4 Oct 2010 - 17:42, édité 1 fois
Re: intéraction lors d'une régression logistique [RESOLU]
Le souci est qu'il y a une variable qui sépare presque parfaitement toutes tes valeurs de Y dans le bon groupe... la régression logistique ne peut être utilisée dans un cas comme celui-ci.
Il faut retirer cette variable du modèle peut-être...
Il faut retirer cette variable du modèle peut-être...
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: intéraction lors d'une régression logistique [RESOLU]
Salut, merci de m'avoir répondu.
Par contre en terme d'informations, avoir une variable qui fait cette séparation représente une erreur de l'avoir inclue dans le modèle à régresser ou plutôt le fait qu'elle représente à elle seule une manière d'expiquer la variable binaire, ou alors est-ce non interprétable?
Merci d'avance.
Par contre en terme d'informations, avoir une variable qui fait cette séparation représente une erreur de l'avoir inclue dans le modèle à régresser ou plutôt le fait qu'elle représente à elle seule une manière d'expiquer la variable binaire, ou alors est-ce non interprétable?
Merci d'avance.
Re: intéraction lors d'une régression logistique [RESOLU]
l'erreur n'est pas de l'avoir inclue dans le modèle... en fait, d'un point de vue mathématique, si une variable explique (presque) parfaitement la variable binaire, la méthode n'est pas applicable (les coefficients de la régression tendent vers l'infini)..
Et effectivement, cette variable peut représenter à elle seule une manière d'expliquer la variable binaire.
Et effectivement, cette variable peut représenter à elle seule une manière d'expliquer la variable binaire.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: intéraction lors d'une régression logistique [RESOLU]
D'accords je vois l'idée.
Pour dissiper tout malentendu, on parle bien du fait qu'une des deux variables croisées explique le modèle quasiment à elle seule et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?
Ensuite une question que je me pose c'est: lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement?
Par exemple si je prendre deux variables VAR1 et VAR2 découpées en 4 classes chacune. Quand je fais VAR1*VAR2 il fait quoi?
-si on est dans la même classe pour les deux alors il code class4, class3 ou class2 et class1 dans tous les autre cas?
-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
-ou bien j'ai rien compris à cette histoire de variables croisés?
Je demande pour essayer de mieux comprendre ce qu'il se passe.
Enfin par conséquent une manière de procéder serait:
1) faire tourner ma régression pour un modèle sans variables croises
2) faire un test de corrélation pour dégager les intéractions les plus fortes
3) faire tourner mon modèle avec les variables sans les croiser et en les croisant quand il s'agit de variables qui sont pas retourner en fin de régression BACK/FOR-WARD
Vraiment merci d'avance pour ceux qui prennent le temps de me répondre.
Pour dissiper tout malentendu, on parle bien du fait qu'une des deux variables croisées explique le modèle quasiment à elle seule et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?
Ensuite une question que je me pose c'est: lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement?
Par exemple si je prendre deux variables VAR1 et VAR2 découpées en 4 classes chacune. Quand je fais VAR1*VAR2 il fait quoi?
-si on est dans la même classe pour les deux alors il code class4, class3 ou class2 et class1 dans tous les autre cas?
-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
-ou bien j'ai rien compris à cette histoire de variables croisés?
Je demande pour essayer de mieux comprendre ce qu'il se passe.
Enfin par conséquent une manière de procéder serait:
1) faire tourner ma régression pour un modèle sans variables croises
2) faire un test de corrélation pour dégager les intéractions les plus fortes
3) faire tourner mon modèle avec les variables sans les croiser et en les croisant quand il s'agit de variables qui sont pas retourner en fin de régression BACK/FOR-WARD
Vraiment merci d'avance pour ceux qui prennent le temps de me répondre.
Re: intéraction lors d'une régression logistique [RESOLU]
"on parle bien du fait qu'une des deux variables croisées explique le modèle quasiment à elle seule"
OUI
"et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?"
c'est pas le croisement avec une autre variable le problème... le problème c'est la variable qui explique quasiment la variable binaire à elle seule. Ca rend les coefficients de régression incalculable.
"lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement? "
-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
OUI
"et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?"
c'est pas le croisement avec une autre variable le problème... le problème c'est la variable qui explique quasiment la variable binaire à elle seule. Ca rend les coefficients de régression incalculable.
"lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement? "
-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: intéraction lors d'une régression logistique [RESOLU]
D'accord, merci pour ces explications qui m'éclairent amplement.
Ma dernière question du coup est: si je veux inclure des interactions dans mon modèle il me faut éviter de mettre parmi mes croisement des variables qui auraient tendance à être conserver dans mes modèles finaux (je veux dire en fin de régression ascendante ou descendante) ?
En fait plus concrètement moi j'avais plein de variables, j'ai fait des test du chi deux pour en éliminer les moins corrélées à ma variable binaire. Puis j'ai balancé des régressions ascendantes et descendantes sur les variables retenues. Et c'est là que je me suis demandé si certaine variables ne seraient pas corrélées entre elle et si justement je n'oubliais pas cette intéraction lors de mes régressions.
Merci d'avance.
Ma dernière question du coup est: si je veux inclure des interactions dans mon modèle il me faut éviter de mettre parmi mes croisement des variables qui auraient tendance à être conserver dans mes modèles finaux (je veux dire en fin de régression ascendante ou descendante) ?
En fait plus concrètement moi j'avais plein de variables, j'ai fait des test du chi deux pour en éliminer les moins corrélées à ma variable binaire. Puis j'ai balancé des régressions ascendantes et descendantes sur les variables retenues. Et c'est là que je me suis demandé si certaine variables ne seraient pas corrélées entre elle et si justement je n'oubliais pas cette intéraction lors de mes régressions.
Merci d'avance.
Re: intéraction lors d'une régression logistique [RESOLU]
"Ma dernière question du coup est: si je veux inclure des interactions dans mon modèle il me faut éviter de mettre parmi mes croisement des variables qui auraient tendance à être conserver dans mes modèles finaux (je veux dire en fin de régression ascendante ou descendante) ?"
je pense que c'est difficile à dire... ça doit largement dépendre du contexte dans lequel tu travailles, du sujet, etc. Il n'y a pas de règles générales pour ça.
je pense que c'est difficile à dire... ça doit largement dépendre du contexte dans lequel tu travailles, du sujet, etc. Il n'y a pas de règles générales pour ça.
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Sujets similaires
» [R] Régression logistique PLS [RESOLU]
» Régression logistique [RESOLU]
» tracer régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» régression et intéraction
» Régression logistique [RESOLU]
» tracer régression logistique [RESOLU]
» résidus d'une régression logistique [RESOLU]
» régression et intéraction
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum