Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
SSD interne Crucial BX500 2,5″ SATA – 500 Go à 29,99€
29.99 €
Voir le deal

intéraction lors d'une régression logistique [RESOLU]

2 participants

Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty intéraction lors d'une régression logistique [RESOLU]

Message par joyeux_lapin13 Mer 21 Avr 2010 - 18:57

Bonjour,

voilà j'essaye de faire une régression logistique (sous SAS) sur un modèle de type:

Y = VAR1 VAR2 VAR3 VAR1*VAR2 VAR2*VAR3 VAR3*VAR1

Mon souci est que lorsque je lance ma procédure on me renvoi le warning suivant:
There is possibly a quasicomplete separation of data points in step 3. The maximum likelihood estimate may not exist.
WARNING: The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood
iteration. Validity of the model fit is questionable.

[/color][/size][/font][/color][/size][/font][/color][/size][/font]
Ce que je sais c'est que le souci vient de mes variables croisés, or je me demande si, plus précisément, lors qu'on a une trop petite intéraction l'estimation du maximum de vraisemblance devient difficile.


Ma question est: est ce que le problème vient bien de là? et si oui est ce qu'il faut y pallier en mettant dans le modèle uniquement les trés trés fortes intéractions (ex: coeff de corrélation > 0.7)

Merci d'avance de votre réponse parce que là je bloque depuis 2 jours...


Dernière édition par joyeux_lapin13 le Lun 4 Oct 2010 - 17:42, édité 1 fois
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par niaboc Jeu 22 Avr 2010 - 18:52

Le souci est qu'il y a une variable qui sépare presque parfaitement toutes tes valeurs de Y dans le bon groupe... la régression logistique ne peut être utilisée dans un cas comme celui-ci.
Il faut retirer cette variable du modèle peut-être...
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par joyeux_lapin13 Ven 23 Avr 2010 - 7:11

Salut, merci de m'avoir répondu.

Par contre en terme d'informations, avoir une variable qui fait cette séparation représente une erreur de l'avoir inclue dans le modèle à régresser ou plutôt le fait qu'elle représente à elle seule une manière d'expiquer la variable binaire, ou alors est-ce non interprétable?

Merci d'avance.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par niaboc Sam 24 Avr 2010 - 17:01

l'erreur n'est pas de l'avoir inclue dans le modèle... en fait, d'un point de vue mathématique, si une variable explique (presque) parfaitement la variable binaire, la méthode n'est pas applicable (les coefficients de la régression tendent vers l'infini)..

Et effectivement, cette variable peut représenter à elle seule une manière d'expliquer la variable binaire.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par joyeux_lapin13 Sam 24 Avr 2010 - 17:13

D'accords je vois l'idée.

Pour dissiper tout malentendu, on parle bien du fait qu'une des deux variables croisées explique le modèle quasiment à elle seule et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?

Ensuite une question que je me pose c'est: lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement?

Par exemple si je prendre deux variables VAR1 et VAR2 découpées en 4 classes chacune. Quand je fais VAR1*VAR2 il fait quoi?
-si on est dans la même classe pour les deux alors il code class4, class3 ou class2 et class1 dans tous les autre cas?
-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
-ou bien j'ai rien compris à cette histoire de variables croisés?

Je demande pour essayer de mieux comprendre ce qu'il se passe.

Enfin par conséquent une manière de procéder serait:
1) faire tourner ma régression pour un modèle sans variables croises
2) faire un test de corrélation pour dégager les intéractions les plus fortes
3) faire tourner mon modèle avec les variables sans les croiser et en les croisant quand il s'agit de variables qui sont pas retourner en fin de régression BACK/FOR-WARD

Vraiment merci d'avance pour ceux qui prennent le temps de me répondre.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par niaboc Dim 25 Avr 2010 - 12:00

"on parle bien du fait qu'une des deux variables croisées explique le modèle quasiment à elle seule"

OUI

"et par conséquent si on la croise à une autre il y a problème ou bien en fait c'est le croisement qui explique le modèle?"

c'est pas le croisement avec une autre variable le problème... le problème c'est la variable qui explique quasiment la variable binaire à elle seule. Ca rend les coefficients de régression incalculable.

"lorsque l'on croise des variables durant une régression logistique, qu'est ce qui se passe exactement? "

-il multiplie les deux modalités ce qui fait que pour ce cas là on se retrouve en fait avec 16 modalités?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par joyeux_lapin13 Dim 25 Avr 2010 - 13:40

D'accord, merci pour ces explications qui m'éclairent amplement.

Ma dernière question du coup est: si je veux inclure des interactions dans mon modèle il me faut éviter de mettre parmi mes croisement des variables qui auraient tendance à être conserver dans mes modèles finaux (je veux dire en fin de régression ascendante ou descendante) ?

En fait plus concrètement moi j'avais plein de variables, j'ai fait des test du chi deux pour en éliminer les moins corrélées à ma variable binaire. Puis j'ai balancé des régressions ascendantes et descendantes sur les variables retenues. Et c'est là que je me suis demandé si certaine variables ne seraient pas corrélées entre elle et si justement je n'oubliais pas cette intéraction lors de mes régressions.

Merci d'avance.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par niaboc Lun 26 Avr 2010 - 18:24

"Ma dernière question du coup est: si je veux inclure des interactions dans mon modèle il me faut éviter de mettre parmi mes croisement des variables qui auraient tendance à être conserver dans mes modèles finaux (je veux dire en fin de régression ascendante ou descendante) ?"

je pense que c'est difficile à dire... ça doit largement dépendre du contexte dans lequel tu travailles, du sujet, etc. Il n'y a pas de règles générales pour ça.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

intéraction lors d'une régression logistique [RESOLU] Empty Re: intéraction lors d'une régression logistique [RESOLU]

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum