Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
mvergnat
 
zezima
 
Florent Aubry
 
c@ssoulet
 
fmachou
 
adri6666
 
Nik
 
Aeelim
 
Kouakakou
 


Regression logistique sur classes désequilibrées

Voir le sujet précédent Voir le sujet suivant Aller en bas

Regression logistique sur classes désequilibrées

Message par conakry le Dim 27 Aoû 2017 - 22:08

Bonjour,

J'ai un soucis et je travaille sous R
Au fait j'ai un échantillon de 4442 observations.
Je dois prédire une variable cible binaire (oui/non) via la régression logistique. Le soucis, les classes sont déséquilibrées (oui=700 et non=3742). Quand je fais ma prédiction, elle est très mauvaise. Je me rends compte qu'il faut équilibrer ma variable de telle sorte que la classe oui soit représentative.
Pouvez vous svp me faire des suggestions en me proposant un code R? Merci par avance

conakry

Nombre de messages : 7
Date d'inscription : 04/07/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique sur classes désequilibrées

Message par Eric Wajnberg le Lun 28 Aoû 2017 - 5:53

Je ne comprends pas. Par équilibré, vous voulez dire autant de oui que de non, donc une probabilité à 50%? Evidement, la régression logistique peut s'appliquer pour modéliser des probabilités qui peuvent différer de 50%, sans quoi cette méthode de régression ne présenterait aucun intérêt!

Ou bien je n'ai pas compris votre question.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 664
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique sur classes désequilibrées

Message par Coco le Lun 28 Aoû 2017 - 11:34

Si tu pensais qu'il y aurait plus de "oui" peut-être que ton échantillon est biaisé (échantillon trop faible, mauvaises observations...)
avatar
Coco

Nombre de messages : 25
Date d'inscription : 23/03/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique sur classes désequilibrées

Message par Eric Wajnberg le Lun 28 Aoû 2017 - 15:49

Coco a écrit:Si tu pensais qu'il y aurait plus de "oui" peut-être que ton échantillon est biaisé (échantillon trop faible, mauvaises observations...)
Ou juste que la proportion de oui est plus élevée, et c'est ce que la régression logistique cherche à modéliser. C'était ma réponse.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 664
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Regression logistique sur classes désequilibrées

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum