Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
classe déséquilibrée régression logistique
5 participants
Page 2 sur 2
Page 2 sur 2 • 1, 2
Re: classe déséquilibrée régression logistique
oui du coup je mélange un peu les deux idées aussi
Si tu montes une étude pour étudier les déclencheurs d'une maladie mais que tu ne met pas à parts égales des conditions où la maladie se déclare et où la maladie ne se déclare pas alors tu crées le déséquilibre entre les cas et les non cas. Et là c'est bien parce que tu n'as pas équilibré ton plan d'expérience.
Au départ, ça peut être un manque de connaissance sur la question. Dans les études suivantes tu recentres tes facteurs pour être plus proche d'un plan équilibré en terme de 0 et 1 et mieux cerner les conditions d'apparition de la maladie.
Suis plus clair ou bien...je suis pas sûr
Si tu montes une étude pour étudier les déclencheurs d'une maladie mais que tu ne met pas à parts égales des conditions où la maladie se déclare et où la maladie ne se déclare pas alors tu crées le déséquilibre entre les cas et les non cas. Et là c'est bien parce que tu n'as pas équilibré ton plan d'expérience.
Au départ, ça peut être un manque de connaissance sur la question. Dans les études suivantes tu recentres tes facteurs pour être plus proche d'un plan équilibré en terme de 0 et 1 et mieux cerner les conditions d'apparition de la maladie.
Suis plus clair ou bien...je suis pas sûr
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: classe déséquilibrée régression logistique
Oui tu es plus clair. As-tu raison pour autant ?
Ce pdf tente à montrer le contraire :
http://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=5&ved=0CF0QFjAE&url=http%3A%2F%2Fengineering.tufts.edu%2Fcee%2Fpeople%2Fvogel%2Fpublications%2FsamplingBias.pdf&ei=U3ISUYHLM-Gm0QW9gYGAAQ&usg=AFQjCNEP2hhVvqy5CWz6WNmrB1cBh-9VRQ&bvm=bv.41934586,d.d2k&cad=rja
Celui-ci est pas mal non plus :
http://gking.harvard.edu/files/abs/0s-abs.shtml
Cdlt
Ce pdf tente à montrer le contraire :
http://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=5&ved=0CF0QFjAE&url=http%3A%2F%2Fengineering.tufts.edu%2Fcee%2Fpeople%2Fvogel%2Fpublications%2FsamplingBias.pdf&ei=U3ISUYHLM-Gm0QW9gYGAAQ&usg=AFQjCNEP2hhVvqy5CWz6WNmrB1cBh-9VRQ&bvm=bv.41934586,d.d2k&cad=rja
Celui-ci est pas mal non plus :
http://gking.harvard.edu/files/abs/0s-abs.shtml
Cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: classe déséquilibrée régression logistique
Mais bien sûr que j'ai raison...comme toujours d'ailleurs !! Tu devrais le savoir à force sdroopy a écrit:Oui tu es plus clair. As-tu raison pour autant ?
Le premier article a l'air de prendre les choses d'une manière très stateuses (les hypothèses de départ ont l'air assez forte quand même) et je suis pas sûr qu'il apporte une réelle réponse à la problématique mais en tout cas il a l'air intéressant sur l'aspect de la mise en évidence des problèmes. Je le lirai avec attention plus tard...qd j'aurai un peu de temps
Le second se rapproche plus de ce que j'ai en tête. Pareil je vais essayer de le lire plus en détail car pour le moment j'ai fait une lecture très transversale
Merci en tout cas
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: classe déséquilibrée régression logistique
Pour revenir plus à mon post d'origine :
Par construction nous avons des probas beaucoup plus faibles quand on a la population de "1" qui est sous-représentée dans la construction du modèle...
Comment cela s'explique? (j'ai l'impression ça se joue essentiellement sur la constante du modèle?)
Du coup si on ne bouge pas le seuil et qu'on veut prédire un nouvel individu, on risque de le classer trop souvent dans les "0"??
En fait, il serait presque recommandé d'adapter le seuil pour chaque modèle construit? ou alors ne faire que des échantillons bien équilibrés?
Par construction nous avons des probas beaucoup plus faibles quand on a la population de "1" qui est sous-représentée dans la construction du modèle...
Comment cela s'explique? (j'ai l'impression ça se joue essentiellement sur la constante du modèle?)
Du coup si on ne bouge pas le seuil et qu'on veut prédire un nouvel individu, on risque de le classer trop souvent dans les "0"??
En fait, il serait presque recommandé d'adapter le seuil pour chaque modèle construit? ou alors ne faire que des échantillons bien équilibrés?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: classe déséquilibrée régression logistique
salut,
on en revient à la discussion des précédents message. Tout dépend l'objectif et le plus importants est de bien comprendre comment chaque choix influence ou non le résultat. Si tout est bien maitrisé et justifié alors sans duote que tu peux adapter le seuil.
Pour les échantillons équilibrés, pour le coup je vais pas plus m'avancer avant d'avoir lu les papiers transmis par droopy
on en revient à la discussion des précédents message. Tout dépend l'objectif et le plus importants est de bien comprendre comment chaque choix influence ou non le résultat. Si tout est bien maitrisé et justifié alors sans duote que tu peux adapter le seuil.
Pour les échantillons équilibrés, pour le coup je vais pas plus m'avancer avant d'avoir lu les papiers transmis par droopy
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: classe déséquilibrée régression logistique
niaboc a écrit:Pour revenir plus à mon post d'origine :
Par construction nous avons des probas beaucoup plus faibles quand on a la population de "1" qui est sous-représentée dans la construction du modèle...
Comment cela s'explique? (j'ai l'impression ça se joue essentiellement sur la constante du modèle?)
Et pour ce qui est de ça?
pourquoi seule la constante est impactée par la chose? pourquoi les coefficients des variables sont toujours valides? en cas de variables catégorielles, est-ce toujours le cas?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Page 2 sur 2 • 1, 2
Sujets similaires
» régression multiple et régression logistique
» Régression Logistique vs Régression Linéaire
» Régression logistique
» régression logistique
» régression logistique
» Régression Logistique vs Régression Linéaire
» Régression logistique
» régression logistique
» régression logistique
Page 2 sur 2
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum