Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Régression logistique
4 participants
Page 1 sur 1
Régression logistique
Bonjour,
Je désire effectuer une régression logistique d'une variable binomiale en fonction de 5 variables quantitatives.Alors pourriez vous m'indiquer les étapes par lesquelles je dois passer.En fait j'ai pas compris est ce qu'on doit commencer par générer le modèle générale,le modèle de backward ou forward?et quel modèle choisir?Et puis si j'ai enfin mon modèle y=f(x),alors si pour un nouvel individu je calcul mon y à partir de ce modèle,comment je peux interpréter,c'est à sire comment je peux savoir par exemple est ce que c'est un bon ou mauvais client?
Merci d'avance!
Je désire effectuer une régression logistique d'une variable binomiale en fonction de 5 variables quantitatives.Alors pourriez vous m'indiquer les étapes par lesquelles je dois passer.En fait j'ai pas compris est ce qu'on doit commencer par générer le modèle générale,le modèle de backward ou forward?et quel modèle choisir?Et puis si j'ai enfin mon modèle y=f(x),alors si pour un nouvel individu je calcul mon y à partir de ce modèle,comment je peux interpréter,c'est à sire comment je peux savoir par exemple est ce que c'est un bon ou mauvais client?
Merci d'avance!
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
Bonjour, pour comparer des modèles avec un nombre de variables différentes, il faut s'intéresser au coefficient de détermination ajusté de chacun des modèles.
Le choix du modèle se fait en connaissant le contexte.
Pour votre nouvel individu, regardez le résidu associé. Est il important, positif, négatif?
Le choix du modèle se fait en connaissant le contexte.
Pour votre nouvel individu, regardez le résidu associé. Est il important, positif, négatif?
StatStatS- Nombre de messages : 11
Date d'inscription : 17/04/2016
Re: Régression logistique
Pour une régression logistique ? La fonction de lien n'étant pas un lien identité, je vois mal comment on pourrait interpréter la somme des carrés des écarts (que le R² soit ajusté ou non).il faut s'intéresser au coefficient de détermination ajusté de chacun des modèles
@statisticienne
Pour poser un cadre, j'évoque ci-dessous ce qui est valable pour une sélection de modèle basée sur un critère d'information (AIC, BIC...) car la sélection de modèle sur p-value est d'après ce que j'en ai lu, très foireuse.
Il n'y a pas de règle précise quant au modèle complet (celui incluant tous les paramètres). Il faut que ce modèle soit plausible et sensé quant à tes hypothèses. A partir de là le processus de sélection aura une base correcte. Sur le choix backward/forward/ou les deux, idem pas de règle d'or. Pour ma part, je suis toujours parti sur du backward car je trouvais plus sensé d'avoir le modèle le plus complexe et d'essayer de le simplifier d'après l'information fournie par les données.
Tu as toujours la possibilité de faire du model averaging si tu n'arrives pas à trancher et notamment si tes modèles sont séparés par 2 unités ou moins sur ton critère de sélection (AIC...)
Pour le bon/mauvais client, je ne suis pas sûr de ce que tu entends par là...est-ce que le fait de s'écarter d'un modèle basé sur la moyenne est un bon critère d'évaluation du client ? Pour rappel, tous les modèles sont faux
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Régression logistique
avec seulement 5 variables quantitatives comme variables indépendantes, y a t'il vraiment besoin de faire du backward/forward? Il ne devrait pas être bien compliqué de voir quelles sont les variables qui ont un effet ou non, et savoir si leur ajout/retrait modifierait quelque chose.
J'imagine que bon/mauvais client renvoi simplement à la variable binomiale d’intérêt (effectivement, c'est pas clairement expliqué..). Si c'est le cas, le modèle prédira la proba qu'un nouveau client soit bon ou mauvais.
HTH, Eric.
J'imagine que bon/mauvais client renvoi simplement à la variable binomiale d’intérêt (effectivement, c'est pas clairement expliqué..). Si c'est le cas, le modèle prédira la proba qu'un nouveau client soit bon ou mauvais.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Régression logistique
Bonjour,
Merci pour toute vos réponses!
@M.Erice:Est ce que c'est bien ça?:Si j'ai un nouvel individu et je calcule son Y à partir cette Y est la proba d’être un bon client,donc d'autant mon Y est élevée d'autant je peux m'assurer que c'est un bon client,c'est bien ça?
Merci pour toute vos réponses!
@M.Erice:Est ce que c'est bien ça?:Si j'ai un nouvel individu et je calcule son Y à partir cette Y est la proba d’être un bon client,donc d'autant mon Y est élevée d'autant je peux m'assurer que c'est un bon client,c'est bien ça?
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
statisticienne a écrit:@M.Erice:Est ce que c'est bien ça?:Si j'ai un nouvel individu et je calcule son Y à partir cette Y est la proba d’être un bon client,donc d'autant mon Y est élevée d'autant je peux m'assurer que c'est un bon client,c'est bien ça?
J'imagine que "M.Erice" c'est moi?? La valeur prédite par le modèle sera dans la même unité que celle rentrée pour les calculs. Si vous rentrez Y comme la proba d'être bon, la prédiction sera la proba d'être bon. Si vous rentrez ça comme la proba d'être mauvais, la prédiction sera la proba d'être mauvais.
HTH, Eric (qui est l'orthographe de mon prénom, jusqu'à preuve du contraire).
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Régression logistique
Oh pardon j'ai pas fait attention M.Eric !
J'ai pas bien saisie votre réponse si ma variable est binaire je l'associe la valeur 1 pour bon client et 0 pour mauvais client, et que je fait ma modélisation glm Y=f(X). Alors si j'utilise les coef trouvés dans ce modèle pour un nouvel individu et je calcule son score,ce score sera la proba d’être un bon client?
J'ai pas bien saisie votre réponse si ma variable est binaire je l'associe la valeur 1 pour bon client et 0 pour mauvais client, et que je fait ma modélisation glm Y=f(X). Alors si j'utilise les coef trouvés dans ce modèle pour un nouvel individu et je calcule son score,ce score sera la proba d’être un bon client?
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
Dans ce cas, La variable modélisée est bien la proba d'être un bon client. Non? Le reste de ma réponse précédente reste valide.statisticienne a écrit:si ma variable est binaire je l'associe la valeur 1 pour bon client et 0 pour mauvais client
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Régression logistique
Merci beaucoup.
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
Bonjour,
En lisant encore sur la régression logistique, j'ai de nouvelles questions:
1/mon échantillon contient un Y binaire (0 ou 1) et 5 variables quanti avec 128 observations. Est ce que cet échantillon me permet d'appliquer ma régression ou sa taille ne permet pas?Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
2/Je repose la question,avec mes 5 variables,comment je peux procéder?est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
3/J ai lu que le modèle me donne l'équation:P(1/X)=exp(b0+b1x1..)/(1+exp(b0+b1x1..)).Alors pour trouver la proba qu'un nouvel indiv appartient à 1 je dois calculer cette expression et non pas b0+b1x1...C'est bien ça?
4/Si j'effectue ma régression sous R en introduisant toutes les variables.comment évaluer la qualité du modèle?parce que je ne trouve pas mon R^2 ni la p-value du modèle.
Dsl je suis déébutante,j'ai besoin de votre aide!
Merci d'avance!
En lisant encore sur la régression logistique, j'ai de nouvelles questions:
1/mon échantillon contient un Y binaire (0 ou 1) et 5 variables quanti avec 128 observations. Est ce que cet échantillon me permet d'appliquer ma régression ou sa taille ne permet pas?Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
2/Je repose la question,avec mes 5 variables,comment je peux procéder?est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
3/J ai lu que le modèle me donne l'équation:P(1/X)=exp(b0+b1x1..)/(1+exp(b0+b1x1..)).Alors pour trouver la proba qu'un nouvel indiv appartient à 1 je dois calculer cette expression et non pas b0+b1x1...C'est bien ça?
4/Si j'effectue ma régression sous R en introduisant toutes les variables.comment évaluer la qualité du modèle?parce que je ne trouve pas mon R^2 ni la p-value du modèle.
Dsl je suis déébutante,j'ai besoin de votre aide!
Merci d'avance!
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
La régression logistique n'est juste qu'une régression. Il n'y a pas de phase d'apprentissage et de validation. Presque 130 observations semble largement suffisant pour estimer les paramètres.statisticienne a écrit:1/mon échantillon contient un Y binaire (0 ou 1) et 5 variables quanti avec 128 observations. Est ce que cet échantillon me permet d'appliquer ma régression ou sa taille ne permet pas?Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
Si vous reposez la même question, je donne la même réponse. Vous pouvez toujours faire du backward/forward mais ce n'est pas forcément très utile dans ce cas, avec juste 5 variables explicatives. Ajustez votre modèle sur toutes les variables (au besoin avec des interactions) et testez la significativité de chacune d'elle sur le modèle obtenu. Ca devrait largement suffire.statisticienne a écrit:2/Je repose la question,avec mes 5 variables,comment je peux procéder?est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
Je ne comprends la notation "p(1/X)". Vous dîtes par ailleurs que votre variable à expliquer se nomme "Y". Pas clair. Quoi qu'il en soit, vous êtes dans un espace logit, donc oui vous devez calculer cette expression, mais les logiciels qui ajustent ce genre de modèles font ça pour vous.statisticienne a écrit:3/J ai lu que le modèle me donne l'équation:P(1/X)=exp(b0+b1x1..)/(1+exp(b0+b1x1..)).Alors pour trouver la proba qu'un nouvel indiv appartient à 1 je dois calculer cette expression et non pas b0+b1x1...C'est bien ça?
Oula.. Petite question, mais réponse plus longue.. On va a déjà dit ici que - dans le cadre d'une régression logistique - il n'est pas aisé de se raccrocher à des notions de R^2, etc. Par ailleurs, une p-value n'a jamais montré qu'un modèle était de "bonne qualité". Vous pouvez par exemple avoir une très petite p-value et un modèle totalement pourri. Ca n'a rien à voir. Dans votre cas, ajustez votre modèle, regardez s'il y a de la surdispersion, testez l'effet des régresseurs, et ca sera déjà très très bien.statisticienne a écrit:4/Si j'effectue ma régression sous R en introduisant toutes les variables.comment évaluer la qualité du modèle?parce que je ne trouve pas mon R^2 ni la p-value du modèle.
Vous n'avez pas à être désolée. On a tous été débutants. Cependant, je veux rajouter que ces forums (notamment celui sur lequel nous discutons actuellement), même s'ils sont utiles, ne peuvent replacer un cours sérieusement mené, notamment ici sur la régression logistique. Il existe de nombreux ouvrages bien fait, y compris sur le web. Vous n'arriverez pas à maitriser ces outils uniquement avec des questions posées ici, même si les réponses qui vous sont fournies peuvent au demeurant être pertinentes..statisticienne a écrit:Dsl je suis déébutante,j'ai besoin de votre aide!
HTH, Erc.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Régression logistique
Bonjour,
En fait j'ai lu bcp de documents mais je ne trouve pas des réponses à mes questions parce que je ne trouve pas une application avec une interprétation détaillée.Je trouve de la théorie mais pour mieux comprendre j'ai besoin d'une interprétation pratique et je ne trouve pas une qui explique vraiment bien la sortie des logiciel.Donc si vous en avez une prière de me la indiquer.
Merci beaucoup pour vos réponses et conseils!!!!
En fait j'ai lu bcp de documents mais je ne trouve pas des réponses à mes questions parce que je ne trouve pas une application avec une interprétation détaillée.Je trouve de la théorie mais pour mieux comprendre j'ai besoin d'une interprétation pratique et je ne trouve pas une qui explique vraiment bien la sortie des logiciel.Donc si vous en avez une prière de me la indiquer.
Merci beaucoup pour vos réponses et conseils!!!!
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Re: Régression logistique
Tu veux sans doute dire calibration/validation ie: tu construis le modèle sur un jeu de données et le valide sur un jeu indépendant du premier.Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
Si tu veux faire de la sélection de modèle sur critère d'information, avec 5 variables autant effectivement construire les modèles candidats qui correspondent à des hypothèses claires de lien entre variables explicatives et expliquée. Plus tu arrives à sélectionner les modèles à tester, mieux c'est mais ce n'est pas toujours évident bien sûr notamment si tu es dans un contexte très prospectif sur le sujet d'étude.est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
Je ne sais pas ce que tu as lu mais pour moi, le livre de Hosmer, Lemeshow & Sturdivant (2013) "Applied Logistic Regression" est un "must-have" sur la régression logistique. Il y a des exemples traités dans chacun des cas.
Comme le souligne Eric, tu ne peux t'épargner ce genre de lecture (cours, livres...) car tes questions sont tout de même encore sur la base de la régression logistique.
Pour finir, pense bien à clairement définir ton objectif quand tu utilises les outils stats car entre une étude prospective et une étude à but de modélisation d'un phénomène, tu n'iras dans le même niveau de détail dans l'analyse et donc les données dont tu auras besoin ne seront pas les mêmes en termes de qualité.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Régression logistique
Bonjour.Merci beaucoup!
statisticienne- Nombre de messages : 125
Date d'inscription : 15/06/2014
Sujets similaires
» Régression Logistique vs Régression Linéaire
» régression multiple et régression logistique
» regression logistique
» Régression logistique
» Regression logistique
» régression multiple et régression logistique
» regression logistique
» Régression logistique
» Regression logistique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|