Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
niaboc
 
c@ssoulet
 
vae
 
Catz
 
cicino
 
Anny_Nina
 


Régression logistique

Voir le sujet précédent Voir le sujet suivant Aller en bas

Régression logistique

Message par statisticienne le Lun 18 Avr 2016 - 16:33

Bonjour,
Je désire effectuer une régression logistique d'une variable binomiale en fonction de 5 variables quantitatives.Alors pourriez vous m'indiquer les étapes par lesquelles je dois passer.En fait j'ai pas compris est ce qu'on doit commencer par générer le modèle générale,le modèle de backward ou forward?et quel modèle choisir?Et puis si j'ai enfin mon modèle y=f(x),alors si pour un nouvel individu je calcul mon y à partir de ce modèle,comment je peux interpréter,c'est à sire comment je peux savoir par exemple est ce que c'est un bon ou mauvais client?
Merci d'avance!

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par StatStatS le Lun 18 Avr 2016 - 17:01

Bonjour, pour comparer des modèles avec un nombre de variables différentes, il faut s'intéresser au coefficient de détermination ajusté de chacun des modèles.
Le choix du modèle se fait en connaissant le contexte.
Pour votre nouvel individu, regardez le résidu associé. Est il important, positif, négatif?

StatStatS

Nombre de messages : 11
Date d'inscription : 17/04/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Nik le Mar 19 Avr 2016 - 8:07

il faut s'intéresser au coefficient de détermination ajusté de chacun des modèles
Pour une régression logistique ? La fonction de lien n'étant pas un lien identité, je vois mal comment on pourrait interpréter la somme des carrés des écarts (que le R² soit ajusté ou non).

@statisticienne
Pour poser un cadre, j'évoque ci-dessous ce qui est valable pour une sélection de modèle basée sur un critère d'information (AIC, BIC...) car la sélection de modèle sur p-value est d'après ce que j'en ai lu, très foireuse.
Il n'y a pas de règle précise quant au modèle complet (celui incluant tous les paramètres). Il faut que ce modèle soit plausible et sensé quant à tes hypothèses. A partir de là le processus de sélection aura une base correcte. Sur le choix backward/forward/ou les deux, idem pas de règle d'or. Pour ma part, je suis toujours parti sur du backward car je trouvais plus sensé d'avoir le modèle le plus complexe et d'essayer de le simplifier d'après l'information fournie par les données.
Tu as toujours la possibilité de faire du model averaging si tu n'arrives pas à trancher et notamment si tes modèles sont séparés par 2 unités ou moins sur ton critère de sélection (AIC...)

Pour le bon/mauvais client, je ne suis pas sûr de ce que tu entends par là...est-ce que le fait de s'écarter d'un modèle basé sur la moyenne est un bon critère d'évaluation du client ? Pour rappel, tous les modèles sont faux Smile

Nik

Nombre de messages : 1551
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Eric Wajnberg le Mar 19 Avr 2016 - 8:35

avec seulement 5 variables quantitatives comme variables indépendantes, y a t'il vraiment besoin de faire du backward/forward? Il ne devrait pas être bien compliqué de voir quelles sont les variables qui ont un effet ou non, et savoir si leur ajout/retrait modifierait quelque chose.

J'imagine que bon/mauvais client renvoi simplement à la variable binomiale d’intérêt (effectivement, c'est pas clairement expliqué..). Si c'est le cas, le modèle prédira la proba qu'un nouveau client soit bon ou mauvais.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Mer 20 Avr 2016 - 7:57

Bonjour,
Merci pour toute vos réponses!
@M.Erice:Est ce que c'est bien ça?:Si j'ai un nouvel individu et je calcule son Y à partir cette Y est la proba d’être un bon client,donc d'autant mon Y est élevée d'autant je peux m'assurer que c'est un bon client,c'est bien ça?

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Eric Wajnberg le Mer 20 Avr 2016 - 9:56

statisticienne a écrit:@M.Erice:Est ce que c'est bien ça?:Si j'ai un nouvel individu et je calcule son Y à partir cette Y est la proba d’être un bon client,donc d'autant mon Y est élevée d'autant je peux m'assurer que c'est un bon client,c'est bien ça?

J'imagine que "M.Erice" c'est moi?? La valeur prédite par le modèle sera dans la même unité que celle rentrée pour les calculs. Si vous rentrez Y comme la proba d'être bon, la prédiction sera la proba d'être bon. Si vous rentrez ça comme la proba d'être mauvais, la prédiction sera la proba d'être mauvais.

HTH, Eric (qui est l'orthographe de mon prénom, jusqu'à preuve du contraire).
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Mer 20 Avr 2016 - 11:14

Oh pardon j'ai pas fait attention M.Eric Crying or Very sad !
J'ai pas bien saisie votre réponse Sad si ma variable est binaire je l'associe la valeur 1 pour bon client et 0 pour mauvais client, et que je fait ma modélisation glm Y=f(X). Alors si j'utilise les coef trouvés dans ce modèle pour un nouvel individu et je calcule son score,ce score sera la proba d’être un bon client?

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Eric Wajnberg le Mer 20 Avr 2016 - 11:36

statisticienne a écrit:si ma variable est binaire je l'associe la valeur 1 pour bon client et 0 pour mauvais client
Dans ce cas, La variable modélisée est bien la proba d'être un bon client. Non? Le reste de ma réponse précédente reste valide.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Mer 20 Avr 2016 - 12:54

Merci beaucoup.

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Jeu 21 Avr 2016 - 14:29

Bonjour,
En lisant encore sur la régression logistique, j'ai de nouvelles questions:
1/mon échantillon contient un Y binaire (0 ou 1) et 5 variables quanti avec 128 observations. Est ce que cet échantillon me permet d'appliquer ma régression ou sa taille ne permet pas?Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
2/Je repose la question,avec mes 5 variables,comment je peux procéder?est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
3/J ai lu que le modèle me donne l'équation:P(1/X)=exp(b0+b1x1..)/(1+exp(b0+b1x1..)).Alors pour trouver la proba qu'un nouvel indiv appartient à 1 je dois calculer cette expression et non pas b0+b1x1...C'est bien ça?
4/Si j'effectue ma régression sous R en introduisant toutes les variables.comment évaluer la qualité du modèle?parce que je ne trouve pas mon R^2 ni la p-value du modèle.
Dsl je suis déébutante,j'ai besoin de votre aide!
Merci d'avance!

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Eric Wajnberg le Ven 22 Avr 2016 - 6:05

statisticienne a écrit:1/mon échantillon contient un Y binaire (0 ou 1) et 5 variables quanti avec 128 observations. Est ce que cet échantillon me permet d'appliquer ma régression ou sa taille ne permet pas?Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
La régression logistique n'est juste qu'une régression. Il n'y a pas de phase d'apprentissage et de validation. Presque 130 observations semble largement suffisant pour estimer les paramètres.
statisticienne a écrit:2/Je repose la question,avec mes 5 variables,comment je peux procéder?est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
Si vous reposez la même question, je donne la même réponse. Vous pouvez toujours faire du backward/forward mais ce n'est pas forcément très utile dans ce cas, avec juste 5 variables explicatives. Ajustez votre modèle sur toutes les variables (au besoin avec des interactions) et testez la significativité de chacune d'elle sur le modèle obtenu. Ca devrait largement suffire.
statisticienne a écrit:3/J ai lu que le modèle me donne l'équation:P(1/X)=exp(b0+b1x1..)/(1+exp(b0+b1x1..)).Alors pour trouver la proba qu'un nouvel indiv appartient à 1 je dois calculer cette expression et non pas b0+b1x1...C'est bien ça?
Je ne comprends la notation "p(1/X)". Vous dîtes par ailleurs que votre variable à expliquer se nomme "Y". Pas clair. Quoi qu'il en soit, vous êtes dans un espace logit, donc oui vous devez calculer cette expression, mais les logiciels qui ajustent ce genre de modèles font ça pour vous.
statisticienne a écrit:4/Si j'effectue ma régression sous R en introduisant toutes les variables.comment évaluer la qualité du modèle?parce que je ne trouve pas mon R^2 ni la p-value du modèle.
Oula.. Petite question, mais réponse plus longue.. On va a déjà dit ici que - dans le cadre d'une régression logistique - il n'est pas aisé de se raccrocher à des notions de R^2, etc. Par ailleurs, une p-value n'a jamais montré qu'un modèle était de "bonne qualité". Vous pouvez par exemple avoir une très petite p-value et un modèle totalement pourri. Ca n'a rien à voir. Dans votre cas, ajustez votre modèle, regardez s'il y a de la surdispersion, testez l'effet des régresseurs, et ca sera déjà très très bien.
statisticienne a écrit:Dsl je suis déébutante,j'ai besoin de votre aide!
Vous n'avez pas à être désolée. On a tous été débutants. Cependant, je veux rajouter que ces forums (notamment celui sur lequel nous discutons actuellement), même s'ils sont utiles, ne peuvent replacer un cours sérieusement mené, notamment ici sur la régression logistique. Il existe de nombreux ouvrages bien fait, y compris sur le web. Vous n'arriverez pas à maitriser ces outils uniquement avec des questions posées ici, même si les réponses qui vous sont fournies peuvent au demeurant être pertinentes..

HTH, Erc.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Ven 22 Avr 2016 - 6:17

Bonjour,
En fait j'ai lu bcp de documents mais je ne trouve pas des réponses à mes questions parce que je ne trouve pas une application avec une interprétation détaillée.Je trouve de la théorie mais pour mieux comprendre j'ai besoin d'une interprétation pratique et je ne trouve pas une qui explique vraiment bien la sortie des logiciel.Donc si vous en avez une prière de me la indiquer.
Merci beaucoup pour vos réponses et conseils!!!!

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Nik le Ven 22 Avr 2016 - 6:45

Parce que à ce que j'ai compris je dois encore diviser ma base en 2 éch: d'apprentissage et de validation
Tu veux sans doute dire calibration/validation ie: tu construis le modèle sur un jeu de données et le valide sur un jeu indépendant du premier.

est ce que j'applique le modèle sur toutes les variables sans utiliser la sélection par stepwise,backword ou forward
Si tu veux faire de la sélection de modèle sur critère d'information, avec 5 variables autant effectivement construire les modèles candidats qui correspondent à des hypothèses claires de lien entre variables explicatives et expliquée. Plus tu arrives à sélectionner les modèles à tester, mieux c'est mais ce n'est pas toujours évident bien sûr notamment si tu es dans un contexte très prospectif sur le sujet d'étude.

Je ne sais pas ce que tu as lu mais pour moi, le livre de Hosmer, Lemeshow & Sturdivant (2013) "Applied Logistic Regression" est un "must-have" sur la régression logistique. Il y a des exemples traités dans chacun des cas.

Comme le souligne Eric, tu ne peux t'épargner ce genre de lecture (cours, livres...) car tes questions sont tout de même encore sur la base de la régression logistique.

Pour finir, pense bien à clairement définir ton objectif quand tu utilises les outils stats car entre une étude prospective et une étude à but de modélisation d'un phénomène, tu n'iras dans le même niveau de détail dans l'analyse et donc les données dont tu auras besoin ne seront pas les mêmes en termes de qualité.

Nik



Nik

Nombre de messages : 1551
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par statisticienne le Ven 22 Avr 2016 - 7:45

Bonjour.Merci beaucoup!

statisticienne

Nombre de messages : 125
Date d'inscription : 15/06/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression logistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum