Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Modele logit: question sur le coefficient
2 participants
Page 1 sur 1
Modele logit: question sur le coefficient
Bonjour à tous
J'aurai besoin de votre aide. La variable dépendante (=favorable à voter pour la restriction des armes à feu aux usa) de mon modèle logit est une variable binaire et mon modèle est un modèle à effet fixe. J'ai une question concernant la variable explicative DEMOCRATIC qui est une variable binaire et prend un si le sénateur est democrate et 0 si republicain. J'obtiens une valeur de 2,55 et la moyenne de sénateur républicain dans mon échantillon est 0,5. Est-ce que 2,55 a du sens ici ?
On m'a appris dans la regression OLS que le coefficient devait etre proche de la moyenne ou alors p-e je me trompe
Merci d'avance pr votre aide
Variable Coefficient Std. Error z-Statistic Prob.
SENATE2 0.053786 0.084663 0.635300 0.5252
SENATE3 0.044310 0.088264 0.502010 0.6157
DEMOCRATIC 2.552425 0.102507 24.90001 0.0000
INDEPENDENT 2.511087 0.446665 5.621855 0.0000
AGE 0.010589 0.004283 2.472503 0.0134
MALE -0.551839 0.148530 -3.715336 0.0002
ALASKA 1.290549 0.338307 3.814724 0.0001
ALABAMA 0.395210 0.367659 1.074937 0.2824
ARIZONA 1.283888 0.346613 3.704097 0.0002
ARKANSAS 1.252372 0.356197 3.515952 0.0004
CALIFORNIA 3.924947 0.815944 4.810313 0.0000
COLORADO 1.010751 0.337812 2.992057 0.0028
CONNECTICUT 3.039929 0.528446 5.752587 0.0000
DELAWARE 2.627711 0.401303 6.547955 0.0000
FLORIDA 1.695410 0.360497 4.702984 0.0000
GEORGIA 0.808423 0.358418 2.255532 0.0241
HAWAII 2.755807 0.513041 5.371513 0.0000
IDAHO 0.565199 0.372817 1.516022 0.1295
ILLINOIS 3.228605 0.452642 7.132795 0.0000
INDIANA 2.018947 0.342701 5.891273 0.0000
IOWA 1.577806 0.352424 4.477006 0.0000
KANSAS 0.906879 0.347602 2.608957 0.0091
KENTUCKY 0.874715 0.350949 2.492425 0.0127
LOUISIANA 0.379939 0.368689 1.030514 0.3028
MAINE 2.083806 0.338674 6.152832 0.0000
MARYLAND 2.652679 0.506974 5.232380 0.0000
MASSACHUSETTS 2.295646 0.426457 5.383070 0.0000
MICHIGAN 2.326538 0.393500 5.912418 0.0000
MINNESOTA 1.350181 0.366768 3.681300 0.0002
MISSISSIPPI 1.197246 0.340466 3.516492 0.0004
MISSOURI 1.249029 0.340484 3.668395 0.0002
MONTANA 0.285695 0.344100 0.830267 0.4064
NEBRASKA 0.646548 0.355043 1.821040 0.0686
NEVADA 0.758484 0.360516 2.103884 0.0354
NEWHAMPSHIRE 0.985485 0.345909 2.848972 0.0044
NEWJERSEY 3.232336 0.539096 5.995846 0.0000
NEWMEXICO 1.572551 0.357776 4.395346 0.0000
NEWYORK 2.543678 0.423498 6.006352 0.0000
NORTHCAROLINA 0.574149 0.355879 1.613326 0.1067
NORTHDAKOTA 1.023746 0.360724 2.838031 0.0045
OHIO 2.738856 0.355912 7.695312 0.0000
OKLAHOMA 0.257866 0.375464 0.686793 0.4922
OREGON 1.872740 0.356564 5.252191 0.0000
PENNSYLVANIA 1.475043 0.338018 4.363808 0.0000
RHODEISLAND 3.513362 0.445009 7.895044 0.0000
SOUTHCAROLINA 0.798793 0.364794 2.189713 0.0285
SOUTHDAKOTA 1.248215 0.367547 3.396070 0.0007
TENNESSEE 1.554772 0.338372 4.594859 0.0000
TEXAS 0.576599 0.361985 1.592881 0.1112
UTAH 1.346339 0.338312 3.979580 0.0001
VERMONT 1.428942 0.375336 3.807099 0.0001
VIRGINIA 1.683875 0.356421 4.724403 0.0000
WASHINGTON 1.735853 0.380601 4.560820 0.0000
WESTVIRGINIA 1.789686 0.412438 4.339288 0.0000
WISCONSIN 1.042452 0.359883 2.896641 0.0038
Y1993 0.698883 0.242610 2.880681 0.0040
Y1995 1.400740 0.240133 5.833177 0.0000
Y1996 2.074738 0.206414 10.05134 0.0000
Y1997 0.615634 0.305052 2.018131 0.0436
Y1998 0.499233 0.184654 2.703618 0.0069
Y1999 1.692618 0.175823 9.626811 0.0000
Y2001 0.747901 0.307166 2.434844 0.0149
Y2002 1.414135 0.311338 4.542123 0.0000
Y2004 1.342665 0.206580 6.499504 0.0000
Y2005 1.783184 0.309071 5.769492 0.0000
Y2006 -2.564154 0.371381 -6.904371 0.0000
Y2007 -1.044845 0.231674 -4.509981 0.0000
Y2008 -3.072226 0.414382 -7.413989 0.0000
Y2009 0.147217 0.175076 0.840878 0.4004
Y2010 0.437828 0.225517 1.941441 0.0522
Y2011 0.885032 0.200067 4.423688 0.0000
GCCRATE 1.018885 20.44980 0.049824 0.9603
GRCRATE -3.440354 6.365898 -0.540435 0.5889
C -3.091712 0.419156 -7.376034 0.0000
Mean dependent var 0.580923 S.D. dependent var 0.493447
S.E. of regression 0.370425 Akaike info criterion 0.880449
Sum squared resid 848.6744 Schwarz criterion 0.960156
Log likelihood -2681.364 Hannan-Quinn criter. 0.908070
Restr. log likelihood -4256.071 Avg. log likelihood -0.428401
LR statistic (73 df) 3149.414 McFadden R-squared 0.369991
Probability(LR stat) 0.000000
Obs with Dep=0 2623 Total obs 6259
Obs with Dep=1 3636
J'aurai besoin de votre aide. La variable dépendante (=favorable à voter pour la restriction des armes à feu aux usa) de mon modèle logit est une variable binaire et mon modèle est un modèle à effet fixe. J'ai une question concernant la variable explicative DEMOCRATIC qui est une variable binaire et prend un si le sénateur est democrate et 0 si republicain. J'obtiens une valeur de 2,55 et la moyenne de sénateur républicain dans mon échantillon est 0,5. Est-ce que 2,55 a du sens ici ?
On m'a appris dans la regression OLS que le coefficient devait etre proche de la moyenne ou alors p-e je me trompe
Merci d'avance pr votre aide
Variable Coefficient Std. Error z-Statistic Prob.
SENATE2 0.053786 0.084663 0.635300 0.5252
SENATE3 0.044310 0.088264 0.502010 0.6157
DEMOCRATIC 2.552425 0.102507 24.90001 0.0000
INDEPENDENT 2.511087 0.446665 5.621855 0.0000
AGE 0.010589 0.004283 2.472503 0.0134
MALE -0.551839 0.148530 -3.715336 0.0002
ALASKA 1.290549 0.338307 3.814724 0.0001
ALABAMA 0.395210 0.367659 1.074937 0.2824
ARIZONA 1.283888 0.346613 3.704097 0.0002
ARKANSAS 1.252372 0.356197 3.515952 0.0004
CALIFORNIA 3.924947 0.815944 4.810313 0.0000
COLORADO 1.010751 0.337812 2.992057 0.0028
CONNECTICUT 3.039929 0.528446 5.752587 0.0000
DELAWARE 2.627711 0.401303 6.547955 0.0000
FLORIDA 1.695410 0.360497 4.702984 0.0000
GEORGIA 0.808423 0.358418 2.255532 0.0241
HAWAII 2.755807 0.513041 5.371513 0.0000
IDAHO 0.565199 0.372817 1.516022 0.1295
ILLINOIS 3.228605 0.452642 7.132795 0.0000
INDIANA 2.018947 0.342701 5.891273 0.0000
IOWA 1.577806 0.352424 4.477006 0.0000
KANSAS 0.906879 0.347602 2.608957 0.0091
KENTUCKY 0.874715 0.350949 2.492425 0.0127
LOUISIANA 0.379939 0.368689 1.030514 0.3028
MAINE 2.083806 0.338674 6.152832 0.0000
MARYLAND 2.652679 0.506974 5.232380 0.0000
MASSACHUSETTS 2.295646 0.426457 5.383070 0.0000
MICHIGAN 2.326538 0.393500 5.912418 0.0000
MINNESOTA 1.350181 0.366768 3.681300 0.0002
MISSISSIPPI 1.197246 0.340466 3.516492 0.0004
MISSOURI 1.249029 0.340484 3.668395 0.0002
MONTANA 0.285695 0.344100 0.830267 0.4064
NEBRASKA 0.646548 0.355043 1.821040 0.0686
NEVADA 0.758484 0.360516 2.103884 0.0354
NEWHAMPSHIRE 0.985485 0.345909 2.848972 0.0044
NEWJERSEY 3.232336 0.539096 5.995846 0.0000
NEWMEXICO 1.572551 0.357776 4.395346 0.0000
NEWYORK 2.543678 0.423498 6.006352 0.0000
NORTHCAROLINA 0.574149 0.355879 1.613326 0.1067
NORTHDAKOTA 1.023746 0.360724 2.838031 0.0045
OHIO 2.738856 0.355912 7.695312 0.0000
OKLAHOMA 0.257866 0.375464 0.686793 0.4922
OREGON 1.872740 0.356564 5.252191 0.0000
PENNSYLVANIA 1.475043 0.338018 4.363808 0.0000
RHODEISLAND 3.513362 0.445009 7.895044 0.0000
SOUTHCAROLINA 0.798793 0.364794 2.189713 0.0285
SOUTHDAKOTA 1.248215 0.367547 3.396070 0.0007
TENNESSEE 1.554772 0.338372 4.594859 0.0000
TEXAS 0.576599 0.361985 1.592881 0.1112
UTAH 1.346339 0.338312 3.979580 0.0001
VERMONT 1.428942 0.375336 3.807099 0.0001
VIRGINIA 1.683875 0.356421 4.724403 0.0000
WASHINGTON 1.735853 0.380601 4.560820 0.0000
WESTVIRGINIA 1.789686 0.412438 4.339288 0.0000
WISCONSIN 1.042452 0.359883 2.896641 0.0038
Y1993 0.698883 0.242610 2.880681 0.0040
Y1995 1.400740 0.240133 5.833177 0.0000
Y1996 2.074738 0.206414 10.05134 0.0000
Y1997 0.615634 0.305052 2.018131 0.0436
Y1998 0.499233 0.184654 2.703618 0.0069
Y1999 1.692618 0.175823 9.626811 0.0000
Y2001 0.747901 0.307166 2.434844 0.0149
Y2002 1.414135 0.311338 4.542123 0.0000
Y2004 1.342665 0.206580 6.499504 0.0000
Y2005 1.783184 0.309071 5.769492 0.0000
Y2006 -2.564154 0.371381 -6.904371 0.0000
Y2007 -1.044845 0.231674 -4.509981 0.0000
Y2008 -3.072226 0.414382 -7.413989 0.0000
Y2009 0.147217 0.175076 0.840878 0.4004
Y2010 0.437828 0.225517 1.941441 0.0522
Y2011 0.885032 0.200067 4.423688 0.0000
GCCRATE 1.018885 20.44980 0.049824 0.9603
GRCRATE -3.440354 6.365898 -0.540435 0.5889
C -3.091712 0.419156 -7.376034 0.0000
Mean dependent var 0.580923 S.D. dependent var 0.493447
S.E. of regression 0.370425 Akaike info criterion 0.880449
Sum squared resid 848.6744 Schwarz criterion 0.960156
Log likelihood -2681.364 Hannan-Quinn criter. 0.908070
Restr. log likelihood -4256.071 Avg. log likelihood -0.428401
LR statistic (73 df) 3149.414 McFadden R-squared 0.369991
Probability(LR stat) 0.000000
Obs with Dep=0 2623 Total obs 6259
Obs with Dep=1 3636
josanche- Nombre de messages : 14
Date d'inscription : 21/05/2012
Re: Modele logit: question sur le coefficient
Si le modèle que tu as calculé est bien un modèle logit (régression logistique) le coefficient ne s'interprète pas de la même manière que dans un modèle linéaire classique. Ici il s'agit d'un rapport des chances. C'est à dire qu'un sénateur démocrate à exp(2.55) soit 12.8 fois plus de chance d'être favorable qu'un républicain. Un rapport des chances c'est un quotient entre deux probabilités. Par exemple si un sénateur républicain à une proba de 0.01 d'être favorable et un sénateur démocrate à une proba de 0.03 d'être favorable alors le rapport des chances est de 0.03/0.01 soit 3 fois plus de chance d'être favorable quand on est démocrate / au républicain.
Il faut bien voir aussi que ce rapport des chances n'est valable que si les autres paramètres de ton modèle sont constant (que les sénateurs proviennent du même état, pour la même année, etc...).
Il faut bien voir aussi que ce rapport des chances n'est valable que si les autres paramètres de ton modèle sont constant (que les sénateurs proviennent du même état, pour la même année, etc...).
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modele logit: question sur le coefficient
Bonjour,
Mon modèle logit est le suivant
Propensité à voter favorablement pour la restriction des armes à feu aux USA (1 ou 0) = C + Democrat + Independent + Male + Age + effet fixe des Etats + effets fixe des années.
Vous avez parlé de la constance des paramètres. Que cela signifie clairement? Dans mon set d'observations, un sénateur ne peut provenir que d'un état mais il peut voter une fois ou plus sur différentes années. Example: Obama était sénateur de l'illinois mais il a voté sur plusieurs années car il était sénateur entre 2000 et 2008. Est-ce que Obama doit etre supprimé de mon set de données ou pas ?
Je suis actuellement en train de faire une regression logistique pour faire la comparaison ENTRE les sénateurs ( pour voir comment les sénateurs ont voté sur un meme projet de loi) et dans le futur, je ferai une régression logistique pour faire la comparaison AU SEIN de chaque sénateur et voir comment un meme sénateur a voté sur plusieurs lois. Dans cette comparaison AU SEIN, les effets fixe seront les sénateurs et les année.
Vous avez parlé de rapport de chances dans votre poste. Mais le modèle logit contrairement au modèle classique n'informe pas sur la magnitude, l'effet marginal d'augmenter une variable indépendante d'une unité sur la variable dépendante. Comment obtenir ce chiffre ? Faut-il calculer cet effet marginal pour chaque observation distinctivement ? J'utilise eviews 4 pour les regression logistiques mais j'ai aussi SPSS 17, que je n'utilise pas lol
Merci d'avance
Jorge
Mon modèle logit est le suivant
Propensité à voter favorablement pour la restriction des armes à feu aux USA (1 ou 0) = C + Democrat + Independent + Male + Age + effet fixe des Etats + effets fixe des années.
Vous avez parlé de la constance des paramètres. Que cela signifie clairement? Dans mon set d'observations, un sénateur ne peut provenir que d'un état mais il peut voter une fois ou plus sur différentes années. Example: Obama était sénateur de l'illinois mais il a voté sur plusieurs années car il était sénateur entre 2000 et 2008. Est-ce que Obama doit etre supprimé de mon set de données ou pas ?
Je suis actuellement en train de faire une regression logistique pour faire la comparaison ENTRE les sénateurs ( pour voir comment les sénateurs ont voté sur un meme projet de loi) et dans le futur, je ferai une régression logistique pour faire la comparaison AU SEIN de chaque sénateur et voir comment un meme sénateur a voté sur plusieurs lois. Dans cette comparaison AU SEIN, les effets fixe seront les sénateurs et les année.
Vous avez parlé de rapport de chances dans votre poste. Mais le modèle logit contrairement au modèle classique n'informe pas sur la magnitude, l'effet marginal d'augmenter une variable indépendante d'une unité sur la variable dépendante. Comment obtenir ce chiffre ? Faut-il calculer cet effet marginal pour chaque observation distinctivement ? J'utilise eviews 4 pour les regression logistiques mais j'ai aussi SPSS 17, que je n'utilise pas lol
Merci d'avance
Jorge
josanche- Nombre de messages : 14
Date d'inscription : 21/05/2012
Re: Modele logit: question sur le coefficient
En fait je me suis mal exprimé, ce n'est pas la constance des paramètres mais des autres variables explicatives.
Le 12.8 fois plus de chance d'être favorable si démocrate par rapport à républicain est vrai pour 1 individu démocrate et républicain intérrogé la même année, d'un même état du même sexe et du même age, etc. Voila ce que représente le 12.8 fois plus de chance. Ca ne veut pas dire qu'Obama doit être virer de ton jeu de données. Par contre il risque d'y avoir une interdépendance entre la couleur politique et les états puis qu’effectivement un seul sénateur par état.
Je t'invite à regarder les autres posts de ce forum parlant de la régression logistique. Tu y trouveras des liens vers des documents très biens faits sur cette regression qui te permettront de mieux percevoir à quoi correspondent les différentes sorties de ce modèle: coefficients, etc.
Le 12.8 fois plus de chance d'être favorable si démocrate par rapport à républicain est vrai pour 1 individu démocrate et républicain intérrogé la même année, d'un même état du même sexe et du même age, etc. Voila ce que représente le 12.8 fois plus de chance. Ca ne veut pas dire qu'Obama doit être virer de ton jeu de données. Par contre il risque d'y avoir une interdépendance entre la couleur politique et les états puis qu’effectivement un seul sénateur par état.
C'est une erreur. En effet imagine un modèle qui liera la probabilité d'apparition d'un cancer donnée avec l'âge pris de manière continu. Le paramètre associé à l'age, beta, te permet de dire qu'un patient à l'année N et à l'année N+1 a X fois plus de chance de contracter ce cancer. Ce x fois plus de chance est obtenu en faisant exponentiel beta. De même si tu vois savoir qu'elle est le rapport des chances d'avoir un cancer à N+20 par rapport à N il te suffit de faire exponentiel de 20xbeta.Mais le modèle logit contrairement au modèle classique n'informe pas sur la magnitude, l'effet marginal d'augmenter une variable indépendante d'une unité sur la variable dépendante
Je t'invite à regarder les autres posts de ce forum parlant de la régression logistique. Tu y trouveras des liens vers des documents très biens faits sur cette regression qui te permettront de mieux percevoir à quoi correspondent les différentes sorties de ce modèle: coefficients, etc.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modele logit: question sur le coefficient
Coucou droopy,
Merci quant aux réponses à mes questions mais je vous ai posé cette question en lisant l'article sur ce lien http://www.murraylax.org/bus735/fall2010/logit_print.pdf.
Selon eux dans le modèle classique, coefficient = effet marginal mais dans le modèle logit, ils disent autre chose. Peut etre j'ai mal compris et si vous pouviez me corriger ca serait super mais j'ai vu sur d'autres forum, que les gens qui utilisaient eviews comme moi et faisait une régression logistique, devait à coté calculer les effets marginaux.
Je vais continuer à lire dans le forum des postes sur la regression logistique
Merci quant aux réponses à mes questions mais je vous ai posé cette question en lisant l'article sur ce lien http://www.murraylax.org/bus735/fall2010/logit_print.pdf.
Selon eux dans le modèle classique, coefficient = effet marginal mais dans le modèle logit, ils disent autre chose. Peut etre j'ai mal compris et si vous pouviez me corriger ca serait super mais j'ai vu sur d'autres forum, que les gens qui utilisaient eviews comme moi et faisait une régression logistique, devait à coté calculer les effets marginaux.
Je vais continuer à lire dans le forum des postes sur la regression logistique
josanche- Nombre de messages : 14
Date d'inscription : 21/05/2012
Sujets similaires
» MODELE LOGIT
» Logit multinomial, significativité des coefficients
» biais back transformation logit
» coefficient de corrélation - coefficient de détermination
» Peut-on analyser un questionnaire question par question
» Logit multinomial, significativité des coefficients
» biais back transformation logit
» coefficient de corrélation - coefficient de détermination
» Peut-on analyser un questionnaire question par question
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum