Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
KTC Écran PC Gaming 24″ (1920 x 1080) 100Hz, dalle VA à 67,39
67.39 €
Voir le deal

Significativité coefficients en régression logistique

4 participants

Aller en bas

Significativité coefficients en régression logistique Empty Significativité coefficients en régression logistique

Message par Angelik Mar 3 Aoû 2010 - 15:49

Bonjour,

Je dois interpréter des régressions logistiques réalisées sous SAS par une autre personne et je suis confrontée à un problème dont je ne trouve pas la solution.

Comment se fait-il que plusieurs des coefficients estimés soient significatifs (statistique de Wald) pour certaines modalités de variables alors que les odds ratio correspondants ne le soient pas (valeur 1 comprise dans l'intervalle de confiance) ?
Inversement, comment se fait-il qu'un OR (pour telle modalité d'une variable contre la modalité de référence) soit significatif alors que le test de Wald du coefficient correspondant ne le soit pas ?

je vous remercie pour votre aide.

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par droopy Mer 4 Aoû 2010 - 12:21

Est-ce que tu peux donner des exemples chiffrés ?

A priori c'est impossible puisque le calcul de l'intervalle de l'odd-ratio pour une modalité donné par rapport à la modalité de référence est calculé à partir de l'intervalle calculé pour le paramètre du modèle. Donc si le paramètre est différent de 0 (significatif), 0 ne devrait pas êter compris dans son IC et donc exp(IC(paramètre)) ne devrait pas contenir 1.

Détail un peu plus les résultats qui te sont fournis.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par joyeux_lapin13 Jeu 5 Aoû 2010 - 0:00

Il me semble que quand l'algorithme diverge, selon le logiciel, il y a un calcul d'odd ratio ajusté et d'intervalle de manière plus ou moins indépendante de la valeur de l'estimateur trouvé étant donné qu'elle est supposé totalement biaisé, dés lors il y aurait une possible contradiction entre un test de significativité basé sur cet estimateur et un rapport de cote calculé autrement, surement avec une méthode numérique à part.

Les seules fois ou j'ai vu celà c'était lors de divergence en fait. Ce que je dis reste pur supposition étant donné que je n'ai jamais cherché à savoir le pourquoi du comment vue qu'en cas de divergence il existe ce fabuleux outil qu'est la régression pénalisé; en tout cas si tu es sous SAS il ajuste bien les odd ratio, en fait il fait quelque chose qui lui permet souvent de trouver une solution optimal... dommage que ça fasse tache un rapport SAS avec ecrit en gros "converge criterion non satisfied" ou un truc comme ça.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Angelik Jeu 5 Aoû 2010 - 9:54

Tout d'abord merci beaucoup de vous intéresser à mon cas !!! et merci pour vos réponses.

En ce qui concerne les calculs, il ne semble pas y avoir de problème
pour SAS qui m'indique que mon modèle est bien convergent (voir
l'exemple chiffré ci-dessous) :

État de convergence du modèle :

Convergence criterion (GCONV=1E-8) satisfied.


Statistiques d'ajustement du modèle :

Critère........Coordonnée à l'origine.............Coordonnée à l'origine

...........................uniquement.........................et covariables
AIC................... 48751.028........................... 39749.235
SC.................... 48756.804........................... 39916.718
-2 Log L ............. 48749.028......................... 39691.235


Test de l'hypothèse nulle globale : BETA=0

Test.................................Khi 2..................DF.........Pr > Khi 2
Likelihood Ratio.........9057.7930...........28...........<.0001
Score..............................8047.7781...........28...........<.0001
Wald...............................6393.3127...........28...........<.0001
Analyse des effets Type 3 :

Effet........................DF................Khi 2 de Wald...........Pr > Khi 2
TYPE.........................2................1.1282......................0.5689
STATUT.....................1................8.6676......................0.0032
BEF..........................7................396.5789......................<.0001
SEXE.........................1................706.3759......................<.0001
age2.........................3................173.3098......................<.0001
arg............................1................73.3491......................<.0001
interne.....................1................87.3250......................<.0001
parents.....................1................4.6632......................0.0308
b1ou2v.......................2................192.1331......................<.0001
b4ou5v.......................2................125.7259......................<.0001
ivre...........................2................954.1822......................<.0001
sport........................1................51.2340......................<.0001
disco2.......................2................2904.5966...........<.0001
CONCERT.................1................259.4157......................<.0001
rat.............................1................43.5143......................<.0001

Analyse des estimations de la vraisemblance maximum :

Paramètre..............................DF....Estimation....Erreur std........Khi 2 de Wald....Pr > Khi 2
Intercept................................1.......0.9254........0.0678........186.1588........<.0001
TYPE....Agricole......................1.......0.0544........0.0512........1.1282........0.2882
TYPE....Professionnel..............1.......-0.0270........0.0298........0.8193........0.3654
STATUT....privé.....................1.......0.0651........0.0221........8.6676........0.0032
BEF....Bernay-Pont Audemer...1.......0.2305........0.0446........26.6819........<.0001
BEF....Dieppe Neufchâtel........1.......0.2059........0.0332........38.4236........<.0001
BEF....Elbeuf Rouen Gauche...1.......-0.3787........0.0330........131.6705........<.0001
BEF....Evreux-Verneuil...........1.......0.1236........0.0367........11.3241........0.0008
BEF....Fécamp Lillebonne.......1.......0.2209........0.0370........35.6146........<.0001
BEF....Le Havre......................1.......-0.2817........0.0302........87.0633........<.0001
BEF....Louviers-Vernon..........1.......-0.2974........0.0353........71.0006........<.0001
SEXE....2...............................1.......-0.3643........0.0137........706.3759........<.0001
age2....15/16 ans.................1.......-0.2703........0.0214........159.2669........<.0001
age2....18 ans.......................1.......0.1636........0.0249........43.0936........<.0001
age2....20/21 ans.................1.......0.1519........0.0317........22.9651........<.0001
arg....0..................................1.......-0.1151........0.0134........73.3491........<.0001
interne....1............................1.......0.2124........0.0227........87.3250........<.0001
parents....0...........................1.......0.0779........0.0361........4.6632........0.0308
b1ou2v....0...........................1.......0.3215........0.0509........39.8773........<.0001
b1ou2v....7...........................1.......-0.2568........0.0959........7.1669........0.0074
b4ou5v....0...........................1.......0.6521........0.0587........123.3070........<.0001
b4ou5v....7...........................1.......-0.5158........0.0649........63.2535........<.0001
ivre....0.................................1.......0.8836........0.0391........511.6446........<.0001
ivre....7.................................1.......-0.3343........0.0526........40.4334........<.0001
sport....1................................1.......0.0980........0.0137........51.2340........<.0001
disco2....discoOcc................1.......-0.1605........0.0202........63.1342........<.0001
disco2....discoReg.................1.......0.9294........0.0203........2103.6251....<.0001
CONCERT....1.......................1.......0.2057........0.0128........259.4157........<.0001
rat....1....................................1.......-0.0980........0.0149........43.5143........<.0001




Estimations des rapports de cotes
:

Effet......................................Point Estimate............95% Limites de confiance de Wald
TYPE Agricole vs Général.......................1.085..............0.930.......1.266
TYPE Professionnel vs Général...............1.000..............0.941.......1.064
STATUT privé vs public..........................1.139..............1.044.......1.242
BEF Bernay-Pont Audemer vs Barentin.......1.055..............0.943.......1.181
BEF Dieppe Neufchâtel vs Barentin............1.030..............0.941.......1.127
BEF Elbeuf Rouen Gauche vs Barentin.........0.574..............0.525.......0.627
BEF Evreux-Verneuil vs Barentin...............0.948..............0.863.......1.041
BEF Fécamp Lillebonne vs Barentin............1.045..............0.948.......1.152
BEF Le Havre vs Barentin........................0.632..............0.583.......0.685
BEF Louviers-Vernon vs Barentin...............0.622..............0.567.......0.683
SEXE 2 vs 1........................................0.483..............0.457.......0.509
age2 15/16 ans vs 17 ans.....................0.798..............0.754.......0.846
age2 18 ans vs 17 ans..........................1.232..............1.149.......1.321
age2 20/21 ans vs 17 ans.....................1.218..............1.115.......1.330
arg 0 vs 1..........................................0.794..............0.754.......0.837
interne 1 vs 0.....................................1.529..............1.399.......1.672
parents 0 vs 1....................................1.169..............1.014.......1.346
b1ou2v 0 vs 1....................................1.471..............1.393.......1.555
b1ou2v 7 vs 1.......................................0.825..............0.623.......1.093
b4ou5v 0 vs 1......................................2.200..............1.895.......2.555
b4ou5v 7 vs 1....................................0.684..............0.574.......0.816
ivre 0 vs 1...........................................4.191..............3.827.......4.591
ivre 7 vs 1.........................................1.240..............1.067.......1.441
sport 1 vs 0.......................................1.217..............1.153.......1.284
disco2 discoOcc vs jmsDisco................1.837..............1.728.......1.954
disco2 discoReg vs jmsDisco.................5.464..............5.137.......5.813
CONCERT 1 vs 0................................1.509..............1.435.......1.587
rat 1 vs 0..........................................0.822..............0.776.......0.871

Pour cette régression, certaines proba sont significatives alors que les OR correspondants ne le sont pas. Dans d'autres régression que j'ai à interpréter, il s'agit du cas inverse !

Merci encore de m'aider à y voir clair.

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par droopy Jeu 5 Aoû 2010 - 14:20

l'estimation des odds-ratio est étrange. Prends par exemple BEF....Bernay-Pont Audemer, l'estimation de son paramètre est de 0.2305, et son odd-ratio de 1.055 alors que exp(0.2305) = 1.2592.

Après je ne connais pas SAS donc je ne suis pas à même de te dire d'où provient ce phénomène mais c'est bizarre.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Angelik Jeu 5 Aoû 2010 - 15:01

Effectivement, tu as raison.
Ce calcul avait normalement été vérifié ; preuve que non !
Je vais refaire tourner les programmes et voir ce que ça donne ; je donnerai les résultats, en espérant que tout soit résolu !!!

Merci beaucoup.

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Angelik Ven 6 Aoû 2010 - 15:08

Bon, j'ai fait mes vérifs ! Et bah, je ne suis pas plus avancée !!!

Pour le calcul des OR, tout est OK. SAS calcule par défaut avec l'option "PARAM=EFFECT", soit OR=exp(2*m1+m2+m3+...) où m1 est l'estimateur pour la modalité considérée, m2 l'estimateur de la deuxième modalité, m3 l'estimateur de la troisième modalité, etc. Dans l'exemple que j'ai donné, pour le BEF Bernay, ça donne OR=exp(2*0.2305+0.2050+(-0.3787)+0.1236+0.2209+(-0.2817)+(-0.2974)=exp(0.0536)=1.055

Maintenant, j'ai toujours le problème de "correspondance des significativités" entre les OR et les estimateurs !

Dans mon programme, j'ai utilisé une pondération. J'ai donc essayé sans mais je retrouve également ce problème mais pas forcément pour les mêmes VA. Par exemple, j'ai un estimateur significatif pour le BEF de Fécamp tandis que l'OR ne l'est pas, mais j'ai également le cas inverse : j'ai un estimateur non-significatif pour la modalité "0" de la VA b1ou2v alors que l'OR l'est !!!

J'ai cherché dans l'aide de SAS (en anglais évidemment) et j'ai trouvé qu'on pouvait utiliser l'option NORMALIZE avec la commande WEIGHT (pondération), citation de l'aide de SAS :

"WEIGHT StatementThe following option can be added to the WEIGHT statement after a slash (/).


NORMALIZE

NORM

causes the weights
specified by the WEIGHT variable to be normalized so that they add up to the
actual sample size. With this option, the estimated covariance matrix of the
parameter estimators is invariant to the scale of the WEIGHT variable.
"

Décidément, il faut que je me mette à l'anglais ! Malgré tout, j'ai essayé mon programme avec cette option. Je retrouve une fois encore les mêmes problèmes que ceux cités ci-dessus mais pas avec les mêmes variables et/ou modalités.

Là, j'ai plus d'idées !!!

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Angelik Mar 10 Aoû 2010 - 15:05

Ça y est, j'ai trouvé la solution !
Il suffisait d'ajouter l'option PARAM=REF dans l'instruction CLASS de la PROC LOGISTIC de SAS.
Car par défaut, SAS n'utilise pas les mêmes paramétrages pour les calculs des coefficients estimés et des OR !!!
Voici l'extrait du document que j'ai trouvé où il est question de cela (attention, il a été traduit de l'anglais au français par mes soins (!!!)
à l'aide du traducteur en ligne Reverso donc c'est pas forcément extra) :


«
L'exponentielle du coefficient estimé est différent de l'OR !!!
C'est parce que, par défaut, SAS utilise ce que l'on appelle"codage d'effet" (effect coding) pour le calcul des coefficients estimés tandis que nous sommes plus familiers avec le "codage de cellule de référence (reference cell coding).
Cependant, pour le calcul des OR estimés, SAS utilise toujours le "codage de cellule de référence".
Avec le codage de cellule de référence, chaque paramètre représente la différence entre le niveau donné et le niveau de référence tandis qu'avec le "codage d'effet", chaque paramètre représente la différence entre le niveau donné et "la réponse moyenne".
Vous pouvez demander à SAS d'utiliser le "codage de cellule de référence" en spécifiant l'option param=ref dans l'instruction CLASS.
»

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par droopy Mar 10 Aoû 2010 - 15:15

cool tu ne devrais plus avoir de soucis alors.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Angelik Mar 10 Aoû 2010 - 22:01

yeahhhhhhhhh !!! Je suis sauvée.
<merci de m'avoir aiguillé et aidé à résoudre mon problème.

Angelik

Nombre de messages : 6
Date d'inscription : 03/08/2010

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Mugabo Mar 31 Mai 2011 - 9:30

Bonjour ,
je viens de suivre votre conversation .. je susi content que Agelik a resolu son probleme.. amis moi aussi j'ai un souci:Je suis entrain de travailler sur un modele logistique mais la convergence n'est pas satisfaite, comme raison:Séparation quasi-complète des points de données détectée.

Si quelqu'un pouvait m'aider je vous remercie

Mugabo.

Mugabo

Nombre de messages : 2
Date d'inscription : 31/05/2011

Revenir en haut Aller en bas

Significativité coefficients en régression logistique Empty Re: Significativité coefficients en régression logistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum