Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
zezima
 
Nik
 
margotte185
 
c@ssoulet
 
Coco
 
Ayana
 


Comparaison de deux scores via une regression logistique

Voir le sujet précédent Voir le sujet suivant Aller en bas

Comparaison de deux scores via une regression logistique

Message par Fkib le Mar 17 Avr 2012 - 14:31

Salut,

Voila, je cherche à comparer deux scores DS ( ici Y) et GIR (ici X) (renseignant sur le degré de dépendance pour les personnes âgés). Tout deux sont des variables catégorielles et ordonnées.
J'ai donc réalisé une régression logistique polytomique ordinale (LOGITS CUMMULATIFS) sous SAS.
Cela dit, SAS me renvoie un warning:

The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.

Cela veut t'il dire que Y sépare presque parfaitement les valeurs de X ? Et qu'on parle bien de séparation quasi-complete ou complete ?

Comment dévier ce problème afin d'ajuster un modèle de régression validé et fiable?

J'ai entendu parler aussi de méthode EXACT ou de méthode dite FIRTH ? Sont elles applicables dans ce cas ?
Vous remerciant pour votre aide.

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Nik le Mar 17 Avr 2012 - 15:00

Cela veut t'il dire que Y sépare presque parfaitement les valeurs de X ? Et qu'on parle bien de séparation quasi-complete ou complete ?
je n'utilise pas SAS mais je ne vois ce qui dans le mesage d'erreur te fait penser ça. On dirait plutôt que la convergence de l'algo du maximum de vraisemblance n'est pas atteinte (pas assez d'itération ?) et que du coup rien n'est sûr sur le fait que tu aies bien une estimation au maximum de vraisemblance.

Nik

Nombre de messages : 1550
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mar 17 Avr 2012 - 15:21

Merci pour ta réponse.
L'estimation au maximum de vraisemblance ne converge pas! Comment palier à ce problème, sachant que je n'ai qu'une variable explicative (les deux scores sont fortement corrélés) et que la taille de mon échantillon est petite?

Merci,

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Nik le Mar 17 Avr 2012 - 15:53

si tu as peu de données alors as de miracle possible. Les stats se basent sur le nombre valeur donc il en faut un maximum.

Nik

Nombre de messages : 1550
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mar 17 Avr 2012 - 15:59

Une solution quand même serait de binariser ta variable dépendante à partir d'une valeur seuil (trouvée dans la littérature si possible) et de faire un modèle logistique simple. En effet, le problème est peut-être que tu as trop de modalités de ta VD par rapport à ton effectif. Certes, tu perdras de l'info en binarisant mais c'est une alternative. la règle en régression logistique : pour ajuster sur une covariable il faut au moins 10 événements (ie au moins 10 sujets ayant 1 comme valeur de la variable dépendante)
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mar 17 Avr 2012 - 16:22

Je ne vois pas comment le faire!!?. Ma variable dépendante à 6 modalités.

Merci pour ta réponse

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mar 17 Avr 2012 - 16:29

Par exemple, si ta variable est codée de 0 (complètement autonome) à 5 (complètement dépendant), n'as tu pas moyen de recoder ça en une variable binaire (dépendant: oui/non).
Un exemple concret c'est la corpulence: on a en général 6 classes selon les imc :
o 16,5 à 18,5 : maigreur 1
o 18,5 à 25 : corpulence normale 2
o 25 à 30 : surpoids 3
o 30 à 35 : obésité modérée 4
o 35 à 40 : obésité sévère 5
o plus de 40 : obésité morbide ou massive 6
mais pour les analyses stats, on crée souvent la variable obésité:oui/non en regroupant respectivement les classes (4-5-6 et 1-2-3).
On perd de la précision dans l'information, mais ça limite les problèmes de convergence du modèle
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mar 17 Avr 2012 - 16:38

Aussi, considres tu 10 sujets pour chaque couple de valeurs (VD,VE) ou alors 10 sujets pour une valeur de la VD indépendamment des valeurs de la VE.

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mar 17 Avr 2012 - 16:55

Quand on fait une régression logistique multivariée, c'est 10 événements par covariable de manière globale, avec comme seule condition quand même que toutes les combinaisons VD-VE existent si la VE est qualitative.
Par exemble si la VD est l'hypertension (0/1) et la VE le statut tabagique (non fumeur- fumeur occasionnel- gros fumeur- très gros fumeur), il faut que dans chaque catégorie de la variable statut tabagique, il y ait des hypertendus et des non-hypertendus, sinon l'association tabac/hypertension ne pourra pas être estimée.

La largeur de tes intervalles de confiance te dira de toute façon très vite si ton modèle est acceptable ou non
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par joyeux_lapin13 le Mar 17 Avr 2012 - 17:44

Bonjour, à titre informatif, les raisons de la divergence de ton modèle sont indiquées dans la table Model Convergence ou un truc du genre.

Toujours à titre culturelle sur SAS et les régressions logistiques, soit SAS n'estime pas le modèle car il n'a pas assez d'itérations pour faire converger l'algorithme de Newton-Raphson (cf la page d'aide de SAS / proc LOGISTIC pour voir comment paramétrer le nombre d'itérations) soit il n'arrive pas à inverser la matrice des dérivées secondes des betas car la diagonale de cette dernière contient un excés de 0 (ce qui arrive très souvent quand on fait de la régression logistique sur données qualitatives et non continues), dans le second cas SAS applique la régression logistique pénalisée qui consiste à remplacer les 0 par un paramètre lambda optimale déterminé par LOOCV.
avatar
joyeux_lapin13

Nombre de messages : 1881
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 12:02

Merci pour vos réponses.
J'ai essayé hier la régression logistique pénalisée, elle me renvoie le même message warning.

Mais après avoir binarisé ma VD, cette regression logistique pénalisée fonctionne plutot bien. Cela dit, quand je veux rajouter l'option selection=backward, SAS semble pas apprécier l'utilisation de selection et de firth en même temps.


Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mer 18 Avr 2012 - 12:11

Pourquoi utilises-tu une procédure de sélection de variables alors que tu n'as qu'une seule VE?
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 12:45

J'avais essayer d'inclure d'autres VE comme age, sexe et type de filière active. Juste pour voir si en laissant VD polytomique et en ajoutant des VD, la reg logistique pénalisée fonctionnait ou pas?

Penses-tu que les résultats de la reg logistique binaire qui semblent significatifs sont exploitables ou devrais-je agrandir la taille de mon echantillon ?

Merci et excuses pour la confusion

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mer 18 Avr 2012 - 12:51

Il faudrait que tu nous donnes tes effectifs et les estimations et intervalles de confiance que tu obtiens, voir si cela paraît cohérent.
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 13:06

-Effectifs:

Valeur ordonée DS_binaire Fréquence totale

1------------------------ 0---------------- 23
2------------------------ 1------------------74

-----------------------------------------------------------------------------
Estimations par l'analyse du maximum de Vaisemblance
Paramètre DDL Val estimée Erreur Khi-2 Pr > Khi-2

Intercept 1 1.9203 0.4632 17.1899 <.0001
score_GIR 1 1 1.5136 1.2971 1.3616 0.2433
score_GIR 2 1 1.9299 1.2789 2.2773 0.1313
score_GIR 3 1 1.0242 1.3319 0.5913 0.4419
score_GIR 4 1 -1.2737 0.6415 3.9420 0.0471
score_GIR 5 1 -0.8217 0.7808 1.1076 0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet Val estimée IC de Wald à 95 %

score_GIR 1 vs 6 48.709 2.393 991.515
score_GIR 2 vs 6 73.865 3.796 >999.999
score_GIR 3 vs 6 29.860 1.346 662.630
score_GIR 4 vs 6 3.000 0.797 11.292
score_GIR 5 vs 6 4.714 0.859 25.867
-----------------------------------------------------------------------------------------

Merci,

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 13:15

Estimations par l'analyse du maximum de Vaisemblance
Paramètre-- DDL --Val estimée- Erreur-- Khi-2 ------Pr > Khi-2

Intercept -- 1 -- 1.9203 --------0.4632 --17.1899 --<.0001
score_GIR 1 1 -- 1.5136 --------1.2971 --1.3616 ---0.2433
score_GIR 2 1-- 1.9299 --------1.2789 --2.2773 ---0.1313
score_GIR 3 1-- 1.0242 --------1.3319 --0.5913 ---0.4419
score_GIR 4 1 -- -1.2737 --------0.6415 --3.9420 ---0.0471
score_GIR 5 1 -- -0.8217 -------0.7808 --1.1076 ---0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet-------- ----------Val estimée-------- IC de Wald à 95 %

score_GIR 1 vs 6 ---48.709 ----------2.393--- 991.515
score_GIR 2 vs 6 ---73.865-----------3.796---- >999.999
score_GIR 3 vs 6--- 29.860-----------1.346----- 662.630
score_GIR 4 vs 6 ---3.000------------ 0.797 ----11.292
score_GIR 5 vs 6--- 4.714------------ 0.859 ----25.867

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Ayana le Mer 18 Avr 2012 - 14:04

SAS ne t'a pas donné la p-value globale de ta variable score_GIR? Car c'est ça le plus important à regarder dans un premier temps...
Ensuite, je pense que malheureusement tu as trop de modalités par rapport à ton effectif, car tes IC sont immenses... [2.4;991.2]
avatar
Ayana

Nombre de messages : 458
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 14:33

Effet---------DDL--- Khi-2---- Pr > Khi-2

score_GIR--5---------17.9921----0.0030

La p-value est inférieure à 0.05, elle n'a donc pas d'effet sur le modèle !!?


Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Fkib le Mer 18 Avr 2012 - 15:38

Pardon, je voulais dire test significatif. Il y'a bien un effet de la VE.

Fkib

Nombre de messages : 10
Date d'inscription : 17/04/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Comparaison de deux scores via une regression logistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum