Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Comparaison de deux scores via une regression logistique
4 participants
Page 1 sur 1
Comparaison de deux scores via une regression logistique
Salut,
Voila, je cherche à comparer deux scores DS ( ici Y) et GIR (ici X) (renseignant sur le degré de dépendance pour les personnes âgés). Tout deux sont des variables catégorielles et ordonnées.
J'ai donc réalisé une régression logistique polytomique ordinale (LOGITS CUMMULATIFS) sous SAS.
Cela dit, SAS me renvoie un warning:
The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.
Cela veut t'il dire que Y sépare presque parfaitement les valeurs de X ? Et qu'on parle bien de séparation quasi-complete ou complete ?
Comment dévier ce problème afin d'ajuster un modèle de régression validé et fiable?
J'ai entendu parler aussi de méthode EXACT ou de méthode dite FIRTH ? Sont elles applicables dans ce cas ?
Vous remerciant pour votre aide.
Voila, je cherche à comparer deux scores DS ( ici Y) et GIR (ici X) (renseignant sur le degré de dépendance pour les personnes âgés). Tout deux sont des variables catégorielles et ordonnées.
J'ai donc réalisé une régression logistique polytomique ordinale (LOGITS CUMMULATIFS) sous SAS.
Cela dit, SAS me renvoie un warning:
The LOGISTIC procedure continues in spite of the above warning. Results shown are based on the last maximum likelihood iteration. Validity of the model fit is questionable.
Cela veut t'il dire que Y sépare presque parfaitement les valeurs de X ? Et qu'on parle bien de séparation quasi-complete ou complete ?
Comment dévier ce problème afin d'ajuster un modèle de régression validé et fiable?
J'ai entendu parler aussi de méthode EXACT ou de méthode dite FIRTH ? Sont elles applicables dans ce cas ?
Vous remerciant pour votre aide.
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
je n'utilise pas SAS mais je ne vois ce qui dans le mesage d'erreur te fait penser ça. On dirait plutôt que la convergence de l'algo du maximum de vraisemblance n'est pas atteinte (pas assez d'itération ?) et que du coup rien n'est sûr sur le fait que tu aies bien une estimation au maximum de vraisemblance.Cela veut t'il dire que Y sépare presque parfaitement les valeurs de X ? Et qu'on parle bien de séparation quasi-complete ou complete ?
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Comparaison de deux scores via une regression logistique
Merci pour ta réponse.
L'estimation au maximum de vraisemblance ne converge pas! Comment palier à ce problème, sachant que je n'ai qu'une variable explicative (les deux scores sont fortement corrélés) et que la taille de mon échantillon est petite?
Merci,
L'estimation au maximum de vraisemblance ne converge pas! Comment palier à ce problème, sachant que je n'ai qu'une variable explicative (les deux scores sont fortement corrélés) et que la taille de mon échantillon est petite?
Merci,
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
si tu as peu de données alors as de miracle possible. Les stats se basent sur le nombre valeur donc il en faut un maximum.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Comparaison de deux scores via une regression logistique
Une solution quand même serait de binariser ta variable dépendante à partir d'une valeur seuil (trouvée dans la littérature si possible) et de faire un modèle logistique simple. En effet, le problème est peut-être que tu as trop de modalités de ta VD par rapport à ton effectif. Certes, tu perdras de l'info en binarisant mais c'est une alternative. la règle en régression logistique : pour ajuster sur une covariable il faut au moins 10 événements (ie au moins 10 sujets ayant 1 comme valeur de la variable dépendante)
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
Je ne vois pas comment le faire!!?. Ma variable dépendante à 6 modalités.
Merci pour ta réponse
Merci pour ta réponse
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Par exemple, si ta variable est codée de 0 (complètement autonome) à 5 (complètement dépendant), n'as tu pas moyen de recoder ça en une variable binaire (dépendant: oui/non).
Un exemple concret c'est la corpulence: on a en général 6 classes selon les imc :
o 16,5 à 18,5 : maigreur 1
o 18,5 à 25 : corpulence normale 2
o 25 à 30 : surpoids 3
o 30 à 35 : obésité modérée 4
o 35 à 40 : obésité sévère 5
o plus de 40 : obésité morbide ou massive 6
mais pour les analyses stats, on crée souvent la variable obésité:oui/non en regroupant respectivement les classes (4-5-6 et 1-2-3).
On perd de la précision dans l'information, mais ça limite les problèmes de convergence du modèle
Un exemple concret c'est la corpulence: on a en général 6 classes selon les imc :
o 16,5 à 18,5 : maigreur 1
o 18,5 à 25 : corpulence normale 2
o 25 à 30 : surpoids 3
o 30 à 35 : obésité modérée 4
o 35 à 40 : obésité sévère 5
o plus de 40 : obésité morbide ou massive 6
mais pour les analyses stats, on crée souvent la variable obésité:oui/non en regroupant respectivement les classes (4-5-6 et 1-2-3).
On perd de la précision dans l'information, mais ça limite les problèmes de convergence du modèle
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
Aussi, considres tu 10 sujets pour chaque couple de valeurs (VD,VE) ou alors 10 sujets pour une valeur de la VD indépendamment des valeurs de la VE.
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Quand on fait une régression logistique multivariée, c'est 10 événements par covariable de manière globale, avec comme seule condition quand même que toutes les combinaisons VD-VE existent si la VE est qualitative.
Par exemble si la VD est l'hypertension (0/1) et la VE le statut tabagique (non fumeur- fumeur occasionnel- gros fumeur- très gros fumeur), il faut que dans chaque catégorie de la variable statut tabagique, il y ait des hypertendus et des non-hypertendus, sinon l'association tabac/hypertension ne pourra pas être estimée.
La largeur de tes intervalles de confiance te dira de toute façon très vite si ton modèle est acceptable ou non
Par exemble si la VD est l'hypertension (0/1) et la VE le statut tabagique (non fumeur- fumeur occasionnel- gros fumeur- très gros fumeur), il faut que dans chaque catégorie de la variable statut tabagique, il y ait des hypertendus et des non-hypertendus, sinon l'association tabac/hypertension ne pourra pas être estimée.
La largeur de tes intervalles de confiance te dira de toute façon très vite si ton modèle est acceptable ou non
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
Bonjour, à titre informatif, les raisons de la divergence de ton modèle sont indiquées dans la table Model Convergence ou un truc du genre.
Toujours à titre culturelle sur SAS et les régressions logistiques, soit SAS n'estime pas le modèle car il n'a pas assez d'itérations pour faire converger l'algorithme de Newton-Raphson (cf la page d'aide de SAS / proc LOGISTIC pour voir comment paramétrer le nombre d'itérations) soit il n'arrive pas à inverser la matrice des dérivées secondes des betas car la diagonale de cette dernière contient un excés de 0 (ce qui arrive très souvent quand on fait de la régression logistique sur données qualitatives et non continues), dans le second cas SAS applique la régression logistique pénalisée qui consiste à remplacer les 0 par un paramètre lambda optimale déterminé par LOOCV.
Toujours à titre culturelle sur SAS et les régressions logistiques, soit SAS n'estime pas le modèle car il n'a pas assez d'itérations pour faire converger l'algorithme de Newton-Raphson (cf la page d'aide de SAS / proc LOGISTIC pour voir comment paramétrer le nombre d'itérations) soit il n'arrive pas à inverser la matrice des dérivées secondes des betas car la diagonale de cette dernière contient un excés de 0 (ce qui arrive très souvent quand on fait de la régression logistique sur données qualitatives et non continues), dans le second cas SAS applique la régression logistique pénalisée qui consiste à remplacer les 0 par un paramètre lambda optimale déterminé par LOOCV.
Re: Comparaison de deux scores via une regression logistique
Merci pour vos réponses.
J'ai essayé hier la régression logistique pénalisée, elle me renvoie le même message warning.
Mais après avoir binarisé ma VD, cette regression logistique pénalisée fonctionne plutot bien. Cela dit, quand je veux rajouter l'option selection=backward, SAS semble pas apprécier l'utilisation de selection et de firth en même temps.
J'ai essayé hier la régression logistique pénalisée, elle me renvoie le même message warning.
Mais après avoir binarisé ma VD, cette regression logistique pénalisée fonctionne plutot bien. Cela dit, quand je veux rajouter l'option selection=backward, SAS semble pas apprécier l'utilisation de selection et de firth en même temps.
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Pourquoi utilises-tu une procédure de sélection de variables alors que tu n'as qu'une seule VE?
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
J'avais essayer d'inclure d'autres VE comme age, sexe et type de filière active. Juste pour voir si en laissant VD polytomique et en ajoutant des VD, la reg logistique pénalisée fonctionnait ou pas?
Penses-tu que les résultats de la reg logistique binaire qui semblent significatifs sont exploitables ou devrais-je agrandir la taille de mon echantillon ?
Merci et excuses pour la confusion
Penses-tu que les résultats de la reg logistique binaire qui semblent significatifs sont exploitables ou devrais-je agrandir la taille de mon echantillon ?
Merci et excuses pour la confusion
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Il faudrait que tu nous donnes tes effectifs et les estimations et intervalles de confiance que tu obtiens, voir si cela paraît cohérent.
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
-Effectifs:
Valeur ordonée DS_binaire Fréquence totale
1------------------------ 0---------------- 23
2------------------------ 1------------------74
-----------------------------------------------------------------------------
Estimations par l'analyse du maximum de Vaisemblance
Paramètre DDL Val estimée Erreur Khi-2 Pr > Khi-2
Intercept 1 1.9203 0.4632 17.1899 <.0001
score_GIR 1 1 1.5136 1.2971 1.3616 0.2433
score_GIR 2 1 1.9299 1.2789 2.2773 0.1313
score_GIR 3 1 1.0242 1.3319 0.5913 0.4419
score_GIR 4 1 -1.2737 0.6415 3.9420 0.0471
score_GIR 5 1 -0.8217 0.7808 1.1076 0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet Val estimée IC de Wald à 95 %
score_GIR 1 vs 6 48.709 2.393 991.515
score_GIR 2 vs 6 73.865 3.796 >999.999
score_GIR 3 vs 6 29.860 1.346 662.630
score_GIR 4 vs 6 3.000 0.797 11.292
score_GIR 5 vs 6 4.714 0.859 25.867
-----------------------------------------------------------------------------------------
Merci,
Valeur ordonée DS_binaire Fréquence totale
1------------------------ 0---------------- 23
2------------------------ 1------------------74
-----------------------------------------------------------------------------
Estimations par l'analyse du maximum de Vaisemblance
Paramètre DDL Val estimée Erreur Khi-2 Pr > Khi-2
Intercept 1 1.9203 0.4632 17.1899 <.0001
score_GIR 1 1 1.5136 1.2971 1.3616 0.2433
score_GIR 2 1 1.9299 1.2789 2.2773 0.1313
score_GIR 3 1 1.0242 1.3319 0.5913 0.4419
score_GIR 4 1 -1.2737 0.6415 3.9420 0.0471
score_GIR 5 1 -0.8217 0.7808 1.1076 0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet Val estimée IC de Wald à 95 %
score_GIR 1 vs 6 48.709 2.393 991.515
score_GIR 2 vs 6 73.865 3.796 >999.999
score_GIR 3 vs 6 29.860 1.346 662.630
score_GIR 4 vs 6 3.000 0.797 11.292
score_GIR 5 vs 6 4.714 0.859 25.867
-----------------------------------------------------------------------------------------
Merci,
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Estimations par l'analyse du maximum de Vaisemblance
Paramètre-- DDL --Val estimée- Erreur-- Khi-2 ------Pr > Khi-2
Intercept -- 1 -- 1.9203 --------0.4632 --17.1899 --<.0001
score_GIR 1 1 -- 1.5136 --------1.2971 --1.3616 ---0.2433
score_GIR 2 1-- 1.9299 --------1.2789 --2.2773 ---0.1313
score_GIR 3 1-- 1.0242 --------1.3319 --0.5913 ---0.4419
score_GIR 4 1 -- -1.2737 --------0.6415 --3.9420 ---0.0471
score_GIR 5 1 -- -0.8217 -------0.7808 --1.1076 ---0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet-------- ----------Val estimée-------- IC de Wald à 95 %
score_GIR 1 vs 6 ---48.709 ----------2.393--- 991.515
score_GIR 2 vs 6 ---73.865-----------3.796---- >999.999
score_GIR 3 vs 6--- 29.860-----------1.346----- 662.630
score_GIR 4 vs 6 ---3.000------------ 0.797 ----11.292
score_GIR 5 vs 6--- 4.714------------ 0.859 ----25.867
Paramètre-- DDL --Val estimée- Erreur-- Khi-2 ------Pr > Khi-2
Intercept -- 1 -- 1.9203 --------0.4632 --17.1899 --<.0001
score_GIR 1 1 -- 1.5136 --------1.2971 --1.3616 ---0.2433
score_GIR 2 1-- 1.9299 --------1.2789 --2.2773 ---0.1313
score_GIR 3 1-- 1.0242 --------1.3319 --0.5913 ---0.4419
score_GIR 4 1 -- -1.2737 --------0.6415 --3.9420 ---0.0471
score_GIR 5 1 -- -0.8217 -------0.7808 --1.1076 ---0.2926
------------------------------------------------------------------------------------------
Estimations des rapports de cotes
Effet-------- ----------Val estimée-------- IC de Wald à 95 %
score_GIR 1 vs 6 ---48.709 ----------2.393--- 991.515
score_GIR 2 vs 6 ---73.865-----------3.796---- >999.999
score_GIR 3 vs 6--- 29.860-----------1.346----- 662.630
score_GIR 4 vs 6 ---3.000------------ 0.797 ----11.292
score_GIR 5 vs 6--- 4.714------------ 0.859 ----25.867
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
SAS ne t'a pas donné la p-value globale de ta variable score_GIR? Car c'est ça le plus important à regarder dans un premier temps...
Ensuite, je pense que malheureusement tu as trop de modalités par rapport à ton effectif, car tes IC sont immenses... [2.4;991.2]
Ensuite, je pense que malheureusement tu as trop de modalités par rapport à ton effectif, car tes IC sont immenses... [2.4;991.2]
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Comparaison de deux scores via une regression logistique
Effet---------DDL--- Khi-2---- Pr > Khi-2
score_GIR--5---------17.9921----0.0030
La p-value est inférieure à 0.05, elle n'a donc pas d'effet sur le modèle !!?
score_GIR--5---------17.9921----0.0030
La p-value est inférieure à 0.05, elle n'a donc pas d'effet sur le modèle !!?
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Re: Comparaison de deux scores via une regression logistique
Pardon, je voulais dire test significatif. Il y'a bien un effet de la VE.
Fkib- Nombre de messages : 10
Date d'inscription : 17/04/2012
Sujets similaires
» Comparaison de modèles de régression logistique NON emboités
» comparaison de Z-scores
» Comparaison de scores
» Mesurer l'effet d'un cours sur les connaissances des élèves
» Comment déconseiller la régression linéaire sur scores
» comparaison de Z-scores
» Comparaison de scores
» Mesurer l'effet d'un cours sur les connaissances des élèves
» Comment déconseiller la régression linéaire sur scores
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum