Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Cartes Pokémon 151 : où trouver le coffret Collection Alakazam-ex ?
Voir le deal

Regression logistique (codages variables quantitatives)

3 participants

Aller en bas

Regression logistique (codages variables quantitatives) Empty Regression logistique (codages variables quantitatives)

Message par Clochette Ven 22 Jan 2010 - 1:20

Bonjour à tous,

J'ai quelques questions concernant la regression logististique; en effet, tout me paraîssait si clair lorsque je l'ai étudié en cours,.... mais appliqué à des données réèlles; c'est tout de suite moins evident!

Alors, il s'agit d'une étude multicentrique, je dispose de plusieurs variables qualitatives et quantitatives.... ; la variable à expliquer etant qualitative, je souhaite donc effectuer un modèle logistique.
Pour selectionner mes variables prises en compte dans le modèle, j'effectue des Chi-2, test de Fisher, Student (selon la nature de ma variable)....

Je selectionne ensuite celles qui ont une p-value < 0.05. Je me retrouve donc avec des variables qualitatives (ordinales, nominales, et binaires) et des variables quantitatives.

Selon la nature de la variable qualitative, soit je la transforme en indicatrice , soit je la code en binaire, si ce n'est pas déjà le cas.

Ma question concerne les variables quantitatives; les introduire directement dans le modèle (sans les recoder) implique des difficultés d'interpretation; on préfère alors la discretiser (selon des seuils de la litterature).

Je dispose donc d'une variable quantitative "age" que je discretise en 3 classes. Lorsque j'effectue le chi-2, je n'ai plus de significativité.... Que dois-je faire? l'inclure dans le modèle (en ne considerant alors que la p-value de Student, lorsqu'elle etait en quantitative)? Si c'est le cas, lorqu'on ordonne les variables dans le modèle logistic (méthode descendante), a quelle position dois-je la mettre?


Merci,
A bientôt,
Clochette

Clochette

Nombre de messages : 3
Date d'inscription : 22/01/2010

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par droopy Ven 22 Jan 2010 - 8:15

Ma question concerne les variables quantitatives; les introduire
directement dans le modèle (sans les recoder) implique des difficultés
d'interpretation; on préfère alors la discretiser (selon des seuils de
la litterature).

Lesquelles ? Lorsque tu fais une régression entre la taille et le poids par exemple, elle est beaucoup plus facile a interpréter si tu conserves la variable quantitative telle quelle plutôt que si tu l'as transforme en variable qualitative (au passage tu as une perte d'information). Sur le forum tu trouveras un post sur la question, il doit pas être très vieux et si je me souviens bien il a du être posté par Niaboc (en fait non ! il est ici :https://statistiques.forumpro.fr/questions-generales-f9/besoin-d-aide-interpretation-regression-logistique-t1185.htm)
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par jigouen Ven 22 Jan 2010 - 8:20

Hello,
Pour interpréter une variable continue telle que l'age,une dose de médicament, tu dis que le risque augmente de x par augmentation d'une année d'age ou d'un gramme de médicament.
En effet tu as de la perte d'information si tu la transformes.

jigouen

Nombre de messages : 54
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par Clochette Sam 23 Jan 2010 - 18:10

Merci pour vos reponses;
En fait, suite à une etude de reproductibilité entre 2 lecteurs; je cherche à determiner les causes de la discordance entre leurs deux jugements. J'ai donc créé une variable discordance (0/1) qui vallait 1 en cas de discodance (par comparaison entre le jugement des 2 lecteurs) et en en cas de concordance 0.

Pour selectionner mes variables dans mon modèle, j'ai fait des comparaisons de proportions, et des comparaisons de moyennes. Je n'ai retenu que les variables significatives.

Parmis celles-ci, (par soucis de linearité, je ne peux pas mettre directement les variables quantitatives dans mon modèle, car je ne sais pas si la relation entre cette variable (par exp l'âge) et la variable à expliquer: discordance est lineaire. Donc j'ai recoder ma variable âge en classes; mais lorsque je verifie ma significativité entre age en classes et discordance, je ne trouve plus de différence significative entre l'age et la discordance.
Dois-je tout de même l'inclure dans le modèle?

Par ailleurs comment puis-je savoir si la relation entre l'age et la discordance est lineaire d'une manière simple?

Autre question: si j'etudie l'adequation de mon modèle aux données, je dois:
1- evaluer les proportions de paires concordantes et discordantes
2- etudier les sujets "hors normes" par l'analyse des résidus
3- Y a autre chose?

Merci

Clochette

Nombre de messages : 3
Date d'inscription : 22/01/2010

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par droopy Dim 24 Jan 2010 - 16:01

Clochette tu trouveras de très lon posts sur la regression logistique sur ce forum qui reprennent en très grande partie tes questions.

Une question me vient à l'esprit est-ce que tu as plus de preuves de la linéarité de la relation entre âge et discordance que de la "justesse" de tes classes ?

Une façon de faire, tu fais un modèle avec la variable en continue. Un autre avec la variable en classe et dans les deux cas tu regardes ce qu'apporte de rentrer la variable dans l'autre format dans le modèle :
1. continu
1 bis continu classe
2 class
2 classe continu

Tu peux aussi faire un "partial residual plot".

Je te conseille vivement de lire le livre "Modelling Binary Data" écrit par Colett
un apperçu ici :
[url=http://books.google.fr/books?id=LMRAIBEbdqsC&printsec=frontcover&dq=modelling binary data&cd=1#v=onepage&q=&f=false]http://books.google.fr/books?id=LMRAIBEbdqsC&printsec=frontcover&dq=modelling binary data&cd=1#v=onepage&q=&f=false[/url]

Et notamment les pages concernant le diagnostique des modèles (page 135...). Ce livre évoque aussi les stratégies de sélection de variables indépendantes.

D'autres mesures existent comme la spécificité, sensibilité, courbe ROC, kappa, le test de homer et lemeshow ...

Voir aussi le pdf du cours de patrick taffé sur la question "cours de regression logistique". Tu as aussi les cours de Philippe Besse de l'université de toulouse.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par Clochette Jeu 28 Jan 2010 - 14:01

Très complet comme réponse!
Merci

Clochette Regression logistique (codages variables quantitatives) Icon_wink

Clochette

Nombre de messages : 3
Date d'inscription : 22/01/2010

Revenir en haut Aller en bas

Regression logistique (codages variables quantitatives) Empty Re: Regression logistique (codages variables quantitatives)

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum