Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Choix de l'imputation multiple
2 participants
Page 1 sur 1
Choix de l'imputation multiple
Bonjour,
Une des méthodes les plus robustes pour éviter les biais lors d'une imputation MAR (Missing At Random) est l'imputation multiple.
Ma variable numérique (marqueur biologique) possédant des valeurs manquantes n'est liée à aucune variable de ma base de données.
J'aimerais donc réaliser une imputation multiple sur les 16% de valeurs manquantes qui manquent mais j'ai le choix entre plusieurs méthodes sur R :
-Linéaire (pmm)
-Logistique
-Poisson
-Polynomial
-Modèle à Odds proportionnels
Etant donné que lorsque je crée un modèle linéaire en croisant ma variable "marqueur biologique" en fonction de toutes mes autres variables, avec une méthode (step) descendante, je n'obtiens à la fin que 2 autres variables dans mon modèle : Marqueur biologique ~ Sexe + Traitement (chacun significatif). On peut donc supposer que le modèle du marqueur biologique est linéaire en fonction de ces deux variables.
Est-ce que je peux appliquer une imputation linéaire pour le coup sur la variable marqueur biologique ?
(Si oui, faut-il préciser dans mon imputation quelles variables sont linéairement associées au marqueur biologique ?)
Je vous remercie d'avance.
PS : Il n'y a aucune hypothèse dans l'étude, ni aucune définition des variables que j'utilise, ce sont des variables purement fictives pour s'entraîner
Une des méthodes les plus robustes pour éviter les biais lors d'une imputation MAR (Missing At Random) est l'imputation multiple.
Ma variable numérique (marqueur biologique) possédant des valeurs manquantes n'est liée à aucune variable de ma base de données.
J'aimerais donc réaliser une imputation multiple sur les 16% de valeurs manquantes qui manquent mais j'ai le choix entre plusieurs méthodes sur R :
-Linéaire (pmm)
-Logistique
-Poisson
-Polynomial
-Modèle à Odds proportionnels
Etant donné que lorsque je crée un modèle linéaire en croisant ma variable "marqueur biologique" en fonction de toutes mes autres variables, avec une méthode (step) descendante, je n'obtiens à la fin que 2 autres variables dans mon modèle : Marqueur biologique ~ Sexe + Traitement (chacun significatif). On peut donc supposer que le modèle du marqueur biologique est linéaire en fonction de ces deux variables.
Est-ce que je peux appliquer une imputation linéaire pour le coup sur la variable marqueur biologique ?
(Si oui, faut-il préciser dans mon imputation quelles variables sont linéairement associées au marqueur biologique ?)
Je vous remercie d'avance.
PS : Il n'y a aucune hypothèse dans l'étude, ni aucune définition des variables que j'utilise, ce sont des variables purement fictives pour s'entraîner
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Choix de l'imputation multiple
Bonjour,
Quel package utilises-tu? Car avec le package mi, R définit lui même le modèle qui dépend seulement de la nature de ta variable. Variable continue=modèle linéaire... En effet, ce package impute par la méthode d'équations chaînées et chaque variable partiellement observée est régressée sur les autres. Ceci dit, si ta variable manquante n'est liée à aucune autre variable, je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation?
Ayana
Quel package utilises-tu? Car avec le package mi, R définit lui même le modèle qui dépend seulement de la nature de ta variable. Variable continue=modèle linéaire... En effet, ce package impute par la méthode d'équations chaînées et chaque variable partiellement observée est régressée sur les autres. Ceci dit, si ta variable manquante n'est liée à aucune autre variable, je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation?
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Choix de l'imputation multiple
Bonjour,
Au final j'utilise le package Mice, j'ai décidé également de prendre un modèle linéaire car la variable est continue.
Je n'ai pas compris cependant ce que tu entends par "je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation". Dans mon dernier modèle, je passe par une sous-base de données créée par un score de propension et je compare ma variable d'intérêt avec un type de traitement.
Merci à toi !
Au final j'utilise le package Mice, j'ai décidé également de prendre un modèle linéaire car la variable est continue.
Je n'ai pas compris cependant ce que tu entends par "je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation". Dans mon dernier modèle, je passe par une sous-base de données créée par un score de propension et je compare ma variable d'intérêt avec un type de traitement.
Merci à toi !
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Choix de l'imputation multiple
Oui, mais quand tu fais de l'imputation avec equations chainees, admettons que tu aies Y ta variable d'interet (variable reponse), T ton traitement et X ta variable manquante, tes valeurs imputees doivent etre tirees dans la distribution de X sachant Y, T. En d'autres termes, tu utilises toutes les infos que tu connais sur la relation entre X et Y et X et T pour imputer ta variable. Si tu ne le fais pas, l'estimation finale de ton effet traitement sera biaise a la fin. D'ailleurs, si tu peux jeter un oeil a ce papier : A comparison of two methods of estimating propensity scores after multiple imputation, Mitra & Reiter, Statistical Methods in Medical Research,2012. Ils observent un biais dans certaines situations car Y n'est pas pris en compte. Mais crois moi sur parole (pour l'instant), ca marche tres bien si Y est inclus dans ton modele
Ayana
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Sujets similaires
» Choix d'un test de comparaison multiple
» regression lineaire multiple
» régression multiple
» Colinéarité et régression multiple
» régression multiple
» regression lineaire multiple
» régression multiple
» Colinéarité et régression multiple
» régression multiple
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum