Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -34%
-34% LG OLED55B3 – TV OLED 4K 55″ 2023 ...
Voir le deal
919 €

Choix de l'imputation multiple

2 participants

Aller en bas

choix - Choix de l'imputation multiple Empty Choix de l'imputation multiple

Message par zezima Jeu 3 Déc 2015 - 20:37

Bonjour,

Une des méthodes les plus robustes pour éviter les biais lors d'une imputation MAR (Missing At Random) est l'imputation multiple.
Ma variable numérique (marqueur biologique) possédant des valeurs manquantes n'est liée à aucune variable de ma base de données.

J'aimerais donc réaliser une imputation multiple sur les 16% de valeurs manquantes qui manquent mais j'ai le choix entre plusieurs méthodes sur R :
-Linéaire (pmm)
-Logistique
-Poisson
-Polynomial
-Modèle à Odds proportionnels

Etant donné que lorsque je crée un modèle linéaire en croisant ma variable "marqueur biologique" en fonction de toutes mes autres variables, avec une méthode (step) descendante, je n'obtiens à la fin que 2 autres variables dans mon modèle : Marqueur biologique ~ Sexe + Traitement (chacun significatif). On peut donc supposer que le modèle du marqueur biologique est linéaire en fonction de ces deux variables.

Est-ce que je peux appliquer une imputation linéaire pour le coup sur la variable marqueur biologique ?
(Si oui, faut-il préciser dans mon imputation quelles variables sont linéairement associées au marqueur biologique ?)

Je vous remercie d'avance.

PS : Il n'y a aucune hypothèse dans l'étude, ni aucune définition des variables que j'utilise, ce sont des variables purement fictives pour s'entraîner

zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

choix - Choix de l'imputation multiple Empty Re: Choix de l'imputation multiple

Message par Ayana Ven 4 Déc 2015 - 7:58

Bonjour,

Quel package utilises-tu? Car avec le package mi, R définit lui même le modèle qui dépend seulement de la nature de ta variable. Variable continue=modèle linéaire... En effet, ce package impute par la méthode d'équations chaînées et chaque variable partiellement observée est régressée sur les autres. Ceci dit, si ta variable manquante n'est liée à aucune autre variable, je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation?
Ayana
Ayana
Ayana

Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

choix - Choix de l'imputation multiple Empty Re: Choix de l'imputation multiple

Message par zezima Dim 13 Déc 2015 - 11:59

Bonjour,

Au final j'utilise le package Mice, j'ai décidé également de prendre un modèle linéaire car la variable est continue.

Je n'ai pas compris cependant ce que tu entends par "je suppose que tu n'auras que le critère de jugement dans le modèle d'imputation". Dans mon dernier modèle, je passe par une sous-base de données créée par un score de propension et je compare ma variable d'intérêt avec un type de traitement.

Merci à toi !
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

choix - Choix de l'imputation multiple Empty Re: Choix de l'imputation multiple

Message par Ayana Mar 15 Déc 2015 - 10:19

Oui, mais quand tu fais de l'imputation avec equations chainees, admettons que tu aies Y ta variable d'interet (variable reponse), T ton traitement et X ta variable manquante, tes valeurs imputees doivent etre tirees dans la distribution de X sachant Y, T. En d'autres termes, tu utilises toutes les infos que tu connais sur la relation entre X et Y et X et T pour imputer ta variable. Si tu ne le fais pas, l'estimation finale de ton effet traitement sera biaise a la fin. D'ailleurs, si tu peux jeter un oeil a ce papier : A comparison of two methods of estimating propensity scores after multiple imputation, Mitra & Reiter, Statistical Methods in Medical Research,2012. Ils observent un biais dans certaines situations car Y n'est pas pris en compte. Mais crois moi sur parole (pour l'instant), ca marche tres bien si Y est inclus dans ton modele

Ayana
Ayana
Ayana

Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

choix - Choix de l'imputation multiple Empty Re: Choix de l'imputation multiple

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum