Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Question sur le Score de Propension - épisode 2
2 participants
Page 1 sur 1
Question sur le Score de Propension - épisode 2
Bonjour,
Je suis en train d'utiliser le score de propension à travers plusieurs méthodes :
- Naive PSM
- Stratified PS
- Trimmed PSM
- IPTW (IPW) (Inverse Propensity Weighting)
L'IPTW est souvent mis en avant par rapport aux autres méthodes dans la littérature mais également par mes anciens professeurs (pléonasme?).
J'ai remarqué que l'IPTW avait quasi-systématiquement des résultats différents par rapport aux autre méthodes sur les jeux de données que j'utilise.
Et pour cause, il suffit que les scores de propension soient très faibles ou très élevés pour que le score de propension pondéré soit lui également très faible ou très élevé.
Cela a pour effet de comparer des scores excessivement différents et donc d'attribuer systématiquement une p-valeur très hautement significative (p<0.001).
Nous avons pensé à remplacer les valeurs de score de propension pondéré supérieurs à 10 par 10; et remplacer les PS pondérés inférieurs à 0.1 par 0.1. Cette fois-ci nous sommes confrontés à deux autres biais : nous avons une sorte de hurdle model (un modèle qui ressemble au chapeau de batman, pour lequel on a deux obstacles pour les PS pondérés à 0.1 et 10. On a également une variabilité du PS pondéré baissée et des groupes dont les moyennes sont plus proches, on a donc une puissance baissée.
Savez-vous comment s'occuper de ces PS pondérés dont les valeurs sont extrêmes ?
Savez-vous s'il existe un moyen en amont de l'IPTW afin d'éviter d'avoir des PS pondérés avec des valeurs extrêmes ?
Merci d'avance
Je suis en train d'utiliser le score de propension à travers plusieurs méthodes :
- Naive PSM
- Stratified PS
- Trimmed PSM
- IPTW (IPW) (Inverse Propensity Weighting)
L'IPTW est souvent mis en avant par rapport aux autres méthodes dans la littérature mais également par mes anciens professeurs (pléonasme?).
J'ai remarqué que l'IPTW avait quasi-systématiquement des résultats différents par rapport aux autre méthodes sur les jeux de données que j'utilise.
Et pour cause, il suffit que les scores de propension soient très faibles ou très élevés pour que le score de propension pondéré soit lui également très faible ou très élevé.
Cela a pour effet de comparer des scores excessivement différents et donc d'attribuer systématiquement une p-valeur très hautement significative (p<0.001).
Nous avons pensé à remplacer les valeurs de score de propension pondéré supérieurs à 10 par 10; et remplacer les PS pondérés inférieurs à 0.1 par 0.1. Cette fois-ci nous sommes confrontés à deux autres biais : nous avons une sorte de hurdle model (un modèle qui ressemble au chapeau de batman, pour lequel on a deux obstacles pour les PS pondérés à 0.1 et 10. On a également une variabilité du PS pondéré baissée et des groupes dont les moyennes sont plus proches, on a donc une puissance baissée.
Savez-vous comment s'occuper de ces PS pondérés dont les valeurs sont extrêmes ?
Savez-vous s'il existe un moyen en amont de l'IPTW afin d'éviter d'avoir des PS pondérés avec des valeurs extrêmes ?
Merci d'avance
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Question sur le Score de Propension - épisode 2
Bonjour,
Des poids "extremes" sont signes d'une quasi-violation de l'hypothese de positivite. En effet, pour les methodes de scores de propension et pour l'inference causale en general, il faut que chaque individu ait une probabilite non-nulle de recevoir l'un ou l'autre des traitements, car sinon on ne peut pas estimer l'effet qu'aurait l'autre traitement sur eux, puisqu'en pratique on a aucune information.
Quand les SP sont tres faibles ou tres eleves, les poids peuvent etre extremes. Pour le matching, ces patients sont en general exclus car il est impossible de trouver un bon match (mais evidemment, les resultats ne deviennent plus generalisables. En IPTW, il est courant de regarder la distribution des poids et s'il existe des extremes, attribuer la valeur du 99e percentile a tous les patients qui ont des valeurs extremes elevees, et le 1e percentile a tous ceux qui ont des valeurs extremes faibles. Par contre oui, ca peut "batmaniser" la distribution. Parfois, les valeurs extremes sont exclues, mais on retombe sur le meme probleme rencontre avec le matching, donc ce n'est pas tres interessant. Cela peut etre acceptable, si au moment de l'interpretation, il est clairement dit que l'effet estime est l'effet parmi les patients qui sont susceptibles de recevoir l'un ou l'autre des traitements.
Je pense qu'ici, tu as une telle confusion par indication (les patients traites avec A ou B ne sont pas du tout les memes) et par consequent, tu cours le risque d'avoir un biais lie a l'extrapolation que tu fais dans tes donnees.
Ayana
Des poids "extremes" sont signes d'une quasi-violation de l'hypothese de positivite. En effet, pour les methodes de scores de propension et pour l'inference causale en general, il faut que chaque individu ait une probabilite non-nulle de recevoir l'un ou l'autre des traitements, car sinon on ne peut pas estimer l'effet qu'aurait l'autre traitement sur eux, puisqu'en pratique on a aucune information.
Quand les SP sont tres faibles ou tres eleves, les poids peuvent etre extremes. Pour le matching, ces patients sont en general exclus car il est impossible de trouver un bon match (mais evidemment, les resultats ne deviennent plus generalisables. En IPTW, il est courant de regarder la distribution des poids et s'il existe des extremes, attribuer la valeur du 99e percentile a tous les patients qui ont des valeurs extremes elevees, et le 1e percentile a tous ceux qui ont des valeurs extremes faibles. Par contre oui, ca peut "batmaniser" la distribution. Parfois, les valeurs extremes sont exclues, mais on retombe sur le meme probleme rencontre avec le matching, donc ce n'est pas tres interessant. Cela peut etre acceptable, si au moment de l'interpretation, il est clairement dit que l'effet estime est l'effet parmi les patients qui sont susceptibles de recevoir l'un ou l'autre des traitements.
Je pense qu'ici, tu as une telle confusion par indication (les patients traites avec A ou B ne sont pas du tout les memes) et par consequent, tu cours le risque d'avoir un biais lie a l'extrapolation que tu fais dans tes donnees.
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Question sur le Score de Propension - épisode 2
Bonjour Ayana, merci pour ton retour.
D'accord donc on a plusieurs solutions: soit supprimer ces poids extrêmes, soit les remplacer par le 1er ou le 99e percentile (c'est déjà mieux que ce que je faisais en choisissant des valeurs "au hasard" en prenant 0.1 et 10).
Je suis d'accord avec ces approches dans le sens où leur score n'est pas informatif, il ne représente pas réellement la probabilité de leur administrer le produit référent.
Cependant si on exclue ces patients, on s'approche théoriquement du PSM naïf, et la batmanisation de la distribution (remplacer par les percentiles) est également quelque chose qui va pénaliser la puissance.
Est-ce que dans ton expérience, tu trouves que le PSM avec remise est plus performant que l'IPTW lorsqu'on est confronté à ce problème de scores de propensions trop proches de 0 ou de 1 ?
Merci
D'accord donc on a plusieurs solutions: soit supprimer ces poids extrêmes, soit les remplacer par le 1er ou le 99e percentile (c'est déjà mieux que ce que je faisais en choisissant des valeurs "au hasard" en prenant 0.1 et 10).
Je suis d'accord avec ces approches dans le sens où leur score n'est pas informatif, il ne représente pas réellement la probabilité de leur administrer le produit référent.
Cependant si on exclue ces patients, on s'approche théoriquement du PSM naïf, et la batmanisation de la distribution (remplacer par les percentiles) est également quelque chose qui va pénaliser la puissance.
Est-ce que dans ton expérience, tu trouves que le PSM avec remise est plus performant que l'IPTW lorsqu'on est confronté à ce problème de scores de propensions trop proches de 0 ou de 1 ?
Merci
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Question sur le Score de Propension - épisode 2
En pratique, si on a des SP proches de 0 ou de 1, on sait que notre question est peu pertinente car cela suggeste que l'on essaie d'estimer l'effet d'un traitement chez des patients qui, dans tous les cas, ne le recevront jamais. Le PSM avec remplacement ne regle pas cela nous plus car ces individus extremes ne seront jamais apparies si tu utilises un caliper, et si tu n'en utilises pas, tu vas apparier des patients qui n'ont rien a voir les uns avec les autres. Le "trimming" des poids extremes est encore la solution statistique la "moins pire", mais la meilleure solution est en general de definir la population sur laquelle tu veux vraiment connaitre l'effet traitement.
Ayana
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Question sur le Score de Propension - épisode 2
D'accord, merci pour ces informations Ayana !
J'y vois plus clair.
J'y vois plus clair.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Question sur le Score de Propension - épisode 2
Je viens juste de tomber sur cet article tout frais, ca pourra peut-etre t'aider:
https://academic.oup.com/aje/advance-article-abstract/doi/10.1093/aje/kwy201/5090958?redirectedFrom=fulltext
https://academic.oup.com/aje/advance-article-abstract/doi/10.1093/aje/kwy201/5090958?redirectedFrom=fulltext
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Question sur le Score de Propension - épisode 2
Ah oui en effet, on peut pas faire plus frais !
Superbe, en totale concordance avec ma problématique, je vais me l'imprimer.
Superbe, en totale concordance avec ma problématique, je vais me l'imprimer.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» Question sur le Score de Propension - épisode 3
» Calculer des Scores de Propension sans traitement
» Questions sur le Score de Propension
» Score de propension : Standardized Mean Difference
» Un score de propension avec ordre d'intérêt des covariables
» Calculer des Scores de Propension sans traitement
» Questions sur le Score de Propension
» Score de propension : Standardized Mean Difference
» Un score de propension avec ordre d'intérêt des covariables
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum