Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
La comparaison binomiale
3 participants
Page 1 sur 1
La comparaison binomiale
Bonjour à tous,
Je suis en train d'utiliser une méthode sur un pool de patients afin de détecter ceux qui ont les valeurs les plus extrêmes. La méthode détecte donc un certain pourcentage de patients outliers.
J'aimerais comparer la fréquence de patient outlier dans chaque centre afin de savoir si un centre a un nombre anormal de valeurs extrêmes.
Pour ce faire j'aimerais utiliser la comparaison binomiale unilatérale.
Je prends la fréquence moyenne d'outlier de tous les centres que je compare à la fréquence d'outlier de chaque centre.
Si un centre a une fréquence significativement supérieure à cette moyenne (d'après la comparaison binomiale) alors une p-valeur est affichée.
Ma première question est : Est-ce que la l'application du test binomial que j'utilise vous paraît cohérente ?
Ma seconde question est : Pensez-vous qu'il est nécessaire dans ce cas de figure d'appliquer un ajustement des p-valeurs sur ces tests pour chaque centre ?
Je vous remercie d'avance.
ps: La méthode initiale utilisée est la distance euclidienne de chaque patient comparé à la moyenne euclidienne globale + 3 SD(de la distance globale), si cette distance est plus élevée que ce seuil, la valeur est considérée comme outlier
Je suis en train d'utiliser une méthode sur un pool de patients afin de détecter ceux qui ont les valeurs les plus extrêmes. La méthode détecte donc un certain pourcentage de patients outliers.
J'aimerais comparer la fréquence de patient outlier dans chaque centre afin de savoir si un centre a un nombre anormal de valeurs extrêmes.
Pour ce faire j'aimerais utiliser la comparaison binomiale unilatérale.
Je prends la fréquence moyenne d'outlier de tous les centres que je compare à la fréquence d'outlier de chaque centre.
Si un centre a une fréquence significativement supérieure à cette moyenne (d'après la comparaison binomiale) alors une p-valeur est affichée.
Ma première question est : Est-ce que la l'application du test binomial que j'utilise vous paraît cohérente ?
Ma seconde question est : Pensez-vous qu'il est nécessaire dans ce cas de figure d'appliquer un ajustement des p-valeurs sur ces tests pour chaque centre ?
Je vous remercie d'avance.
ps: La méthode initiale utilisée est la distance euclidienne de chaque patient comparé à la moyenne euclidienne globale + 3 SD(de la distance globale), si cette distance est plus élevée que ce seuil, la valeur est considérée comme outlier
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: La comparaison binomiale
Pour un problème de comptage avec une inflation de zéro (modèle zero-inflated), on m'avait conseillé d'utiliser un modèle en deux parties de type hurdle model :
1) analyser la distribution des zéros et des valeurs non nulles en fonction du facteur d'intérêt par un modèle logistique binomial,
2) analyser les données non nulles par un modèle tronqué n'ayant pas de zéro.
A l'instar de cette approche, je me demande si tu ne peux pas alors tester le nombre d'outliers en fonction du centre par un modèle logistique binomial, ce qui me semble éviterai de se poser le problème de l'ajustement des p-values. Sinon, il me semble que dans le principe, ton approche est assez proche de celle que je suggère.
1) analyser la distribution des zéros et des valeurs non nulles en fonction du facteur d'intérêt par un modèle logistique binomial,
2) analyser les données non nulles par un modèle tronqué n'ayant pas de zéro.
A l'instar de cette approche, je me demande si tu ne peux pas alors tester le nombre d'outliers en fonction du centre par un modèle logistique binomial, ce qui me semble éviterai de se poser le problème de l'ajustement des p-values. Sinon, il me semble que dans le principe, ton approche est assez proche de celle que je suggère.
Florent Aubry- Nombre de messages : 251
Date d'inscription : 02/11/2015
Re: La comparaison binomiale
Merci énormément pour cette réponse, l'approche est très sensée, j'avais pensé n'effectuer que la 2ème partie de la méthode Hurdle.
Je reviendrais exposer brièvement mes résultats une fois que j'aurais testé la méthode.
Je reviendrais exposer brièvement mes résultats une fois que j'aurais testé la méthode.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: La comparaison binomiale
Tout d'abord avant d'appliquer un modèle de Hurdle ou de zéro inflation, il faut se poser deux questions :
- Quelle distribution suivent mes données ?
- Pour quelle raison devrais-je modifier mes résultats sur le count "0" ?
On utilise le modèle de l'inflation zéro lorsqu'on estime qu'il y a trop de 0 mais qu'on ne devrait pas tous les supprimer.
Exemple : Le nombre d'occasions sexuelles non-protégées. Un grand nombre de zéro va être recueilli parce qu'un grand nombre d'individus n'a pas de partenaires sexuel. Il faut tout de même garder une partie des 0 correspondant aux personnes qui ont un partenaire sexuel mais qui se protègent.
Il fallait donc prendre en compte une variable de confusion : le fait d'avoir une partenaire sexuel.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.
On utilise le modèle de hurdle lorsqu'on estime qu'il y a trop de 0 et qu'il ne devrait pas y en avoir, qu'on veut donc tous les supprimer.
Exemple : Le nombre de cigarettes fumées dans le mois. On va avoir un grand nombre de personnes qui va répondre qu'il n'ont fumé aucune cigarette dans le mois parce qu'ils ne sont pas fumeurs. Les personnes supposées êtres fumeurs auront au minimum 1 cigarette fumée par mois.
Il fallait une fois de plus prendre en compte une variable de confusion : être un fumeur.
On supprime donc tous les 0.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.
Dans le cas de figure de ma problématique, je ne pense pas que ça soit applicable mais peut être que je me trompe.
J'ai des counts pour chaque centre, qui représentent le nombre de patients considérés outliers sur toutes les données comprises. J'ai du coup beaucoup de centres (une grande majorité) qui n'ont aucun outlier. Il y a donc un très grand nombre de counts=0.
C'est ce qui me pose problème lorsque je fais ma comparaison binomiale car ça baisse très fortement ma moyenne globale de counts. Je me demande donc si c'est bien normal que je garde les 0 car je n'ai pas d'explication avec les modèles de Hurdle et d'inflation du zéro qui m'expliquent si je dois ne pas garder les 0.
- Quelle distribution suivent mes données ?
- Pour quelle raison devrais-je modifier mes résultats sur le count "0" ?
On utilise le modèle de l'inflation zéro lorsqu'on estime qu'il y a trop de 0 mais qu'on ne devrait pas tous les supprimer.
Exemple : Le nombre d'occasions sexuelles non-protégées. Un grand nombre de zéro va être recueilli parce qu'un grand nombre d'individus n'a pas de partenaires sexuel. Il faut tout de même garder une partie des 0 correspondant aux personnes qui ont un partenaire sexuel mais qui se protègent.
Il fallait donc prendre en compte une variable de confusion : le fait d'avoir une partenaire sexuel.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.
On utilise le modèle de hurdle lorsqu'on estime qu'il y a trop de 0 et qu'il ne devrait pas y en avoir, qu'on veut donc tous les supprimer.
Exemple : Le nombre de cigarettes fumées dans le mois. On va avoir un grand nombre de personnes qui va répondre qu'il n'ont fumé aucune cigarette dans le mois parce qu'ils ne sont pas fumeurs. Les personnes supposées êtres fumeurs auront au minimum 1 cigarette fumée par mois.
Il fallait une fois de plus prendre en compte une variable de confusion : être un fumeur.
On supprime donc tous les 0.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.
Dans le cas de figure de ma problématique, je ne pense pas que ça soit applicable mais peut être que je me trompe.
J'ai des counts pour chaque centre, qui représentent le nombre de patients considérés outliers sur toutes les données comprises. J'ai du coup beaucoup de centres (une grande majorité) qui n'ont aucun outlier. Il y a donc un très grand nombre de counts=0.
C'est ce qui me pose problème lorsque je fais ma comparaison binomiale car ça baisse très fortement ma moyenne globale de counts. Je me demande donc si c'est bien normal que je garde les 0 car je n'ai pas d'explication avec les modèles de Hurdle et d'inflation du zéro qui m'expliquent si je dois ne pas garder les 0.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: La comparaison binomiale
Bonjour,
le modèle Hurdle est effectivement utile lorsque :
- la fréquence associée aux 0 est une donnée manquante.
ou encore quand le processus des 0 ne suit pas le même processus que les valeurs supérieures à 0.
Exemple :
Le nombre de paquets de BN achetés par jour pour une famille va dépendre de plusieurs critères panélistes, des promo, des médias, mais lorsque le mec n’achète pas le produit lors d’une venue en magasin, ça peut venir d’une autre raison (déjà achetés récemment pas exemple).
=>la loi de la décision d’acheter est différente de la loi du nombre de paquet de BN achetés.
Par contre je ne serai pas parti sur un test unilatéral mais plutôt bilatéral.
Et pour ton cas, peut-être que les 0 sont "normaux", et que la probabilité de succès de ta binomiale est juste très faible?
Niaboc
le modèle Hurdle est effectivement utile lorsque :
- la fréquence associée aux 0 est une donnée manquante.
ou encore quand le processus des 0 ne suit pas le même processus que les valeurs supérieures à 0.
Exemple :
Le nombre de paquets de BN achetés par jour pour une famille va dépendre de plusieurs critères panélistes, des promo, des médias, mais lorsque le mec n’achète pas le produit lors d’une venue en magasin, ça peut venir d’une autre raison (déjà achetés récemment pas exemple).
=>la loi de la décision d’acheter est différente de la loi du nombre de paquet de BN achetés.
Par contre je ne serai pas parti sur un test unilatéral mais plutôt bilatéral.
Et pour ton cas, peut-être que les 0 sont "normaux", et que la probabilité de succès de ta binomiale est juste très faible?
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: La comparaison binomiale
Merci pour ces éclaircissements, c'est intéressant.
Pour le coup, c'est ce que je me disais, peut être que je cherche la petite bête mais j'aimerais être sur de mon coup. Je pense en effet que la probabilité de ma binomiale est juste très faible et on arrive à détecter des très petits centres lorsqu'ils ont un patient outlier.
Cela soulève une autre problématique au niveau de "qu'est-ce qu'un centre outlier" mais après faut regarder chaque centre au cas par cas ou alors décider de ne pas inclure les centres de moins de 5 patients dans la détection d'outliers (c'est souvent fait par les boîtes de monitoring).
Pour le coup, c'est ce que je me disais, peut être que je cherche la petite bête mais j'aimerais être sur de mon coup. Je pense en effet que la probabilité de ma binomiale est juste très faible et on arrive à détecter des très petits centres lorsqu'ils ont un patient outlier.
Cela soulève une autre problématique au niveau de "qu'est-ce qu'un centre outlier" mais après faut regarder chaque centre au cas par cas ou alors décider de ne pas inclure les centres de moins de 5 patients dans la détection d'outliers (c'est souvent fait par les boîtes de monitoring).
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: La comparaison binomiale
Niaboc, je me demandais pourquoi tu aurais fait du bilatéral ?
Mon hypothèse H0 est "Ce centre a une probabilité plus petite ou égale à la moyenne globale".
Mon hypothèse H1 est "Ce centre a une probabilité significativement supérieure à la moyenne globale".
Les centres ayant une probabilité plus faible que la moyenne globale ne m'intéressent pas étant donné que je m'intéresse aux outliers et non aux inliers.
H0 : p1 <= pGlobale
H1 : p1 > pGlobale
Tu es d'accord avec ce raisonnement ?
Ah et aussi, dans la littérature je n'ai pas trouvé de conditions qui impliquent de ne pas pouvoir utiliser la comparaison binomiale à part "The sampling distribution of a count variable is only well described by the binomial distribution when the pop size is significantly larger than the sampling size".
On doit bien vérifier que chaque centre a un effectif beaucoup plus petit que l'effectif global et on peut utiliser le test binomial ?
Mon hypothèse H0 est "Ce centre a une probabilité plus petite ou égale à la moyenne globale".
Mon hypothèse H1 est "Ce centre a une probabilité significativement supérieure à la moyenne globale".
Les centres ayant une probabilité plus faible que la moyenne globale ne m'intéressent pas étant donné que je m'intéresse aux outliers et non aux inliers.
H0 : p1 <= pGlobale
H1 : p1 > pGlobale
Tu es d'accord avec ce raisonnement ?
Ah et aussi, dans la littérature je n'ai pas trouvé de conditions qui impliquent de ne pas pouvoir utiliser la comparaison binomiale à part "The sampling distribution of a count variable is only well described by the binomial distribution when the pop size is significantly larger than the sampling size".
On doit bien vérifier que chaque centre a un effectif beaucoup plus petit que l'effectif global et on peut utiliser le test binomial ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: La comparaison binomiale
Salut,
j'aurai fait un test bilatéral par rapport à tout ce que j'ai pu lire sur les tests unilatéraux/bilatéraux, comme par exemple cette remarque de Cassoulet dans ce post () :
"Je ne crois pas. On utilise un test unilatéral lorsque la différence attendue ne peut aller que dans un sens, pas lorsqu'on pense qu'éventuellement ca serait logique qu'elle aille dans tel sens. Il est donc assez rare d'utiliser les tests unilatéraux en médecine, car il est très difficile de justifier leur utilisation dans la plupart des cas. Par exemple, lorsqu'on évalue l'effet d'un traitement, meme si il existe des arguments forts pour une "amélioration", on utilise toujours un test bilatéral (les exemples de traitements entrainant des effets contraires aux effets attendus ne manquent pas....). Je pense que l'étude de l'effet d'un entrainement quelconque est assez similaire méthodologiquement à l'évaluation de l'effet d'un traitement."
Niaboc
j'aurai fait un test bilatéral par rapport à tout ce que j'ai pu lire sur les tests unilatéraux/bilatéraux, comme par exemple cette remarque de Cassoulet dans ce post () :
"Je ne crois pas. On utilise un test unilatéral lorsque la différence attendue ne peut aller que dans un sens, pas lorsqu'on pense qu'éventuellement ca serait logique qu'elle aille dans tel sens. Il est donc assez rare d'utiliser les tests unilatéraux en médecine, car il est très difficile de justifier leur utilisation dans la plupart des cas. Par exemple, lorsqu'on évalue l'effet d'un traitement, meme si il existe des arguments forts pour une "amélioration", on utilise toujours un test bilatéral (les exemples de traitements entrainant des effets contraires aux effets attendus ne manquent pas....). Je pense que l'étude de l'effet d'un entrainement quelconque est assez similaire méthodologiquement à l'évaluation de l'effet d'un traitement."
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Sujets similaires
» loi binomiale
» loi binomiale
» Loi binomiale?
» calcul covariance loi binomiale
» Formules de la loi binomiale
» loi binomiale
» Loi binomiale?
» calcul covariance loi binomiale
» Formules de la loi binomiale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|