Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-20%
Le deal à ne pas rater :
(Adhérents Fnac) Enceinte Bluetooth Marshall Stanmore II Noir
199.99 € 249.99 €
Voir le deal

La comparaison binomiale

3 participants

Aller en bas

La comparaison binomiale Empty La comparaison binomiale

Message par zezima Ven 8 Juil 2016 - 7:30

Bonjour à tous,

Je suis en train d'utiliser une méthode sur un pool de patients afin de détecter ceux qui ont les valeurs les plus extrêmes. La méthode détecte donc un certain pourcentage de patients outliers.

J'aimerais comparer la fréquence de patient outlier dans chaque centre afin de savoir si un centre a un nombre anormal de valeurs extrêmes.

Pour ce faire j'aimerais utiliser la comparaison binomiale unilatérale.

Je prends la fréquence moyenne d'outlier de tous les centres que je compare à la fréquence d'outlier de chaque centre.
Si un centre a une fréquence significativement supérieure à cette moyenne (d'après la comparaison binomiale) alors une p-valeur est affichée.

Ma première question est : Est-ce que la l'application du test binomial que j'utilise vous paraît cohérente ?
Ma seconde question est : Pensez-vous qu'il est nécessaire dans ce cas de figure d'appliquer un ajustement des p-valeurs sur ces tests pour chaque centre ?

Je vous remercie d'avance.


ps: La méthode initiale utilisée est la distance euclidienne de chaque patient comparé à la moyenne euclidienne globale + 3 SD(de la distance globale), si cette distance est plus élevée que ce seuil, la valeur est considérée comme outlier
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par Florent Aubry Ven 8 Juil 2016 - 10:07

Pour un problème de comptage avec une inflation de zéro (modèle zero-inflated), on m'avait conseillé d'utiliser un modèle en deux parties  de type hurdle model :
1) analyser la distribution des zéros et des valeurs non nulles en fonction du facteur d'intérêt par un modèle logistique binomial,
2) analyser les données non nulles par un modèle tronqué n'ayant pas de zéro.

A l'instar de cette approche, je me demande si tu ne peux pas alors tester le nombre d'outliers en fonction du centre par un modèle logistique binomial, ce qui me semble éviterai de se poser le problème de l'ajustement des p-values. Sinon, il me semble que dans le principe, ton approche est assez proche de celle que je suggère.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par zezima Ven 8 Juil 2016 - 15:06

Merci énormément pour cette réponse, l'approche est très sensée, j'avais pensé n'effectuer que la 2ème partie de la méthode Hurdle.

Je reviendrais exposer brièvement mes résultats une fois que j'aurais testé la méthode.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par zezima Lun 11 Juil 2016 - 12:43

Tout d'abord avant d'appliquer un modèle de Hurdle ou de zéro inflation, il faut se poser deux questions :
- Quelle distribution suivent mes données ?
- Pour quelle raison devrais-je modifier mes résultats sur le count "0" ?

On utilise le modèle de l'inflation zéro lorsqu'on estime qu'il y a trop de 0 mais qu'on ne devrait pas tous les supprimer.
Exemple : Le nombre d'occasions sexuelles non-protégées. Un grand nombre de zéro va être recueilli parce qu'un grand nombre d'individus n'a pas de partenaires sexuel. Il faut tout de même garder une partie des 0 correspondant aux personnes qui ont un partenaire sexuel mais qui se protègent.
Il fallait donc prendre en compte une variable de confusion : le fait d'avoir une partenaire sexuel.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.

On utilise le modèle de hurdle lorsqu'on estime qu'il y a trop de 0 et qu'il ne devrait pas y en avoir, qu'on veut donc tous les supprimer.
Exemple : Le nombre de cigarettes fumées dans le mois. On va avoir un grand nombre de personnes qui va répondre qu'il n'ont fumé aucune cigarette dans le mois parce qu'ils ne sont pas fumeurs. Les personnes supposées êtres fumeurs auront au minimum 1 cigarette fumée par mois.
Il fallait une fois de plus prendre en compte une variable de confusion : être un fumeur.
On supprime donc tous les 0.
On obtient donc un modèle binomial négatif ou un modèle de poisson tronqué.

Dans le cas de figure de ma problématique, je ne pense pas que ça soit applicable mais peut être que je me trompe.
J'ai des counts pour chaque centre, qui représentent le nombre de patients considérés outliers sur toutes les données comprises. J'ai du coup beaucoup de centres (une grande majorité) qui n'ont aucun outlier. Il y a donc un très grand nombre de counts=0.
C'est ce qui me pose problème lorsque je fais ma comparaison binomiale car ça baisse très fortement ma moyenne globale de counts. Je me demande donc si c'est bien normal que je garde les 0 car je n'ai pas d'explication avec les modèles de Hurdle et d'inflation du zéro qui m'expliquent si je dois ne pas garder les 0.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par niaboc Lun 11 Juil 2016 - 21:13

Bonjour,

le modèle Hurdle est effectivement utile lorsque  :
- la fréquence associée aux 0 est une donnée manquante.
ou encore quand le processus des 0 ne suit pas le même processus que les valeurs supérieures à 0.


Exemple :
Le nombre de paquets de BN achetés par jour pour une famille va dépendre de plusieurs critères panélistes, des promo, des médias, mais lorsque le mec n’achète pas le produit lors d’une venue en magasin, ça peut venir d’une autre raison (déjà achetés récemment pas exemple).
=>la loi de la décision d’acheter est différente de la loi du nombre de paquet de BN achetés.


Par contre je ne serai pas parti sur un test unilatéral mais plutôt bilatéral.

Et pour ton cas, peut-être que les 0 sont "normaux", et que la probabilité de succès de ta binomiale est juste très faible?


Niaboc
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par zezima Mar 12 Juil 2016 - 7:18

Merci pour ces éclaircissements, c'est intéressant.

Pour le coup, c'est ce que je me disais, peut être que je cherche la petite bête mais j'aimerais être sur de mon coup. Je pense en effet que la probabilité de ma binomiale est juste très faible et on arrive à détecter des très petits centres lorsqu'ils ont un patient outlier.

Cela soulève une autre problématique au niveau de "qu'est-ce qu'un centre outlier" mais après faut regarder chaque centre au cas par cas ou alors décider de ne pas inclure les centres de moins de 5 patients dans la détection d'outliers (c'est souvent fait par les boîtes de monitoring).
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par zezima Jeu 4 Aoû 2016 - 13:09

Niaboc, je me demandais pourquoi tu aurais fait du bilatéral ?

Mon hypothèse H0 est "Ce centre a une probabilité plus petite ou égale à la moyenne globale".
Mon hypothèse H1 est "Ce centre a une probabilité significativement supérieure à la moyenne globale".
Les centres ayant une probabilité plus faible que la moyenne globale ne m'intéressent pas étant donné que je m'intéresse aux outliers et non aux inliers.

H0 : p1 <= pGlobale
H1 : p1 > pGlobale

Tu es d'accord avec ce raisonnement ?

Ah et aussi, dans la littérature je n'ai pas trouvé de conditions qui impliquent de ne pas pouvoir utiliser la comparaison binomiale à part "The sampling distribution of a count variable is only well described by the binomial distribution when the pop size is significantly larger than the sampling size".
On doit bien vérifier que chaque centre a un effectif beaucoup plus petit que l'effectif global et on peut utiliser le test binomial ?
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

La comparaison binomiale Empty Re: La comparaison binomiale

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum