Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Multiplicité de tests multivariés
3 participants
Page 1 sur 1
Multiplicité de tests multivariés
Bonjour,
Imaginons que j'ai une variable numérique continue pour laquelle j'ai une valeur dans chaque centre.
Je suis en train de faire une analyse multiple, je compare chacune des moyennes de mes centres avec la moyenne globale de centres pour détecter des "outliers".
Du coup je dois gérer une multiplicité et au lieu de prendre un seuil à 2 SD (95%), je prends 3 SD (99,8%) pour corriger ce problème de risque alpha multiplié.
J'aimerais faire une sorte de scoring de plusieurs tests statistiques sur ces centres.
Par exemple, je comparerais pour chaque centre sa moyenne et sa variance avec la moyenne et la variance globale de tous les centres (j'applique donc 2 tests pour plusieurs centres), j'arrive donc à une multiplicité de multiplicité de tests.
Selon vous, faut-il modifier le seuil alpha ou ne pas le toucher ?
Comment feriez-vous pour prendre en compte une énième multiplicité ?
En vous remerciant d'avance.
Imaginons que j'ai une variable numérique continue pour laquelle j'ai une valeur dans chaque centre.
Je suis en train de faire une analyse multiple, je compare chacune des moyennes de mes centres avec la moyenne globale de centres pour détecter des "outliers".
Du coup je dois gérer une multiplicité et au lieu de prendre un seuil à 2 SD (95%), je prends 3 SD (99,8%) pour corriger ce problème de risque alpha multiplié.
J'aimerais faire une sorte de scoring de plusieurs tests statistiques sur ces centres.
Par exemple, je comparerais pour chaque centre sa moyenne et sa variance avec la moyenne et la variance globale de tous les centres (j'applique donc 2 tests pour plusieurs centres), j'arrive donc à une multiplicité de multiplicité de tests.
Selon vous, faut-il modifier le seuil alpha ou ne pas le toucher ?
Comment feriez-vous pour prendre en compte une énième multiplicité ?
En vous remerciant d'avance.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Multiplicité de tests multivariés
Bonjour,
A priori pas besoin de gérer cet aspect car les tests et les lois de distribution associés ne sont pas les même.
Nik
A priori pas besoin de gérer cet aspect car les tests et les lois de distribution associés ne sont pas les même.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Multiplicité de tests multivariés
D'accord, du coup c'est impossible de faire le test ou au contraire tu gardes ta borne à 99,8% pour toutes tes variables ?
Moi je me voyais créer un score qui prend en compte plusieurs variables et du coup tester cette variable avec la loi qu'elle suit et un seuil adapté.
Moi je me voyais créer un score qui prend en compte plusieurs variables et du coup tester cette variable avec la loi qu'elle suit et un seuil adapté.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Multiplicité de tests multivariés
Oui tu gardes à 99.8 pour toutes les variables. Tu tiens comptes de la multiplicité des tests par type de test donné. Tu n'as pas à prendre en compte qu'à côté tu fais d'autres tests sur des lois différentes même si eux même sont sujet à des corrections pour tests multiple.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Multiplicité de tests multivariés
Merci bien
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Multiplicité de tests multivariés
Bonjour,
indépendamment de la multiplicité des tests, n'y aurait-il pas un problème de dépendance des données ? Il me semble que tu as un jeu de données qui n'est qu'un sous ensemble de l'autre non ?
Cdlt
indépendamment de la multiplicité des tests, n'y aurait-il pas un problème de dépendance des données ? Il me semble que tu as un jeu de données qui n'est qu'un sous ensemble de l'autre non ?
Cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Multiplicité de tests multivariés
Bonjour,
Oui en effet, il y a de gros risque pour que certaines variables soient surrexprimées par rapport à d'autres à cause de la dépendance. (un peu comme si on mettait le BMI et le poids sur une ACP)
A part supprimer les variables complètement doublons (comme l'exemple du BMI-poids), je ne vois pas quel autre problème je pourrais rencontrer.
Mon but est au final d'indiquer les centres "outliers" donc s'ils sortent outlier pour 2 variables, c'est tout bénéfice pour l'analyse.
Oui en effet, il y a de gros risque pour que certaines variables soient surrexprimées par rapport à d'autres à cause de la dépendance. (un peu comme si on mettait le BMI et le poids sur une ACP)
A part supprimer les variables complètement doublons (comme l'exemple du BMI-poids), je ne vois pas quel autre problème je pourrais rencontrer.
Mon but est au final d'indiquer les centres "outliers" donc s'ils sortent outlier pour 2 variables, c'est tout bénéfice pour l'analyse.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» multiplicité des tests
» multiplicité des tests
» multiplicité des tests en régression
» Multiplicité dans le domaine de la santé
» tests
» multiplicité des tests
» multiplicité des tests en régression
» Multiplicité dans le domaine de la santé
» tests
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum