Multiplicité de tests multivariés

par zezima Jeu 3 Mar 2016 - 10:02

Bonjour,

Imaginons que j'ai une variable numérique continue pour laquelle j'ai une valeur dans chaque centre.

Je suis en train de faire une analyse multiple, je compare chacune des moyennes de mes centres avec la moyenne globale de centres pour détecter des "outliers".
Du coup je dois gérer une multiplicité et au lieu de prendre un seuil à 2 SD (95%), je prends 3 SD (99,8%) pour corriger ce problème de risque alpha multiplié.

J'aimerais faire une sorte de scoring de plusieurs tests statistiques sur ces centres.
Par exemple, je comparerais pour chaque centre sa moyenne et sa variance avec la moyenne et la variance globale de tous les centres (j'applique donc 2 tests pour plusieurs centres), j'arrive donc à une multiplicité de multiplicité de tests.

Selon vous, faut-il modifier le seuil alpha ou ne pas le toucher ?
Comment feriez-vous pour prendre en compte une énième multiplicité ?

En vous remerciant d'avance.

par Nik Jeu 3 Mar 2016 - 11:20

Bonjour,

A priori pas besoin de gérer cet aspect car les tests et les lois de distribution associés ne sont pas les même.

Nik

par zezima Jeu 3 Mar 2016 - 13:02

D'accord, du coup c'est impossible de faire le test ou au contraire tu gardes ta borne à 99,8% pour toutes tes variables ?

Moi je me voyais créer un score qui prend en compte plusieurs variables et du coup tester cette variable avec la loi qu'elle suit et un seuil adapté.

par Nik Jeu 3 Mar 2016 - 15:24

Oui tu gardes à 99.8 pour toutes les variables. Tu tiens comptes de la multiplicité des tests par type de test donné. Tu n'as pas à prendre en compte qu'à côté tu fais d'autres tests sur des lois différentes même si eux même sont sujet à des corrections pour tests multiple.

par zezima Jeu 3 Mar 2016 - 15:58

Merci bien

par droopy Jeu 3 Mar 2016 - 16:10

Bonjour,

indépendamment de la multiplicité des tests, n'y aurait-il pas un problème de dépendance des données ? Il me semble que tu as un jeu de données qui n'est qu'un sous ensemble de l'autre non ?

Cdlt

par zezima Jeu 3 Mar 2016 - 16:20

Bonjour,

Oui en effet, il y a de gros risque pour que certaines variables soient surrexprimées par rapport à d'autres à cause de la dépendance. (un peu comme si on mettait le BMI et le poids sur une ACP)

A part supprimer les variables complètement doublons (comme l'exemple du BMI-poids), je ne vois pas quel autre problème je pourrais rencontrer.

Mon but est au final d'indiquer les centres "outliers" donc s'ils sortent outlier pour 2 variables, c'est tout bénéfice pour l'analyse.

par Contenu sponsorisé

Multiplicité de tests multivariés

Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés

Re: Multiplicité de tests multivariés