Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Mann-Whitney U pour grands échantillons
3 participants
Page 1 sur 1
Mann-Whitney U pour grands échantillons
Bonjour à toutes et à tous !
Je possède un jeu de données avec des valeurs de potentiels d'ionisation d'ADN pour des mutations bénignes et un jeu de données avec des valeurs de potentiels d'ionisation d'ADN pour des mutations pathogènes.
Je tente de déterminer si les moyennes sont significativement différentes entre mes deux échantillons.
J'ai pour cela vérifier si mes échantillons suivaient une loi normale grâce à un test de shapiro, ce n'est pas le cas. La variance n'est pas la même non plus si je me fie au test de Levene. Dès lors j'ai écarté le test t paramétrique et je me suis tourné vers un test de Mann-Whitney U, cependant je me demande s'il est judicieux de se fier à la p-value obtenue étant donné que la taille de mes échantillons sont différentes et que le nombre d'observations au sein des échantillons est également très grande (2662630 pour mes bénins ,128173 pour mes malades). Il me semblait (je n'arrive plus à remettre la main dessus) avoir lu - au cours de mes recherches pour déterminer le bon test à effectuer - que le test de Mann-Whitney U perdait son intérêt pour de grands échantillons. Il me semble aussi avoir lu que dans certains cas, on pouvait quand même utiliser un test t de student lorsque l'échantillon était grand ? Même si la loi normale n'est pas suivie ?
D'avance merci, tous les éclaircissements sont les bienvenus !!
Jonathan
Je possède un jeu de données avec des valeurs de potentiels d'ionisation d'ADN pour des mutations bénignes et un jeu de données avec des valeurs de potentiels d'ionisation d'ADN pour des mutations pathogènes.
Je tente de déterminer si les moyennes sont significativement différentes entre mes deux échantillons.
J'ai pour cela vérifier si mes échantillons suivaient une loi normale grâce à un test de shapiro, ce n'est pas le cas. La variance n'est pas la même non plus si je me fie au test de Levene. Dès lors j'ai écarté le test t paramétrique et je me suis tourné vers un test de Mann-Whitney U, cependant je me demande s'il est judicieux de se fier à la p-value obtenue étant donné que la taille de mes échantillons sont différentes et que le nombre d'observations au sein des échantillons est également très grande (2662630 pour mes bénins ,128173 pour mes malades). Il me semblait (je n'arrive plus à remettre la main dessus) avoir lu - au cours de mes recherches pour déterminer le bon test à effectuer - que le test de Mann-Whitney U perdait son intérêt pour de grands échantillons. Il me semble aussi avoir lu que dans certains cas, on pouvait quand même utiliser un test t de student lorsque l'échantillon était grand ? Même si la loi normale n'est pas suivie ?
D'avance merci, tous les éclaircissements sont les bienvenus !!
Jonathan
Cracramon- Nombre de messages : 24
Date d'inscription : 11/01/2016
Re: Mann-Whitney U pour grands échantillons
Je ne vois pas pourquoi un test de Mann-Whitney perdrait de la validité sur de grands échantillons. Je n'ai jamais vu ce genre d'information et n'en comprendrais pas la logique. Ce genre de tests (non paramétriques) au contraire perd de la validité sur de très petits échantillons. Mais c'est une autre histoire. Vous pouvez donc vous lancer.
En revanche, si un test t n'est pas valide (e.g., parce qu'on est trop loin de la normalité), il reste non valide sur de grands échantillons.
HTH, Eric.
En revanche, si un test t n'est pas valide (e.g., parce qu'on est trop loin de la normalité), il reste non valide sur de grands échantillons.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Mann-Whitney U pour grands échantillons
Bonjour,
Ce qu'il risque de se passer mais ça c'est vrai pour n'importe quel test, c'est qu'avec autant de données tes tests soient toujours significatifs et au final peu informatifs.
cdlt
Ce qu'il risque de se passer mais ça c'est vrai pour n'importe quel test, c'est qu'avec autant de données tes tests soient toujours significatifs et au final peu informatifs.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Mann-Whitney U pour grands échantillons
Merci à vous deux pour vos précisions !
(et merci de m'avoir fait googleliser HTH et cdlt ahah )
(et merci de m'avoir fait googleliser HTH et cdlt ahah )
Cracramon- Nombre de messages : 24
Date d'inscription : 11/01/2016
Sujets similaires
» Mann Whitney pour les petits échantillons
» Que faire en cas de (très) grands échantillons ?
» régression sur très grands échantillons
» Mann Whitney-ra ou Mann whitney-ra pas ?
» Mann Whitney
» Que faire en cas de (très) grands échantillons ?
» régression sur très grands échantillons
» Mann Whitney-ra ou Mann whitney-ra pas ?
» Mann Whitney
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|