Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Problème test krustal-wallis : limites??
2 participants
Page 1 sur 1
Problème test krustal-wallis : limites??
Bonjour,
Pour chaque gène, j'ai voulu compter le nombre d'exons par tiers (position start -> tiers1, tiers1 -> tiers2, tiers2 -> positon end) , afin de montrer que le nombre d'exon est bien répartie tout le long des gènes.
J'ai donc 3 groupes : tiers1, tiers2 et tiers3 avec 23354 valeurs dont plusieurs se répètent.
En fonction de la distribution, j'ai décidé de faire un test non paramétrique et plus particulièrement krustal-wallis (sous R).
tiers1:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.371 4.000 114.000
tiers2:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 1.000 1.000 2.694 3.000 110.000
tiers3:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.393 4.000 89.000
Au vu des médianes je m'attends à ce que le test ne soit pas significatif, mais j'obtiens une pvalue de 2e-16.
> kruskal.test(data_exon[,c(2:4)])
Kruskal-Wallis rank sum test
data: data_exon[, c(2:4)]
Kruskal-Wallis chi-squared = 1611.676, df = 2, p-value < 2.2e-16
Le test est il adapté à mon cas ?
Y aurait il une limite due aux valeurs testées.
je vous remercie par avance de m'aider.
Pour chaque gène, j'ai voulu compter le nombre d'exons par tiers (position start -> tiers1, tiers1 -> tiers2, tiers2 -> positon end) , afin de montrer que le nombre d'exon est bien répartie tout le long des gènes.
J'ai donc 3 groupes : tiers1, tiers2 et tiers3 avec 23354 valeurs dont plusieurs se répètent.
En fonction de la distribution, j'ai décidé de faire un test non paramétrique et plus particulièrement krustal-wallis (sous R).
tiers1:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.371 4.000 114.000
tiers2:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 1.000 1.000 2.694 3.000 110.000
tiers3:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.393 4.000 89.000
Au vu des médianes je m'attends à ce que le test ne soit pas significatif, mais j'obtiens une pvalue de 2e-16.
> kruskal.test(data_exon[,c(2:4)])
Kruskal-Wallis rank sum test
data: data_exon[, c(2:4)]
Kruskal-Wallis chi-squared = 1611.676, df = 2, p-value < 2.2e-16
Le test est il adapté à mon cas ?
Y aurait il une limite due aux valeurs testées.
je vous remercie par avance de m'aider.
jp2mars- Nombre de messages : 3
Date d'inscription : 09/02/2012
Re: Problème test krustal-wallis : limites??
Bonjour.
Je ne sais pas si Kruskal-Wallis est adapté, vu que tes résultats ne ne permettent pas de comprendre ce que tu as traité comme données. Le test de Kruskal-Wallis permet de savoir si des échantillons proviennent d'une même population (ou de populations ayant la même répartition). Or ici, tu as quoi, comme échantillons testés ? Autrement dit, ton échantillon "tiers 1" est constitué de quelles valeurs (ces valeurs qui vont de 1 à 114) ? J'ai un peu l'impression qu'il s'agit d'effectifs. Ou alors, je ne comprends pas ce que tu appelles "montrer que le nombre d'exon est bien répartie tout le long des gènes".
En tout cas, si tes valeurs sont des entiers, le fait que la médiane soit à 1 dans deux cas et à 2 dans un autre donne déjà un indice d'une répartition nettement différente, donc ne contredit pas le fait que le test soit significatif (rappel : On ne tient pas compte des valeurs, mais de leur ordre).
Cordialement.
Je ne sais pas si Kruskal-Wallis est adapté, vu que tes résultats ne ne permettent pas de comprendre ce que tu as traité comme données. Le test de Kruskal-Wallis permet de savoir si des échantillons proviennent d'une même population (ou de populations ayant la même répartition). Or ici, tu as quoi, comme échantillons testés ? Autrement dit, ton échantillon "tiers 1" est constitué de quelles valeurs (ces valeurs qui vont de 1 à 114) ? J'ai un peu l'impression qu'il s'agit d'effectifs. Ou alors, je ne comprends pas ce que tu appelles "montrer que le nombre d'exon est bien répartie tout le long des gènes".
En tout cas, si tes valeurs sont des entiers, le fait que la médiane soit à 1 dans deux cas et à 2 dans un autre donne déjà un indice d'une répartition nettement différente, donc ne contredit pas le fait que le test soit significatif (rappel : On ne tient pas compte des valeurs, mais de leur ordre).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Problème test krustal-wallis : limites??
Merci pour la réponse.
Pour expliquer un peu mieux le problème :
J'ai une liste de gènes (23354). Pour chaque gène je récupère la position des exons.
Ensuite je regarde sur chaque tiers du gènes combien je trouve d'exon.
Le but est de vérifier que les exons sont régulièrement répartis ou non le long des gènes.
Il y a un problème auquel je vient de penser, c'est que le nombres d'exons par gènes n'est pas toujours le même, ça varie de 1 à 312.
Du coup je pensais peut être qu'il vallait mieux que je travail sur le ratio nb_exon_par_tiers / nb_exon_total.
Sinon tu as sûrement raison si je regarde le nombre de valeurs = 1 il y une grosse différence. Je comprend pourquoi alors le test ressort comme significatif.
Je vais tester avec les ratios.
encore merci.
Pour expliquer un peu mieux le problème :
J'ai une liste de gènes (23354). Pour chaque gène je récupère la position des exons.
Ensuite je regarde sur chaque tiers du gènes combien je trouve d'exon.
Le but est de vérifier que les exons sont régulièrement répartis ou non le long des gènes.
Il y a un problème auquel je vient de penser, c'est que le nombres d'exons par gènes n'est pas toujours le même, ça varie de 1 à 312.
Du coup je pensais peut être qu'il vallait mieux que je travail sur le ratio nb_exon_par_tiers / nb_exon_total.
Sinon tu as sûrement raison si je regarde le nombre de valeurs = 1 il y une grosse différence. Je comprend pourquoi alors le test ressort comme significatif.
Je vais tester avec les ratios.
encore merci.
jp2mars- Nombre de messages : 3
Date d'inscription : 09/02/2012
Re: Problème test krustal-wallis : limites??
Ok,
je vois mieux.
Il y aurait sans doute des idées plus intéressantes. Par exemple, tester si les positions des exons sur les gènes sont modélisables par une variable aléatoire uniforme. Un test d'adéquation classique permet de conclure.
Mais attention, en traitant tous les gènes, tu peux obtenir une conclusion "répartition régulière", alors même que ce n'est vrai pour aucun d'entre eux mais que les écarts se neutralisent.
Cordialement.
je vois mieux.
Il y aurait sans doute des idées plus intéressantes. Par exemple, tester si les positions des exons sur les gènes sont modélisables par une variable aléatoire uniforme. Un test d'adéquation classique permet de conclure.
Mais attention, en traitant tous les gènes, tu peux obtenir une conclusion "répartition régulière", alors même que ce n'est vrai pour aucun d'entre eux mais que les écarts se neutralisent.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Problème test krustal-wallis : limites??
Malheureusement, mes compétences en stat sont vites limitées.
Je vais essayer quand même de creuser l'idée.
Encore merci.
Je vais essayer quand même de creuser l'idée.
Encore merci.
jp2mars- Nombre de messages : 3
Date d'inscription : 09/02/2012
Re: Problème test krustal-wallis : limites??
Je ne connais pas du tout R (sauf de réputation), mais il doit bien y avoirs les tests d'adéquation classiques (von Mises ou Kolmogorov-Smirnov). Avec le chois du modèle auquel comparer.
Bonne recherche.
Bonne recherche.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Test non paramétrique : Kruskal-Wallis ou test U ? HELP
» Test de Kruskal Wallis ?
» Question ardue : test kruskal wallis
» Interprétation test posthoc de kruskal wallis
» Test post Kruskal Wallis.
» Test de Kruskal Wallis ?
» Question ardue : test kruskal wallis
» Interprétation test posthoc de kruskal wallis
» Test post Kruskal Wallis.
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum