Problème test krustal-wallis : limites??

par jp2mars Jeu 9 Fév 2012 - 10:23

Bonjour,

Pour chaque gène, j'ai voulu compter le nombre d'exons par tiers (position start -> tiers1, tiers1 -> tiers2, tiers2 -> positon end) , afin de montrer que le nombre d'exon est bien répartie tout le long des gènes.

J'ai donc 3 groupes : tiers1, tiers2 et tiers3 avec 23354 valeurs dont plusieurs se répètent.

En fonction de la distribution, j'ai décidé de faire un test non paramétrique et plus particulièrement krustal-wallis (sous R).

tiers1:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.371 4.000 114.000

tiers2:
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 1.000 1.000 2.694 3.000 110.000

tiers3:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 1.000 2.000 3.393 4.000 89.000

Au vu des médianes je m'attends à ce que le test ne soit pas significatif, mais j'obtiens une pvalue de 2e-16.

> kruskal.test(data_exon[,c(2:4)])

Kruskal-Wallis rank sum test

data: data_exon[, c(2:4)]
Kruskal-Wallis chi-squared = 1611.676, df = 2, p-value < 2.2e-16

Le test est il adapté à mon cas ?
Y aurait il une limite due aux valeurs testées.

je vous remercie par avance de m'aider.

par gg Jeu 9 Fév 2012 - 13:10

Bonjour.

Je ne sais pas si Kruskal-Wallis est adapté, vu que tes résultats ne ne permettent pas de comprendre ce que tu as traité comme données. Le test de Kruskal-Wallis permet de savoir si des échantillons proviennent d'une même population (ou de populations ayant la même répartition). Or ici, tu as quoi, comme échantillons testés ? Autrement dit, ton échantillon "tiers 1" est constitué de quelles valeurs (ces valeurs qui vont de 1 à 114) ? J'ai un peu l'impression qu'il s'agit d'effectifs. Ou alors, je ne comprends pas ce que tu appelles "montrer que le nombre d'exon est bien répartie tout le long des gènes".

En tout cas, si tes valeurs sont des entiers, le fait que la médiane soit à 1 dans deux cas et à 2 dans un autre donne déjà un indice d'une répartition nettement différente, donc ne contredit pas le fait que le test soit significatif (rappel : On ne tient pas compte des valeurs, mais de leur ordre).

Cordialement.

par jp2mars Jeu 9 Fév 2012 - 13:24

Merci pour la réponse.

Pour expliquer un peu mieux le problème :

J'ai une liste de gènes (23354). Pour chaque gène je récupère la position des exons.
Ensuite je regarde sur chaque tiers du gènes combien je trouve d'exon.

Le but est de vérifier que les exons sont régulièrement répartis ou non le long des gènes.

Il y a un problème auquel je vient de penser, c'est que le nombres d'exons par gènes n'est pas toujours le même, ça varie de 1 à 312.
Du coup je pensais peut être qu'il vallait mieux que je travail sur le ratio nb_exon_par_tiers / nb_exon_total.

Sinon tu as sûrement raison si je regarde le nombre de valeurs = 1 il y une grosse différence. Je comprend pourquoi alors le test ressort comme significatif.

Je vais tester avec les ratios.

encore merci.

par gg Jeu 9 Fév 2012 - 13:40

Ok,

je vois mieux.
Il y aurait sans doute des idées plus intéressantes. Par exemple, tester si les positions des exons sur les gènes sont modélisables par une variable aléatoire uniforme. Un test d'adéquation classique permet de conclure.
Mais attention, en traitant tous les gènes, tu peux obtenir une conclusion "répartition régulière", alors même que ce n'est vrai pour aucun d'entre eux mais que les écarts se neutralisent.

Cordialement.

par jp2mars Jeu 9 Fév 2012 - 13:50

Malheureusement, mes compétences en stat sont vites limitées.
Je vais essayer quand même de creuser l'idée.

Encore merci.

par gg Jeu 9 Fév 2012 - 19:18

Je ne connais pas du tout R (sauf de réputation), mais il doit bien y avoirs les tests d'adéquation classiques (von Mises ou Kolmogorov-Smirnov). Avec le chois du modèle auquel comparer.

Bonne recherche.

par Contenu sponsorisé

Problème test krustal-wallis : limites??

Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??

Re: Problème test krustal-wallis : limites??