comparaison de moyennes sur échantillons non indépendants

par skymoon13 Jeu 12 Nov 2015 - 13:33

Bonjour,

Je suis récemment diplômé d'un M2 en écologie et je travaille actuellement sur des données en génétiques des populations. Plus précisément sur des données génétiques d'un poisson en voie d'extinction.
Mon problème actuel concerne la comparaison de moyennes de deux groupes d'individus.
Pour ces deux groupes j'ai à disposition une variable continue (bornée entre 0 et 1) qui correspond à un coefficient de consanguinité individuel pour chaque individu.
Chaque groupe n'a pas le même nombre d'individus (mais ils ont tous deux au moins 30 individus)
Les distributions ne sont pas normales.
J'ai donc penché pour un test non paramétrique. Mais lequel...? étant donné que les deux groupes que je compare, sont, à mon sens non indépendants car l'un est constitué d'un échantillon de descendants de l'autre. C'est à dire que dans un groupe on a les parents et dans l'autre, certains descendants de ces parents. Par conséquent les valeurs de consanguinités individuelles du groupe de descendants sont en relation avec les valeurs de consanguinité des parents. En effet la théorie prédit que plus les parents sont consanguins, plus les descendants ont des chances de l'être. Vu que je n'ai pas des effectifs égaux entre les groupes comparés, je ne pense pas pouvoir utiliser un test de Friedman ou Wilcoxon.

Est-ce que quelqu'un pourrait m'aider à résoudre ce problème?

PS: Je mets en pièce jointe un fichier .xls avec 4 colonnes. La première et la 3ème correspondent aux noms des individus des deux groupes et la 2ème et la 4ème aux valeurs du coefficient de consanguinité individuel pour chacun des individus.

Fichiers joints

: exemple_forum_compar_moyennes.xlsx Vous n'avez pas la permission de télécharger les fichiers joints.(16 Ko) Téléchargé 6 fois

par Nik Jeu 12 Nov 2015 - 14:07

Bonjour,

Je n'ai pas compris ce que tu cherches à comparer.
Je ne comprends pas non plus pourquoi tu te retrouves avec 1 seul mesure de consanguinité pour chaque individu alors que tu devrais la mesurer entre tous les individus (ie une sorte de distance génétique entre les individus), non ?

Nik

par skymoon13 Ven 13 Nov 2015 - 10:28

Bonjour Nik,

En réalité je cherche à comparer les moyennes (ou peut être qu'il faudrait que je m'intéresse aux médianes...?) de 2 groupes d'individus pour lesquels j'ai des mesures de consanguinité individuelle (calculée à partir de séquences microsatellites). Afin de savoir si un groupe est en moyenne plus consanguin que l'autre.

En fait le coefficient de consanguinité individuel est calculé en utilisant, pour chaque individu, l'ensemble des données génétiques (dans notre cas les variants alléliques à plusieurs loci microsatellites) que l'on possède sur lui. De ce que j'ai compris, un coefficient de consanguinité individuel est attribué en calculant les probabilités que les 2 allèles d'un locus donné soient identiques par descendance. C'est à dire la probabilité qu'ils proviennent de deux individus parentaux apparentés (ex frère et sœur). Si on prend un cas extrême, relativement aux fréquences alléliques de la population (préalablement calculées), un individu qui serait homozygote (avec des allèles rares très peu présents dans la population) à plusieurs loci aurait un coefficient de consanguinité individuel plus élevé qu'un individu qui serait hétérozygote à tous les loci.

Ces valeurs de consanguinité individuelles sont calculées par un logiciel appellé Coancestry et les détails du calcul me paraissent encore obscurs mais quoi qu'il en soit, mon problème actuel concerne la comparaison des moyennes (ou médianes) des consanguinité individuelle de chaque groupe afin de voir si leur différence est significative entre les 2 groupes. Auquel cas, je pourrai en déduire qu'un groupe est significativement plus consanguin que l'autre ( ce qui devrait être le cas étant donné que les individus parentaux (cf doc .xls: GEND13-14) sont déjà pour la plupart frères et sœurs ou demi frères et sœurs. Ceux là même qui ont donné naissance aux individus de l'échantillon de descendants (cf doc .xls: D15)

En espérant avoir clarifié mon problème,

Simon

par VirginieIAE Ven 13 Nov 2015 - 23:01

Bonsoir,

Je suis bien loin d'être une flèche en stats. peut-être vaut-il mieux attendre confirmation ou infirmation par un pro mais...

Que dis-tu d'un Wilcoxon apparié ?

Virginie

par skymoon13 Sam 14 Nov 2015 - 13:28

Bonjour Virginie,

Je vais essayer de faire ce que tu suggères même si dans tous les exemples d'utilisation de ce test que j'ai vu jusqu'à présent les échantillons comparés ont même taille. Ce qui n'est pas le cas pour les miens. Mais vu que je n'ai vu nulle part que les conditions d'applications de ce test exigeaient des effectifs égaux, je vais suivre ton idée. A moins que quelqu'un en sache plus sur le sujet...

Merci,

Simon

par c@ssoulet Lun 16 Nov 2015 - 8:49

Les tests appariés sont utilisables lorsqu'on effectue plusieurs mesures sur les MEMES individus, à des temps ou dans des conditions différentes.

Leur interet est d'etre plus puissants (ils détectent des différences plus faibles) que les non paramétriques car ils prennent en compte le fait que les mesures ont tendance à être moins variables pour un même individu (en quelques sortes chaque individu est son propre témoin)

Tu n'es clairement pas dans une situation ou l'utilisation d'un paramétrique est correcte.

En première analyse, j'aurais tendance à tester avec un non paramétrique pour me faire une idée du truc. Si tu as des indications en faveur d'une différence significative, ou proche de la significativité, il faudra te mettre en rapport avec un biostatisticien pour aller plus loin.

par skymoon13 Mar 17 Nov 2015 - 8:55

Merci beaucoup pour vos réponses. Finalement j'ai opté pour un test avec une méthode de bootstrap.

Simon

par Contenu sponsorisé

comparaison de moyennes sur échantillons non indépendants

comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants

Re: comparaison de moyennes sur échantillons non indépendants