Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
comparaison de moyennes sur échantillons non indépendants
4 participants
Page 1 sur 1
comparaison de moyennes sur échantillons non indépendants
Bonjour,
Je suis récemment diplômé d'un M2 en écologie et je travaille actuellement sur des données en génétiques des populations. Plus précisément sur des données génétiques d'un poisson en voie d'extinction.
Mon problème actuel concerne la comparaison de moyennes de deux groupes d'individus.
Pour ces deux groupes j'ai à disposition une variable continue (bornée entre 0 et 1) qui correspond à un coefficient de consanguinité individuel pour chaque individu.
Chaque groupe n'a pas le même nombre d'individus (mais ils ont tous deux au moins 30 individus)
Les distributions ne sont pas normales.
J'ai donc penché pour un test non paramétrique. Mais lequel...? étant donné que les deux groupes que je compare, sont, à mon sens non indépendants car l'un est constitué d'un échantillon de descendants de l'autre. C'est à dire que dans un groupe on a les parents et dans l'autre, certains descendants de ces parents. Par conséquent les valeurs de consanguinités individuelles du groupe de descendants sont en relation avec les valeurs de consanguinité des parents. En effet la théorie prédit que plus les parents sont consanguins, plus les descendants ont des chances de l'être. Vu que je n'ai pas des effectifs égaux entre les groupes comparés, je ne pense pas pouvoir utiliser un test de Friedman ou Wilcoxon.
Est-ce que quelqu'un pourrait m'aider à résoudre ce problème?
PS: Je mets en pièce jointe un fichier .xls avec 4 colonnes. La première et la 3ème correspondent aux noms des individus des deux groupes et la 2ème et la 4ème aux valeurs du coefficient de consanguinité individuel pour chacun des individus.
Je suis récemment diplômé d'un M2 en écologie et je travaille actuellement sur des données en génétiques des populations. Plus précisément sur des données génétiques d'un poisson en voie d'extinction.
Mon problème actuel concerne la comparaison de moyennes de deux groupes d'individus.
Pour ces deux groupes j'ai à disposition une variable continue (bornée entre 0 et 1) qui correspond à un coefficient de consanguinité individuel pour chaque individu.
Chaque groupe n'a pas le même nombre d'individus (mais ils ont tous deux au moins 30 individus)
Les distributions ne sont pas normales.
J'ai donc penché pour un test non paramétrique. Mais lequel...? étant donné que les deux groupes que je compare, sont, à mon sens non indépendants car l'un est constitué d'un échantillon de descendants de l'autre. C'est à dire que dans un groupe on a les parents et dans l'autre, certains descendants de ces parents. Par conséquent les valeurs de consanguinités individuelles du groupe de descendants sont en relation avec les valeurs de consanguinité des parents. En effet la théorie prédit que plus les parents sont consanguins, plus les descendants ont des chances de l'être. Vu que je n'ai pas des effectifs égaux entre les groupes comparés, je ne pense pas pouvoir utiliser un test de Friedman ou Wilcoxon.
Est-ce que quelqu'un pourrait m'aider à résoudre ce problème?
PS: Je mets en pièce jointe un fichier .xls avec 4 colonnes. La première et la 3ème correspondent aux noms des individus des deux groupes et la 2ème et la 4ème aux valeurs du coefficient de consanguinité individuel pour chacun des individus.
- Fichiers joints
skymoon13- Nombre de messages : 4
Date d'inscription : 12/11/2015
Re: comparaison de moyennes sur échantillons non indépendants
Bonjour,
Je n'ai pas compris ce que tu cherches à comparer.
Je ne comprends pas non plus pourquoi tu te retrouves avec 1 seul mesure de consanguinité pour chaque individu alors que tu devrais la mesurer entre tous les individus (ie une sorte de distance génétique entre les individus), non ?
Nik
Je n'ai pas compris ce que tu cherches à comparer.
Je ne comprends pas non plus pourquoi tu te retrouves avec 1 seul mesure de consanguinité pour chaque individu alors que tu devrais la mesurer entre tous les individus (ie une sorte de distance génétique entre les individus), non ?
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: comparaison de moyennes sur échantillons non indépendants
Bonjour Nik,
En réalité je cherche à comparer les moyennes (ou peut être qu'il faudrait que je m'intéresse aux médianes...?) de 2 groupes d'individus pour lesquels j'ai des mesures de consanguinité individuelle (calculée à partir de séquences microsatellites). Afin de savoir si un groupe est en moyenne plus consanguin que l'autre.
En fait le coefficient de consanguinité individuel est calculé en utilisant, pour chaque individu, l'ensemble des données génétiques (dans notre cas les variants alléliques à plusieurs loci microsatellites) que l'on possède sur lui. De ce que j'ai compris, un coefficient de consanguinité individuel est attribué en calculant les probabilités que les 2 allèles d'un locus donné soient identiques par descendance. C'est à dire la probabilité qu'ils proviennent de deux individus parentaux apparentés (ex frère et sœur). Si on prend un cas extrême, relativement aux fréquences alléliques de la population (préalablement calculées), un individu qui serait homozygote (avec des allèles rares très peu présents dans la population) à plusieurs loci aurait un coefficient de consanguinité individuel plus élevé qu'un individu qui serait hétérozygote à tous les loci.
Ces valeurs de consanguinité individuelles sont calculées par un logiciel appellé Coancestry et les détails du calcul me paraissent encore obscurs mais quoi qu'il en soit, mon problème actuel concerne la comparaison des moyennes (ou médianes) des consanguinité individuelle de chaque groupe afin de voir si leur différence est significative entre les 2 groupes. Auquel cas, je pourrai en déduire qu'un groupe est significativement plus consanguin que l'autre ( ce qui devrait être le cas étant donné que les individus parentaux (cf doc .xls: GEND13-14) sont déjà pour la plupart frères et sœurs ou demi frères et sœurs. Ceux là même qui ont donné naissance aux individus de l'échantillon de descendants (cf doc .xls: D15)
En espérant avoir clarifié mon problème,
Simon
En réalité je cherche à comparer les moyennes (ou peut être qu'il faudrait que je m'intéresse aux médianes...?) de 2 groupes d'individus pour lesquels j'ai des mesures de consanguinité individuelle (calculée à partir de séquences microsatellites). Afin de savoir si un groupe est en moyenne plus consanguin que l'autre.
En fait le coefficient de consanguinité individuel est calculé en utilisant, pour chaque individu, l'ensemble des données génétiques (dans notre cas les variants alléliques à plusieurs loci microsatellites) que l'on possède sur lui. De ce que j'ai compris, un coefficient de consanguinité individuel est attribué en calculant les probabilités que les 2 allèles d'un locus donné soient identiques par descendance. C'est à dire la probabilité qu'ils proviennent de deux individus parentaux apparentés (ex frère et sœur). Si on prend un cas extrême, relativement aux fréquences alléliques de la population (préalablement calculées), un individu qui serait homozygote (avec des allèles rares très peu présents dans la population) à plusieurs loci aurait un coefficient de consanguinité individuel plus élevé qu'un individu qui serait hétérozygote à tous les loci.
Ces valeurs de consanguinité individuelles sont calculées par un logiciel appellé Coancestry et les détails du calcul me paraissent encore obscurs mais quoi qu'il en soit, mon problème actuel concerne la comparaison des moyennes (ou médianes) des consanguinité individuelle de chaque groupe afin de voir si leur différence est significative entre les 2 groupes. Auquel cas, je pourrai en déduire qu'un groupe est significativement plus consanguin que l'autre ( ce qui devrait être le cas étant donné que les individus parentaux (cf doc .xls: GEND13-14) sont déjà pour la plupart frères et sœurs ou demi frères et sœurs. Ceux là même qui ont donné naissance aux individus de l'échantillon de descendants (cf doc .xls: D15)
En espérant avoir clarifié mon problème,
Simon
skymoon13- Nombre de messages : 4
Date d'inscription : 12/11/2015
Re: comparaison de moyennes sur échantillons non indépendants
Bonsoir,
Je suis bien loin d'être une flèche en stats. peut-être vaut-il mieux attendre confirmation ou infirmation par un pro mais...
Que dis-tu d'un Wilcoxon apparié ?
Virginie
Je suis bien loin d'être une flèche en stats. peut-être vaut-il mieux attendre confirmation ou infirmation par un pro mais...
Que dis-tu d'un Wilcoxon apparié ?
Virginie
VirginieIAE- Nombre de messages : 10
Date d'inscription : 13/11/2015
Re: comparaison de moyennes sur échantillons non indépendants
Bonjour Virginie,
Je vais essayer de faire ce que tu suggères même si dans tous les exemples d'utilisation de ce test que j'ai vu jusqu'à présent les échantillons comparés ont même taille. Ce qui n'est pas le cas pour les miens. Mais vu que je n'ai vu nulle part que les conditions d'applications de ce test exigeaient des effectifs égaux, je vais suivre ton idée. A moins que quelqu'un en sache plus sur le sujet...
Merci,
Simon
Je vais essayer de faire ce que tu suggères même si dans tous les exemples d'utilisation de ce test que j'ai vu jusqu'à présent les échantillons comparés ont même taille. Ce qui n'est pas le cas pour les miens. Mais vu que je n'ai vu nulle part que les conditions d'applications de ce test exigeaient des effectifs égaux, je vais suivre ton idée. A moins que quelqu'un en sache plus sur le sujet...
Merci,
Simon
skymoon13- Nombre de messages : 4
Date d'inscription : 12/11/2015
Re: comparaison de moyennes sur échantillons non indépendants
Les tests appariés sont utilisables lorsqu'on effectue plusieurs mesures sur les MEMES individus, à des temps ou dans des conditions différentes.
Leur interet est d'etre plus puissants (ils détectent des différences plus faibles) que les non paramétriques car ils prennent en compte le fait que les mesures ont tendance à être moins variables pour un même individu (en quelques sortes chaque individu est son propre témoin)
Tu n'es clairement pas dans une situation ou l'utilisation d'un paramétrique est correcte.
En première analyse, j'aurais tendance à tester avec un non paramétrique pour me faire une idée du truc. Si tu as des indications en faveur d'une différence significative, ou proche de la significativité, il faudra te mettre en rapport avec un biostatisticien pour aller plus loin.
Leur interet est d'etre plus puissants (ils détectent des différences plus faibles) que les non paramétriques car ils prennent en compte le fait que les mesures ont tendance à être moins variables pour un même individu (en quelques sortes chaque individu est son propre témoin)
Tu n'es clairement pas dans une situation ou l'utilisation d'un paramétrique est correcte.
En première analyse, j'aurais tendance à tester avec un non paramétrique pour me faire une idée du truc. Si tu as des indications en faveur d'une différence significative, ou proche de la significativité, il faudra te mettre en rapport avec un biostatisticien pour aller plus loin.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: comparaison de moyennes sur échantillons non indépendants
Merci beaucoup pour vos réponses. Finalement j'ai opté pour un test avec une méthode de bootstrap.
Simon
Simon
skymoon13- Nombre de messages : 4
Date d'inscription : 12/11/2015
Sujets similaires
» Comparaison échantillons indépendants
» Comparaison de 2 moyennes : taille échantillons
» comparaison de moyennes de deux échantillons
» COMPARAISON DES MOYENNES DE TRES GROS ECHANTILLONS
» Mac Nemar et comparaison d’échantillons
» Comparaison de 2 moyennes : taille échantillons
» comparaison de moyennes de deux échantillons
» COMPARAISON DES MOYENNES DE TRES GROS ECHANTILLONS
» Mac Nemar et comparaison d’échantillons
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|