Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Différence significative
3 participants
Page 1 sur 1
Différence significative
Bonjour à tous.
Etant dans le domaine de la biologie, je dois avouer que mes cours de statistiques remontent à loin. Voici mon problème :
Le codage de l'ADN utilise 4 caractères (nucléotides) différents, dont la combinaison permet de déterminer la séquence d'un gène de laquelle est déduite la séquence d'une protéine. Dans une séquence de 159000 nucléotides, une occurence spécifique de 7 nucléotides apparait 31 fois, alors que sa fréquence théorique est de 1/16384, soit 9,7 fois. Je cherche à déterminer si cette différence est statistiquement significative ou non. Je me suis orienté vers un chi², mais je bloque concernant les degrés de liberté.
Merci pour votre aide.
Etant dans le domaine de la biologie, je dois avouer que mes cours de statistiques remontent à loin. Voici mon problème :
Le codage de l'ADN utilise 4 caractères (nucléotides) différents, dont la combinaison permet de déterminer la séquence d'un gène de laquelle est déduite la séquence d'une protéine. Dans une séquence de 159000 nucléotides, une occurence spécifique de 7 nucléotides apparait 31 fois, alors que sa fréquence théorique est de 1/16384, soit 9,7 fois. Je cherche à déterminer si cette différence est statistiquement significative ou non. Je me suis orienté vers un chi², mais je bloque concernant les degrés de liberté.
Merci pour votre aide.
Bichette- Nombre de messages : 3
Date d'inscription : 25/05/2009
Re: Différence significative
Bonjour,
perso je serais plus parti sur la comparaison de ta fréquence observée avec la fréquence théorique :
http://spiral.univ-lyon1.fr/mathsv/cours/stats/chap7/c7p3/c7p3.html
moi j'obtiens un valeur de z = 6.84 et donc une proba de 0, donc très fortement significatif.
micros
perso je serais plus parti sur la comparaison de ta fréquence observée avec la fréquence théorique :
http://spiral.univ-lyon1.fr/mathsv/cours/stats/chap7/c7p3/c7p3.html
moi j'obtiens un valeur de z = 6.84 et donc une proba de 0, donc très fortement significatif.
micros
Invité- Invité
Re: Différence significative
Ok, je vois l'idée. Merci beaucoup.
Ma fréquence observée est donc significativement différente de ma fréquence théorique. Ce genre de test doit il être référencé comme un Z-test en anglais ?
Ma fréquence observée est donc significativement différente de ma fréquence théorique. Ce genre de test doit il être référencé comme un Z-test en anglais ?
Bichette- Nombre de messages : 3
Date d'inscription : 25/05/2009
Re: Différence significative
DAns un 1er temps, vous supposez que les fréquences sont équivalentes : c'est à dire que la différence observée peut être attribuée au hasard de l'échantillonnage, l'échantillon extrait étant extrait au hasard de la population de 1/16384.
Ensuite, nous calculons la probabilité que cela puisse se produire.
Le test approprié est le test au moyen de la loi binomiale (voir norme NF X 06-069)
Ici vous chercher à savoir si la différence de proportion 31/159000 est significativement différente de la proportion absolue 1/16384.
Nous cherchons donc la probabilité Bin(x>=31;1590000;1/16384)
Pour ma part je trouve 4,277E-8 se qui est une probablité très faible
Le risque d'affirmer que cette différence n'est pas attribuable au hasard est de 1 chance sur 427722326
Il est ici aisé d'assumé que cette différence est lié à une cause spéciale.
Il est possible d'approximée la loi normale par tout un tas d'autres lois (poisson, khi², normale, ...) mais les logiciels et algorythmes actuels permettent de le calculer directement (même avec XL)
Lisez la norme NF X 06-069
Zadam's
Ensuite, nous calculons la probabilité que cela puisse se produire.
Le test approprié est le test au moyen de la loi binomiale (voir norme NF X 06-069)
Ici vous chercher à savoir si la différence de proportion 31/159000 est significativement différente de la proportion absolue 1/16384.
Nous cherchons donc la probabilité Bin(x>=31;1590000;1/16384)
Pour ma part je trouve 4,277E-8 se qui est une probablité très faible
Le risque d'affirmer que cette différence n'est pas attribuable au hasard est de 1 chance sur 427722326
Il est ici aisé d'assumé que cette différence est lié à une cause spéciale.
Il est possible d'approximée la loi normale par tout un tas d'autres lois (poisson, khi², normale, ...) mais les logiciels et algorythmes actuels permettent de le calculer directement (même avec XL)
Lisez la norme NF X 06-069
Zadam's
Zadam's- Nombre de messages : 3
Date d'inscription : 23/05/2009
Re: Différence significative
Avec des effectifs aussi grand, la loi binomiale tend certainement vers une loi normale. Dans un soucis de simplicité vue la question posée, il est sans doute préférable de rester sur des tests plus basiques surtout si les stats ne sont pas la spécialité de bichette.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Différence significative
Zadam's a écrit:Il est possible d'approximée la loi normale par tout un tas d'autres lois (poisson, khi², normale, ...) mais les logiciels et algorythmes actuels permettent de le calculer directement (même avec XL)
En général on cherche plutôt à approximer les autres lois par une loi normale. C'est beaucoup plus pratique notamment pour l'estimation des seuils de décision et les calculs de p-value.
micros
Invité- Invité
Re: Différence significative
Merci aux gens ayant répondu. En effet, les stats ne sont pas ma spécialité, la première solution convient à me répondre et de plus, je la comprend (d'autant plus que les deux conclusions sont les mêmes non).
En ce qui concerne le référencement de la loi utilisée, il s'agit bien d'un Z-test ?
En ce qui concerne le référencement de la loi utilisée, il s'agit bien d'un Z-test ?
Bichette- Nombre de messages : 3
Date d'inscription : 25/05/2009
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum