Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse statistique projet de maitrise
3 participants
Page 1 sur 1
Analyse statistique projet de maitrise
Bonjour,
Pour la petite histoire, je fais une étude visant à comparer la quantité de certaine protéine exprimé entre deux groupes de poissons (dont l'un à une particularité cellulaire). Mon but est d'identifier les protéines dont la quantité varie significativement d'un groupe à l'autre.
Pour ce faire, j'ai fais des triplicata pour chaque chaque groupe.
1) La technique que j'ai utilisé fais en sorte que j'ai du me débarrassé d'une valeurs non viable dans certain cas. Par conséquent, j'ai des protéines avec 3 valeurs pour chaque groupe, d'autre avec 3 valeurs contre 2 et un dernier groupe de protéine avec 2 valeurs contre 2.
2) Dans un premier temps, j'ai tester si l'ensemble des valeurs suive une loi de normalité dans le programme xlstat et apparemment ce n'est pas le cas.
3) Par conséquent, j'ai essayé de faire un test non paramétrique de mann-whitney.
Mon problème est que je n'arrive jamais à obtenir une p value significative (<0.05) avec ce test alors que je sais avec certitude qu'il y a des différences significatives pour certaines protéines. (Pour ce que cela vaut vu que la loi de normalité n'est pas respecté, le programme d'où j'ai pris mes valeurs faisait des ANOVA pour chaque protéine et certaine avait une p value <0.01). De plus le test ne peux comparer que les protéines ayant le même nombre de valeurs pour chaque groupe
Mes questions:
1)Est ce que ce qu'il est possible que le test ne retourne pas de différence significative à cause que le nombre de réplica est simplement trop faible vis à vis de la puissance statistique du test ?
2) Est ce qu'il y aurait une autre test plus adapté à ma situation pour traiter mes données?
3) Est ce que une transformation de mes données (log() par exemple) pourrait me permettre satisfaire à la loi de normalité et d'utiliser une anova ou un t-test?
Merci de votre aide!
Pour la petite histoire, je fais une étude visant à comparer la quantité de certaine protéine exprimé entre deux groupes de poissons (dont l'un à une particularité cellulaire). Mon but est d'identifier les protéines dont la quantité varie significativement d'un groupe à l'autre.
Pour ce faire, j'ai fais des triplicata pour chaque chaque groupe.
1) La technique que j'ai utilisé fais en sorte que j'ai du me débarrassé d'une valeurs non viable dans certain cas. Par conséquent, j'ai des protéines avec 3 valeurs pour chaque groupe, d'autre avec 3 valeurs contre 2 et un dernier groupe de protéine avec 2 valeurs contre 2.
2) Dans un premier temps, j'ai tester si l'ensemble des valeurs suive une loi de normalité dans le programme xlstat et apparemment ce n'est pas le cas.
3) Par conséquent, j'ai essayé de faire un test non paramétrique de mann-whitney.
Mon problème est que je n'arrive jamais à obtenir une p value significative (<0.05) avec ce test alors que je sais avec certitude qu'il y a des différences significatives pour certaines protéines. (Pour ce que cela vaut vu que la loi de normalité n'est pas respecté, le programme d'où j'ai pris mes valeurs faisait des ANOVA pour chaque protéine et certaine avait une p value <0.01). De plus le test ne peux comparer que les protéines ayant le même nombre de valeurs pour chaque groupe
Mes questions:
1)Est ce que ce qu'il est possible que le test ne retourne pas de différence significative à cause que le nombre de réplica est simplement trop faible vis à vis de la puissance statistique du test ?
2) Est ce qu'il y aurait une autre test plus adapté à ma situation pour traiter mes données?
3) Est ce que une transformation de mes données (log() par exemple) pourrait me permettre satisfaire à la loi de normalité et d'utiliser une anova ou un t-test?
Merci de votre aide!
logan169- Nombre de messages : 2
Date d'inscription : 22/05/2014
Re: Analyse statistique projet de maitrise
Bonsoir.
je n'ai pas trop compris, mais si tu essaies de faire des comparaisons avec des effectifs de 2 valeurs, tu n'as aucune chance d'avoir des tests significatifs. Peut-on d'ailleurs encore parler de statistiques ?
Autre remarque : "ester si l'ensemble des valeurs suive une loi de normalité" ?? Veux-tu dire que tu as tout mélangé pour tester la normalité ?
A priori, l'hypothèse de Normalité concerne chacune des variables étudiées. Si tu étudies 3 protéines, la quantité de l'une peut suivre une loi de Gauss et pas les deux autres, ou bien deux et pas la troisième, ou bien les trois, ou aucune.
mais si tu as bien des séries de 2 ou 3 valeurs, les tests de Normalité ne servent à rien (à priori, ils réussissent, mais ça ne veut rien dire).
Cordialement.
NB : Si tu ne peux avoir que 2 ou 3 valeurs, traite directement les résultats. Sans tests.
je n'ai pas trop compris, mais si tu essaies de faire des comparaisons avec des effectifs de 2 valeurs, tu n'as aucune chance d'avoir des tests significatifs. Peut-on d'ailleurs encore parler de statistiques ?
Autre remarque : "ester si l'ensemble des valeurs suive une loi de normalité" ?? Veux-tu dire que tu as tout mélangé pour tester la normalité ?
A priori, l'hypothèse de Normalité concerne chacune des variables étudiées. Si tu étudies 3 protéines, la quantité de l'une peut suivre une loi de Gauss et pas les deux autres, ou bien deux et pas la troisième, ou bien les trois, ou aucune.
mais si tu as bien des séries de 2 ou 3 valeurs, les tests de Normalité ne servent à rien (à priori, ils réussissent, mais ça ne veut rien dire).
Cordialement.
NB : Si tu ne peux avoir que 2 ou 3 valeurs, traite directement les résultats. Sans tests.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Analyse statistique projet de maitrise
Merci pour ta réponse,
Tout d'abord, je ne voulais pas rentrer dans les détails mais chaque répliqua d'un groupe est fait à partir de 4 individus. J'imagine au risque de me tromper que l'on peut considérer les valeurs en protéine d'un échantillon comme une moyenne entre ces 4 individus. Donc même avec deux répliqua de chaque bord, on a la quantité en protéine de 8 individus . Est ce que je me trompe de penser que c'est statistiquement fiable comme cela?
Ensuite, tu as raison concernant la loi de normalité. J'ai stupidement tout analysé ensemble alors que les valeurs entre protéine sont théoriquement indépendante les unes des autres. Je pense que je peux dont faire un test de student en supposant que la loi est respectée.
A ce moment là, est ce que tu penses qu'il est nécessaire de vérifier que la variance est similaire dans chaque groupe avec un test de Fisher?
Merci
Tout d'abord, je ne voulais pas rentrer dans les détails mais chaque répliqua d'un groupe est fait à partir de 4 individus. J'imagine au risque de me tromper que l'on peut considérer les valeurs en protéine d'un échantillon comme une moyenne entre ces 4 individus. Donc même avec deux répliqua de chaque bord, on a la quantité en protéine de 8 individus . Est ce que je me trompe de penser que c'est statistiquement fiable comme cela?
Ensuite, tu as raison concernant la loi de normalité. J'ai stupidement tout analysé ensemble alors que les valeurs entre protéine sont théoriquement indépendante les unes des autres. Je pense que je peux dont faire un test de student en supposant que la loi est respectée.
A ce moment là, est ce que tu penses qu'il est nécessaire de vérifier que la variance est similaire dans chaque groupe avec un test de Fisher?
Merci
logan169- Nombre de messages : 2
Date d'inscription : 22/05/2014
Re: Analyse statistique projet de maitrise
A toi de choisir : Soit tu as deux moyennes (donc deux individu), soit tu as 8 individus, donc 8 valeurs !
Et remplacer les individus par une moyenne a un effet pervers : ça réduit la dispersion. Ce qui va fausser toute analyse de comparaison.
"Je pense que je peux donc faire un test de student en supposant que la loi est respectée."
C'est toi qui vois ! Mais même avec 8 ou 12 valeurs, on est loin des tailles d'échantillons qui permettent de négliger la Normalité de la variable étudiée.
Cordialement.
Et remplacer les individus par une moyenne a un effet pervers : ça réduit la dispersion. Ce qui va fausser toute analyse de comparaison.
"Je pense que je peux donc faire un test de student en supposant que la loi est respectée."
C'est toi qui vois ! Mais même avec 8 ou 12 valeurs, on est loin des tailles d'échantillons qui permettent de négliger la Normalité de la variable étudiée.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Analyse statistique projet de maitrise
j'arrive un peu tard mais si j'ai bien compris, ton plan expérimental est fait de telle sorte qu'une analyse correspond à un pool de 4 individus et tu as fait au maximum 3 analyses par condition expérimentale (soit 12 individus sur 3 mesures). Donc au mieux tu te retrouves avec des comparaisons n=3 vs n=3 représentatives de 12 individus pour chaque condition.
Le fait d'avoir poolé tes individus au départ t'a peut être aidé techniquement (quantité de matériel faible, diminution du nombre d'analyses donc du temps et du coût) mais ça t'a fait perdre toute l'information de dispersion comme l'a indiqué gg. Tu te retrouves avec des valeurs moyennes pour 4 individus sans en connaitre ni la variance ni l'écart type. Rien ne te dit si ta valeur moyenne est tirée vers le bas ou le haut à cause d'un individu "aberrant" ou "atypique".
Je serais toi, je me contenterais de tirer des tendances de tes résultats. Je sais que ce n'est pas vraiment satisfaisant comme réponse mais je ne vois pas comment faire autrement.
Autrement si tu veux absolument utiliser un test statistique, comme ton n max est de 3 mesures par condition oriente toi vers du non paramétrique.
Le fait d'avoir poolé tes individus au départ t'a peut être aidé techniquement (quantité de matériel faible, diminution du nombre d'analyses donc du temps et du coût) mais ça t'a fait perdre toute l'information de dispersion comme l'a indiqué gg. Tu te retrouves avec des valeurs moyennes pour 4 individus sans en connaitre ni la variance ni l'écart type. Rien ne te dit si ta valeur moyenne est tirée vers le bas ou le haut à cause d'un individu "aberrant" ou "atypique".
Je serais toi, je me contenterais de tirer des tendances de tes résultats. Je sais que ce n'est pas vraiment satisfaisant comme réponse mais je ne vois pas comment faire autrement.
Autrement si tu veux absolument utiliser un test statistique, comme ton n max est de 3 mesures par condition oriente toi vers du non paramétrique.
bloup- Nombre de messages : 41
Date d'inscription : 13/03/2012
Sujets similaires
» Aide Projet Statistique Urgent
» Projet marketing
» Estimation temps d'un projet
» Aide projet de stat
» statistique
» Projet marketing
» Estimation temps d'un projet
» Aide projet de stat
» statistique
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum