Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quel approche statistique utiliser ?
4 participants
Page 1 sur 1
Quel approche statistique utiliser ?
Bonjour
Je me présente. Alexis, thésard en gal... heu en biologie à Rennes.
Je découvre ce forum avec plaisir, espérant une aide qui pourrait débloquer ma situation, et freiner mon arrachage de cheveux (si il m'en restait...).
Je vous explique mon problème.
Fondamentalement, j'ai des données, mais aucune idée de la "bonne" façon de les analyser statistiquement .
Voici le topo :
J'ai exposé des cultures de cellules à une drogue A qui modifie un paramètre biologique connu (le pH) et peut-être d'autres (c'est ce que l'on souhaite découvrir).
En parallèle, pendant le traitement, une autre culture des mêmes cellules est traité à une autre drogue (B) dont je connais l'effet : elle modifie le pH dans mes cultures de la même manière que la drogue A, mais c'est tout !
C'est un contrôle qui me permet de savoir si les effets trouvés dans la 1ère condition sont uniquement dû à un changement de pH.
Enfin une dernière condition : je traite mes cellules à un composé sans effet, c'est mon contrôle principal.
Grâce à ma technique, je mesure une variable X (intensité de fluorescence d'un marqueur spécifique) dans mes 3 conditions et j'obtiens des données cellule par cellule.
Pour chaque expérience, j'obtiens donc entre 600 et 1500 données de la variable X, par condition.
J'ai effectué 6 expérience pour l'instant.
Pour chaque expérience, les données obtenues ne sont pas comparables en terme d'échelle : à chaque fois, les réglages de la machine qui va extraire les données du paramètre X sera réglée différemment, car il y a de la variabilité d'efficacité de la technique d'une manip à l'autre.
Par exemple, dans la manip 1, X peut prendre des valeurs de 10 à 150, alors que dans la manip 4, il prendra des valeurs de 12000 à 180000. Il n'y a pas de linéarité des résultats entre les expériences.
Je compare toutefois les mêmes 3 conditions entre elles dans chaque expérience, et c'est donc les différences intra-expériences entre ces 3 conditions qui m’intéressent.
Mais je dois bien entendu intégrer la reproductibilité inter-expériences de mes résultats en compilant les 6 expériences.
A noter qu' il existe une très forte variabilité de la valeur que peut prendre X dans chaque condition de chaque expérience.
La méthode que j'ai utilisée jusque là commence par ramener toutes mes valeurs en "facteur d'induction" du contrôle principal :
- Dans chaque expérience, j'ai calculé la moyenne de ma condition "contrôle principal"
- J'ai défini la moyenne de ma condition "contrôle principal" à 1
- J'ai divisé toutes les valeurs des mes conditions "drogue A" et "drogue B" par la moyenne de ma condition "contrôle principal"
- J'ai fait la moyenne des valeurs centrées sur 1 de mes conditions "drogue A" et "drogue B"
- Je fais la moyenne des moyennes des mes expériences
- Présentés en histogrammes, ce sont mes résultats finaux.
Test stat : je compare les conditions 2 à 2 en utilisant le test de Mann et Whitney et le test de Wilcoxon (je ne sais pas lequel est le plus approprié ici).
Mon tuteur de thèse que je vois une fois par an m'a dit que je faisait une erreur de type 2 (??) et qu'il fallait que j'utilise des tests type ANOVA pour comparer mes 3 conditions simultanément.
Je ne comprends rien à cela, et je suis perdu . Mes questions sont donc :
- Comment dois-je considérer mes données ?
Comparer les data en cellule par cellule, centrer les données et puller les 6 expériences (mettre à la suite les plages de données les une après les autres) ? rester en moyenne des moyennes de chaque expérience ?
- Selon ce que je choisis, dois-je vérifier la distribution , la variance, la normalité de chacune de mes conditions, dans chaque expérience ? Sur quelle plage ? dans le pull de toutes les expériences avec des données centrées ?
- Surtout, pourquoi ne pourrais-je pas utiliser des comparaisons 2 à 2 (test t, z',...) dans ces conditions qui sont totalement indépendantes à mes yeux ?
- Si je dois utiliser une ANOVA, pourquoi et quelle information j'en tirerais ?
Voilà, le pavé est terminé
Merci à qui voudra bien prendre le temps de le lire , et surtout à qui voudra bien prendre le temps de tenter de m'aider !
Je me rends compte à quel point j'aurais dû être plus assidu en cours de stat, et surtout à quel point un statisticien est nécessaire en amont de tout travaux engagés en "haut-débit"...
Surtout, j'ai découvert que j'aimais les maths, je trouve ce monde fascinant, mais je crois que c'est trop tard pour m'y lancer à fond maintenant...
Un jour qui sait !
Significativement votre...
Alex
Je me présente. Alexis, thésard en gal... heu en biologie à Rennes.
Je découvre ce forum avec plaisir, espérant une aide qui pourrait débloquer ma situation, et freiner mon arrachage de cheveux (si il m'en restait...).
Je vous explique mon problème.
Fondamentalement, j'ai des données, mais aucune idée de la "bonne" façon de les analyser statistiquement .
Voici le topo :
J'ai exposé des cultures de cellules à une drogue A qui modifie un paramètre biologique connu (le pH) et peut-être d'autres (c'est ce que l'on souhaite découvrir).
En parallèle, pendant le traitement, une autre culture des mêmes cellules est traité à une autre drogue (B) dont je connais l'effet : elle modifie le pH dans mes cultures de la même manière que la drogue A, mais c'est tout !
C'est un contrôle qui me permet de savoir si les effets trouvés dans la 1ère condition sont uniquement dû à un changement de pH.
Enfin une dernière condition : je traite mes cellules à un composé sans effet, c'est mon contrôle principal.
Grâce à ma technique, je mesure une variable X (intensité de fluorescence d'un marqueur spécifique) dans mes 3 conditions et j'obtiens des données cellule par cellule.
Pour chaque expérience, j'obtiens donc entre 600 et 1500 données de la variable X, par condition.
J'ai effectué 6 expérience pour l'instant.
Pour chaque expérience, les données obtenues ne sont pas comparables en terme d'échelle : à chaque fois, les réglages de la machine qui va extraire les données du paramètre X sera réglée différemment, car il y a de la variabilité d'efficacité de la technique d'une manip à l'autre.
Par exemple, dans la manip 1, X peut prendre des valeurs de 10 à 150, alors que dans la manip 4, il prendra des valeurs de 12000 à 180000. Il n'y a pas de linéarité des résultats entre les expériences.
Je compare toutefois les mêmes 3 conditions entre elles dans chaque expérience, et c'est donc les différences intra-expériences entre ces 3 conditions qui m’intéressent.
Mais je dois bien entendu intégrer la reproductibilité inter-expériences de mes résultats en compilant les 6 expériences.
A noter qu' il existe une très forte variabilité de la valeur que peut prendre X dans chaque condition de chaque expérience.
La méthode que j'ai utilisée jusque là commence par ramener toutes mes valeurs en "facteur d'induction" du contrôle principal :
- Dans chaque expérience, j'ai calculé la moyenne de ma condition "contrôle principal"
- J'ai défini la moyenne de ma condition "contrôle principal" à 1
- J'ai divisé toutes les valeurs des mes conditions "drogue A" et "drogue B" par la moyenne de ma condition "contrôle principal"
- J'ai fait la moyenne des valeurs centrées sur 1 de mes conditions "drogue A" et "drogue B"
- Je fais la moyenne des moyennes des mes expériences
- Présentés en histogrammes, ce sont mes résultats finaux.
Test stat : je compare les conditions 2 à 2 en utilisant le test de Mann et Whitney et le test de Wilcoxon (je ne sais pas lequel est le plus approprié ici).
Mon tuteur de thèse que je vois une fois par an m'a dit que je faisait une erreur de type 2 (??) et qu'il fallait que j'utilise des tests type ANOVA pour comparer mes 3 conditions simultanément.
Je ne comprends rien à cela, et je suis perdu . Mes questions sont donc :
- Comment dois-je considérer mes données ?
Comparer les data en cellule par cellule, centrer les données et puller les 6 expériences (mettre à la suite les plages de données les une après les autres) ? rester en moyenne des moyennes de chaque expérience ?
- Selon ce que je choisis, dois-je vérifier la distribution , la variance, la normalité de chacune de mes conditions, dans chaque expérience ? Sur quelle plage ? dans le pull de toutes les expériences avec des données centrées ?
- Surtout, pourquoi ne pourrais-je pas utiliser des comparaisons 2 à 2 (test t, z',...) dans ces conditions qui sont totalement indépendantes à mes yeux ?
- Si je dois utiliser une ANOVA, pourquoi et quelle information j'en tirerais ?
Voilà, le pavé est terminé
Merci à qui voudra bien prendre le temps de le lire , et surtout à qui voudra bien prendre le temps de tenter de m'aider !
Je me rends compte à quel point j'aurais dû être plus assidu en cours de stat, et surtout à quel point un statisticien est nécessaire en amont de tout travaux engagés en "haut-débit"...
Surtout, j'ai découvert que j'aimais les maths, je trouve ce monde fascinant, mais je crois que c'est trop tard pour m'y lancer à fond maintenant...
Un jour qui sait !
Significativement votre...
Alex
AlexH35- Nombre de messages : 1
Date d'inscription : 28/05/2015
Re: Quel approche statistique utiliser ?
J'ai fait ce petit truc pour les étudiants un peu largués. C'est très basique mais ca permet au moins d'avoir quelques notions de base. Tu trouveras une une introduction sur l'ANOVA et quelques explications sur le problème de la multiplicité des tests.
https://docs.google.com/document/d/1c9iihWqheHRIejCl9aHW6QD_WVkmlG6c52TuY_00_B0/edit?usp=sharing
https://docs.google.com/document/d/1c9iihWqheHRIejCl9aHW6QD_WVkmlG6c52TuY_00_B0/edit?usp=sharing
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Quel approche statistique utiliser ?
je le trouve vraiment sympa ton doc et bien rédigé!
great job guy
great job guy
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Quel approche statistique utiliser ?
Bonjour,
Je préviens tout de suite que je ne suis pas très douée en statistique..
J'ai travaillé avec des mouches. Un logiciel enregistre si les mouches sautent (marqué d'un 1) ou pas (marqué d'un 0) selon si on leur a administré un médicament ou juste un contrôle.
Ensuite on met nos données excel dans un logiciel qui calcule la moyenne des sauts et qui compare les résultats entre contrôle et médicament.
Voilà mon problème, nous utilisons actuellement le t-test. Mais parfois nos échantillons sont >30 car il y a un seuil automatique qui supprime une mouche n'ayant pas sauté suffisamment. On a donc une grande variabilité de n.
Quel serait, pour vous le ou les tests les plus appropriés?
Un tout grand merci d'avance pour votre aide !!
Je préviens tout de suite que je ne suis pas très douée en statistique..
J'ai travaillé avec des mouches. Un logiciel enregistre si les mouches sautent (marqué d'un 1) ou pas (marqué d'un 0) selon si on leur a administré un médicament ou juste un contrôle.
Ensuite on met nos données excel dans un logiciel qui calcule la moyenne des sauts et qui compare les résultats entre contrôle et médicament.
Voilà mon problème, nous utilisons actuellement le t-test. Mais parfois nos échantillons sont >30 car il y a un seuil automatique qui supprime une mouche n'ayant pas sauté suffisamment. On a donc une grande variabilité de n.
Quel serait, pour vous le ou les tests les plus appropriés?
Un tout grand merci d'avance pour votre aide !!
anais_jo- Nombre de messages : 1
Date d'inscription : 11/06/2015
Sujets similaires
» quel test statistique utiliser?
» Quel test statistique utiliser ?
» quel test statistique utiliser
» Quel test statistique utiliser?
» Quel test statistique utiliser ?
» Quel test statistique utiliser ?
» quel test statistique utiliser
» Quel test statistique utiliser?
» Quel test statistique utiliser ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum