Quel approche statistique utiliser ?

par AlexH35 Jeu 28 Mai 2015 - 17:20

Bonjour

Je me présente. Alexis, thésard en gal... heu en biologie à Rennes.
Je découvre ce forum avec plaisir, espérant une aide qui pourrait débloquer ma situation, et freiner mon arrachage de cheveux (si il m'en restait...).
Je vous explique mon problème.
Fondamentalement, j'ai des données, mais aucune idée de la "bonne" façon de les analyser statistiquement

.

Voici le topo :

J'ai exposé des cultures de cellules à une drogue A qui modifie un paramètre biologique connu (le pH) et peut-être d'autres (c'est ce que l'on souhaite découvrir).
En parallèle, pendant le traitement, une autre culture des mêmes cellules est traité à une autre drogue (B) dont je connais l'effet : elle modifie le pH dans mes cultures de la même manière que la drogue A, mais c'est tout !
C'est un contrôle qui me permet de savoir si les effets trouvés dans la 1ère condition sont uniquement dû à un changement de pH.
Enfin une dernière condition : je traite mes cellules à un composé sans effet, c'est mon contrôle principal.

Grâce à ma technique, je mesure une variable X (intensité de fluorescence d'un marqueur spécifique) dans mes 3 conditions et j'obtiens des données cellule par cellule.
Pour chaque expérience, j'obtiens donc entre 600 et 1500 données de la variable X, par condition.
J'ai effectué 6 expérience pour l'instant.
Pour chaque expérience, les données obtenues ne sont pas comparables en terme d'échelle : à chaque fois, les réglages de la machine qui va extraire les données du paramètre X sera réglée différemment, car il y a de la variabilité d'efficacité de la technique d'une manip à l'autre.
Par exemple, dans la manip 1, X peut prendre des valeurs de 10 à 150, alors que dans la manip 4, il prendra des valeurs de 12000 à 180000. Il n'y a pas de linéarité des résultats entre les expériences.
Je compare toutefois les mêmes 3 conditions entre elles dans chaque expérience, et c'est donc les différences intra-expériences entre ces 3 conditions qui m’intéressent.
Mais je dois bien entendu intégrer la reproductibilité inter-expériences de mes résultats en compilant les 6 expériences.
A noter qu' il existe une très forte variabilité de la valeur que peut prendre X dans chaque condition de chaque expérience.

La méthode que j'ai utilisée jusque là commence par ramener toutes mes valeurs en "facteur d'induction" du contrôle principal :
- Dans chaque expérience, j'ai calculé la moyenne de ma condition "contrôle principal"
- J'ai défini la moyenne de ma condition "contrôle principal" à 1
- J'ai divisé toutes les valeurs des mes conditions "drogue A" et "drogue B" par la moyenne de ma condition "contrôle principal"
- J'ai fait la moyenne des valeurs centrées sur 1 de mes conditions "drogue A" et "drogue B"
- Je fais la moyenne des moyennes des mes expériences
- Présentés en histogrammes, ce sont mes résultats finaux.
Test stat : je compare les conditions 2 à 2 en utilisant le test de Mann et Whitney et le test de Wilcoxon (je ne sais pas lequel est le plus approprié ici).

Mon tuteur de thèse que je vois une fois par an m'a dit que je faisait une erreur de type 2 (??) et qu'il fallait que j'utilise des tests type ANOVA pour comparer mes 3 conditions simultanément.

Je ne comprends rien à cela, et je suis perdu confused

. Mes questions sont donc :
- Comment dois-je considérer mes données ?
Comparer les data en cellule par cellule, centrer les données et puller les 6 expériences (mettre à la suite les plages de données les une après les autres) ? rester en moyenne des moyennes de chaque expérience ?
- Selon ce que je choisis, dois-je vérifier la distribution , la variance, la normalité de chacune de mes conditions, dans chaque expérience ? Sur quelle plage ? dans le pull de toutes les expériences avec des données centrées ?
- Surtout, pourquoi ne pourrais-je pas utiliser des comparaisons 2 à 2 (test t, z',...) dans ces conditions qui sont totalement indépendantes à mes yeux ?
- Si je dois utiliser une ANOVA, pourquoi et quelle information j'en tirerais ?

Voilà, le pavé est terminé Laughing

Merci à qui voudra bien prendre le temps de le lire study

, et surtout à qui voudra bien prendre le temps de tenter de m'aider Razz

!
Je me rends compte à quel point j'aurais dû être plus assidu en cours de stat, et surtout à quel point un statisticien est nécessaire en amont de tout travaux engagés en "haut-débit"...
Surtout, j'ai découvert que j'aimais les maths, je trouve ce monde fascinant, mais je crois que c'est trop tard pour m'y lancer à fond maintenant...
Un jour qui sait !

Significativement votre... geek

Alex

par c@ssoulet Ven 29 Mai 2015 - 7:10

J'ai fait ce petit truc pour les étudiants un peu largués. C'est très basique mais ca permet au moins d'avoir quelques notions de base. Tu trouveras une une introduction sur l'ANOVA et quelques explications sur le problème de la multiplicité des tests.

https://docs.google.com/document/d/1c9iihWqheHRIejCl9aHW6QD_WVkmlG6c52TuY_00_B0/edit?usp=sharing

par niaboc Ven 29 Mai 2015 - 8:25

je le trouve vraiment sympa ton doc et bien rédigé!

great job guy

par anais_jo Jeu 11 Juin 2015 - 12:35

Bonjour,
Je préviens tout de suite que je ne suis pas très douée en statistique..
J'ai travaillé avec des mouches. Un logiciel enregistre si les mouches sautent (marqué d'un 1) ou pas (marqué d'un 0) selon si on leur a administré un médicament ou juste un contrôle.
Ensuite on met nos données excel dans un logiciel qui calcule la moyenne des sauts et qui compare les résultats entre contrôle et médicament.

Voilà mon problème, nous utilisons actuellement le t-test. Mais parfois nos échantillons sont >30 car il y a un seuil automatique qui supprime une mouche n'ayant pas sauté suffisamment. On a donc une grande variabilité de n.

Quel serait, pour vous le ou les tests les plus appropriés?

Un tout grand merci d'avance pour votre aide !!

par Contenu sponsorisé

Quel approche statistique utiliser ?

Quel approche statistique utiliser ?

Re: Quel approche statistique utiliser ?

Re: Quel approche statistique utiliser ?

Re: Quel approche statistique utiliser ?

Re: Quel approche statistique utiliser ?