Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Mann Whitney-ra ou Mann whitney-ra pas ?
2 participants
Page 1 sur 1
Mann Whitney-ra ou Mann whitney-ra pas ?
Salut a vous,
je suis Elsa, je me suis inscrite il y a un moment car je dois faire de l'analyse en proteomique (en biologie) et je n'ai personne qui fait des stats autour de moi, du moins sérieusement (genre faire du student t test avec 4 echantillons c'est pas le top hein...)
Bref je reviens vers vous voir si vous accepteriez de m'aider moi, la "non stat"
Pardonnez svp le manque de savoir hein...!
Mon but est de comparer les niveaux d'expression des proteines extraites d'echantillons humains, entre 2 groupes: fertiles et infertiles.
Les proteines sont ete detectees par proteomique.
6 hommes dans chaque groupes qui ont donne 3 samples, a 3 temps differents (car on sait qu'utiliser un seul echantillon c'est pas valable, car proteome assez variable)
Donc en tout j'ai 18 donnees numeriques par groupe.
J'ai au depart calcule la CV de chaque proteines (ien a 560) pour voir si la dispersion entre les 2 groupes est la meme.
Evidemment pour certaines PAS DU TOUT, genre CV de 0.2 pour les fertiles et 0.8 pour les infertiles.
Je pensais faire un mann whitney pour voir si les differences observees sont significatives et aller plus loin sur ces proteines. (a partir des 18 donnees par groupes)
Mais je me demandais si j'ai le droit de comparer les moyennes/medianes entre 2 groupes dont les donnees n'ont pas la meme dispersion ? Che pas si les donnees ne varient pas pareil d'un groupe a l'autre je peux quand meme faire une comparaison de leur moyenne??????
Je me base aussi sur un box plot pour voir l'etandue de la dispersion parfois c'est super etale pour les infertiles, et pas du tout pour les controles. Je peux toujours comparer leur mediannes/moyennes ????????????
Est-ce que je dois du coup, traiter les donnees differemment pour les proteines dont les CV sont comparables? ou leur dispersion sur le graph ?
Est- ce que je suis une bonne logique pour analyser ces resultats ?
(j'ai l'impression que de comp les medianes/ moyennes ca ne prend pas en compte la dispersion des donnees dans chaque groupe)
Sachant que l'idee est de voir
- 1: si certaines proteines sont detectables uniquement dans un groupe ou pas
- 2: pour celles qui sont communes aux 2 groupes, si le niveau d'expression varie chez un groupe en particulier.
- 3: si cette variation est mathematiquement significative.
Ne relisant je me demande si j'ai le droit de considerer la medianne ou la moyenne d'un des 2 groupes quand les donnees sont super variables et pas dans l'autre en fait... Comme si je pouvais pas les grouper en fait.... si c'est ca c'est la m*rde !!!... :-(
je suis Elsa, je me suis inscrite il y a un moment car je dois faire de l'analyse en proteomique (en biologie) et je n'ai personne qui fait des stats autour de moi, du moins sérieusement (genre faire du student t test avec 4 echantillons c'est pas le top hein...)
Bref je reviens vers vous voir si vous accepteriez de m'aider moi, la "non stat"
Pardonnez svp le manque de savoir hein...!
Mon but est de comparer les niveaux d'expression des proteines extraites d'echantillons humains, entre 2 groupes: fertiles et infertiles.
Les proteines sont ete detectees par proteomique.
6 hommes dans chaque groupes qui ont donne 3 samples, a 3 temps differents (car on sait qu'utiliser un seul echantillon c'est pas valable, car proteome assez variable)
Donc en tout j'ai 18 donnees numeriques par groupe.
J'ai au depart calcule la CV de chaque proteines (ien a 560) pour voir si la dispersion entre les 2 groupes est la meme.
Evidemment pour certaines PAS DU TOUT, genre CV de 0.2 pour les fertiles et 0.8 pour les infertiles.
Je pensais faire un mann whitney pour voir si les differences observees sont significatives et aller plus loin sur ces proteines. (a partir des 18 donnees par groupes)
Mais je me demandais si j'ai le droit de comparer les moyennes/medianes entre 2 groupes dont les donnees n'ont pas la meme dispersion ? Che pas si les donnees ne varient pas pareil d'un groupe a l'autre je peux quand meme faire une comparaison de leur moyenne??????
Je me base aussi sur un box plot pour voir l'etandue de la dispersion parfois c'est super etale pour les infertiles, et pas du tout pour les controles. Je peux toujours comparer leur mediannes/moyennes ????????????
Est-ce que je dois du coup, traiter les donnees differemment pour les proteines dont les CV sont comparables? ou leur dispersion sur le graph ?
Est- ce que je suis une bonne logique pour analyser ces resultats ?
(j'ai l'impression que de comp les medianes/ moyennes ca ne prend pas en compte la dispersion des donnees dans chaque groupe)
Sachant que l'idee est de voir
- 1: si certaines proteines sont detectables uniquement dans un groupe ou pas
- 2: pour celles qui sont communes aux 2 groupes, si le niveau d'expression varie chez un groupe en particulier.
- 3: si cette variation est mathematiquement significative.
Ne relisant je me demande si j'ai le droit de considerer la medianne ou la moyenne d'un des 2 groupes quand les donnees sont super variables et pas dans l'autre en fait... Comme si je pouvais pas les grouper en fait.... si c'est ca c'est la m*rde !!!... :-(
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
bouhou j'ai saoule tout le monde avec mes questions ?
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Ben ... oui, un peu.
Non pas qu'il y ait trop de questions, plutôt qu'il y a trop d'imprécision dans ce que tu dis, sans compter sur un fin de message qui ressemble plus à un défoulement qu'à une conversation.
A vue de nez, il te fait commencer par organiser tes données pour voir ce que tu peux en dire, les trier, les représenter, les analyser avec ton propre cerveau. Ensuite, s'il te semble que certaines hypothèses ont lieu d'être, tu pourras éventuellement voir si elles sont confirmables statistiquement. Mais que pourrais-on te conseiller alors qu'on n'a ni la compétence biologique, ni la connaissance des données ?
Si tu as des questions de technique statistique, tu peux essayer de les reposer, mais pas noyées au milieu d'un long texte pas toujours soigneusement écrit.
Pour la question sur Mann-Whithney, les CV n'ont aucun intérêt, mais si les variances sont très inégales, il est difficile de conclure. Il est vrai que si les moyennes sont très inégales, on n'a pas non plus besoin de test. L'idée de mesurer la dispersion avec les CV ne me semble pas très saine.
Globalement, je crains que la collaboration d'un biostatisticien soit absolument nécessaire, surtout que tu traites des données nombreuses d'un petit échantillon.
Cordialement.
Non pas qu'il y ait trop de questions, plutôt qu'il y a trop d'imprécision dans ce que tu dis, sans compter sur un fin de message qui ressemble plus à un défoulement qu'à une conversation.
A vue de nez, il te fait commencer par organiser tes données pour voir ce que tu peux en dire, les trier, les représenter, les analyser avec ton propre cerveau. Ensuite, s'il te semble que certaines hypothèses ont lieu d'être, tu pourras éventuellement voir si elles sont confirmables statistiquement. Mais que pourrais-on te conseiller alors qu'on n'a ni la compétence biologique, ni la connaissance des données ?
Si tu as des questions de technique statistique, tu peux essayer de les reposer, mais pas noyées au milieu d'un long texte pas toujours soigneusement écrit.
Pour la question sur Mann-Whithney, les CV n'ont aucun intérêt, mais si les variances sont très inégales, il est difficile de conclure. Il est vrai que si les moyennes sont très inégales, on n'a pas non plus besoin de test. L'idée de mesurer la dispersion avec les CV ne me semble pas très saine.
Globalement, je crains que la collaboration d'un biostatisticien soit absolument nécessaire, surtout que tu traites des données nombreuses d'un petit échantillon.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Ha je m'en doutais ^^
Pour la fin du message je ne peux que m'en excuser, ou l'effacer si ça froisse.
Pour les tonnes de fautes aussi mais la majorité est due a un clavier qwerty...
Pour l’imprécision c'est bien la le problème et je m'en doutais, d’où le "Pardonnez svp le manque de savoir"
Après si de toutes façon, on considère, enfin toi modérateur ?, que je n'ai pas ma place ici en tant que profane, c'est assez simple a dire.
Pour l’étape de tri: c'est de cette étape la que me viennent toutes ces questions, enfin pardon tout ce désordre d'inculte.
Je pensais que je ne pouvais pas utiliser le même outil statistique pour comparer les données des 2 groupes. Et la ta réponse au sujet des variances m'aide déjà beaucoup.
1- Est-ce que des données a variance trop inégales peuvent être comparées?
2- Si oui comment ?
3- Y aurait-il un site autre que wiki, qui puisse donner des définitions des termes statistiques (faire la différence entre variance et Cv de façon plus imagée pour moi par exemple? )
EDIT: ou un livre que je puisse acheter?
Merci gg pour ta réponse précédente
Pour la fin du message je ne peux que m'en excuser, ou l'effacer si ça froisse.
Pour les tonnes de fautes aussi mais la majorité est due a un clavier qwerty...
Pour l’imprécision c'est bien la le problème et je m'en doutais, d’où le "Pardonnez svp le manque de savoir"
Après si de toutes façon, on considère, enfin toi modérateur ?, que je n'ai pas ma place ici en tant que profane, c'est assez simple a dire.
Pour l’étape de tri: c'est de cette étape la que me viennent toutes ces questions, enfin pardon tout ce désordre d'inculte.
Je pensais que je ne pouvais pas utiliser le même outil statistique pour comparer les données des 2 groupes. Et la ta réponse au sujet des variances m'aide déjà beaucoup.
1- Est-ce que des données a variance trop inégales peuvent être comparées?
2- Si oui comment ?
3- Y aurait-il un site autre que wiki, qui puisse donner des définitions des termes statistiques (faire la différence entre variance et Cv de façon plus imagée pour moi par exemple? )
EDIT: ou un livre que je puisse acheter?
Merci gg pour ta réponse précédente
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
1) Je ne suis pas modérateurAprès si de toutes façon, on considère, enfin toi modérateur ?, que je n'ai pas ma place ici en tant que profane, c'est assez simple a dire.
2) Je ne te dénie pas le droit de poser des questions sur ce forum.
Je donne simplement mon impression sur ta situation.
Pour tes questions :
1) et 2 Pour des données nombreuse, surtout portant sur des variables gaussiennes, le test de Student est utilisable, il est assez "robuste". Idem pour une anova si tu fais des comparaisons multiples.
3) Pour les statistiques, rien ne vaut un bon bouquin de statistiques. Tu y verras que le CV est quasiment inutilisé, en particulier pour des comparaisons. Pour ma part, j'utilise beaucoup le Saporta ("Probabilités, analyse de données et statistiques"), mais il y a probablement des ouvrages plus adaptés aux biostatistiques. Si tu as une BU à proximité ...
Cordialement.
Dernière édition par gg le Mar 4 Sep 2012 - 20:19, édité 1 fois
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
ok super alors
Ton impression est la bienvenue, même si ça ne se voit pas sur le poste précédent peut-être
Tu m'avais déjà remonte les bretelles la première fois que je suis venue et ça m'a bien aidée. Donc j'en redemande
Mais justement je ne suis pas en situation gaussienne: 18 valeurs pour chaque groupe...
Est-ce que je peux toujours calculer la variance, les comparer et faire le calcul de F ?
Quelle formule faut-il utiliser dans Excel ? J'ai fait la variance VARP car je ne suis dit que un groupe= population ?
Merci pour l'aide, vraiment !
Ton impression est la bienvenue, même si ça ne se voit pas sur le poste précédent peut-être
Tu m'avais déjà remonte les bretelles la première fois que je suis venue et ça m'a bien aidée. Donc j'en redemande
Mais justement je ne suis pas en situation gaussienne: 18 valeurs pour chaque groupe...
Est-ce que je peux toujours calculer la variance, les comparer et faire le calcul de F ?
Quelle formule faut-il utiliser dans Excel ? J'ai fait la variance VARP car je ne suis dit que un groupe= population ?
Merci pour l'aide, vraiment !
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Excel est un piètre outil de statistiques.
Je ne sais pas vraiment ce que tu cherches à faire. Car on ne peut pas considérer que tu as 2 échantillons de 18 données (par groupe de 3 elles sont dépendantes, puisque provenant de la même personne. Si la moyenne a un sens, tu peux alors comparer les moyennes d'un groupe à l'autre.
En fait je suis dans le flou, car je ne sais pas ce que tu as calculé, tu as dit que tu avais calculé des CV sans dire exactement de quoi, maintenant tu parles de variances sans dire de quoi.
Juste une chose : Si tu veux inférer de tes 2 fois 6 cas à la situation générale, il s'agit d'échantillons, et alors la bonne fonction excel est VAR.
Et si tu veux de l'aide, précise clairement de quoi tu parles.
Cordialement.
Je ne sais pas vraiment ce que tu cherches à faire. Car on ne peut pas considérer que tu as 2 échantillons de 18 données (par groupe de 3 elles sont dépendantes, puisque provenant de la même personne. Si la moyenne a un sens, tu peux alors comparer les moyennes d'un groupe à l'autre.
En fait je suis dans le flou, car je ne sais pas ce que tu as calculé, tu as dit que tu avais calculé des CV sans dire exactement de quoi, maintenant tu parles de variances sans dire de quoi.
Juste une chose : Si tu veux inférer de tes 2 fois 6 cas à la situation générale, il s'agit d'échantillons, et alors la bonne fonction excel est VAR.
Et si tu veux de l'aide, précise clairement de quoi tu parles.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Puisque tu m'as appris qu'il fallait comparer les variances avant de faire une comparaison de moyennes, j'ai utilisé sur excel la fonction VARP pour calculer la variance entre les 18 données numériques de chaque groupe.
J'ai fait le ratio
Var groupe 1 / Var groupe 2 = F
J'ai trouvé la table sur le net et regardé le F théorique pour F95%(17,17) pour définir le seuil.
Après je pensais comparer les moyennes avec un mann whitney mais sur les protéines dont le Fobs < Fth.
Mais je ne sais pas quoi faire de celles qui ont une variance non homogène entre les 2 groupes.
1- Est- ce qu'en condition non paramétrique ça a une importance ?
J'ai pensé transformer les données numériques (log) pour tenter de les faire suivre une distribution gaussienne et pouvoir utiliser le t-test que tu me disais assez robuste pour gérer des variances non homogène. Sur Excel propose un "type 3" dans le TTEST pour les cas ou les variances ne sont pas homogènes. Je pense donc utiliser celui la pour les cas spéciaux.
Sinon le graph prism donne plus de détails c'est sur. Comme l'intervalle de confiance si j'ai bien compris.
J'ai graph prism sur mon ordi. Et la partie "aide" m'aide aussi pas mal.
2- comment dois-je calculer la variance en considérant que j'ai 6 groupes de 3 données dépendantes dans chaque groupe alors ?
3- le test de mann whitney ou TTEST est toujours applicable dans ce cas ?
Si ça devient trop lourd car je n'ai AUCUNE base je comprends et je vous laisse, je ne me vexerai pas.
J'ai fait le ratio
Var groupe 1 / Var groupe 2 = F
J'ai trouvé la table sur le net et regardé le F théorique pour F95%(17,17) pour définir le seuil.
Après je pensais comparer les moyennes avec un mann whitney mais sur les protéines dont le Fobs < Fth.
Mais je ne sais pas quoi faire de celles qui ont une variance non homogène entre les 2 groupes.
1- Est- ce qu'en condition non paramétrique ça a une importance ?
J'ai pensé transformer les données numériques (log) pour tenter de les faire suivre une distribution gaussienne et pouvoir utiliser le t-test que tu me disais assez robuste pour gérer des variances non homogène. Sur Excel propose un "type 3" dans le TTEST pour les cas ou les variances ne sont pas homogènes. Je pense donc utiliser celui la pour les cas spéciaux.
Sinon le graph prism donne plus de détails c'est sur. Comme l'intervalle de confiance si j'ai bien compris.
J'ai graph prism sur mon ordi. Et la partie "aide" m'aide aussi pas mal.
2- comment dois-je calculer la variance en considérant que j'ai 6 groupes de 3 données dépendantes dans chaque groupe alors ?
3- le test de mann whitney ou TTEST est toujours applicable dans ce cas ?
Si ça devient trop lourd car je n'ai AUCUNE base je comprends et je vous laisse, je ne me vexerai pas.
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Bonjour.
Pour tes questions du début, je te renvoie à mon dernier message. J'y contestais l'intérêt de faire des calculs sur les 18 valeurs, puisque ce sont en fait 6 triplets de valeurs liées. On peut toujours calculer dès qu'on a des chiffres, mais est-ce utile ?
Lorsque la variance est très hétérogène, la comparaison des moyennes n'a plus tellement d'intérêt. Mais ici, la faiblesse de l'échantillon rend cette comparaison peu fiable.
Pour tes questions de la fin, j'ai déjà en partie répondu. Disons que si les valeurs de chaque individu sont très peu dispersées (par rapport à la dispersion générale), tu peux utiliser les moyennes par individu et faire la comparaison des deux échantillons de 6. Dans ce cas là, on peut tenter un test non paramétrique, mais il sera probablement non significatif, faute de données. De plus, on estime très mal les moyennes par individu puisqu'on les estime sur un échantillon de 3. Donc il faudra interpréter avec prudence.
Par contre, si les valeurs d'un individu sont fortement dispersées (par exemple les 18 valeurs vont de 5 à 20 et l'individu X a les valeurs 7, 14 et 17), il n'y a plus de bonne méthode : On a trop peu d'information pour savoir quelle est vraiment la moyenne de chaque individu (3 valeurs ne font pas une statistique).
Cordialement.
NB : Faire des stats en n'ayant "AUCUNE base" étant délicat, il faut absolument soit en apprendre vite beaucoup (ne faire que ça pendant 10 jours), soit se faire aider par un biostatisticien, soit laisser tomber. On ne loue pas une Ferrari quand on n'a pas appris à conduire.
Pour tes questions du début, je te renvoie à mon dernier message. J'y contestais l'intérêt de faire des calculs sur les 18 valeurs, puisque ce sont en fait 6 triplets de valeurs liées. On peut toujours calculer dès qu'on a des chiffres, mais est-ce utile ?
Lorsque la variance est très hétérogène, la comparaison des moyennes n'a plus tellement d'intérêt. Mais ici, la faiblesse de l'échantillon rend cette comparaison peu fiable.
Pour tes questions de la fin, j'ai déjà en partie répondu. Disons que si les valeurs de chaque individu sont très peu dispersées (par rapport à la dispersion générale), tu peux utiliser les moyennes par individu et faire la comparaison des deux échantillons de 6. Dans ce cas là, on peut tenter un test non paramétrique, mais il sera probablement non significatif, faute de données. De plus, on estime très mal les moyennes par individu puisqu'on les estime sur un échantillon de 3. Donc il faudra interpréter avec prudence.
Par contre, si les valeurs d'un individu sont fortement dispersées (par exemple les 18 valeurs vont de 5 à 20 et l'individu X a les valeurs 7, 14 et 17), il n'y a plus de bonne méthode : On a trop peu d'information pour savoir quelle est vraiment la moyenne de chaque individu (3 valeurs ne font pas une statistique).
Cordialement.
NB : Faire des stats en n'ayant "AUCUNE base" étant délicat, il faut absolument soit en apprendre vite beaucoup (ne faire que ça pendant 10 jours), soit se faire aider par un biostatisticien, soit laisser tomber. On ne loue pas une Ferrari quand on n'a pas appris à conduire.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Mann Whitney-ra ou Mann whitney-ra pas ?
Ha ha la Ferrari on me paye pour la conduire...sans permis...!
Je tente du mieux que je peux d'en apprendre justement, après je n'ai surement pas les bons moyens pour (venir ici et pondre des postes trop lourds a lire par ex )
Je pourrai faire comme les autres biologistes: ne pas me poser de questions et faire mon TTEST sur excel, pondre des protéines qui varient significativement, vérifier ça sur mon western blot et publier ça comme une vérité scientifique... et passer a la suite.
C'est pas tant de ne pas savoir conduire la Ferrari le problème, c'est de tout faire pour pouvoir le faire un jour correctement.
Donc je vais aller voir si je trouve un biostatisticien.
Merci pour ton aide précieuse !
Je tente du mieux que je peux d'en apprendre justement, après je n'ai surement pas les bons moyens pour (venir ici et pondre des postes trop lourds a lire par ex )
Je pourrai faire comme les autres biologistes: ne pas me poser de questions et faire mon TTEST sur excel, pondre des protéines qui varient significativement, vérifier ça sur mon western blot et publier ça comme une vérité scientifique... et passer a la suite.
C'est pas tant de ne pas savoir conduire la Ferrari le problème, c'est de tout faire pour pouvoir le faire un jour correctement.
Donc je vais aller voir si je trouve un biostatisticien.
Merci pour ton aide précieuse !
Elsa- Nombre de messages : 13
Localisation : Montreal
Date d'inscription : 04/03/2011
Sujets similaires
» Mann Whitney
» Mann-Whitney
» Wilcoxon VS MAnn-Whitney
» MANN WHITNEY OU KHI DEUX
» Student ou Mann-Whitney ?
» Mann-Whitney
» Wilcoxon VS MAnn-Whitney
» MANN WHITNEY OU KHI DEUX
» Student ou Mann-Whitney ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum