Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
comparaison >2 moyennes sans avoir les données brutes
3 participants
Page 1 sur 1
comparaison >2 moyennes sans avoir les données brutes
Bonjour,
Je fais une analyse comparative à partir de données que j'ai extraites de la littérature.
J'ai plusieurs espèces et pour chaque espèce je dispose d'une série de moyennes, écart-types et de la taille d'échantillon (qui peut être très différentes).
Je souhaite pour chacune de mes espèces pouvoir identifier quelles sont les moyennes qui sont significativement différentes entres elles.
Si j'avais eu les données brutes j'aurais fait une ANOVA suivie d'un "post-hoc" test (en trouvant le bon test car mes tailles d'échantillons sont différentes). Mais je n'ai malheureusement pas les données brutes qui ont permis de calculer les moyennes et écart-types.
Pour le moment j'ai pu déterminer graphiquement laquelle de ces moyennes différents l'une de l'autre en considérant 2 moyennes significativement différentes lorsque leur barres d'erreur ne se chevauchent pas.
Connaitriez-vous un moyen robuste et acceptable par des "reviewers" de faire cela?
Merci par avance pour votre aide
Je fais une analyse comparative à partir de données que j'ai extraites de la littérature.
J'ai plusieurs espèces et pour chaque espèce je dispose d'une série de moyennes, écart-types et de la taille d'échantillon (qui peut être très différentes).
Je souhaite pour chacune de mes espèces pouvoir identifier quelles sont les moyennes qui sont significativement différentes entres elles.
Si j'avais eu les données brutes j'aurais fait une ANOVA suivie d'un "post-hoc" test (en trouvant le bon test car mes tailles d'échantillons sont différentes). Mais je n'ai malheureusement pas les données brutes qui ont permis de calculer les moyennes et écart-types.
Pour le moment j'ai pu déterminer graphiquement laquelle de ces moyennes différents l'une de l'autre en considérant 2 moyennes significativement différentes lorsque leur barres d'erreur ne se chevauchent pas.
Connaitriez-vous un moyen robuste et acceptable par des "reviewers" de faire cela?
Merci par avance pour votre aide
emy- Nombre de messages : 4
Date d'inscription : 17/09/2013
Re: comparaison >2 moyennes sans avoir les données brutes
Bonjour.
Si tu pensais faire une anova, c'est que tes variables sont (approximativement) gaussiennes. Dans ce cas, tu peux faire de la comparaison deux à deux avec le test de Fischer (Student, t-test). En te limitant aux cas où les barres ne se chevauchent pas, ou, si tu as le temps, en faisant toutes les comparaisons. En effet, on n'a besoin que des moyennes, variances et effectifs (mais il faut reprendre les formules du test, et faire à la main).
Cordialement.
Si tu pensais faire une anova, c'est que tes variables sont (approximativement) gaussiennes. Dans ce cas, tu peux faire de la comparaison deux à deux avec le test de Fischer (Student, t-test). En te limitant aux cas où les barres ne se chevauchent pas, ou, si tu as le temps, en faisant toutes les comparaisons. En effet, on n'a besoin que des moyennes, variances et effectifs (mais il faut reprendre les formules du test, et faire à la main).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: comparaison >2 moyennes sans avoir les données brutes
Bonjour,
N'aillant pas les données brutes je ne sais pas de facon certaine quelles distributions ont les variables pour lesquelles je dispose les moyennes, ecart-type et taille d'échantillon. Cependant ma suposition est que les variables ont plutot une distribution de poisson.
J'utilise le program R et il me semble que pour être en mesure de faire un test de Student, il est necessaire d'avoir les données brutes (argument x = vecteur composé des données brutes)? je me trompe?
Autre question, le fait de faire des tests a la main est acceptable par la suite dans un article scientifique?
N'aillant pas les données brutes je ne sais pas de facon certaine quelles distributions ont les variables pour lesquelles je dispose les moyennes, ecart-type et taille d'échantillon. Cependant ma suposition est que les variables ont plutot une distribution de poisson.
J'utilise le program R et il me semble que pour être en mesure de faire un test de Student, il est necessaire d'avoir les données brutes (argument x = vecteur composé des données brutes)? je me trompe?
Autre question, le fait de faire des tests a la main est acceptable par la suite dans un article scientifique?
emy- Nombre de messages : 4
Date d'inscription : 17/09/2013
Re: comparaison >2 moyennes sans avoir les données brutes
1) Si la distribution n'est pas Normale, l'anova n'est possible que sur de gros échantillons.
2) Il ne faut pas confondre "faire faire des tests par un logiciel" et "faire des tests". On trouve dans tous les bouquins de statistiques la description du test de Student, et si on veut automatiser on programme un peu (en R, au besoin sur tableur)
3) Si les tailles d'échantillons sont faibles (disons moins de 20), on parle pour rien puisque les conditions d'application des tests (anova, t-test) ne sont pas réunies.
4) Bien sûr que le test fait à la main est acceptable ! Un logiciel ne garantit rien (en particulier pas l'usage incorrect).
Cordialement.
2) Il ne faut pas confondre "faire faire des tests par un logiciel" et "faire des tests". On trouve dans tous les bouquins de statistiques la description du test de Student, et si on veut automatiser on programme un peu (en R, au besoin sur tableur)
3) Si les tailles d'échantillons sont faibles (disons moins de 20), on parle pour rien puisque les conditions d'application des tests (anova, t-test) ne sont pas réunies.
4) Bien sûr que le test fait à la main est acceptable ! Un logiciel ne garantit rien (en particulier pas l'usage incorrect).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: comparaison >2 moyennes sans avoir les données brutes
Merci pour votre reponse.
Concernant la taille d'echantillon parfois, pour une serie de moyennes que je souhaite comparer, certaine sont superieures a 20 et certaines inferieure à 20.
Du coup dans mon cas de figure (absence de données brutes, et taille d'echantillon non balancées) voyez vous un moyen d'arriver, de maniere robuste, a comparer plusieurs moyennes entre elles?
Cordialement
Concernant la taille d'echantillon parfois, pour une serie de moyennes que je souhaite comparer, certaine sont superieures a 20 et certaines inferieure à 20.
Du coup dans mon cas de figure (absence de données brutes, et taille d'echantillon non balancées) voyez vous un moyen d'arriver, de maniere robuste, a comparer plusieurs moyennes entre elles?
Cordialement
emy- Nombre de messages : 4
Date d'inscription : 17/09/2013
Re: comparaison >2 moyennes sans avoir les données brutes
A vue, oui, et tu l'as fait.
Une justification par des tests demanderait sans doute de modéliser les variables (Poisson ?) pour construire un test adapté. Si c'est possible.
Cordialement.
Une justification par des tests demanderait sans doute de modéliser les variables (Poisson ?) pour construire un test adapté. Si c'est possible.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: comparaison >2 moyennes sans avoir les données brutes
Je ne connais pas de "immediate command" pour les anova. Mais sur Stata (et donc je suppose sur d'autres softs) il existe entre autres une "immediate command" permettant de faire un ttest en rentrant pour chaque groupe la moyenne, l'écart type et l'effectif (commande ttesti).
Voilà une partie du fichier d'aide, la ligne de commande pour le ttest et la liste des tests "immédiats"
Immediate form of two-sample mean-comparison test
ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2
Sometimes you may not have the data, but you know something about the data and what you do know is adequate to perform the statistical test. An immediate command is a command that obtains data not from the data stored in memory but from numbers typed as arguments. Immediate commands, in effect, turn Stata into a glorified hand calculator.
bitesti Binomial probability test
cci Tables for epidemiologists; see [ST] epitab
csi
iri
mcci
cii Confidence intervals for means, proportions, counts
prtesti One- and two-sample tests of proportions
sampsi Sample size and power determination
sdtesti Variance comparison tests
symmi Symmetry and marginal homogeneity tests
tabi One- and two-way tables of frequencies
ttesti Mean comparison tests
twoway scatteri Scatterplot
twoway pci Paired-coordinate plot with spikes or lines
twoway pcarrowi Paired-coordinate plot with arrows
Voilà une partie du fichier d'aide, la ligne de commande pour le ttest et la liste des tests "immédiats"
Immediate form of two-sample mean-comparison test
ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2
Sometimes you may not have the data, but you know something about the data and what you do know is adequate to perform the statistical test. An immediate command is a command that obtains data not from the data stored in memory but from numbers typed as arguments. Immediate commands, in effect, turn Stata into a glorified hand calculator.
bitesti Binomial probability test
cci Tables for epidemiologists; see [ST] epitab
csi
iri
mcci
cii Confidence intervals for means, proportions, counts
prtesti One- and two-sample tests of proportions
sampsi Sample size and power determination
sdtesti Variance comparison tests
symmi Symmetry and marginal homogeneity tests
tabi One- and two-way tables of frequencies
ttesti Mean comparison tests
twoway scatteri Scatterplot
twoway pci Paired-coordinate plot with spikes or lines
twoway pcarrowi Paired-coordinate plot with arrows
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: comparaison >2 moyennes sans avoir les données brutes
Bonjour,
Ceci est une bonne nouvelle. Merci!
Malheureusement je ne dispose pas de stata.
Quelqu'un aurait-il une idée si cela peut se faire sous R?
Ceci est une bonne nouvelle. Merci!
Malheureusement je ne dispose pas de stata.
Quelqu'un aurait-il une idée si cela peut se faire sous R?
emy- Nombre de messages : 4
Date d'inscription : 17/09/2013
Sujets similaires
» Fitter des moyennes plutôt que des données brutes
» Comparaison moyennes de données appariées - Nb de variables?
» données brutes ou cvs?
» Traitement données brutes - CAH
» Transformation de données pour avoir une loi normale
» Comparaison moyennes de données appariées - Nb de variables?
» données brutes ou cvs?
» Traitement données brutes - CAH
» Transformation de données pour avoir une loi normale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum