Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
normalité des données
2 participants
Page 1 sur 1
normalité des données
Bonjour,
Je dispose de variables mesurées sur des plantes telles que la longueur de feuille, le nombre de grains etc. obtenues sur 300 individus répétés 2 fois et selon 2 traitements différents.
Avant de réaliser des tests d'ANOVA, je commence toujours pas vérifier que mes données sont distribuées normalement et que les variances entre les groupes sont homoscédastiques. En générale, les tests sur les variances sont concluants, mais les tests de normalité des données (shapiro-Wilk sous R) sont très rarement bons. Les valeurs de W sont très élevées (entre 0.99 et 1), mais les valeurs de p-value sont de l'ordre de 10-6, ce qui me contraint la plupart du temps à rejeter l'hypothèse de normalité.
Il me semble que cette hypothèse de normalité ne pèse pas sur la pertinence des résultats donnés ensuite par l'ANOVA, cependant, je m'étonne que mes tests de normalité soient toujours négatifs. En effet, lorsque je représente mes données sous forme d'histogrammes, la forme globale est bien celle d'une courbe en cloche.
Cela pourrait-il être du au fait que je dispose d'un grand nombre d'individus? Dois je plus me fier à la valeur du W donné par le test?
Il s'agit d'un problème récurrent et je me demande comment justifier le fait de ne pas valider cette hypothèse de normalité dans le cadre de tests par ANOVA?
Merci
Je dispose de variables mesurées sur des plantes telles que la longueur de feuille, le nombre de grains etc. obtenues sur 300 individus répétés 2 fois et selon 2 traitements différents.
Avant de réaliser des tests d'ANOVA, je commence toujours pas vérifier que mes données sont distribuées normalement et que les variances entre les groupes sont homoscédastiques. En générale, les tests sur les variances sont concluants, mais les tests de normalité des données (shapiro-Wilk sous R) sont très rarement bons. Les valeurs de W sont très élevées (entre 0.99 et 1), mais les valeurs de p-value sont de l'ordre de 10-6, ce qui me contraint la plupart du temps à rejeter l'hypothèse de normalité.
Il me semble que cette hypothèse de normalité ne pèse pas sur la pertinence des résultats donnés ensuite par l'ANOVA, cependant, je m'étonne que mes tests de normalité soient toujours négatifs. En effet, lorsque je représente mes données sous forme d'histogrammes, la forme globale est bien celle d'une courbe en cloche.
Cela pourrait-il être du au fait que je dispose d'un grand nombre d'individus? Dois je plus me fier à la valeur du W donné par le test?
Il s'agit d'un problème récurrent et je me demande comment justifier le fait de ne pas valider cette hypothèse de normalité dans le cadre de tests par ANOVA?
Merci
Kalypso- Nombre de messages : 2
Date d'inscription : 25/07/2011
Re: normalité des données
Bonsoir.
Je n'ai pas de réponse sur la question de la normalité de tes données, mais il faut savoir que le test de variance qu'on fait dans l'anova est "robuste", c'est à dire qu'il s'adapte sans trop de problèmes à des variables non gaussiennes. le fait que tes histogrammes soient à "une bosse" est rassurant. Par contre, si les variances sont très dissemblables, le test n'est plus adéquat (mais dans ce cas, on a déjà des conclusions utiles). Attention, ce sont les variances de chaque groupe qui sont comparées, "les variances entre les groupes" ne veut pas dire grand chose. et l'homoscédasticité est le fait qu'elles sont à peu près égales.
Cordialement.
Je n'ai pas de réponse sur la question de la normalité de tes données, mais il faut savoir que le test de variance qu'on fait dans l'anova est "robuste", c'est à dire qu'il s'adapte sans trop de problèmes à des variables non gaussiennes. le fait que tes histogrammes soient à "une bosse" est rassurant. Par contre, si les variances sont très dissemblables, le test n'est plus adéquat (mais dans ce cas, on a déjà des conclusions utiles). Attention, ce sont les variances de chaque groupe qui sont comparées, "les variances entre les groupes" ne veut pas dire grand chose. et l'homoscédasticité est le fait qu'elles sont à peu près égales.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: normalité des données
Merci pour cette réponse.
Kalypso- Nombre de messages : 2
Date d'inscription : 25/07/2011
Sujets similaires
» Test de la normalité des données
» ACM CAH (données qualitatives & grosse base de données)
» normalité
» Analyse de la normalité
» Normalité & tests
» ACM CAH (données qualitatives & grosse base de données)
» normalité
» Analyse de la normalité
» Normalité & tests
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|