Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -20%
-20% Récupérateur à eau mural 300 ...
Voir le deal
79 €

normalité des données

2 participants

Aller en bas

données - normalité des données Empty normalité des données

Message par Kalypso Lun 25 Juil 2011 - 13:57

Bonjour,

Je dispose de variables mesurées sur des plantes telles que la longueur de feuille, le nombre de grains etc. obtenues sur 300 individus répétés 2 fois et selon 2 traitements différents.
Avant de réaliser des tests d'ANOVA, je commence toujours pas vérifier que mes données sont distribuées normalement et que les variances entre les groupes sont homoscédastiques. En générale, les tests sur les variances sont concluants, mais les tests de normalité des données (shapiro-Wilk sous R) sont très rarement bons. Les valeurs de W sont très élevées (entre 0.99 et 1), mais les valeurs de p-value sont de l'ordre de 10-6, ce qui me contraint la plupart du temps à rejeter l'hypothèse de normalité.
Il me semble que cette hypothèse de normalité ne pèse pas sur la pertinence des résultats donnés ensuite par l'ANOVA, cependant, je m'étonne que mes tests de normalité soient toujours négatifs. En effet, lorsque je représente mes données sous forme d'histogrammes, la forme globale est bien celle d'une courbe en cloche.
Cela pourrait-il être du au fait que je dispose d'un grand nombre d'individus? Dois je plus me fier à la valeur du W donné par le test?
Il s'agit d'un problème récurrent et je me demande comment justifier le fait de ne pas valider cette hypothèse de normalité dans le cadre de tests par ANOVA?

Merci

Kalypso

Nombre de messages : 2
Date d'inscription : 25/07/2011

Revenir en haut Aller en bas

données - normalité des données Empty Re: normalité des données

Message par gg Lun 25 Juil 2011 - 16:10

Bonsoir.

Je n'ai pas de réponse sur la question de la normalité de tes données, mais il faut savoir que le test de variance qu'on fait dans l'anova est "robuste", c'est à dire qu'il s'adapte sans trop de problèmes à des variables non gaussiennes. le fait que tes histogrammes soient à "une bosse" est rassurant. Par contre, si les variances sont très dissemblables, le test n'est plus adéquat (mais dans ce cas, on a déjà des conclusions utiles). Attention, ce sont les variances de chaque groupe qui sont comparées, "les variances entre les groupes" ne veut pas dire grand chose. et l'homoscédasticité est le fait qu'elles sont à peu près égales.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

données - normalité des données Empty Re: normalité des données

Message par Kalypso Jeu 28 Juil 2011 - 8:17

Merci pour cette réponse.

Kalypso

Nombre de messages : 2
Date d'inscription : 25/07/2011

Revenir en haut Aller en bas

données - normalité des données Empty Re: normalité des données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum