Condition de normalité sur petits échantillons (pour ANOVA)

Voir le sujet précédent Voir le sujet suivant Aller en bas

Condition de normalité sur petits échantillons (pour ANOVA)

Message par sunshine le Mar 26 Jan 2016 - 13:31

Bonjour,

je souhaite réaliser une ANOVA et pour cela vérifier en amont les conditions de validité. En particulier je voudrais vérifier la normalité des distributions en utilisant, par exemple, un test de Shapiro-Wilk. Or mes échantillons étant de petite taille (7, 14, et 3 individus pour mes 3 catégories nominales respectives), il semblerait que le test n'a qu'un faible intérêt.
Ma question est donc la suivante : comment puis-je vérifier que les conditions de validité de l'ANOVA sont respectées (et donc justifier de la pertinence de cette ANOVA), alors que les tests de normalité et la petite taille de mes échantillons n'a pas vraiment de sens ?
Puis-je "simplement" partir du principe que l'ANOVA est assez robuste même en cas de violation des conditions de normalité ?

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par droopy le Mar 26 Jan 2016 - 15:23

Bonjour,

Arf la sacrosainte condition de normalité. Avec aussi peu d'effectifs par groupe je ne vois pas comment tu peux t'en sortir (surtout avec 3 individus). Dans ces cas là sois tu sais par ailleurs que les distributions de cette variable sont normales, soit tu n'en as aucune idée et tu ne peux pas raisonablement tester (statistiquement ou visuellement) cette hypothèse. "Plus important" que la normalité pour une ANOVA il te faut l'homogénéité des variances ce qui semblent encore une fois difficile à appréhender compte tenu de la taille de ton jeu de données. Je serais toi je partirais sur une version non paramétrique avec un test de Kruskal-Wallis.

droopy
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par Eric Wajnberg le Mar 26 Jan 2016 - 16:25

Si la variable mesurée est notoirement non normale, pas exemple un comptage (Poisson) ou un pourcentage (Binomiale) alors il faut mieux s'orienter vers d'autres choix que l'ANOVA (et pas forcement en non-paramétrique qui doit rester le choix ultime car peu puissant).

Egalement, l'ANOVA est notoirement connue pour être bien robuste à l'écart à la normalité.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 664
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par sunshine le Mer 27 Jan 2016 - 9:07

Bonjour,

merci pour vos réponses Droopy et Eric.

J'ai du mal à comprendre pourquoi une variable mesurée en pourcentage est notoirement binomiale. L'unité de mesure influence la forme de la distribution ?

Je comprends que l'usage d'une ANOVA est critiquable dans ce cas, mais je ne cherche pas à prédire les valeurs de ma variable, seulement à évaluer si il y a des différences selon les catégories. Ca ne tient pas la route même si on mentionne les limites ?

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par droopy le Mer 27 Jan 2016 - 9:14

L'anova n'a pas un but prédictif (même si on peut obtenir les prédictions qui dans un cas comme le tien sont les moyennes par classe), mais bien de tester si les moyennes des différents groupes sont égales, ou si au moins l'une des moyennes n'est pas égale aux autres. Autant l'anova est robuste à la non normalité (comme toujours jusqu'à un certain point), autant elle n'est pas robuste à la non homogénéité des variances (hétéroscédasticité). Ces deux hypothèses sont des hypothèses du modèle linéaire qui sous-tend l'anova.

Pour ce qui est des variables, il est évident que selon la manière dont tu exprimes tes données, les distributions de celles-ci ne seront pas les mêmes.

Tu peux par exemple observer 2 individus avec un donné, mais que dans un cas ces 2 individus ont été observés parmi 20 et dans l'autre parmi 200. Selon que tu exprimes ta variable en effectif ou en proportion tu n'as plus les mêmes valeurs et donc plus les mêmes distributions non plus.

droopy
avatar
droopy

Nombre de messages : 1069
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par Eric Wajnberg le Mer 27 Jan 2016 - 9:39

sunshine a écrit:J'ai du mal à comprendre pourquoi une variable mesurée en pourcentage est notoirement binomiale. L'unité de mesure influence la forme de la distribution ?

Une variable exprimée en pourcentage n'est pas notoirement binomiale. Elle est binomiale (enfin dans la majorité des cas). Plus précisément, si je dis qu'un certain nombre individus présentent une caractéristique parmi deux possibles, sur un nombre total d’individus, alors je suis clairement dans le cas binomial. Des exemples sont : Le pourcentage individus dans un sondage qui votent à droite plutôt qu'à gauche, le pourcentage d'individus présentant une maladie donnée parmi un ensemble d'individus, le pourcentage de cellules cancéreuses dans un comptage, etc.

En revanche, je peux avoir une donnée exprimée en pourcentage qui n'est pas binomiale. Si je dis par exemple que dans l'air il y a 20% d'oxygène, personne ne compte les molécules et la valeur suit dans ce cas une belle loi normale. Bref, non, ce n'est pas l'unité de mesure qui influence la forme de la distribution. Mais dans la grande majorité des cas, parler d'une variable qui exprime un pourcentage indique qu'on a une distribution binomiale, et le traitement stat doit être ajusté en conséquence. A vous de voir avec vos propres données.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 664
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Condition de normalité sur petits échantillons (pour ANOVA)

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum