Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
niaboc
 
c@ssoulet
 
vae
 
Catz
 
cicino
 
Coco
 
droopy
 
Anny_Nina
 


Valeurs aberrante : Faut-il les supprimer pour les anova?

Voir le sujet précédent Voir le sujet suivant Aller en bas

Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par adecordoue le Sam 23 Sep 2017 - 19:23

Bonjour,

Je suis actuellement en train de faire une analyse statistique univariée sur une étude portant sur des animaux.

En faisant les barres plots, je me rends compte que beaucoup de valeurs sont aberrantes.
Cependant, comme mon échantillon est réduit (environ 30 individus), si je supprime l'ensemble des individus ayant au moins une valeur aberrante, je me retrouve avec seulement une vingtaine.

Est ce que cela vous semble cohérent si pour calculer mes anova je décide de supprimer uniquement les valeurs aberrantes pour le critère étudié par l'anova?

Exemple :
Critère 1 : les individus 1 et 4 présentent une valeur aberrante
Critère 2 : uniquement l'individu 6 est aberrant

Merci d'avance pour votre aide,

Alexandre

adecordoue

Nombre de messages : 2
Date d'inscription : 23/09/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par Eric Wajnberg le Dim 24 Sep 2017 - 10:32

Deux points :

1) Quel critère utilisez-vous pour déclarer une valeur comme aberrante ? (je veux dire un critère qui ne soit pas arbitraire).

2)  Sans critère sérieux de l'identification du fait qu'une valeur soit aberrante, il est évidement erroné de décider de retirer cette valeur de l'échantillon avant de faire des tests statistiques. Avec une telle démarche, l'échantillon ne représente plus la population d'origine que l'on cherche à décrire/comparer, et les résultats obtenus n'ont plus aucune valeur.

(un critère non arbitraire de l'identification d'une valeur aberrante pourrait pas exemple être le faite qu'une erreur de mesure ait pu être identifiée, etc.).

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par adecordoue le Dim 24 Sep 2017 - 16:59

Merci pour ces éléments.

Afin de définir si une valeur est aberrante j'utilise le plus souvent les sorties Boxplot de R (cf. image).



Dans l'exemple présenté, est ce que cela est cohérent statistiquement de retirer les individus représentés par les croix afin de faire l'analyse de la variance?

Est ce que, dans le cas où j'ai plusieurs réponses, il est nécessaire de supprimer les individus aberrants pour l'ensemble des anova ou est il possible de les retirer uniquement pour la réponse où ces derniers sont aberrants?

merci d'avance,

Alexandre

adecordoue

Nombre de messages : 2
Date d'inscription : 23/09/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par Eric Wajnberg le Lun 25 Sep 2017 - 5:19

adecordoue a écrit:Dans l'exemple présenté, est ce que cela est cohérent statistiquement de retirer les individus représentés par les croix afin de faire l'analyse de la variance?
Non.

Dans un boxplot, un point est représenté comme "outlier" (non comme aberrant) lorsqu'il est à plus de 1.5 le quartile correspondant. C'est une convention graphique et en aucun cas un critère d'identification d'une valeur aberrante.
adecordoue a écrit:Est ce que, dans le cas où j'ai plusieurs réponses, il est nécessaire de supprimer les individus aberrants pour l'ensemble des anova ou est il possible de les retirer uniquement pour la réponse où ces derniers sont aberrants?
Absolument pas. Vous avez décidé de considérer ces valeurs comme aberrantes, alors qu'elle ne le sont pas. L'analyse (ANOVA, etc.) doit être faites sans qu'aucune valeur ne soit retirée.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par c@ssoulet le Lun 25 Sep 2017 - 8:04

Sur une étude portant sur des organismes vivants, une valeur aberrante c'est une valeur physiologiquement impossible. Un être humain qui mesure 3 mètres par exemple, ou une souris qui pèse 2 kg.

Quand tu détectes des outliers, quelle que soit la méthode, la conduite à tenir est simple : vérifier la donnée, au besoin refaire la mesure ou le dosage, et corriger éventuellement. Si un retest est impossible, dans le doute ON GARDE. On ne supprime que si on est dans le physiologiquement impossible, et on garde une trace de la suppression.

Tant que tu es dans le physiologiquement possible, il ne faut pas supprimer des données qui ne font que refléter la réalité biologique. Un homme de 2m20 n'a rien d'aberrant. Il est juste beaucoup plus grand que la moyenne, mais ca n'en fait pas "une aberration". Un LDL proche de zéro est très étonnant mais n'a rien d'aberrant. Si on avait considéré tous les LDL "au plancher" comme aberrants, on n'aurait jamais découvert que certaines personnes portent une mutation génétique expliquant le phénomène, on n'aurait jamais décortiqué le mécanisme et on n'aurait jamais développé la nouvelle génération d'hypolipémiants qui tapent dessus.

c@ssoulet

Nombre de messages : 762
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par Nik le Lun 25 Sep 2017 - 8:29

Bonjour,

Pour compléter les éléments apportés par Eric et C@ssoulet, si tu es dans l'optique de faire une ANOVA, tu es donc dans le cadre du modèle linéaire. Dans ce cas, peu importe qu'il y ait des valeurs qui apparaissent aberrantes dans un représentation ou une autre, ce qui compte c'est l'étude des résidus du modèle et voir quelles sont les valeurs influentes.

Par ailleurs, si tu décides de supprimer des valeurs (qui seraient potentiellement aberrantes et qui pèseraient beaucoup dans la détermination du modèle), il vaut mieux les supprimer définitivement de l'ensemble de tes analyses car sinon tu pourrais te retrouver à faire des analyses sur des jeux de données qui ne sont jamais les même ce qui est toujours très difficile à expliquer et à justifier.

HTH

Nik

Nik

Nombre de messages : 1551
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Valeurs aberrante : Faut-il les supprimer pour les anova?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum