Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Valeurs aberrante : Faut-il les supprimer pour les anova?
4 participants
Page 1 sur 1
Valeurs aberrante : Faut-il les supprimer pour les anova?
Bonjour,
Je suis actuellement en train de faire une analyse statistique univariée sur une étude portant sur des animaux.
En faisant les barres plots, je me rends compte que beaucoup de valeurs sont aberrantes.
Cependant, comme mon échantillon est réduit (environ 30 individus), si je supprime l'ensemble des individus ayant au moins une valeur aberrante, je me retrouve avec seulement une vingtaine.
Est ce que cela vous semble cohérent si pour calculer mes anova je décide de supprimer uniquement les valeurs aberrantes pour le critère étudié par l'anova?
Exemple :
Critère 1 : les individus 1 et 4 présentent une valeur aberrante
Critère 2 : uniquement l'individu 6 est aberrant
Merci d'avance pour votre aide,
Alexandre
Je suis actuellement en train de faire une analyse statistique univariée sur une étude portant sur des animaux.
En faisant les barres plots, je me rends compte que beaucoup de valeurs sont aberrantes.
Cependant, comme mon échantillon est réduit (environ 30 individus), si je supprime l'ensemble des individus ayant au moins une valeur aberrante, je me retrouve avec seulement une vingtaine.
Est ce que cela vous semble cohérent si pour calculer mes anova je décide de supprimer uniquement les valeurs aberrantes pour le critère étudié par l'anova?
Exemple :
Critère 1 : les individus 1 et 4 présentent une valeur aberrante
Critère 2 : uniquement l'individu 6 est aberrant
Merci d'avance pour votre aide,
Alexandre
adecordoue- Nombre de messages : 2
Date d'inscription : 23/09/2017
Re: Valeurs aberrante : Faut-il les supprimer pour les anova?
Deux points :
1) Quel critère utilisez-vous pour déclarer une valeur comme aberrante ? (je veux dire un critère qui ne soit pas arbitraire).
2) Sans critère sérieux de l'identification du fait qu'une valeur soit aberrante, il est évidement erroné de décider de retirer cette valeur de l'échantillon avant de faire des tests statistiques. Avec une telle démarche, l'échantillon ne représente plus la population d'origine que l'on cherche à décrire/comparer, et les résultats obtenus n'ont plus aucune valeur.
(un critère non arbitraire de l'identification d'une valeur aberrante pourrait pas exemple être le faite qu'une erreur de mesure ait pu être identifiée, etc.).
HTH, Eric.
1) Quel critère utilisez-vous pour déclarer une valeur comme aberrante ? (je veux dire un critère qui ne soit pas arbitraire).
2) Sans critère sérieux de l'identification du fait qu'une valeur soit aberrante, il est évidement erroné de décider de retirer cette valeur de l'échantillon avant de faire des tests statistiques. Avec une telle démarche, l'échantillon ne représente plus la population d'origine que l'on cherche à décrire/comparer, et les résultats obtenus n'ont plus aucune valeur.
(un critère non arbitraire de l'identification d'une valeur aberrante pourrait pas exemple être le faite qu'une erreur de mesure ait pu être identifiée, etc.).
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Valeurs aberrante : Faut-il les supprimer pour les anova?
Merci pour ces éléments.
Afin de définir si une valeur est aberrante j'utilise le plus souvent les sorties Boxplot de R (cf. image).
Dans l'exemple présenté, est ce que cela est cohérent statistiquement de retirer les individus représentés par les croix afin de faire l'analyse de la variance?
Est ce que, dans le cas où j'ai plusieurs réponses, il est nécessaire de supprimer les individus aberrants pour l'ensemble des anova ou est il possible de les retirer uniquement pour la réponse où ces derniers sont aberrants?
merci d'avance,
Alexandre
Afin de définir si une valeur est aberrante j'utilise le plus souvent les sorties Boxplot de R (cf. image).
Dans l'exemple présenté, est ce que cela est cohérent statistiquement de retirer les individus représentés par les croix afin de faire l'analyse de la variance?
Est ce que, dans le cas où j'ai plusieurs réponses, il est nécessaire de supprimer les individus aberrants pour l'ensemble des anova ou est il possible de les retirer uniquement pour la réponse où ces derniers sont aberrants?
merci d'avance,
Alexandre
adecordoue- Nombre de messages : 2
Date d'inscription : 23/09/2017
Re: Valeurs aberrante : Faut-il les supprimer pour les anova?
Non.adecordoue a écrit:Dans l'exemple présenté, est ce que cela est cohérent statistiquement de retirer les individus représentés par les croix afin de faire l'analyse de la variance?
Dans un boxplot, un point est représenté comme "outlier" (non comme aberrant) lorsqu'il est à plus de 1.5 le quartile correspondant. C'est une convention graphique et en aucun cas un critère d'identification d'une valeur aberrante.
Absolument pas. Vous avez décidé de considérer ces valeurs comme aberrantes, alors qu'elle ne le sont pas. L'analyse (ANOVA, etc.) doit être faites sans qu'aucune valeur ne soit retirée.adecordoue a écrit:Est ce que, dans le cas où j'ai plusieurs réponses, il est nécessaire de supprimer les individus aberrants pour l'ensemble des anova ou est il possible de les retirer uniquement pour la réponse où ces derniers sont aberrants?
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Valeurs aberrante : Faut-il les supprimer pour les anova?
Sur une étude portant sur des organismes vivants, une valeur aberrante c'est une valeur physiologiquement impossible. Un être humain qui mesure 3 mètres par exemple, ou une souris qui pèse 2 kg.
Quand tu détectes des outliers, quelle que soit la méthode, la conduite à tenir est simple : vérifier la donnée, au besoin refaire la mesure ou le dosage, et corriger éventuellement. Si un retest est impossible, dans le doute ON GARDE. On ne supprime que si on est dans le physiologiquement impossible, et on garde une trace de la suppression.
Tant que tu es dans le physiologiquement possible, il ne faut pas supprimer des données qui ne font que refléter la réalité biologique. Un homme de 2m20 n'a rien d'aberrant. Il est juste beaucoup plus grand que la moyenne, mais ca n'en fait pas "une aberration". Un LDL proche de zéro est très étonnant mais n'a rien d'aberrant. Si on avait considéré tous les LDL "au plancher" comme aberrants, on n'aurait jamais découvert que certaines personnes portent une mutation génétique expliquant le phénomène, on n'aurait jamais décortiqué le mécanisme et on n'aurait jamais développé la nouvelle génération d'hypolipémiants qui tapent dessus.
Quand tu détectes des outliers, quelle que soit la méthode, la conduite à tenir est simple : vérifier la donnée, au besoin refaire la mesure ou le dosage, et corriger éventuellement. Si un retest est impossible, dans le doute ON GARDE. On ne supprime que si on est dans le physiologiquement impossible, et on garde une trace de la suppression.
Tant que tu es dans le physiologiquement possible, il ne faut pas supprimer des données qui ne font que refléter la réalité biologique. Un homme de 2m20 n'a rien d'aberrant. Il est juste beaucoup plus grand que la moyenne, mais ca n'en fait pas "une aberration". Un LDL proche de zéro est très étonnant mais n'a rien d'aberrant. Si on avait considéré tous les LDL "au plancher" comme aberrants, on n'aurait jamais découvert que certaines personnes portent une mutation génétique expliquant le phénomène, on n'aurait jamais décortiqué le mécanisme et on n'aurait jamais développé la nouvelle génération d'hypolipémiants qui tapent dessus.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Valeurs aberrante : Faut-il les supprimer pour les anova?
Bonjour,
Pour compléter les éléments apportés par Eric et C@ssoulet, si tu es dans l'optique de faire une ANOVA, tu es donc dans le cadre du modèle linéaire. Dans ce cas, peu importe qu'il y ait des valeurs qui apparaissent aberrantes dans un représentation ou une autre, ce qui compte c'est l'étude des résidus du modèle et voir quelles sont les valeurs influentes.
Par ailleurs, si tu décides de supprimer des valeurs (qui seraient potentiellement aberrantes et qui pèseraient beaucoup dans la détermination du modèle), il vaut mieux les supprimer définitivement de l'ensemble de tes analyses car sinon tu pourrais te retrouver à faire des analyses sur des jeux de données qui ne sont jamais les même ce qui est toujours très difficile à expliquer et à justifier.
HTH
Nik
Pour compléter les éléments apportés par Eric et C@ssoulet, si tu es dans l'optique de faire une ANOVA, tu es donc dans le cadre du modèle linéaire. Dans ce cas, peu importe qu'il y ait des valeurs qui apparaissent aberrantes dans un représentation ou une autre, ce qui compte c'est l'étude des résidus du modèle et voir quelles sont les valeurs influentes.
Par ailleurs, si tu décides de supprimer des valeurs (qui seraient potentiellement aberrantes et qui pèseraient beaucoup dans la détermination du modèle), il vaut mieux les supprimer définitivement de l'ensemble de tes analyses car sinon tu pourrais te retrouver à faire des analyses sur des jeux de données qui ne sont jamais les même ce qui est toujours très difficile à expliquer et à justifier.
HTH
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum