Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Boîtes à moustaches : valeurs aberrantes
3 participants
Page 1 sur 1
Boîtes à moustaches : valeurs aberrantes
Bonjour !
J'ai fait des boîtes à moustache sous MINITAB et sous STATISTICA ensuite pour avoir une meilleure représentation. Seulement je ne comprends pas : sous STATISTICA les boîtes incluent des valeurs que MINITAB jugeaient aberrantes. Est-ce une question d'options (je ne l'ai pas trouvé sous STATISTICA) ou cela signifie que mes valeurs aberrantes ne sont pas si aberrantes que ça ? Je suis désolée si ma question paraît peu claire ou stupide mais j'ai du mal à formuler ce que je veux dire et ne suis pas une habituée des stats...
J'ai fait des boîtes à moustache sous MINITAB et sous STATISTICA ensuite pour avoir une meilleure représentation. Seulement je ne comprends pas : sous STATISTICA les boîtes incluent des valeurs que MINITAB jugeaient aberrantes. Est-ce une question d'options (je ne l'ai pas trouvé sous STATISTICA) ou cela signifie que mes valeurs aberrantes ne sont pas si aberrantes que ça ? Je suis désolée si ma question paraît peu claire ou stupide mais j'ai du mal à formuler ce que je veux dire et ne suis pas une habituée des stats...
Pechou- Nombre de messages : 20
Date d'inscription : 20/07/2011
Re: Boîtes à moustaches : valeurs aberrantes
Bonjour.
Tu as seulement deux logiciels différents, donc deux résultats différents. Sur une notion aussi malsaine que la notion de "valeurs aberrantes", il est normal que les pratiques différent. Je suis cependant surpris que Minitab élimine des valeurs, ou simplement propose d'en éliminer : la détection de valeurs à éliminer dépend tellement du contexte qu'elle ne doit jamais être sous-traitée à un logiciel.
"que mes valeurs aberrantes ne sont pas si aberrantes que ça ? " Seul toi peux décider qu'une valeur est aberrante (faussée, mal copiée, exceptionnelle et à ne pas considérer, ...). Et tu les enlèves de l'étude avant tout travail avec.
Cordialement.
Tu as seulement deux logiciels différents, donc deux résultats différents. Sur une notion aussi malsaine que la notion de "valeurs aberrantes", il est normal que les pratiques différent. Je suis cependant surpris que Minitab élimine des valeurs, ou simplement propose d'en éliminer : la détection de valeurs à éliminer dépend tellement du contexte qu'elle ne doit jamais être sous-traitée à un logiciel.
"que mes valeurs aberrantes ne sont pas si aberrantes que ça ? " Seul toi peux décider qu'une valeur est aberrante (faussée, mal copiée, exceptionnelle et à ne pas considérer, ...). Et tu les enlèves de l'étude avant tout travail avec.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Boîtes à moustaches : valeurs aberrantes
C'est pas des valeurs aberrantes, c'est des valeurs EXTREMES (outlier).
La définition de la "frontière" au delà de laquelle les valeurs sont considérées comme extrêmes varie en fonction des logiciels.
La définition originale de Tucker est "1.5 * intervalle interquantile". Mais il a toujours été admis que cette limitte est purement arbitraire et a été définie de façon pratique. Donc certains ont décidé de se fixer d'autres limites, jugées (à tord ou à raison) comme plus pratiques. On retrouve assez fréquemment le 10° et 90° percentiles.
Il faut de toutes façons bien préciser les choses: ces limites définissant les outliers quelles qu'elles soient n'ont aucune justification mathématique et ne servent qu'à permettre une visualisation plus claire de la distribution des données. Ce ne sont que des pirouettes graphiques, qui ne peuvent en aucun cas servir à éliminer des valeurs d'une analyse.
Un outlier est une valeur extrême, pas une valeur aberrante, qu'il est utile et facile de repérer visuellement mais qui'il n'est que très rarement justifié d'éliminer. Et un simple graphe en boite ne paut pas justifier à lui seul l'élimination d'un outlier.
La définition de la "frontière" au delà de laquelle les valeurs sont considérées comme extrêmes varie en fonction des logiciels.
La définition originale de Tucker est "1.5 * intervalle interquantile". Mais il a toujours été admis que cette limitte est purement arbitraire et a été définie de façon pratique. Donc certains ont décidé de se fixer d'autres limites, jugées (à tord ou à raison) comme plus pratiques. On retrouve assez fréquemment le 10° et 90° percentiles.
Il faut de toutes façons bien préciser les choses: ces limites définissant les outliers quelles qu'elles soient n'ont aucune justification mathématique et ne servent qu'à permettre une visualisation plus claire de la distribution des données. Ce ne sont que des pirouettes graphiques, qui ne peuvent en aucun cas servir à éliminer des valeurs d'une analyse.
Un outlier est une valeur extrême, pas une valeur aberrante, qu'il est utile et facile de repérer visuellement mais qui'il n'est que très rarement justifié d'éliminer. Et un simple graphe en boite ne paut pas justifier à lui seul l'élimination d'un outlier.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Boîtes à moustaches : valeurs aberrantes
Effectivement je me suis mal exprimée, ce sont( des valeurs extrêmes. Je vous remercie tous les deux pour vos indications !
Pechou- Nombre de messages : 20
Date d'inscription : 20/07/2011
Sujets similaires
» detection de valeurs aberrantes
» valeurs aberrantes et anova
» Détecter des valeurs abérrantes
» Algorithme d'élimination de valeurs aberrantes
» Detection de valeurs aberrantes à plusieurs dimensions
» valeurs aberrantes et anova
» Détecter des valeurs abérrantes
» Algorithme d'élimination de valeurs aberrantes
» Detection de valeurs aberrantes à plusieurs dimensions
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum