Les posteurs les plus actifs de la semaine
NALI
méthode détection données aberrantes Vote_lcapméthode détection données aberrantes Voting_barméthode détection données aberrantes Vote_rcap 
Eric Wajnberg
méthode détection données aberrantes Vote_lcapméthode détection données aberrantes Voting_barméthode détection données aberrantes Vote_rcap 


méthode détection données aberrantes

Aller en bas

méthode détection données aberrantes Empty méthode détection données aberrantes

Message par niaboc le Mer 23 Juil 2014 - 19:39

Bonjour,

quelles méthodes de détection de données aberrantes connaissez-vous, pour une série de données dont on ne connait pas la loi?

la méthode utilisée pour l'instant dans le programme que j'utilise est :
moyenne+-X*écart type.

Cependant, la moyenne et l'écart type peuvent être bcp influencés par les données aberrantes... et je cherche une méthode plus robuste.

Merci
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

méthode détection données aberrantes Empty Re: méthode détection données aberrantes

Message par gg le Mer 23 Juil 2014 - 22:24

Bonjour.

La principale méthode n'est pas statistique, c'est le rejet des valeurs aberrantes (celles qui ne peuvent pas être de vraies valeurs). Par exemple, pour des notes sur 20, les valeurs négatives ou supérieures à 20, ou avec plus de 2 chiffres après la virgule; pour des tailles en cm, les négatifs et les supérieurs à 270, etc.

Une valeur éloignée de la moyenne peut être une valeur extrême, mais pas du tout aberrante. par exemple, elle aurait conduit à rejeter la note 20 d'un très bon élève lors d'un contrôle raté par l'ensemble de la classe.

Comme la moyenne est sensible aux valeurs aberrantes, il est souvent possible (séries symétriques) de la remplacer par la médiane, plus robuste.

Cordialement.

gg

Nombre de messages : 2111
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

méthode détection données aberrantes Empty Re: méthode détection données aberrantes

Message par niaboc le Jeu 24 Juil 2014 - 7:18

Bonjour,

en fait j'ai des séries de données qui peuvent ressembler à ça :

0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,2,2,2,2,3,3,3,4,4,4,5,6,7,18,20
ou encore
0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,6


dans ce cas, j'aimerais bien supprimer le 18 et le 20 de la première série et le 6 de la deuxième.

Car ensuite je fais des tests stats à l'aide de ces séries et je n'ai pas envie que les valeurs extrêmes (qui peuvent être aberrantes dans certains cas) prennent beaucoup trop de poids dans mes tests.

J'ai vu la méthode de Dixon, mais qui permet de rejeter 1 ou 2 valeurs aberrantes par série seulement... et puis l'effectif est limité dans ce test.

Du coup je ne sais pas trop comment faire à part moy±X*std
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

méthode détection données aberrantes Empty Re: méthode détection données aberrantes

Message par c@ssoulet le Jeu 24 Juil 2014 - 7:23

Tu peux aussi appliquer la méthode utilisée dans le box plot de Tukey, c'est à dire considérer comme outlier les valeurs superieures au 75° percentile + 1.5 ecart interquartile et inf. 25° - 1.5 EI. Mais comme le dit gg c'est juste une methode permettant d'isoler certaines valeurs extremes à vérifier particulièrement. Rien ne te dit qu'un outlier soit aberrant et il n'est pas méthodologiquement correct d'éliminer "automatiquement" les outliers

c@ssoulet

Nombre de messages : 898
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

méthode détection données aberrantes Empty Re: méthode détection données aberrantes

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum