Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Test pour détecter valeurs aberrantes
2 participants
Page 1 sur 1
Test pour détecter valeurs aberrantes
Bonjour à tous,
Je recherche un test statistique permettant d'identifier des valeurs aberrantes avec R.
J'ai vu que le test de Dixon pouvait répondre à cette problématique. Malheureusement, il peut seulement être réalisable sur un petit jeu de données...
Je traite à peu près 70000 lignes...
Auriez-vous un test à me proposer ?
En vous remerciant par avance !
Je recherche un test statistique permettant d'identifier des valeurs aberrantes avec R.
J'ai vu que le test de Dixon pouvait répondre à cette problématique. Malheureusement, il peut seulement être réalisable sur un petit jeu de données...
Je traite à peu près 70000 lignes...
Auriez-vous un test à me proposer ?
En vous remerciant par avance !
klaklar- Nombre de messages : 3
Date d'inscription : 21/10/2015
Re: Test pour détecter valeurs aberrantes
Bonjour,
Tout d'abord une valeur aberrante est une notion totalement subjective, il va falloir que tu saches d'abord pourquoi tu serais confronté à des valeurs aberrantes (exemple : "outlier"=valeurs trop extrêmes par rapport à la moyenne à cause d'un arrondissement, d'un mauvais remplissage ou du remplissage de la valeur par une personne non formée; ou par exemple, "inlier"=des groupes de valeurs trop proches les unes des autres (variabilité trop faible pour être réelle); "le digit preference" pour lequel on évalue la fréquence d'unités qu'on recontre...), bref, il faut savoir ce que tu cherches.
Qu'est-ce qui toi te dérange dans ton jeu de données (comme valeurs aberrantes) ?
Ensuite, il faut savoir à quoi correspondent tes lignes, est-ce que ce sont des individus que tu traites ?
Il y a des dizaines de tests et graphiques permettant de traiter les valeurs aberrantes, en fonction de ce qu'on cherche à leur sujet.
C'était mon sujet de fin de d'études
Tout d'abord une valeur aberrante est une notion totalement subjective, il va falloir que tu saches d'abord pourquoi tu serais confronté à des valeurs aberrantes (exemple : "outlier"=valeurs trop extrêmes par rapport à la moyenne à cause d'un arrondissement, d'un mauvais remplissage ou du remplissage de la valeur par une personne non formée; ou par exemple, "inlier"=des groupes de valeurs trop proches les unes des autres (variabilité trop faible pour être réelle); "le digit preference" pour lequel on évalue la fréquence d'unités qu'on recontre...), bref, il faut savoir ce que tu cherches.
Qu'est-ce qui toi te dérange dans ton jeu de données (comme valeurs aberrantes) ?
Ensuite, il faut savoir à quoi correspondent tes lignes, est-ce que ce sont des individus que tu traites ?
Il y a des dizaines de tests et graphiques permettant de traiter les valeurs aberrantes, en fonction de ce qu'on cherche à leur sujet.
C'était mon sujet de fin de d'études
Dernière édition par zezima le Mer 6 Sep 2017 - 15:02, édité 1 fois (Raison : I made mistakes)
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» Détecter des valeurs abérrantes
» detecter des valeurs anormales
» valeurs aberrantes et anova
» detection de valeurs aberrantes
» Détecter des valeurs extrêmes avec une loi béta-binomiale
» detecter des valeurs anormales
» valeurs aberrantes et anova
» detection de valeurs aberrantes
» Détecter des valeurs extrêmes avec une loi béta-binomiale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum