Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
détection d'outliers
2 participants
Page 1 sur 1
détection d'outliers
Bonjour, je suis en L3 biologie. Je dois faire un compte rendu de TP de virologie.
J'ai plusieurs séries d'une dizaine de données. Je voudrais savoir comment je peut déterminer statistiquement quelles valeurs sont aberrantes mais je ne vois pas vraiment comment faire.
Exemple de série de données:
% de cellules mortes:
7
32
0
28
40
32,73
20
16
18,3
8,45
Je suppose qu'il doit y avoir un moyen rigoureux de détecter les outliers mais je n'ai pas trouvé lequel. Est-ce que vous pouvez m'aider?
Merci d'avance
Laetitia
J'ai plusieurs séries d'une dizaine de données. Je voudrais savoir comment je peut déterminer statistiquement quelles valeurs sont aberrantes mais je ne vois pas vraiment comment faire.
Exemple de série de données:
% de cellules mortes:
7
32
0
28
40
32,73
20
16
18,3
8,45
Je suppose qu'il doit y avoir un moyen rigoureux de détecter les outliers mais je n'ai pas trouvé lequel. Est-ce que vous pouvez m'aider?
Merci d'avance
Laetitia
laetis- Nombre de messages : 2
Date d'inscription : 24/02/2013
Re: détection d'outliers
Bonjour.
A priori, la détection de valeurs "aberrantes" n'est pas du ressort des statistiques (en quoi un calcul pourrait-il dire que la réalité est "fausse" ?). les méthodes classiques éliminent les valeurs "éloignées de la moyenne", ce qui souvent ne pose pas de problème, mais est scientifiquement discutable. Prends les taux de mortalité en France pour les 18-25 ans au vingtième siècle : va-t-on éliminer les taux de 1914 à 1918 ? Si on le fait, ce doit être avec de bonnes raisons.
Dans ton cas, éliminer (ou revérifier) les valeurs négatives ou supérieures à 100 est une bonne idée. Si tu as un modèle de mortalité, tu peux en déduire que certaines valeurs sont anormales et les éliminer.
Cordialement.
A priori, la détection de valeurs "aberrantes" n'est pas du ressort des statistiques (en quoi un calcul pourrait-il dire que la réalité est "fausse" ?). les méthodes classiques éliminent les valeurs "éloignées de la moyenne", ce qui souvent ne pose pas de problème, mais est scientifiquement discutable. Prends les taux de mortalité en France pour les 18-25 ans au vingtième siècle : va-t-on éliminer les taux de 1914 à 1918 ? Si on le fait, ce doit être avec de bonnes raisons.
Dans ton cas, éliminer (ou revérifier) les valeurs négatives ou supérieures à 100 est une bonne idée. Si tu as un modèle de mortalité, tu peux en déduire que certaines valeurs sont anormales et les éliminer.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Détection événements inhabituels
» detection de valeurs aberrantes
» Détermination de la limite de détection via Probit
» méthode détection données aberrantes
» Détection d'outliers, quel test utiliser
» detection de valeurs aberrantes
» Détermination de la limite de détection via Probit
» méthode détection données aberrantes
» Détection d'outliers, quel test utiliser
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum