Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
observations aberrantes
3 participants
Page 1 sur 1
observations aberrantes
salut ,
dans ma procédure je doit comparer les distances de mahalanobis et les distances robustes: ce que j'obtiens c'est que avec la 1ère méthode je détecte une seule observation aberrante alors qu'avec la seconde je remarque qu'il y a beaucoup d'observations qui deviennent aberrantes(+ que 135 sur 390) est-ce normal?? et doit-je les retirer pour faire une analyse discriminante factorielle ???ou autre analyse de groupement??
merci d'avance pour votre aide
S.H
dans ma procédure je doit comparer les distances de mahalanobis et les distances robustes: ce que j'obtiens c'est que avec la 1ère méthode je détecte une seule observation aberrante alors qu'avec la seconde je remarque qu'il y a beaucoup d'observations qui deviennent aberrantes(+ que 135 sur 390) est-ce normal?? et doit-je les retirer pour faire une analyse discriminante factorielle ???ou autre analyse de groupement??
merci d'avance pour votre aide
S.H
sh- Nombre de messages : 24
Date d'inscription : 13/04/2011
Re: observations aberrantes
Bonjour.
Je ne sais pas quel rapport tu fais entre distance et observations aberrantes, mais il est évident que si un tiers des observations sont déclarées aberrantes, c'est la procédure qui l'est (aberrante).
A noter : Si on est raisonnable, il n'existe aucune procédure sérieuse qui peut décider au seul vu des valeurs que l'une d'entre elles est aberrante.
Par exemple dans la série de notes 17, 18, 16, 18, 19, 17, 3, 19, 17, 18, 18, 19, 20, 18, 17, 19, 17, 20, 18, 19, 19, 17, 18, 19, décider que 3 est aberrante (ce que font toutes les méthodes automatiques) est très risqué (classe de 23 bons élèves et un qui n'y comprend rien); alors que dans la série 17, 18, 16, 18, 19, 17, 21, 19, 17, 18, 18, 19, 20, 18, 17, 19, 17, 20, 18, 19, 19, 17, 18, 19, il y a peu de chance que la valeur 21, aberrante pour une notation sur 20 habituelle, soit détectée.
Cordialement.
Je ne sais pas quel rapport tu fais entre distance et observations aberrantes, mais il est évident que si un tiers des observations sont déclarées aberrantes, c'est la procédure qui l'est (aberrante).
A noter : Si on est raisonnable, il n'existe aucune procédure sérieuse qui peut décider au seul vu des valeurs que l'une d'entre elles est aberrante.
Par exemple dans la série de notes 17, 18, 16, 18, 19, 17, 3, 19, 17, 18, 18, 19, 20, 18, 17, 19, 17, 20, 18, 19, 19, 17, 18, 19, décider que 3 est aberrante (ce que font toutes les méthodes automatiques) est très risqué (classe de 23 bons élèves et un qui n'y comprend rien); alors que dans la série 17, 18, 16, 18, 19, 17, 21, 19, 17, 18, 18, 19, 20, 18, 17, 19, 17, 20, 18, 19, 19, 17, 18, 19, il y a peu de chance que la valeur 21, aberrante pour une notation sur 20 habituelle, soit détectée.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: observations aberrantes
Il y a plusieurs méthodes pour détecter la présence de valeurs aberrantes. La méthode de Yates en est une. Par contre si tes valeurs suivent la loi normale (ce que tu peux vérifier avec un test de l'ajustement analytique utilisant le Khi carre), alors tu peux décider d'un seuil de confiance c ou 0<= c<= 1 avec c très prés de 1 par exemple 0.95 et éliminer comme aberrant toute observation qui serait en dehors de l'intervalle Xbarre +/- zc* ecart type des observations. Ici zc représente la valeur telle que Prob(loi normale centrée et réduite <= zc)=(1+c)/2. Normalement la valeur de zc est lue a partir de la table de la loi normale. Exemple pour c=.95 zc=1.96
vblover- Nombre de messages : 6
Date d'inscription : 15/04/2011
Re: observations aberrantes
salut,
merci pour toutes vos réponses cela m'aide beaucoup
ma question (pour vblover) : quel code ou fonction doit-on utiliser pour vérifier si la matrice de mes observations m*n suit bien une loi normale??
n' a-t-on pas que lorsque le nombre des observation est très grand (m>100), la matrice d'observations suit "automatiquement "une loi normale???
merci
S.H
merci pour toutes vos réponses cela m'aide beaucoup
ma question (pour vblover) : quel code ou fonction doit-on utiliser pour vérifier si la matrice de mes observations m*n suit bien une loi normale??
n' a-t-on pas que lorsque le nombre des observation est très grand (m>100), la matrice d'observations suit "automatiquement "une loi normale???
merci
S.H
sh- Nombre de messages : 24
Date d'inscription : 13/04/2011
Re: observations aberrantes
Hello Sh !
Je ne suis pas Vblover, mais ce que tu écris m'inquiète pour toi. la taille de la matrice d'observations n'a rien à voir avec la loi des observations (gaussienne ou pas). Si les observations sont des valeurs entières entre 1 et 5, il sera toujours difficile de dire qu'elles prennent toutes les valeurs autour d'une moyenne puisque les valeurs non entières ne sont jamais prises.
Ce qui est vrai, c'est que l'approximation gaussienne est possible pour certains calculs, comme celui de la moyenne. On peut approximer la loi de la moyenne par une gaussienne. Ce qui est tout à fait autre chose.
Cordialement.
Je ne suis pas Vblover, mais ce que tu écris m'inquiète pour toi. la taille de la matrice d'observations n'a rien à voir avec la loi des observations (gaussienne ou pas). Si les observations sont des valeurs entières entre 1 et 5, il sera toujours difficile de dire qu'elles prennent toutes les valeurs autour d'une moyenne puisque les valeurs non entières ne sont jamais prises.
Ce qui est vrai, c'est que l'approximation gaussienne est possible pour certains calculs, comme celui de la moyenne. On peut approximer la loi de la moyenne par une gaussienne. Ce qui est tout à fait autre chose.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: observations aberrantes
oui oui vous avez raison j'ai confondu avec la moyenne
s.H
s.H
sh- Nombre de messages : 24
Date d'inscription : 13/04/2011
Sujets similaires
» valeurs aberrantes et anova
» ACP et le nombre d'observations ?
» Détecter des valeurs abérrantes
» Pondération des observations
» STATA: observations manquantes
» ACP et le nombre d'observations ?
» Détecter des valeurs abérrantes
» Pondération des observations
» STATA: observations manquantes
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum