Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Test de la normalité des données
3 participants
Page 1 sur 1
Test de la normalité des données
Bonjour ,
pour tester la normalité des données j'ai d'abord appliqué le test de Shapiro-Wilk en trouvant les résultat suivantes
W = 0.9842, p-value = 0.05374
et le test de Kolmogrov donne
D = 0.1032, p-value = 0.05565
Est ce qu'on peut décider que les données suivent une loi normale (les p_value ne sont pas trop supérieur à 0.05!!)?
Merci d'avance pour vos réponses
Inès
pour tester la normalité des données j'ai d'abord appliqué le test de Shapiro-Wilk en trouvant les résultat suivantes
W = 0.9842, p-value = 0.05374
et le test de Kolmogrov donne
D = 0.1032, p-value = 0.05565
Est ce qu'on peut décider que les données suivent une loi normale (les p_value ne sont pas trop supérieur à 0.05!!)?
Merci d'avance pour vos réponses
Inès
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
Bonjour.
Non, on ne peut pas décider. Si on soupçonnait les données d'être loin de la normalité, on est plutôt conforté (au seuil de risque 10%, le test est significatif). Si on avait de bonnes raisons de penser la distribution gaussienne, on est dans le domaine d'acceptation.
N'importe comment, un test ne donne pas de garantie. mais si tu avais décidé de faire un test au seuil de risque 5%, il ne te reste plus qu'à conclure en fonction de ce que tu avais décidé.
Cordialement.
Non, on ne peut pas décider. Si on soupçonnait les données d'être loin de la normalité, on est plutôt conforté (au seuil de risque 10%, le test est significatif). Si on avait de bonnes raisons de penser la distribution gaussienne, on est dans le domaine d'acceptation.
N'importe comment, un test ne donne pas de garantie. mais si tu avais décidé de faire un test au seuil de risque 5%, il ne te reste plus qu'à conclure en fonction de ce que tu avais décidé.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Test de la normalité des données
C'est mon problème je ne sais pas est ce que je dois décider que la distribution des données est normale ou non ,surtout que la densité n'a pas vraiment l'air d'une densité normale !!
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
Il faudrait savoir combien tu as de valeurs. Au premier coup d'oeil la deviation a la normalite n'est pas extraordinaire : ta distribution est a peu pres symetrique, il ne semble pas y avoir de longues queues qui trainent ni d'outliers. Certes c'est pas la belle cloche décrite dans les livres mais bon, pour faire un ttest derrière je m'en contenterais....
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Test de la normalité des données
Pour obtenir une courbe de ce genre sans trop trafiquer, il faut avoir un grand nombre de données, donc le t-test s'applique (C'est la Normalité approximative de la moyenne qui est utilisée).
Cordialement.
NB : Il est écrit N=152, même avec des données absolument quelconques, avec 152 valeurs il n'y a pas besoin de se poser ce genre de question ...
Cordialement.
NB : Il est écrit N=152, même avec des données absolument quelconques, avec 152 valeurs il n'y a pas besoin de se poser ce genre de question ...
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Test de la normalité des données
Merci d'abord pour vos réponses .
J'ai appliqué le t-test et je trouve
t.test(Geo19echan[,2])
One Sample t-test
data: Geo19echan[, 2]
t = 1065.295, df = 151, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
269.6109 270.6128
sample estimates:
mean of x
270.1118
Le p-value est inférieure à 0.05 donc les données ne suivent pas une loi de student(loi normale ) ?
J'ai appliqué le t-test et je trouve
t.test(Geo19echan[,2])
One Sample t-test
data: Geo19echan[, 2]
t = 1065.295, df = 151, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
269.6109 270.6128
sample estimates:
mean of x
270.1118
Le p-value est inférieure à 0.05 donc les données ne suivent pas une loi de student(loi normale ) ?
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
Heu ...
Sais-tu vraiment ce que tu fais ?
En tout cas, ta conclusion n'a rien à voir avec le test.
Et la fin montre que tu manipules des mots sans te soucier de leur sens.
Sais-tu vraiment ce que tu fais ?
En tout cas, ta conclusion n'a rien à voir avec le test.
Et la fin montre que tu manipules des mots sans te soucier de leur sens.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Test de la normalité des données
J'avoue je ne sais pas trop utiliser le t-test!
Une autre question , la taille de données est 152 est il efficace d'appliquer un test de Shapiro-Wilk ?
Une autre question , la taille de données est 152 est il efficace d'appliquer un test de Shapiro-Wilk ?
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
Mais tu veux faire quoi au juste ?
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Test de la normalité des données
Je voudrais implémenter le test de shapiro-wilk dans un logiciel , mais en regardant les étapes du calcul je tombe sur le document suivant
http://eduscol.education.fr/rnchimie/math/benichou/tests/normalite/normalite.htm
ou il dit que ce test "Ce test est valable pour des tailles n d'échantillons relativement faibles (n compris entre 5 et 38)"
et en regardant la tale des coefficient pour le calcul de la test je trouve que l'effectif maximal est 38 !
http://eduscol.education.fr/rnchimie/math/benichou/tests/normalite/normalite.htm
ou il dit que ce test "Ce test est valable pour des tailles n d'échantillons relativement faibles (n compris entre 5 et 38)"
et en regardant la tale des coefficient pour le calcul de la test je trouve que l'effectif maximal est 38 !
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
mais dans quel but ? Une fois que tu sais si tes distributions sont normales ou pas, tu veux en faire quoi ?
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Test de la normalité des données
je teste la normalité des données pour calculer la capabilité d'un processus de fabrication , cet indice de capabilité dépend de la normalité des données :
1- si on est dans le cas d'une distribution normale :
Cp=(Ts-Ti)/6*Sigma
2-Si les données ne suivent pas une loi normale
Cp=(Ts-Ti)/(quantile(0.99865)-quantile( 0.00135))
1- si on est dans le cas d'une distribution normale :
Cp=(Ts-Ti)/6*Sigma
2-Si les données ne suivent pas une loi normale
Cp=(Ts-Ti)/(quantile(0.99865)-quantile( 0.00135))
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Re: Test de la normalité des données
Automatiser la décision "distribution normale ou pas" sera difficile, car le choix et l'interprétation des tests de normalité sont difficiles et demandent un peu de réflexion. Et en pratique on se laisse souvent un peu de marge par rapport à une distribution strictement normale.
La plus grosse difficulté est que plus l'effectif est grand plus on rejette facilement l'hypothèse de normalité. Et donc plus on a de mesures plus le test a tendance à rejeter - à tord- des distributions présentant de tout petits écarts à la normalité. En pratique, la décision se fait très souvent sur une représentation graphique et c'est le statisticien qui décide..
Voilà de la lecture qui t'aidera à cerner la difficulté d'une décision strictement basée sur le calcul
http://archive.numdam.org/ARCHIVE/RSA/RSA_1972__20_2/RSA_1972__20_2_5_0/RSA_1972__20_2_5_0.pdf
La plus grosse difficulté est que plus l'effectif est grand plus on rejette facilement l'hypothèse de normalité. Et donc plus on a de mesures plus le test a tendance à rejeter - à tord- des distributions présentant de tout petits écarts à la normalité. En pratique, la décision se fait très souvent sur une représentation graphique et c'est le statisticien qui décide..
Voilà de la lecture qui t'aidera à cerner la difficulté d'une décision strictement basée sur le calcul
http://archive.numdam.org/ARCHIVE/RSA/RSA_1972__20_2/RSA_1972__20_2_5_0/RSA_1972__20_2_5_0.pdf
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Test de la normalité des données
Je vous remercie pour votre réponse
toussaZK- Nombre de messages : 81
Date d'inscription : 02/06/2014
Sujets similaires
» normalité des données
» test de normalité
» détaillé le khi2 étape par étape
» test de normalité en ACP
» test de normalité en ACP
» test de normalité
» détaillé le khi2 étape par étape
» test de normalité en ACP
» test de normalité en ACP
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|