Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
DEBUTANT > Test de Student et normalité des séries
3 participants
Page 1 sur 1
DEBUTANT > Test de Student et normalité des séries
Bonjour,
Je suis en train de réaliser ma thèse d'exercice de médecine et j'ai une question statistique. Je précise que je ne suis pas un expert en statistique, d'où ma demande d'aide ;-)
J'ai 2 populations : population R n=53 et Population I n=63.
Je souhaite comparer les âges de mes 2 populations.
Voici les données :
Population R :
26
26
27
27
27
27
27
27
27
27
28
28
28
28
28
28
28
28
28
29
29
29
29
29
29
29
29
30
30
30
30
30
30
30
30
30
31
31
31
31
31
33
33
33
33
33
35
35
36
37
38
38
68
Population I :
28
28
29
29
29
29
29
30
30
31
31
31
31
31
31
31
31
31
31
32
32
32
32
32
32
32
33
33
33
33
33
33
34
34
34
34
34
34
34
34
34
35
35
35
35
35
35
36
37
37
38
39
39
42
43
43
45
46
48
48
48
57
60
Je voulais utiliser le test de Student pour ces données quantitatives que sont les âges, avec mes 2 groupes.
Sauf que si j'utilise le Test de Shapiro pour vérifier la normalité, il est significative pour chaque groupe donc si j'ai bien compris, les séries d'âge ne suivent pas la loi normale et je ne peux donc pas utiliser le test de Student, est-ce exact ?
Si oui, comment faire pour les comparer, il faut que j'utilise le test de Wilcoxon pour échantillons indépendants ?
Merci beaucoup pour votre aide,
Cordialement,
David
Je suis en train de réaliser ma thèse d'exercice de médecine et j'ai une question statistique. Je précise que je ne suis pas un expert en statistique, d'où ma demande d'aide ;-)
J'ai 2 populations : population R n=53 et Population I n=63.
Je souhaite comparer les âges de mes 2 populations.
Voici les données :
Population R :
26
26
27
27
27
27
27
27
27
27
28
28
28
28
28
28
28
28
28
29
29
29
29
29
29
29
29
30
30
30
30
30
30
30
30
30
31
31
31
31
31
33
33
33
33
33
35
35
36
37
38
38
68
Population I :
28
28
29
29
29
29
29
30
30
31
31
31
31
31
31
31
31
31
31
32
32
32
32
32
32
32
33
33
33
33
33
33
34
34
34
34
34
34
34
34
34
35
35
35
35
35
35
36
37
37
38
39
39
42
43
43
45
46
48
48
48
57
60
Je voulais utiliser le test de Student pour ces données quantitatives que sont les âges, avec mes 2 groupes.
Sauf que si j'utilise le Test de Shapiro pour vérifier la normalité, il est significative pour chaque groupe donc si j'ai bien compris, les séries d'âge ne suivent pas la loi normale et je ne peux donc pas utiliser le test de Student, est-ce exact ?
Si oui, comment faire pour les comparer, il faut que j'utilise le test de Wilcoxon pour échantillons indépendants ?
Merci beaucoup pour votre aide,
Cordialement,
David
davidpes85- Nombre de messages : 2
Date d'inscription : 16/02/2020
Re: DEBUTANT > Test de Student et normalité des séries
Bonjour.
Tu peux effectivement utiliser un test non paramétrique (wilcoxon par exemple), et ici, avec une variable numérique qu'on peut considérer comme ordinale, c'est une bonne idée. On peut aussi, vu la taille des données, utiliser quand même un test de Student, car la variable "moyenne de l'échantillon" se rapproche d'une distribution gaussienne quand l'échantillon est de grande taille.
Cordialement.
Tu peux effectivement utiliser un test non paramétrique (wilcoxon par exemple), et ici, avec une variable numérique qu'on peut considérer comme ordinale, c'est une bonne idée. On peut aussi, vu la taille des données, utiliser quand même un test de Student, car la variable "moyenne de l'échantillon" se rapproche d'une distribution gaussienne quand l'échantillon est de grande taille.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: DEBUTANT > Test de Student et normalité des séries
gg, la raison pour laquelle on pourrait utiliser un test-t dans ce cas n'est pas due au fait que la moyenne va finir par suivre une loi normale (ce qui est le cas), mais parce que le test t est notoirement connu (depuis les années 60) pour être très robuste à la non-normalité. Si on compare deux échantillons avec des distributions complètement pourries (multimodales, avec de longues queues que d'un côté, même avec beaucoup de données), les moyennes seront bellement normales, mais une procédure fondées sur la normalité (ANOVA, test-t, etc.) sera totalement fausse.gg a écrit: On peut aussi, vu la taille des données, utiliser quand même un test de Student, car la variable "moyenne de l'échantillon" se rapproche d'une distribution gaussienne quand l'échantillon est de grande taille.
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: DEBUTANT > Test de Student et normalité des séries
Bonjour Eric.
Il me semble pourtant que dans ces deux cas (et c'est pourquoi je les ai cités explicitement), c'est la distribution de la moyenne qui est en cause dans le test, pas celle de la variable. D'ailleurs, pour une variable fortement bimodale, il faut une taille d'échantillon bien plus forte pour assurer la robustesse.
Cordialement
Il me semble pourtant que dans ces deux cas (et c'est pourquoi je les ai cités explicitement), c'est la distribution de la moyenne qui est en cause dans le test, pas celle de la variable. D'ailleurs, pour une variable fortement bimodale, il faut une taille d'échantillon bien plus forte pour assurer la robustesse.
Cordialement
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: DEBUTANT > Test de Student et normalité des séries
C'est les moyennes qu'on compare, effectivement, mais toute la distribution des échantillons participe à la construction du test, par exemple les variances des deux échantillons (ou la variance commune, etc.), leur erreur standard, etc., et ces autres caractéristiques des échantillons ne sont pas nécessairement corrélées aux moyennes. Ceci est pour le cas simple du test-t, mais c'est vrai pour n'importe quel test sur données normales. Il ne suffit pas d'augmenter les tailles des échantillons pour se libérer des contraintes de normalité.
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: DEBUTANT > Test de Student et normalité des séries
Merci pour vos réponses et pour le débat, je comprends mieux !
J'ai une autre question pour l'utilisation d'un test et le choix du test statistique.
J'ai mes 2 memes populations R=53 et I=63.
J'étudie le secteur d'activité de chacun des groupes, répartis en 3 classes : Urbain, Semi-rural et Rural.
Dans le groupe I, j'ai 63 réponses, 1 réponse par sujet.
Pour le groupe R, certains ont 2 réponses, ce qui me fait 72 réponses pour une population de 53.
Il faut donc utiliser un test pour données appariées, non ? Je peux utiliser le test exact de Fisher ? ou le test de McNemar ?
Ou alors j'utilise quand meme un Chi2 ?
Merci encore ;-)
bonne soirée,
J'ai une autre question pour l'utilisation d'un test et le choix du test statistique.
J'ai mes 2 memes populations R=53 et I=63.
J'étudie le secteur d'activité de chacun des groupes, répartis en 3 classes : Urbain, Semi-rural et Rural.
Dans le groupe I, j'ai 63 réponses, 1 réponse par sujet.
Pour le groupe R, certains ont 2 réponses, ce qui me fait 72 réponses pour une population de 53.
Il faut donc utiliser un test pour données appariées, non ? Je peux utiliser le test exact de Fisher ? ou le test de McNemar ?
Ou alors j'utilise quand meme un Chi2 ?
Merci encore ;-)
bonne soirée,
davidpes85- Nombre de messages : 2
Date d'inscription : 16/02/2020
Re: DEBUTANT > Test de Student et normalité des séries
Les choses se compliquent sensiblement.
D'abord, on n'est plus dans le cas d'un test t ou l'on veut comparer les deux groupes, mais plutôt dans le cas d'une ANOVA à deux facteurs croisés, avec l'effet groupe, l'effet "urbain/semi-rural/rural", et l'interaction entre ces deux facteurs.
La classification supplémentaire dont vous parlez à présent ne serait-elle pas à l'origine du fait que vous trouvez que vos données ne sont pas normales ? Il est très possible que ça soit le cas.
Bref, si les données peuvent être considérées comme normales, une ANOVA à deux facteurs fera l'affaire.
Enfin, il y a le problème des données répétées/appariées. Vous n'allez pas vous en sortir avec une ANOVA sur données répétées, car peu de données le sont. Il n'y a pas trop de solution.
Pour ma part (mais ça sera compliqué pour vous à mettre en œuvre), j’utiliserais une procédure bootstrap, en: (1) tirant au hasard une réponse pour les sujets qui en en fournissent deux, (2) calculer une ANOVA sur le dataset obtenu, (3) répéter l'ensemble de nombreuses fois. Ca permettra de tester les trois effets (deux facteurs, et leur interaction) et leur robustesse.
Désolé de ne pas pouvoir vous donner une réponse plus simple.
D'autres sur ce forum auront peut-être d'autres solutions plus simples à vous proposer.
HTH, Eric.
D'abord, on n'est plus dans le cas d'un test t ou l'on veut comparer les deux groupes, mais plutôt dans le cas d'une ANOVA à deux facteurs croisés, avec l'effet groupe, l'effet "urbain/semi-rural/rural", et l'interaction entre ces deux facteurs.
La classification supplémentaire dont vous parlez à présent ne serait-elle pas à l'origine du fait que vous trouvez que vos données ne sont pas normales ? Il est très possible que ça soit le cas.
Bref, si les données peuvent être considérées comme normales, une ANOVA à deux facteurs fera l'affaire.
Enfin, il y a le problème des données répétées/appariées. Vous n'allez pas vous en sortir avec une ANOVA sur données répétées, car peu de données le sont. Il n'y a pas trop de solution.
Pour ma part (mais ça sera compliqué pour vous à mettre en œuvre), j’utiliserais une procédure bootstrap, en: (1) tirant au hasard une réponse pour les sujets qui en en fournissent deux, (2) calculer une ANOVA sur le dataset obtenu, (3) répéter l'ensemble de nombreuses fois. Ca permettra de tester les trois effets (deux facteurs, et leur interaction) et leur robustesse.
Désolé de ne pas pouvoir vous donner une réponse plus simple.
D'autres sur ce forum auront peut-être d'autres solutions plus simples à vous proposer.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Sujets similaires
» Question de débutant : quel test statistique
» Fisher test et test de student
» test de normalité
» test de normalité
» test de normalité en ACP
» Fisher test et test de student
» test de normalité
» test de normalité
» test de normalité en ACP
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|