Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment :
Manga Chainsaw Man : où acheter le Tome 17 ...
Voir le deal
19.99 €

DEBUTANT > Test de Student et normalité des séries

3 participants

Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty DEBUTANT > Test de Student et normalité des séries

Message par davidpes85 Dim 16 Fév 2020 - 15:16

Bonjour,

Je suis en train de réaliser ma thèse d'exercice de médecine et j'ai une question statistique. Je précise que je ne suis pas un expert en statistique, d'où ma demande d'aide ;-)

J'ai 2 populations : population R n=53 et Population I n=63.
Je souhaite comparer les âges de mes 2 populations.

Voici les données :
Population R :
26
26
27
27
27
27
27
27
27
27
28
28
28
28
28
28
28
28
28
29
29
29
29
29
29
29
29
30
30
30
30
30
30
30
30
30
31
31
31
31
31
33
33
33
33
33
35
35
36
37
38
38
68
Population I :
28
28
29
29
29
29
29
30
30
31
31
31
31
31
31
31
31
31
31
32
32
32
32
32
32
32
33
33
33
33
33
33
34
34
34
34
34
34
34
34
34
35
35
35
35
35
35
36
37
37
38
39
39
42
43
43
45
46
48
48
48
57
60

Je voulais utiliser le test de Student pour ces données quantitatives que sont les âges, avec mes 2 groupes.
Sauf que si j'utilise le Test de Shapiro pour vérifier la normalité, il est significative pour chaque groupe donc si j'ai bien compris, les séries d'âge ne suivent pas la loi normale et je ne peux donc pas utiliser le test de Student, est-ce exact ?
Si oui, comment faire pour les comparer, il faut que j'utilise le test de Wilcoxon pour échantillons indépendants ?

Merci beaucoup pour votre aide,
Cordialement,
David

davidpes85

Nombre de messages : 2
Date d'inscription : 16/02/2020

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par gg Dim 16 Fév 2020 - 17:25

Bonjour.

Tu peux effectivement utiliser un test non paramétrique (wilcoxon par exemple), et ici, avec une variable numérique qu'on peut considérer comme ordinale, c'est une bonne idée. On peut aussi, vu la taille des données, utiliser quand même un test de Student, car la variable "moyenne de l'échantillon" se rapproche d'une distribution gaussienne quand l'échantillon est de grande taille.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par Eric Wajnberg Lun 17 Fév 2020 - 9:53

gg a écrit: On peut aussi, vu la taille des données, utiliser quand même un test de Student, car la variable "moyenne de l'échantillon" se rapproche d'une distribution gaussienne quand l'échantillon est de grande taille.
gg, la raison pour laquelle on pourrait utiliser un test-t dans ce cas n'est pas due au fait que la moyenne va finir par suivre une loi normale (ce qui est le cas), mais parce que le test t est notoirement connu (depuis les années 60) pour être très robuste à la non-normalité. Si on compare deux échantillons avec des distributions complètement pourries (multimodales, avec de longues queues que d'un côté, même avec beaucoup de données), les moyennes seront bellement normales, mais une procédure fondées sur la normalité (ANOVA, test-t, etc.) sera totalement fausse.

Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par gg Lun 17 Fév 2020 - 12:32

Bonjour Eric.

Il me semble pourtant que dans ces deux cas (et c'est pourquoi je les ai cités explicitement), c'est la distribution de la moyenne qui est en cause dans le test, pas celle de la variable. D'ailleurs, pour une variable fortement bimodale, il faut une taille d'échantillon bien plus forte pour assurer la robustesse.

Cordialement

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par Eric Wajnberg Lun 17 Fév 2020 - 12:55

C'est les moyennes qu'on compare, effectivement, mais toute la distribution des échantillons participe à la construction du test, par exemple les variances des deux échantillons (ou la variance commune, etc.), leur erreur standard, etc., et ces autres caractéristiques des échantillons ne sont pas nécessairement corrélées aux moyennes. Ceci est pour le cas simple du test-t, mais c'est vrai pour n'importe quel test sur données normales. Il ne suffit pas d'augmenter les tailles des échantillons pour se libérer des contraintes de normalité.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par davidpes85 Lun 17 Fév 2020 - 22:21

Merci pour vos réponses et pour le débat, je comprends mieux !

J'ai une autre question pour l'utilisation d'un test et le choix du test statistique.
J'ai mes 2 memes populations R=53 et I=63.
J'étudie le secteur d'activité de chacun des groupes, répartis en 3 classes : Urbain, Semi-rural et Rural.
Dans le groupe I, j'ai 63 réponses, 1 réponse par sujet.
Pour le groupe R, certains ont 2 réponses, ce qui me fait 72 réponses pour une population de 53.
Il faut donc utiliser un test pour données appariées, non ? Je peux utiliser le test exact de Fisher ? ou le test de McNemar ?
Ou alors j'utilise quand meme un Chi2 ?

Merci encore ;-)
bonne soirée,

davidpes85

Nombre de messages : 2
Date d'inscription : 16/02/2020

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par Eric Wajnberg Mar 18 Fév 2020 - 8:57

Les choses se compliquent sensiblement.

D'abord, on n'est plus dans le cas d'un test t ou l'on veut comparer les deux groupes, mais plutôt dans le cas d'une ANOVA à deux facteurs croisés, avec l'effet groupe, l'effet "urbain/semi-rural/rural", et l'interaction entre ces deux facteurs.

La classification supplémentaire dont vous parlez à présent ne serait-elle pas à l'origine du fait que vous trouvez que vos données ne sont pas normales ? Il est très possible que ça soit le cas.

Bref, si les données peuvent être considérées comme normales, une ANOVA à deux facteurs fera l'affaire.

Enfin, il y a le problème des données répétées/appariées. Vous n'allez pas vous en sortir avec une ANOVA sur données répétées, car peu de données le sont. Il n'y a pas trop de solution.

Pour ma part (mais ça sera compliqué pour vous à mettre en œuvre), j’utiliserais une procédure bootstrap, en: (1) tirant au hasard une réponse pour les sujets qui en en fournissent deux, (2) calculer une ANOVA sur le dataset obtenu, (3) répéter l'ensemble de nombreuses fois. Ca permettra de tester les trois effets (deux facteurs, et leur interaction) et leur robustesse.

Désolé de ne pas pouvoir vous donner une réponse plus simple.

D'autres sur ce forum auront peut-être d'autres solutions plus simples à vous proposer.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

DEBUTANT > Test de Student et normalité des séries Empty Re: DEBUTANT > Test de Student et normalité des séries

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum