Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
comparaison de moyenne de deux échantillons, cas spécial
+2
kass
cocotta
6 participants
Page 1 sur 1
comparaison de moyenne de deux échantillons, cas spécial
Bonjour,
Le boxplot se trouve sur le lien http://www.hpics.li/fbc60
J'ai deux échantillons (un national qui regroupe toutes les catégories, l'autre "échantillon de catégorie" est plus petit et est inclus dans l'échantillon national), je dois alors pour chaque catégorie comparer sa moyenne à la moyenne nationale.
Je vérifie alors la normalité dans l'échantillon totale et les échantillons de chaque catégorie. Si un au moins des échantillons n'est pas normal, il faut utiliser le wilcoxon, sinon c'est student. Problème: que ce soit student ou wilcoxon, les deux échantillons doivent être indépendants!!! Or ce n'est pas le cas ici!!!!!
Même quand je finis par séparer les deux échantillons (c-à-d je me crée l'échantillon de la catégorie au final contre toutes les autres catégories (par ex les CHU opposés à toutes les autres catégories sauf CHU pour pouvoir appliquer wilcoxon ou Student....sauf que je me trompe complètement en faisant celà, car l'objectif est de comparer la moyenne des CHU avec la moyenne nationale (toutes les autres catégories y compris les CHU)!!! (car sur le boxplot, je dois à chaque fois comparer la moyenne nationale "le trait rouge", contre les moyennes de chaque catégorie "le point rouge")
Je me dis alors peut-être que je peux considérer la moyenne nationale comme une valeur fixée, et quand la normalité est bien vérifiée dans l'échantillon national et l'échantillon de catégorie, que je peux dans ce cas utilser student "comparaison d'une moyenne à une valeur fixée" mais je ne sais pas si c'est juste.
Si c'est juste (dans le cas de normalité et donc d'pplication de student)., je me confronte dans le cas contraire où la normalité n'est pas vérifiée (dans ce cas c'est wilcoxon qui doit être appliqué, or wilcoxon suppose que les deux échantillons doivent être tout à fait indéependants et ce n'est pas le cas ici!!!!)
Si il existe des tests de moyenne à appliquer dans ces cas là (quand un échatillon est inclus dans un autre), je ne me poserai plus de question et se sera alors les tests appropriés.
Concernant la façon dont ont procédé les autres personnes qui ont travaillé sur le même sujet avant, , ils ne sont pas du tout rigoureux sur ces tests : par exemple ils ne vérifient pas du tout la normalité, ils appliquent directement student (quand l'ffectif de la catégorie en question est supérieure à 30), et wilcoxon sinon, et ils vont même jusqu'à ignorer certains résultats de leurs tests si le boxplot affiche un paradoxe. (En effet, on crée dabord le boxplot sur lequel on représente la moyenne nationale "en trait rouge" et la moyenne de chaque catégorie "en point rouge" pour avoir une visibilité sur la différence entre la moyenne nationale et la moyenne de chaque catégorie "Cf. l'exemple ci dessous")
Sauriez-vous de quoi il s'agit, et s'il existe des tests plus appropiés à mon cas que le student et le wilcoxon???
En vous remerciant
Le boxplot se trouve sur le lien http://www.hpics.li/fbc60
J'ai deux échantillons (un national qui regroupe toutes les catégories, l'autre "échantillon de catégorie" est plus petit et est inclus dans l'échantillon national), je dois alors pour chaque catégorie comparer sa moyenne à la moyenne nationale.
Je vérifie alors la normalité dans l'échantillon totale et les échantillons de chaque catégorie. Si un au moins des échantillons n'est pas normal, il faut utiliser le wilcoxon, sinon c'est student. Problème: que ce soit student ou wilcoxon, les deux échantillons doivent être indépendants!!! Or ce n'est pas le cas ici!!!!!
Même quand je finis par séparer les deux échantillons (c-à-d je me crée l'échantillon de la catégorie au final contre toutes les autres catégories (par ex les CHU opposés à toutes les autres catégories sauf CHU pour pouvoir appliquer wilcoxon ou Student....sauf que je me trompe complètement en faisant celà, car l'objectif est de comparer la moyenne des CHU avec la moyenne nationale (toutes les autres catégories y compris les CHU)!!! (car sur le boxplot, je dois à chaque fois comparer la moyenne nationale "le trait rouge", contre les moyennes de chaque catégorie "le point rouge")
Je me dis alors peut-être que je peux considérer la moyenne nationale comme une valeur fixée, et quand la normalité est bien vérifiée dans l'échantillon national et l'échantillon de catégorie, que je peux dans ce cas utilser student "comparaison d'une moyenne à une valeur fixée" mais je ne sais pas si c'est juste.
Si c'est juste (dans le cas de normalité et donc d'pplication de student)., je me confronte dans le cas contraire où la normalité n'est pas vérifiée (dans ce cas c'est wilcoxon qui doit être appliqué, or wilcoxon suppose que les deux échantillons doivent être tout à fait indéependants et ce n'est pas le cas ici!!!!)
Si il existe des tests de moyenne à appliquer dans ces cas là (quand un échatillon est inclus dans un autre), je ne me poserai plus de question et se sera alors les tests appropriés.
Concernant la façon dont ont procédé les autres personnes qui ont travaillé sur le même sujet avant, , ils ne sont pas du tout rigoureux sur ces tests : par exemple ils ne vérifient pas du tout la normalité, ils appliquent directement student (quand l'ffectif de la catégorie en question est supérieure à 30), et wilcoxon sinon, et ils vont même jusqu'à ignorer certains résultats de leurs tests si le boxplot affiche un paradoxe. (En effet, on crée dabord le boxplot sur lequel on représente la moyenne nationale "en trait rouge" et la moyenne de chaque catégorie "en point rouge" pour avoir une visibilité sur la différence entre la moyenne nationale et la moyenne de chaque catégorie "Cf. l'exemple ci dessous")
Sauriez-vous de quoi il s'agit, et s'il existe des tests plus appropiés à mon cas que le student et le wilcoxon???
En vous remerciant
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: comparaison de moyenne de deux échantillons, cas spécial
Bonjour bonjour,
Essayons d'éclair la situation.
1- Le test de student peut être utilisé pour comparer des échantillons indépendants, mais aussi pour comparer des échantillons appariés : voir ce site STHDA
Bien évidement, il faudrait vérifier la normalité et l'égalité des variances pour être rigoureux. Je reconnais que peu de gens font ces vérifications.
2- Comme le test de student, le test de wilcoxon peut être utilisé pour comparer des groupes indépendants ou des groupes appariés. J'insiste là dessus puisque j'ai noté une petite confusion dans ton discours.
Le test de wilcoxon est un test non-paramétrique, qui ne dépend ni de la moyenne ni de l'écart-type de tes observations. C'est un test basé sur le rang des observations.
La question de la normalité ne se pose plus avec ce test.
3-J'ai l'impression que la définition de la notion "échantillon indépendants" , "échantillon apparié" n'est pas très très clair pour toi.
Ne pas confondre inclusion et dépendance.
Comme son nom l'indique, des échantillons appariés ce sont des échantillons qui marchent par couple. Dans ton exemple ce n'est pas le cas.
Ci-dessous un exemple d'échantillons appariés :
- Soit un échantillon de 10 patients.
- Chacun des patients a été traité par deux médicaments différents à des moments différents: Un médicament A et un médicament B.
- Pour chaque patient 12 h après traitement, la température du corps est enregistrée
Question: Y a t-il une différence entre les 2 médicaments A et B.
Dans ce cas là j'ai bien un test apparié, puisque on a les mêmes individus dans le groupe A et dans le groupe B, sauf qu'ils ont reçu 2 traitements A et B différents à des moments différents.
Dans ton cas c'est simplement un test indépendant et il te faut juste comparer chacun de tes groupes à l'ensemble (la moyenne nationale).
Dans ton cas, je ferais un test de student ou de wilcoxon comparant deux groupes indépendants.
Si tu as un nombre d'échantillon n>=30 (suffisamment grand) dans chacun de tes groupes, tu peux assumer la normalité et faire un test de student.
Sinon applique un test de wilcoxon pour l'ensemble de tes groupes, pour avoir le même test à chaque fois et être homogène dans ton raisonnement statistique.
De toute façon lorsqu'une différence observée est vraiment significative, dans la plus part des cas, elle résiste quelque soit le test statistique utilisé (paramétrique et non paramétrique) .
Je te souhaite bon courage pour ton analyse.
Kass
Essayons d'éclair la situation.
1- Le test de student peut être utilisé pour comparer des échantillons indépendants, mais aussi pour comparer des échantillons appariés : voir ce site STHDA
Bien évidement, il faudrait vérifier la normalité et l'égalité des variances pour être rigoureux. Je reconnais que peu de gens font ces vérifications.
2- Comme le test de student, le test de wilcoxon peut être utilisé pour comparer des groupes indépendants ou des groupes appariés. J'insiste là dessus puisque j'ai noté une petite confusion dans ton discours.
Le test de wilcoxon est un test non-paramétrique, qui ne dépend ni de la moyenne ni de l'écart-type de tes observations. C'est un test basé sur le rang des observations.
La question de la normalité ne se pose plus avec ce test.
3-J'ai l'impression que la définition de la notion "échantillon indépendants" , "échantillon apparié" n'est pas très très clair pour toi.
Ne pas confondre inclusion et dépendance.
Comme son nom l'indique, des échantillons appariés ce sont des échantillons qui marchent par couple. Dans ton exemple ce n'est pas le cas.
Ci-dessous un exemple d'échantillons appariés :
- Soit un échantillon de 10 patients.
- Chacun des patients a été traité par deux médicaments différents à des moments différents: Un médicament A et un médicament B.
- Pour chaque patient 12 h après traitement, la température du corps est enregistrée
Question: Y a t-il une différence entre les 2 médicaments A et B.
Dans ce cas là j'ai bien un test apparié, puisque on a les mêmes individus dans le groupe A et dans le groupe B, sauf qu'ils ont reçu 2 traitements A et B différents à des moments différents.
Dans ton cas c'est simplement un test indépendant et il te faut juste comparer chacun de tes groupes à l'ensemble (la moyenne nationale).
Dans ton cas, je ferais un test de student ou de wilcoxon comparant deux groupes indépendants.
Si tu as un nombre d'échantillon n>=30 (suffisamment grand) dans chacun de tes groupes, tu peux assumer la normalité et faire un test de student.
Sinon applique un test de wilcoxon pour l'ensemble de tes groupes, pour avoir le même test à chaque fois et être homogène dans ton raisonnement statistique.
De toute façon lorsqu'une différence observée est vraiment significative, dans la plus part des cas, elle résiste quelque soit le test statistique utilisé (paramétrique et non paramétrique) .
Je te souhaite bon courage pour ton analyse.
Kass
merci Kass, mais mes échantillons ne sont pas du tout aisni
Bonjour tout le monde,
Bonjour Kass,
je te remercie bien pour toutes les explications aue tu m'as fourni, c'est très utile et très explicite.
Il reste une chose, c'est que mes deux échantillons ne sont ni indépendants, ni appariés.
L'objectif, est de comparer la moyenne nationale (qui comporte toute catégorie confondue des CHU, des CH, des PSPH, des Privés) avec par exemple la catégorie des CHU. Alors, on voit clairement que ce n'est ni indépendants (car les CHU font partie de l'achantillon national), ni appariés.
Je sais que je peux faire un wilcoxon (quand la normalité n'est pas vérifié) pour par exemple opposer les CHU à toutes les autres catégories "sauf les CHU". Mais dans ce cas, ça ne reviens plus à comparer l'échantillon national (toutes catégorie confondue y compris les CHU) avec l'échantillon des CHU (pourtant c'est l'objectif, comparer le national contre chaque catégorie)
donc se sont tout à fait deux échantillons (pas le même type de dépendance comme le cas des échantillons appariés), mais pas indépendants, je peux les appeler plutot, deux échantillons un inclus dans l'autre tout simplement.
Voilà s'il existe d'autres tests que Student ou wilcoxon pour ce genre d'échantillons, je serai partante
Merci infiniment
Bonjour Kass,
je te remercie bien pour toutes les explications aue tu m'as fourni, c'est très utile et très explicite.
Il reste une chose, c'est que mes deux échantillons ne sont ni indépendants, ni appariés.
L'objectif, est de comparer la moyenne nationale (qui comporte toute catégorie confondue des CHU, des CH, des PSPH, des Privés) avec par exemple la catégorie des CHU. Alors, on voit clairement que ce n'est ni indépendants (car les CHU font partie de l'achantillon national), ni appariés.
Je sais que je peux faire un wilcoxon (quand la normalité n'est pas vérifié) pour par exemple opposer les CHU à toutes les autres catégories "sauf les CHU". Mais dans ce cas, ça ne reviens plus à comparer l'échantillon national (toutes catégorie confondue y compris les CHU) avec l'échantillon des CHU (pourtant c'est l'objectif, comparer le national contre chaque catégorie)
donc se sont tout à fait deux échantillons (pas le même type de dépendance comme le cas des échantillons appariés), mais pas indépendants, je peux les appeler plutot, deux échantillons un inclus dans l'autre tout simplement.
Voilà s'il existe d'autres tests que Student ou wilcoxon pour ce genre d'échantillons, je serai partante
Merci infiniment
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: comparaison de moyenne de deux échantillons, cas spécial
Bonjour,
Avez vous finalement trouver votre réponse. Je suis dans le même cas que vous et je sais vraiment pas quoi faire...merci!
angélique
Avez vous finalement trouver votre réponse. Je suis dans le même cas que vous et je sais vraiment pas quoi faire...merci!
angélique
angelique59- Nombre de messages : 1
Date d'inscription : 18/11/2010
Re: comparaison de moyenne de deux échantillons, cas spécial
saluut!
J'ai un échantillon de 15 personnes qui ont été étudiées sur deux phases: avec ou sans un traitement (X).
Chaque individu de cet echatillon a subi 10 séances AVEC traitement et 10 autres séances SANS traitement, pour chaque séances plusieurs paramètres ont été étudiées!
Quel test utiliser pour comparer les paramètres entre les deux phases de l'étude (avec ou sans le traitement X)
J'ai un échantillon de 15 personnes qui ont été étudiées sur deux phases: avec ou sans un traitement (X).
Chaque individu de cet echatillon a subi 10 séances AVEC traitement et 10 autres séances SANS traitement, pour chaque séances plusieurs paramètres ont été étudiées!
Quel test utiliser pour comparer les paramètres entre les deux phases de l'étude (avec ou sans le traitement X)
aminos- Nombre de messages : 3
Date d'inscription : 24/11/2010
Re: comparaison de moyenne de deux échantillons, cas spécial
aminos a écrit:saluut!
J'ai un échantillon de 15 personnes qui ont été étudiées sur deux phases: avec ou sans un traitement (X).
Chaque individu de cet echatillon a subi 10 séances AVEC traitement et 10 autres séances SANS traitement, pour chaque séances plusieurs paramètres ont été étudiées!
Quel test utiliser pour comparer les paramètres entre les deux phases de l'étude (avec ou sans le traitement X)
Dans ton cas c'est bien des données appariées.
Donc pour des variables quantitatives relis le post un peu plus haut.
Pour du qualitatif il me semble qu'il y'a le test de mac nemar.
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: comparaison de moyenne de deux échantillons, cas spécial
Dans mon cas, les paramètres relevés avant et après le traitement sont tous des paramètres numériques. Le test de McNemar ne marche qu'avec des variables nominales ou ordinales.
Si j'utilise un test t pour échantillons appariés je crains que les résultats ne vont pas tenir en compte le nombre de séances réalisées pour la même personne. C'est comme si on comparait 15 séances à 15 séances pour la même variable au lieu de comparer en fait 150 séances avec 150 autres séances!
Si j'utilise un test t pour échantillons appariés je crains que les résultats ne vont pas tenir en compte le nombre de séances réalisées pour la même personne. C'est comme si on comparait 15 séances à 15 séances pour la même variable au lieu de comparer en fait 150 séances avec 150 autres séances!
aminos- Nombre de messages : 3
Date d'inscription : 24/11/2010
Re: comparaison de moyenne de deux échantillons, cas spécial
aminos a écrit:saluut!
J'ai un échantillon de 15 personnes qui ont été étudiées sur deux phases: avec ou sans un traitement (X).
Chaque individu de cet echatillon a subi 10 séances AVEC traitement et 10 autres séances SANS traitement, pour chaque séances plusieurs paramètres ont été étudiées!
Quel test utiliser pour comparer les paramètres entre les deux phases de l'étude (avec ou sans le traitement X)
Il manque des renseignements sur la méthodo. Si la moitié des patients ont eu 10 séances avec PUIS 10 séances sans et que l'autre moitié a bénéficié des séances en sens inverse (sans puis avec) avec attribution aléatoire de l'ordre des séances, c'est un schéma classique d'étude en cross-over.
Un cross-over, ca s'interprète avec une ANOVA en mesures répétées, qui permet d'étudier en 1 seul test l'effet principal, l'effet période et l'effet carryover (interaction)
Si il n'y a pas d'attribution aléatoire de l'ordre des traitements, c'est un gros biais (impossible d'estimer les effets période et carryover). Tu peux toujours faire un ttest apparié, mais il devient très hasardeux de faire un lien direct avec l'effet du traitement.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Sujets similaires
» Comparaison d'échantillons (moyenne)
» Comparaison moyenne à une norme / petits échantillons
» Comparaison de deux échantillons appariés
» comparaison de moyennes de deux échantillons
» Comparaison de deux échantillons liés
» Comparaison moyenne à une norme / petits échantillons
» Comparaison de deux échantillons appariés
» comparaison de moyennes de deux échantillons
» Comparaison de deux échantillons liés
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum