Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Chi2 tenant compte de l'effectif de l'echantillon
3 participants
Page 1 sur 1
Chi2 tenant compte de l'effectif de l'echantillon
Bonjour,
Arrêtez-moi si je me trompe mais lorsque l'on fait un test du chi2 sur un tableau de contingence, cela ne tient pas compte du fait que l'échantillon ne représente pas l'ensemble de la population (et qu'il y a donc une variance supplémentaire qui peut faire apparaitre des différences sans que celles-ci soient significatives).
Existe-t-il une méthode ou un test particulier qui tiendrait compte de cet aspect là (i.e des marges d'erreurs liées au sous-échantillonnage de la population)?
Ma question est sans doute un peu bateau, je débute, donc tous les commentaires sont les bienvenues!
Merci pour votre aide,
Barthélémy
Arrêtez-moi si je me trompe mais lorsque l'on fait un test du chi2 sur un tableau de contingence, cela ne tient pas compte du fait que l'échantillon ne représente pas l'ensemble de la population (et qu'il y a donc une variance supplémentaire qui peut faire apparaitre des différences sans que celles-ci soient significatives).
Existe-t-il une méthode ou un test particulier qui tiendrait compte de cet aspect là (i.e des marges d'erreurs liées au sous-échantillonnage de la population)?
Ma question est sans doute un peu bateau, je débute, donc tous les commentaires sont les bienvenues!
Merci pour votre aide,
Barthélémy
Barthos- Nombre de messages : 5
Date d'inscription : 21/09/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
Barthos a écrit:Bonjour,
Arrêtez-moi si je me trompe mais lorsque l'on fait un test du chi2 sur un tableau de contingence, cela ne tient pas compte du fait que l'échantillon ne représente pas l'ensemble de la population
tu te trompes.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Chi2 tenant compte de l'effectif de l'echantillon
Tant mieux !
Mais dans ce cas, j'aimerais comprendre comment. En particulier, vu que je ne fournie nulle part l'effectif de la population, comment le test sait-il que par exemple j'ai 74 réponses sur 100 personnes (fiabilité forte) ou au contraire 74 sur un million (fiabilité faible). Est-ce que la distribution du Xi2 est un passage à la limite dans le cas ou la population est infiniment plus grande que l'échantillon (ce qui m'arrangerai car je suis dans ce cas) ?
Mais dans ce cas, j'aimerais comprendre comment. En particulier, vu que je ne fournie nulle part l'effectif de la population, comment le test sait-il que par exemple j'ai 74 réponses sur 100 personnes (fiabilité forte) ou au contraire 74 sur un million (fiabilité faible). Est-ce que la distribution du Xi2 est un passage à la limite dans le cas ou la population est infiniment plus grande que l'échantillon (ce qui m'arrangerai car je suis dans ce cas) ?
Barthos- Nombre de messages : 5
Date d'inscription : 21/09/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
Bonsoir.
Attention, le test du Khi-deux ne concerne que ton échantillon. Il ne dit rien sur les individus qui ne sont pas utilisés.
Je crois que tu ferais bien de dire ce que tu fais exactement.
Cordialement.
Attention, le test du Khi-deux ne concerne que ton échantillon. Il ne dit rien sur les individus qui ne sont pas utilisés.
Je crois que tu ferais bien de dire ce que tu fais exactement.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
C'est pas le nombre de personnes qui détermine directement la "fiabilité" de ton échantillon. C'est la méthode d'échantillonnage. Imagine par exemple que sur tes 74/100 tu ne sélectionnes que des femmes. Ton résultat sera complètement biaisé.
Ca peut arriver. Par exemple, si tu travailles sur une maladie qui touche très majoritairement les femmes et que pour des raisons pratiques tu sélectionnes tes patientes dans une maternité, tu n'auras que des femmes et pas un seul homme dans ton échantillon et donc un biais de sélection énorme. Cette situation peut se produire assez souvent en pratique, de facon moins caricaturale et beaucoup plus insidieuse. Ca fait partie des compétences des méthodologistes de savoir les détecter et les éviter.
C'est donc un problème différent du test statistique proprement dit, dont le calcul "intègre" de toutes façons le fait que tu ne t'intéresses qu'à un échantillon (si tu travailles sur la population totale, tu n'as pas besoin de faire de test !)
Ca peut arriver. Par exemple, si tu travailles sur une maladie qui touche très majoritairement les femmes et que pour des raisons pratiques tu sélectionnes tes patientes dans une maternité, tu n'auras que des femmes et pas un seul homme dans ton échantillon et donc un biais de sélection énorme. Cette situation peut se produire assez souvent en pratique, de facon moins caricaturale et beaucoup plus insidieuse. Ca fait partie des compétences des méthodologistes de savoir les détecter et les éviter.
C'est donc un problème différent du test statistique proprement dit, dont le calcul "intègre" de toutes façons le fait que tu ne t'intéresses qu'à un échantillon (si tu travailles sur la population totale, tu n'as pas besoin de faire de test !)
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Chi2 tenant compte de l'effectif de l'echantillon
Attention, C@ssoulet,
ici, il ne s'agit pas d'un test par échantillonnage, car justement, rien ne mesure la taille de l'échantillon. On peut cependant l'utiliser car c'est une version "asymptotique" d'un test exact (test multinomial).
Par contre, je suis un peu en interrogation sur ce qu'a vraiment fait Barthos :
En effet, l'usage d'un test du Khi-deux ne repose pas sur la taille de l'échantillon, mais sur le nombre de cas pour les deux critères et sur des effectifs de classes minimaux.
Barthos, "si tu nous écoutes", viens préciser ta situation. D'ailleurs faire un choix d'échantillon représentatif de 74 individus sur 100 est assez délicat généralement. Sur 1 million, souvent moins.
Cordialement.
ici, il ne s'agit pas d'un test par échantillonnage, car justement, rien ne mesure la taille de l'échantillon. On peut cependant l'utiliser car c'est une version "asymptotique" d'un test exact (test multinomial).
Par contre, je suis un peu en interrogation sur ce qu'a vraiment fait Barthos :
, comment le test sait-il que par exemple j'ai 74 réponses sur 100 personnes (fiabilité forte) ou au contraire 74 sur un million (fiabilité faible).
En effet, l'usage d'un test du Khi-deux ne repose pas sur la taille de l'échantillon, mais sur le nombre de cas pour les deux critères et sur des effectifs de classes minimaux.
Barthos, "si tu nous écoutes", viens préciser ta situation. D'ailleurs faire un choix d'échantillon représentatif de 74 individus sur 100 est assez délicat généralement. Sur 1 million, souvent moins.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
J'ai l'impression ses questions sont plus basiques:
- "es-ce qu'on peut étendre les conclusions d'un test sur un échantillon à une population entière ?". Si l'échantillon est bien choisi, oui.
- "es-ce qu'on tient compte de l'effectif dans le test du chi2 ?" oui.
- " es ce qu'il y a un risque que l'intensité de l'effet observé dans mon échantillon soit différent de la "vraie" intensité mesurée sur la population entière?" oui. Il est même de 99.99999%: sauf hasard extraordinaire, la "vraie" intensité ne sera jamais exactement égale à l'intensité mesurée sur un échantillon. Mais si le plan d'expériences est bien construit, la valeur estimée sur l'échantillon devrait être du même ordre de grandeur que la "vraie". C'est pour ca que les résultats sont souvent accompagnés de leur intervalle de confiance.
- "es-ce qu'on peut étendre les conclusions d'un test sur un échantillon à une population entière ?". Si l'échantillon est bien choisi, oui.
- "es-ce qu'on tient compte de l'effectif dans le test du chi2 ?" oui.
- " es ce qu'il y a un risque que l'intensité de l'effet observé dans mon échantillon soit différent de la "vraie" intensité mesurée sur la population entière?" oui. Il est même de 99.99999%: sauf hasard extraordinaire, la "vraie" intensité ne sera jamais exactement égale à l'intensité mesurée sur un échantillon. Mais si le plan d'expériences est bien construit, la valeur estimée sur l'échantillon devrait être du même ordre de grandeur que la "vraie". C'est pour ca que les résultats sont souvent accompagnés de leur intervalle de confiance.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Chi2 tenant compte de l'effectif de l'echantillon
Je vous écoute même avec attention!!
Alors pour préciser un peu la situation, j'ai fait une enquête sur les docteurs (au sens de titulaires d'un doctorant) et j'étudie ici le lien qu'il peut y avoir entre travailler dans le secteur public ou le secteur privé en fonction de la "séniorité" du docteur (4 classes différentes définies en fonction de l'antériorité de la soutenance de thèse).
En faisant mon tableau de contingence, j'observe que les docteurs les plus "seniors" ont plus tendance à travailler dans le privé que dans le public, ce qui est l'inverse des autres niveaux de séniorité. Donc c'est intéressant!
Cependant, mon effectif de docteurs "seniors" (de l'ordre de la centaine) est plus faible que mes effectifs dans les autres catégories (plutôt 300). Donc je m'interrogeais sur le fait que la répartition observée chez les docteurs seniors ne soit pas lié au hasard et au fait qu'on a moins d'effectifs que dans les autres catégories. D'où ma question sur la prise en compte des effectifs dans le chi2. En gros, si mon Chi2 est significatif, est-ce que je peux en déduire qu'il y a bien un effet significatif de la séniorité sur le fait de travailler dans le public ou dans le privé malgré la faiblesse relative de mon échantillon "senior". Après, il se peut effectivement que cela soit dû à un biais dans la population interrogée mais ce n'est pas ma question.
Merci en tout cas pour vos réponses!
Barthélémy
Alors pour préciser un peu la situation, j'ai fait une enquête sur les docteurs (au sens de titulaires d'un doctorant) et j'étudie ici le lien qu'il peut y avoir entre travailler dans le secteur public ou le secteur privé en fonction de la "séniorité" du docteur (4 classes différentes définies en fonction de l'antériorité de la soutenance de thèse).
En faisant mon tableau de contingence, j'observe que les docteurs les plus "seniors" ont plus tendance à travailler dans le privé que dans le public, ce qui est l'inverse des autres niveaux de séniorité. Donc c'est intéressant!
Cependant, mon effectif de docteurs "seniors" (de l'ordre de la centaine) est plus faible que mes effectifs dans les autres catégories (plutôt 300). Donc je m'interrogeais sur le fait que la répartition observée chez les docteurs seniors ne soit pas lié au hasard et au fait qu'on a moins d'effectifs que dans les autres catégories. D'où ma question sur la prise en compte des effectifs dans le chi2. En gros, si mon Chi2 est significatif, est-ce que je peux en déduire qu'il y a bien un effet significatif de la séniorité sur le fait de travailler dans le public ou dans le privé malgré la faiblesse relative de mon échantillon "senior". Après, il se peut effectivement que cela soit dû à un biais dans la population interrogée mais ce n'est pas ma question.
Merci en tout cas pour vos réponses!
Barthélémy
Barthos- Nombre de messages : 5
Date d'inscription : 21/09/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
gg a écrit:c'est une version "asymptotique" d'un test exact (test multinomial).
Est-ce que cela signifie que c'est un test qui fonctionne quand la population totale est bien plus grande que la population observée?
Merci,
Barthélémy
Barthos- Nombre de messages : 5
Date d'inscription : 21/09/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
Bonjour Barthos.
Cordialement.
NB : Un sondage "au hasard" avec 100 cas est aussi juste si la population est de 1000 000 que si elle est de 500. C'est seulement le "au hasard" qui est souvent très délicat lorsqu'il y a un million de personnes.
Tu viens toi-même de donner la réponse à ta première phrase dans la deuxième. Bien évidemment, si ton échantillon est "représentatif" (choisi au hasard dans l'ensemble de la population concernée), ton résultat est significatif. Surtout avec des effectifs de cet ordre (des centaines). Maintenant, c'est à toi de voir si ton échantillon est biaisé ou non.En gros, si mon Chi2 est significatif, est-ce que je peux en déduire qu'il y a bien un effet significatif de la séniorité sur le fait de travailler dans le public ou dans le privé malgré la faiblesse relative de mon échantillon "senior". Après, il se peut effectivement que cela soit dû à un biais dans la population interrogée mais ce n'est pas ma question.
Non, c'est seulement un résultat (approximation) qui devient parfaitement juste quand la taille des classes tend vers l'infini. Mais dans la pratique, les statisticiens considèrent que le test est sain pour des tailles de classes (modèle) de 5 ou plus (ce qui fait faible, pour l'infini !). Alors toi avec tes centaines d'individus ...Est-ce que cela signifie que c'est un test qui fonctionne quand la population totale est bien plus grande que la population observée?
Cordialement.
NB : Un sondage "au hasard" avec 100 cas est aussi juste si la population est de 1000 000 que si elle est de 500. C'est seulement le "au hasard" qui est souvent très délicat lorsqu'il y a un million de personnes.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Chi2 tenant compte de l'effectif de l'echantillon
Merci beaucoup pour ces éclaircissements!
Barthélémy
Barthélémy
Barthos- Nombre de messages : 5
Date d'inscription : 21/09/2011
Sujets similaires
» questions sur le chi2
» plus loin que le chi2
» Interprétation du chi2
» Question sur le Chi2
» Test du Chi2
» plus loin que le chi2
» Interprétation du chi2
» Question sur le Chi2
» Test du Chi2
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum