Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Calcul taille échantillons - Incidence
5 participants
Page 1 sur 1
Calcul taille échantillons - Incidence
Bonjour,
Je cherche à calculer la taille d'échantillon requise pour un concevoir une étude clinique non interventionnelle (registre observationnel) dont le but est d'analyser l'incidence d'une pathologie.
D'après la littérature, l'incidence attendue serait de 30%.
Pourriez-vous me rappeler la formule pour calculer la taille d'échantillon ?
Merci pour votre aide,
Abiow
Je cherche à calculer la taille d'échantillon requise pour un concevoir une étude clinique non interventionnelle (registre observationnel) dont le but est d'analyser l'incidence d'une pathologie.
D'après la littérature, l'incidence attendue serait de 30%.
Pourriez-vous me rappeler la formule pour calculer la taille d'échantillon ?
Merci pour votre aide,
Abiow
abiow- Nombre de messages : 15
Date d'inscription : 15/09/2008
Re: Calcul taille échantillons - Incidence
Salut,
La taillle de l'échantillon dépend avant tout des analyses statistiques envisagées et non de la proba d'un évènemement à modéliser.
Je ne maitrise pas trop ces aspects mais sous R voir le package power de Stéphane Champély.
nik
La taillle de l'échantillon dépend avant tout des analyses statistiques envisagées et non de la proba d'un évènemement à modéliser.
Je ne maitrise pas trop ces aspects mais sous R voir le package power de Stéphane Champély.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Calcul taille échantillons - Incidence
Voila, en esperant que ca t'aide :
doc package pwr
cours sur le package pwr
doc package pwr
cours sur le package pwr
vorace54- Nombre de messages : 6
Date d'inscription : 26/11/2010
Re: Calcul taille échantillons - Incidence
N'existe-t-il pas une formule du type : N=t².p(1-p)/m² ?
Savez-vous si je peux l'appliquer dans mon cas ?
Merci,
Abiow
Savez-vous si je peux l'appliquer dans mon cas ?
Merci,
Abiow
abiow- Nombre de messages : 15
Date d'inscription : 15/09/2008
Re: Calcul taille échantillons - Incidence
Bonjour,
On en revient à ce que Nik disait : ça dépend de ce que tu veux faire. "Calculer la taille de l'échantillon" ça ne veut rien dire, il faut calculer la taille de l'échantillon pour avoir telle probabilité d'atteindre tel but.
On en revient à ce que Nik disait : ça dépend de ce que tu veux faire. "Calculer la taille de l'échantillon" ça ne veut rien dire, il faut calculer la taille de l'échantillon pour avoir telle probabilité d'atteindre tel but.
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: Calcul taille échantillons - Incidence
Sans doute me suis-je mal exprimée, je ne suis pas à l'aise dans le domaine...
Je cherche à calculer une taille d'échantillon pour obtenir une incidence de 30%.
Dans ce cas, la formule ci-dessus est-elle appropriée ?
Merci pour votre aide,
Abiow
Je cherche à calculer une taille d'échantillon pour obtenir une incidence de 30%.
Dans ce cas, la formule ci-dessus est-elle appropriée ?
Merci pour votre aide,
Abiow
abiow- Nombre de messages : 15
Date d'inscription : 15/09/2008
Re: Calcul taille échantillons - Incidence
Donc, si j'ai bien compris, tu veux prendre un échantillon de taille N suffisante pour tester que l'incidence est de 30%. Je ne comprends pas trop la formule que tu proposes (que sont t et m ?) mais en tout cas, il est nécessaire de choisir un risque pour ce test. De plus, il est important de connaître la précision qui te guide (31%, est-ce différent de 30%, ou quasiment égal ?). Ensuite, tout dépend si tu te prépares à utiliser de grands échantillons (quelques centaines), ou si tu auras des difficultés à multiplier les observations. dans le premier cas, des formules analogue à celle que tu écris sont possibles.
Enfin, comme il s'agit de données observationnelles, il faut assurer d'éliminer tous les biais observationnels (genre "incidence du cancer" dans la population d'un hôpital général). C'est sans doute la partie la plus délicate (les formules statistiques supposent qu'on a pris un échantillon au hasard dans la population globale).
Cordialement.
Enfin, comme il s'agit de données observationnelles, il faut assurer d'éliminer tous les biais observationnels (genre "incidence du cancer" dans la population d'un hôpital général). C'est sans doute la partie la plus délicate (les formules statistiques supposent qu'on a pris un échantillon au hasard dans la population globale).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul taille échantillons - Incidence
Merci pour ce éclaircissements.
Dans ma formule :
t = niveau de confiance -> 1,96?
m = marge d'erreur -> 5%?
La précision dont tu parles correspondrait à ma marge d'erreur. Par contre, peux-tu me préciser ce que tu entends par "choisir un risque pour ce test" ?
Autrement, oui je me prépare à utiliser qques centaines d'observations.
Dans ma formule :
t = niveau de confiance -> 1,96?
m = marge d'erreur -> 5%?
La précision dont tu parles correspondrait à ma marge d'erreur. Par contre, peux-tu me préciser ce que tu entends par "choisir un risque pour ce test" ?
Autrement, oui je me prépare à utiliser qques centaines d'observations.
abiow- Nombre de messages : 15
Date d'inscription : 15/09/2008
Re: Calcul taille échantillons - Incidence
Je ne connais pas non plus la formule que tu proposes. Pour estimer une taille d'échantillon il faut que tu saches quel test/analyse stat tu va devoir pratiquer sur tes données. Ceci suppose aussi que tu saches quelles variables explicatives tu va rentrer dans test analyses.
A mon avis là il y a une grosse erreur sur la formulation. Si tu fais des stats correctes, ton incidence ne devrait pas changer. L'incidence est un paramètre fixé dans ta population (au moins à instant t) et tu cherches à l'estimer. Donc si tu choisis un échantilon trop petit tu risques fort de mal estimer ton incidence. Du coup si tu répètes ton estimation avec la même taille d'échantillon tu auras de grande chance de trouver une valeur de prévalence très différente.
Donc définir une taille d'échantillon pour obtenir une certaine valeur de paramètre revient à dire que tu cherches à bidouiller tes analyses pour obtenir ce que tu veux. Dans ton cas tu cherches l'échantillon minimum qui te permettra d'évaluer correctement la valeur de ton paramètre, c'est très différent. Donc sans rien connaitre des analyses que tu va faire tu ne pourras rien estimer du tout : ni ta taille d'échantillon et donc ni ton incidence.
nik
Je cherche à calculer une taille d'échantillon pour obtenir une incidence de 30%
A mon avis là il y a une grosse erreur sur la formulation. Si tu fais des stats correctes, ton incidence ne devrait pas changer. L'incidence est un paramètre fixé dans ta population (au moins à instant t) et tu cherches à l'estimer. Donc si tu choisis un échantilon trop petit tu risques fort de mal estimer ton incidence. Du coup si tu répètes ton estimation avec la même taille d'échantillon tu auras de grande chance de trouver une valeur de prévalence très différente.
Donc définir une taille d'échantillon pour obtenir une certaine valeur de paramètre revient à dire que tu cherches à bidouiller tes analyses pour obtenir ce que tu veux. Dans ton cas tu cherches l'échantillon minimum qui te permettra d'évaluer correctement la valeur de ton paramètre, c'est très différent. Donc sans rien connaitre des analyses que tu va faire tu ne pourras rien estimer du tout : ni ta taille d'échantillon et donc ni ton incidence.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Calcul taille échantillons - Incidence
Ok.
Dans un test, on teste une hypothèse, par exemple pour toi "L'incidence est 30%". Suivant l'échantillon, le résultat sera plus ou moins proche de la vraie valeur, et on ne peut pas espérer avoir une certitude (dans l'échantillon, même si c'est improbable, on peut avoir une incidence nulle, ou encore de 100%, si on tombe sur un "échantillon extrême"). Il y a donc toujours un risque de déclarer l'hypothèse fausse alors même qu'elle est vraie. On prend très souvent 5% pour ce risque (ce qui te donne ton "niveau de confiance" 1,96 pour une modélisation gaussienne). A ne pas confondre avec la marge d'erreur qui concerne les valeurs de l'incidence dans l'échantillon : Tu considères comme acceptables pour des vérifications de 30% les valeurs de 25% à 35%. Avec une marge d'erreur de 1%, on n'accepte plus que de 29 à 31 %, mais on n'a pas changé le risque du test.
Donc, pour n grand, on peut utiliser l'approximation Normale, et on obtient la formule que tu évoques : N>=t².p(1-p)/m², ce qui, avec les valeurs que tu as signalées donne au moins 323 individus, et pour une marge d'erreur 1%¨, 8068 individus.
Alors, si ton résultat sur au moins 323 individus est dans la fourchette 25-35%, tu ne pourras pas conclure grand chose, les valeurs de la littérature ne sont pas contredites (mais si tu as trouvé 26%, l'hypothèse que la vraie valeur est 25 % est tout autant confirmée !). Par contre, si tu es en dehors, tu pourras affirmer, avec une chance sur 20 (5%) toutefois de te tromper, que la valeur classique de 30% n'est pas bonne.
Tout ça en admettant que ton échantillon est bien représentatif, c'est à dire l'équivalent d'une prise au hasard parmi toute la population possible (*).
Cordialement.
(*) J'espère que la population totale concernée est de plusieurs dizaines de milliers, sinon l'approximation gaussienne n'a plus lieu d'être.
Dans un test, on teste une hypothèse, par exemple pour toi "L'incidence est 30%". Suivant l'échantillon, le résultat sera plus ou moins proche de la vraie valeur, et on ne peut pas espérer avoir une certitude (dans l'échantillon, même si c'est improbable, on peut avoir une incidence nulle, ou encore de 100%, si on tombe sur un "échantillon extrême"). Il y a donc toujours un risque de déclarer l'hypothèse fausse alors même qu'elle est vraie. On prend très souvent 5% pour ce risque (ce qui te donne ton "niveau de confiance" 1,96 pour une modélisation gaussienne). A ne pas confondre avec la marge d'erreur qui concerne les valeurs de l'incidence dans l'échantillon : Tu considères comme acceptables pour des vérifications de 30% les valeurs de 25% à 35%. Avec une marge d'erreur de 1%, on n'accepte plus que de 29 à 31 %, mais on n'a pas changé le risque du test.
Donc, pour n grand, on peut utiliser l'approximation Normale, et on obtient la formule que tu évoques : N>=t².p(1-p)/m², ce qui, avec les valeurs que tu as signalées donne au moins 323 individus, et pour une marge d'erreur 1%¨, 8068 individus.
Alors, si ton résultat sur au moins 323 individus est dans la fourchette 25-35%, tu ne pourras pas conclure grand chose, les valeurs de la littérature ne sont pas contredites (mais si tu as trouvé 26%, l'hypothèse que la vraie valeur est 25 % est tout autant confirmée !). Par contre, si tu es en dehors, tu pourras affirmer, avec une chance sur 20 (5%) toutefois de te tromper, que la valeur classique de 30% n'est pas bonne.
Tout ça en admettant que ton échantillon est bien représentatif, c'est à dire l'équivalent d'une prise au hasard parmi toute la population possible (*).
Cordialement.
(*) J'espère que la population totale concernée est de plusieurs dizaines de milliers, sinon l'approximation gaussienne n'a plus lieu d'être.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul taille échantillons - Incidence
Pour Nik,
J'ai interprété le message de Abiow comme "je veux vérifier que ,l'incidence est bien environ 30%. On obtient facilement la formule qu'il propose en ajustant l'intervalle de confiance (approximation gaussienne pour l'estimation d'une proportion) à l'intervalle fourchette.
Cette formule est un classique, elle est même probablement dans les normes de statistiques (en France, celles de l'AFNOR).
Cordialement.
J'ai interprété le message de Abiow comme "je veux vérifier que ,l'incidence est bien environ 30%. On obtient facilement la formule qu'il propose en ajustant l'intervalle de confiance (approximation gaussienne pour l'estimation d'une proportion) à l'intervalle fourchette.
Cette formule est un classique, elle est même probablement dans les normes de statistiques (en France, celles de l'AFNOR).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul taille échantillons - Incidence
On obtient facilement la formule qu'il propose en ajustant l'intervalle de confiance (approximation gaussienne pour l'estimation d'une proportion) à l'intervalle fourchette.
Cette formule est un classique, elle est même probablement dans les normes de statistiques (en France, celles de l'AFNOR).
Comme indiqué, je n'y connais pas grand chose en analyse de puissance donc j'ai juste souligné la tournure de phrase qui prête sérieusement à confusion et qui est donc à éviter .
Par contre, les normes AFNOR ce n'est, pour moi, absolument pas un gage de qualité mais simplement un moyen d'uniformisation de procédure ce qui n'est pas totalement la même chose .
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Calcul taille échantillons - Incidence
Nik,
ne vas surtout pas dans l'industrie :
"les normes AFNOR ce n'est, pour moi, absolument pas un gage de qualité"
De quoi te faire licencier immédiatement !
La normalisation est un des instruments de base de la qualité, et en contrôle qualité, les outils statistiques sont ceux qui sont normalisés, sinon on ne peut pas vérifier.
Cordialement.
ne vas surtout pas dans l'industrie :
"les normes AFNOR ce n'est, pour moi, absolument pas un gage de qualité"
De quoi te faire licencier immédiatement !
La normalisation est un des instruments de base de la qualité, et en contrôle qualité, les outils statistiques sont ceux qui sont normalisés, sinon on ne peut pas vérifier.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul taille échantillons - Incidence
gg,
Il s'agirait donc de tester H0: {incidence =30%}. Dans ce cas, j'aimerais comprendre comment on choisit la taille de l'échantillon pour que cette hypothèse soit déclarée "satistiquement vraie" (dans le cas où le test ne rejette pas H0) ?
Pour ma part, je ne sais que (le principe pour) déterminer la taille de l'échantillon pour avoir telle probabilité de rejeter l'hypothèse nulle H0 (la "puissance"), sur base de la valeur attendue du paramètre. Et je ne sais pas comment mettre en évidence la "significativité" de l'hypothèse nulle H0, quelle que soit la taille de l'échantillon.
Il s'agirait donc de tester H0: {incidence =30%}. Dans ce cas, j'aimerais comprendre comment on choisit la taille de l'échantillon pour que cette hypothèse soit déclarée "satistiquement vraie" (dans le cas où le test ne rejette pas H0) ?
Pour ma part, je ne sais que (le principe pour) déterminer la taille de l'échantillon pour avoir telle probabilité de rejeter l'hypothèse nulle H0 (la "puissance"), sur base de la valeur attendue du paramètre. Et je ne sais pas comment mettre en évidence la "significativité" de l'hypothèse nulle H0, quelle que soit la taille de l'échantillon.
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: Calcul taille échantillons - Incidence
Merci pour vos réponses.
gg,
dois-je en conclure que cela revient à comparer la littérature (30%) avec le résultat de mon étude ? Dans ce cas, dois-je poser une hypothèse de supériorité pour le calcul de mon échantillon, de la même manière que dans les études comparatives randomisées ?
Désolée, mais je suis un peu embrouillée encore..
gg,
dois-je en conclure que cela revient à comparer la littérature (30%) avec le résultat de mon étude ? Dans ce cas, dois-je poser une hypothèse de supériorité pour le calcul de mon échantillon, de la même manière que dans les études comparatives randomisées ?
Désolée, mais je suis un peu embrouillée encore..
abiow- Nombre de messages : 15
Date d'inscription : 15/09/2008
Re: Calcul taille échantillons - Incidence
abiow,
Classiquement, voilà ce qu'on fait. On veut "prouver" que l'incidence est, disons, pour exemple, plus petite que 50%. On va donc faire un test de l'hypothèse nulle H0:{incidence > 50%}, et notre espoir est que le résultat de ce test soit le rejet de cette hypothèse. On a une valeur a priori de cette incidence, disons 30%. On détermine alors la taille de l'échantillon nécessaire pour avoir, disons, 90% de probabilité de rejetter H0 si l'incidence est effectivement de 30% (car la probabilité de rejeter H0 dépend de la valeur effective de l'incidence).
Classiquement, voilà ce qu'on fait. On veut "prouver" que l'incidence est, disons, pour exemple, plus petite que 50%. On va donc faire un test de l'hypothèse nulle H0:{incidence > 50%}, et notre espoir est que le résultat de ce test soit le rejet de cette hypothèse. On a une valeur a priori de cette incidence, disons 30%. On détermine alors la taille de l'échantillon nécessaire pour avoir, disons, 90% de probabilité de rejetter H0 si l'incidence est effectivement de 30% (car la probabilité de rejeter H0 dépend de la valeur effective de l'incidence).
popotam- Nombre de messages : 371
Date d'inscription : 27/09/2006
Re: Calcul taille échantillons - Incidence
Pour Popotam :
[edit : Je n'avais pas vu ton message de ce matin vers 10h. Il décrit une autre façon de faire, qui revient à peu près au même si tu remplaces 50% par 35%.]
"comment on choisit la taille de l'échantillon pour que cette hypothèse soit déclarée "statistiquement vraie" (dans le cas où le test ne rejette pas H0) ?" Je ne sais pas. Ah si : Un échantillon de toute la population. C'est le seul moyen d'être sûr.
Dans les tests par échantillonnage, H0 ne peut pas être déclarée "vraie".
La question de Abiow est d'obtenir un intervalle de confiance qui déclare fausse H0 lorsqu'on s'écarte à plus de 5% de 30%. C'est tout. La présentation (malsaine) habituelle de cette demande est "Quelle taille d'échantillon est nécessaire pour tester ?". La vraie question est "Quelle taille d'échantillon est nécessaire pour que la zone d'acceptation de H0 soit dans la fourchette à + ou - 5% ?".
Cordialement.
[edit : Je n'avais pas vu ton message de ce matin vers 10h. Il décrit une autre façon de faire, qui revient à peu près au même si tu remplaces 50% par 35%.]
"comment on choisit la taille de l'échantillon pour que cette hypothèse soit déclarée "statistiquement vraie" (dans le cas où le test ne rejette pas H0) ?" Je ne sais pas. Ah si : Un échantillon de toute la population. C'est le seul moyen d'être sûr.
Dans les tests par échantillonnage, H0 ne peut pas être déclarée "vraie".
La question de Abiow est d'obtenir un intervalle de confiance qui déclare fausse H0 lorsqu'on s'écarte à plus de 5% de 30%. C'est tout. La présentation (malsaine) habituelle de cette demande est "Quelle taille d'échantillon est nécessaire pour tester ?". La vraie question est "Quelle taille d'échantillon est nécessaire pour que la zone d'acceptation de H0 soit dans la fourchette à + ou - 5% ?".
Cordialement.
Dernière édition par gg le Mer 26 Jan 2011 - 15:22, édité 1 fois
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul taille échantillons - Incidence
Pour Abiow :
Je ne comprends pas vraiment ce que tu racontes.
J'étais parti sur l'idée que tu voulais vérifier que l'incidence est bien de 30 %. Mais si tu veux faire autre chose, il serait temps de le dire. la taille de l'échantillon est une question secondaire. la question principale est "que veut-on savoir et comment va-t-on faire pour essayer de l'apprendre ?"
Cordialement.
Je ne comprends pas vraiment ce que tu racontes.
J'étais parti sur l'idée que tu voulais vérifier que l'incidence est bien de 30 %. Mais si tu veux faire autre chose, il serait temps de le dire. la taille de l'échantillon est une question secondaire. la question principale est "que veut-on savoir et comment va-t-on faire pour essayer de l'apprendre ?"
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Comparaison de 2 moyennes : taille échantillons
» Types de données et taille d'échantillons
» Taille échantillon pour égalité 2 échantillons appariés
» Calcul de la taille d'un échantillon
» calcul de taille d'échantillon
» Types de données et taille d'échantillons
» Taille échantillon pour égalité 2 échantillons appariés
» Calcul de la taille d'un échantillon
» calcul de taille d'échantillon
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum