Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Quelle méthode pour intervalle de confiance?
3 participants
Page 1 sur 1
Quelle méthode pour intervalle de confiance?
Bonjour,
Je suis nouveau sur le forum et je désire savoir s’il est possible de calculer un intervalle de confiance dans les conditions suivantes :
Il s’agit d’estimer la qualité d’un critère (bien/moyen/pas bien)
Population > 20'000 individus
Échantillon : N = 100
Résultat:
Bien (=100) 95 individus
Moyen (=75) 3 individus
Pas bien (=0) 2 individus
Moyenne = 97.25
Je désire savoir s’il est possible de calculer un intervalle de confiance autour de cette moyenne. En effet la variable est discontinue, mais il y a 3 choix possibles (et non pas 2). De ce fait je bloque un peu sur le choix de la méthode…
Merci d’avance si vous pouvez m’aider
Je suis nouveau sur le forum et je désire savoir s’il est possible de calculer un intervalle de confiance dans les conditions suivantes :
Il s’agit d’estimer la qualité d’un critère (bien/moyen/pas bien)
Population > 20'000 individus
Échantillon : N = 100
Résultat:
Bien (=100) 95 individus
Moyen (=75) 3 individus
Pas bien (=0) 2 individus
Moyenne = 97.25
Je désire savoir s’il est possible de calculer un intervalle de confiance autour de cette moyenne. En effet la variable est discontinue, mais il y a 3 choix possibles (et non pas 2). De ce fait je bloque un peu sur le choix de la méthode…
Merci d’avance si vous pouvez m’aider
Desmond81- Nombre de messages : 4
Date d'inscription : 27/09/2016
Re: Quelle méthode pour intervalle de confiance?
Bonjour,
En faisant ce calcul de moyenne, tu as complètement déterminé le calcul de l'intervalle de confiance de ton score moyen. Donc si c'est l'intervalle de cette moyenne que cherches tu n'as plus trop de question à te poser (un coup de google te donnera la formule adéquate si tu ne la connais pas par cœur).
Par contre, soit conscient que tu es seul juge de l'interprétabilité d'une telle moyenne et donc de son IC.....
Nik
En faisant ce calcul de moyenne, tu as complètement déterminé le calcul de l'intervalle de confiance de ton score moyen. Donc si c'est l'intervalle de cette moyenne que cherches tu n'as plus trop de question à te poser (un coup de google te donnera la formule adéquate si tu ne la connais pas par cœur).
Par contre, soit conscient que tu es seul juge de l'interprétabilité d'une telle moyenne et donc de son IC.....
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Quelle méthode pour intervalle de confiance?
Pas très sûr de bien comprendre la réponse de Nik.
La moyenne est connue, donc. Elle vaut 97.25. elle correspond à la somme des valeurs divisée par leur nombre. Ok.
L'étape suivante est de calculer l'erreur standard (SE), c'est la racine carrée de la variance divisée par la racine carrée du nombre de valeurs. Sur ce point, Nik à raison. La formule est disponible partout, excel (par exemple) sait la calculer, etc.
C'est sur la suite que j'ai beaucoup plus de problème. Pour calculer un intervalle de confiance autour de la moyenne, il faut connaitre la distribution de la variable mesurée. Si cette distribution était Normale (i.e., Gaussienne), l'intervalle de confiance recherchée, à 5%, serait +- 1.96xSE (à peu près). Oui, mais la distribution n'est ici pas Normale (loin s'en faut). Donc un intervalle de confiance calculé ainsi serait totalement faux.
Que faire alors ? La réponse n'est pas simple. Personnellement, dans ce genre de cas, je préfère calculer cet intervalle par bootstrap, mais c'est assez technique.
Un autre point de difficulté ici est que l'attribution des valeurs 100, 75 et 0, aux catégories "bien", "moyen" et "pas bien" semble assez arbitraire, et d'autres valeurs donneraient d'autres résultats évidement.
Donc pas simple. La vraie question ici, je pense, est pourquoi vouloir utiliser des paramètres quantitatifs (moyenne, intervalle de confiance) pour décrire une variable essentiellement qualitative. A quoi servira cet intervalle de confiance rechercher ?
HTH, Eric.
La moyenne est connue, donc. Elle vaut 97.25. elle correspond à la somme des valeurs divisée par leur nombre. Ok.
L'étape suivante est de calculer l'erreur standard (SE), c'est la racine carrée de la variance divisée par la racine carrée du nombre de valeurs. Sur ce point, Nik à raison. La formule est disponible partout, excel (par exemple) sait la calculer, etc.
C'est sur la suite que j'ai beaucoup plus de problème. Pour calculer un intervalle de confiance autour de la moyenne, il faut connaitre la distribution de la variable mesurée. Si cette distribution était Normale (i.e., Gaussienne), l'intervalle de confiance recherchée, à 5%, serait +- 1.96xSE (à peu près). Oui, mais la distribution n'est ici pas Normale (loin s'en faut). Donc un intervalle de confiance calculé ainsi serait totalement faux.
Que faire alors ? La réponse n'est pas simple. Personnellement, dans ce genre de cas, je préfère calculer cet intervalle par bootstrap, mais c'est assez technique.
Un autre point de difficulté ici est que l'attribution des valeurs 100, 75 et 0, aux catégories "bien", "moyen" et "pas bien" semble assez arbitraire, et d'autres valeurs donneraient d'autres résultats évidement.
Donc pas simple. La vraie question ici, je pense, est pourquoi vouloir utiliser des paramètres quantitatifs (moyenne, intervalle de confiance) pour décrire une variable essentiellement qualitative. A quoi servira cet intervalle de confiance rechercher ?
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Quelle méthode pour intervalle de confiance?
Je ne suis pas rentré dans les détails mais avec un tel parti pris de donner des valeurs arbitraire aux mots, il ne sert à rien de se poser des questions sur la distribution de la variable. Autant se dire qu'elle est normale que ce soit réellement ou asymptotiquement car on ne pourra jamais déterminer une distribution. On en est plus à ça près...
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Quelle méthode pour intervalle de confiance?
En fait, si, la distribution est connue. Elle est multinomiale. On peut jouer sur sa convergence asymptotique vers une normale, mais on s'écarte effectivement du problème ici. Et, effectivement l'attribution arbitraire de valeurs aux modalités semble un sérieux problème ici, comme je l'ai souligné dans mon post.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Quelle méthode pour intervalle de confiance?
Merci pour vos réponses.
Effectivement lorsque l'on m'a demandé de chercher cet intervalle, j'ai également pensé que cette notation (0/75/100) était arbitraire. Je vais tenter plutôt de considérer les variables comme qualitatives (fréquences: bien: 0.95, moyen: 0.03, pas bien; 0.02). Mais là aussi j'ai une question: puis-je calculer directement l'IC prenant en compte les 3 fréquences? (Je ne connais que le moyen de le calculer pour 2 fréquences... ex: Bien:0.95 pas bien 0.05). J'espère que je suis assez clair dans ma question. En tout cas merci encore pour votre temps!
Effectivement lorsque l'on m'a demandé de chercher cet intervalle, j'ai également pensé que cette notation (0/75/100) était arbitraire. Je vais tenter plutôt de considérer les variables comme qualitatives (fréquences: bien: 0.95, moyen: 0.03, pas bien; 0.02). Mais là aussi j'ai une question: puis-je calculer directement l'IC prenant en compte les 3 fréquences? (Je ne connais que le moyen de le calculer pour 2 fréquences... ex: Bien:0.95 pas bien 0.05). J'espère que je suis assez clair dans ma question. En tout cas merci encore pour votre temps!
Desmond81- Nombre de messages : 4
Date d'inscription : 27/09/2016
Re: Quelle méthode pour intervalle de confiance?
L'intervalle de confiance de quoi ? Vous le dites pas dans votre post, or c'est bien là le coeur du problème discuté ici. Chaque modalité peut-être considérée en tant que telle contre les deux autres et peut alors être prise comme issue d'une loi binomiale, et l'intervalle de confiance de la fréquence de chaque classe devient facile à calculer. Mais je ne suis pas sûr que c'est là l'objet de votre question.Desmond81 a écrit:puis-je calculer directement l'IC prenant en compte les 3 fréquences?
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Quelle méthode pour intervalle de confiance?
je parlais de la distribution du score. Effectivement, initialement la variable est multinomiale.Eric Wajnberg a écrit:En fait, si, la distribution est connue. Elle est multinomiale
@Desmond
Si tu veux qu'on aille plus loin, il faut reposer à plat la question intiale et sans doute oublier ce score. Peut être même que la notion d'intervalle de confiance n' alors plus aucun intérêt. Mais tout cela dépend de la question posées aux données.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Quelle méthode pour intervalle de confiance?
e vais tenter avec un exemple concret:
Au départ j’ai 12 machines fabriquant 5000 pièces en bois par semaine et je veux comparer l’efficacité de ces machines. Sur chacune de ces machines 100 mesures ont été effectuées aléatoirement (100 pièces tirées au sort) auxquelles on attribue une évaluation « Bien », « moyen », « pas bien ».
Pour la 1ère machine on a obtenu :
Bien : 95
Moyen : 3
Pas bien : 2
Je peux calculer l’IC pour chacune des modalités sur la base des fréquences suivantes.:
Fréquence « bien » : 0.95
Fréquence « reste » : 0.05
Fréquence « moyen » : 0.03
Fréquence « reste » : 0.97
Fréquence « pas bien » : 0.02
Fréquence « reste » : 0.98
J’ai ainsi 3 intervalles de confiance différents. Cependant je voulais savoir s’il est possible d’avoir un intervalle de confiance prenant en compte les 3 modalités (à la fois)
Merci d'avance
Au départ j’ai 12 machines fabriquant 5000 pièces en bois par semaine et je veux comparer l’efficacité de ces machines. Sur chacune de ces machines 100 mesures ont été effectuées aléatoirement (100 pièces tirées au sort) auxquelles on attribue une évaluation « Bien », « moyen », « pas bien ».
Pour la 1ère machine on a obtenu :
Bien : 95
Moyen : 3
Pas bien : 2
Je peux calculer l’IC pour chacune des modalités sur la base des fréquences suivantes.:
Fréquence « bien » : 0.95
Fréquence « reste » : 0.05
Fréquence « moyen » : 0.03
Fréquence « reste » : 0.97
Fréquence « pas bien » : 0.02
Fréquence « reste » : 0.98
J’ai ainsi 3 intervalles de confiance différents. Cependant je voulais savoir s’il est possible d’avoir un intervalle de confiance prenant en compte les 3 modalités (à la fois)
Merci d'avance
Desmond81- Nombre de messages : 4
Date d'inscription : 27/09/2016
Re: Quelle méthode pour intervalle de confiance?
On avance. Deux points donc :
1) Calculer un intervalle de confiance sur un pourcentage. Si n tirages sont effectués, et si on a la fréquence p. L'intervalle de confiance de p à 5% est p ± 1.96*sqrt(p*(1-p)/n) (pour n suffisamment grand, en pratique n>30). Ainsi, donc votre exemple, l'intervalle de la fréquence de "bien" est 0.95 ± 1.96*sqrt(0.95*(1-0.95)/100), soit 0.95 ± 0.95*sqrt(0.95*0.05/100), soit 0.95 ± 0.043, soit à peu près [0.90; 0.99].
2) Vous dites que votre but est de comparer l'efficacité des 12 machines, pas de calculer des intervalles de confiance, et on revient précisément sur ma question initiale. Pour comparer l'efficacité des 12 machines, pas besoin d'intervalles de confiance, et pas besoin non plus d'attribuer des valeurs arbitraires aux trois catégories "bien", "moyen" et "pas bien". Il y a plusieurs solutions possibles. La plus simple est de construire la table de contingence à 12 lignes et trois colonnes et de la soumettre à un Chi2. Vous aurez directement la réponse à votre question.
HTH, Eric.
1) Calculer un intervalle de confiance sur un pourcentage. Si n tirages sont effectués, et si on a la fréquence p. L'intervalle de confiance de p à 5% est p ± 1.96*sqrt(p*(1-p)/n) (pour n suffisamment grand, en pratique n>30). Ainsi, donc votre exemple, l'intervalle de la fréquence de "bien" est 0.95 ± 1.96*sqrt(0.95*(1-0.95)/100), soit 0.95 ± 0.95*sqrt(0.95*0.05/100), soit 0.95 ± 0.043, soit à peu près [0.90; 0.99].
2) Vous dites que votre but est de comparer l'efficacité des 12 machines, pas de calculer des intervalles de confiance, et on revient précisément sur ma question initiale. Pour comparer l'efficacité des 12 machines, pas besoin d'intervalles de confiance, et pas besoin non plus d'attribuer des valeurs arbitraires aux trois catégories "bien", "moyen" et "pas bien". Il y a plusieurs solutions possibles. La plus simple est de construire la table de contingence à 12 lignes et trois colonnes et de la soumettre à un Chi2. Vous aurez directement la réponse à votre question.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Quelle méthode pour intervalle de confiance?
Merci beaucoup pour ces explications! Bonne soirée!
Desmond81- Nombre de messages : 4
Date d'inscription : 27/09/2016
Sujets similaires
» Quelle méthode pour prévoir un événement cyclique ?
» Quelle méthode pour estimer une série temporelle?
» quelle méthode pour réduire une batterie de variable dicho ?
» Quelle méthode à utiliser
» Quelle méthode utiliser?
» Quelle méthode pour estimer une série temporelle?
» quelle méthode pour réduire une batterie de variable dicho ?
» Quelle méthode à utiliser
» Quelle méthode utiliser?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum