Les posteurs les plus actifs de la semaine
Kaidozaki
 


Quelle méthode pour intervalle de confiance?

Voir le sujet précédent Voir le sujet suivant Aller en bas

Quelle méthode pour intervalle de confiance?

Message par Desmond81 le Mar 27 Sep - 13:14

Bonjour,

Je suis nouveau sur le forum et je désire savoir s’il est possible de calculer un intervalle de confiance dans les conditions suivantes :

Il s’agit d’estimer la qualité d’un critère (bien/moyen/pas bien)

Population > 20'000 individus
Échantillon : N = 100

Résultat:

Bien (=100)          95 individus

Moyen (=75)         3 individus

Pas bien (=0)        2 individus


Moyenne = 97.25

Je désire savoir s’il est possible de calculer un intervalle de confiance autour de cette moyenne. En effet la variable est discontinue, mais il y a 3 choix possibles (et non pas 2). De ce fait je bloque un peu sur le choix de la méthode…

Merci d’avance si vous pouvez m’aider

Desmond81

Nombre de messages : 4
Date d'inscription : 27/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Nik le Mar 27 Sep - 14:09

Bonjour,

En faisant ce calcul de moyenne, tu as complètement déterminé le calcul de l'intervalle de confiance de ton score moyen. Donc si c'est l'intervalle de cette moyenne que cherches tu n'as plus trop de question à te poser (un coup de google te donnera la formule adéquate si tu ne la connais pas par cœur).
Par contre, soit conscient que tu es seul juge de l'interprétabilité d'une telle moyenne et donc de son IC.....

Nik

Nik

Nombre de messages : 1500
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Eric Wajnberg le Mar 27 Sep - 21:12

Pas très sûr de bien comprendre la réponse de Nik.

La moyenne est connue, donc. Elle vaut 97.25. elle correspond à la somme des valeurs divisée par leur nombre. Ok.

L'étape suivante est de calculer l'erreur standard (SE), c'est la racine carrée de la variance divisée par la racine carrée du nombre de valeurs. Sur ce point, Nik à raison. La formule est disponible partout, excel (par exemple) sait la calculer, etc.

C'est sur la suite que j'ai beaucoup plus de problème. Pour calculer un intervalle de confiance autour de la moyenne, il faut connaitre la distribution de la variable mesurée. Si cette distribution était Normale (i.e., Gaussienne), l'intervalle de confiance recherchée, à 5%, serait +- 1.96xSE (à peu près). Oui, mais la distribution n'est ici pas Normale (loin s'en faut). Donc un intervalle de confiance calculé ainsi serait totalement faux.

Que faire alors ? La réponse n'est pas simple. Personnellement, dans ce genre de cas, je préfère calculer cet intervalle par bootstrap, mais c'est assez technique.

Un autre point de difficulté ici est que l'attribution des valeurs 100, 75 et 0, aux catégories "bien", "moyen" et "pas bien" semble assez arbitraire, et d'autres valeurs donneraient d'autres résultats évidement.

Donc pas simple. La vraie question ici, je pense, est pourquoi vouloir utiliser des paramètres quantitatifs (moyenne, intervalle de confiance) pour décrire une variable essentiellement qualitative. A quoi servira cet intervalle de confiance rechercher ?

HTH, Eric.

Eric Wajnberg

Nombre de messages : 306
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Nik le Mer 28 Sep - 12:18

Je ne suis pas rentré dans les détails mais avec un tel parti pris de donner des valeurs arbitraire aux mots, il ne sert à rien de se poser des questions sur la distribution de la variable. Autant se dire qu'elle est normale que ce soit réellement ou asymptotiquement car on ne pourra jamais déterminer une distribution. On en est plus à ça près...


Nik

Nombre de messages : 1500
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Eric Wajnberg le Mer 28 Sep - 14:15

En fait, si, la distribution est connue. Elle est multinomiale. On peut jouer sur sa convergence asymptotique vers une normale, mais on s'écarte effectivement du problème ici. Et, effectivement l'attribution arbitraire de valeurs aux modalités semble un sérieux problème ici, comme je l'ai souligné dans mon post.

Eric.

Eric Wajnberg

Nombre de messages : 306
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Desmond81 le Mer 28 Sep - 19:36

Merci pour vos réponses.

Effectivement lorsque l'on m'a demandé de chercher cet intervalle, j'ai également pensé que cette notation (0/75/100) était arbitraire. Je vais tenter plutôt de considérer les variables comme qualitatives (fréquences: bien: 0.95, moyen: 0.03, pas bien; 0.02). Mais là aussi j'ai une question: puis-je calculer directement l'IC prenant en compte les 3 fréquences? (Je ne connais que le moyen de le calculer pour 2 fréquences... ex: Bien:0.95 pas bien 0.05). J'espère que je suis assez clair dans ma question. En tout cas merci encore pour votre temps!

Desmond81

Nombre de messages : 4
Date d'inscription : 27/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Eric Wajnberg le Mer 28 Sep - 20:22

Desmond81 a écrit:puis-je calculer directement l'IC prenant en compte les 3 fréquences?
L'intervalle de confiance de quoi ? Vous le dites pas dans votre post, or c'est bien là le coeur du problème discuté ici. Chaque modalité peut-être considérée en tant que telle contre les deux autres et peut alors être prise comme issue d'une loi binomiale, et l'intervalle de confiance de la fréquence de chaque classe devient facile à calculer. Mais je ne suis pas sûr que c'est là l'objet de votre question.

Eric.

Eric Wajnberg

Nombre de messages : 306
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Nik le Jeu 29 Sep - 6:51

Eric Wajnberg a écrit:En fait, si, la distribution est connue. Elle est multinomiale
je parlais de la distribution du score. Effectivement, initialement la variable est multinomiale.


@Desmond
Si tu veux qu'on aille plus loin, il faut reposer à plat la question intiale et sans doute oublier ce score. Peut être même que la notion d'intervalle de confiance n' alors plus aucun intérêt. Mais tout cela dépend de la question posées aux données.

Nik

Nik

Nombre de messages : 1500
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Desmond81 le Jeu 29 Sep - 19:51

e vais tenter avec un exemple concret:

Au départ j’ai 12 machines fabriquant 5000 pièces en bois par semaine et je veux comparer l’efficacité de ces machines. Sur chacune de ces machines 100 mesures ont été effectuées aléatoirement (100 pièces tirées au sort) auxquelles on attribue une évaluation « Bien », « moyen », « pas bien ».

Pour la 1ère machine on a obtenu :

Bien : 95
Moyen : 3
Pas bien : 2

Je peux calculer l’IC pour chacune des modalités sur la base des fréquences suivantes.:


Fréquence « bien » : 0.95
Fréquence « reste » : 0.05

Fréquence « moyen » : 0.03
Fréquence « reste » : 0.97

Fréquence « pas bien » : 0.02
Fréquence « reste » : 0.98


J’ai ainsi 3 intervalles de confiance différents. Cependant je voulais savoir s’il est possible d’avoir un intervalle de confiance prenant en compte les 3 modalités (à la fois)

Merci d'avance

Desmond81

Nombre de messages : 4
Date d'inscription : 27/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Eric Wajnberg le Jeu 29 Sep - 21:13

On avance. Deux points donc :

1) Calculer un intervalle de confiance sur un pourcentage. Si n tirages sont effectués, et si on a la fréquence p. L'intervalle de confiance de p à 5%  est p ± 1.96*sqrt(p*(1-p)/n) (pour n suffisamment grand, en pratique n>30). Ainsi, donc votre exemple, l'intervalle de la fréquence de "bien" est 0.95 ± 1.96*sqrt(0.95*(1-0.95)/100), soit 0.95 ± 0.95*sqrt(0.95*0.05/100), soit 0.95 ± 0.043, soit à peu près [0.90; 0.99].

2) Vous dites que votre but est de comparer l'efficacité des 12 machines, pas de calculer des intervalles de confiance, et on revient précisément sur ma question initiale. Pour comparer l'efficacité des 12 machines, pas besoin d'intervalles de confiance, et pas besoin non plus d'attribuer des valeurs arbitraires aux trois catégories "bien", "moyen" et "pas bien". Il y a plusieurs solutions possibles. La plus simple est de construire la table de contingence à 12 lignes et trois colonnes et de la soumettre à un Chi2. Vous aurez directement la réponse à votre question.

HTH, Eric.

Eric Wajnberg

Nombre de messages : 306
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Desmond81 le Dim 2 Oct - 19:15

Merci beaucoup pour ces explications! Bonne soirée!

Desmond81

Nombre de messages : 4
Date d'inscription : 27/09/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Quelle méthode pour intervalle de confiance?

Message par Contenu sponsorisé Aujourd'hui à 12:26


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum