Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -20%
Drone Dji DJI Mini 4K (EU)
Voir le deal
239 €

Bonjour, une question de statistique

4 participants

Aller en bas

Bonjour, une question de statistique Empty Bonjour, une question de statistique

Message par grego Lun 22 Fév 2016 - 21:58

Voila je voudrais juste vous posez une question sur un problème de statistique ( je n'y connais rien )

Voilà mon problème .

Une personne fait un sondage par téléphone sur 5000 habitants sur 300 millions....sur les 5000 personnes ,66 répondent  affirmativement à la question et 4934 par la négative .

cette personne me dit que grâce à l' Intervalle de confiance , on peut avoir un chiffre exact sur les 300 millions de personnes c'est à dire que l'on peut affirmer que  4 millions +/-  de  personnes auraient répondu la même chose ,je ne comprends pas comment cela est possible avec un si faible échantillon de réponse affirmatives.

Je ne comprends pas trop comment un sondage aussi faible ( 0,001 % des personnes vivant dans ce pays ) avec des résultats aussi faible 66 personnes (soit  0,000022% de la population totale )puisse permettre d'extrapoler les résultats des 300 millions de personne  sans parler que cela se passe par téléphone et qu'il peut y avoir des mensonges, des faux positif etc....

merci pour vos réponses

grego

Nombre de messages : 5
Date d'inscription : 22/02/2016

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par gg Mar 23 Fév 2016 - 8:45

Bonjour.

Effectivement, tu as des raisons de mettre en doute cette affirmation. le problème n'est pas les 300 millions, mais :
* le type de sondage, qui n'est pas aléatoire : Comme tu l'as bien vu, on n'interroge que par téléphone, et que ceux qui veulent bien répondre au téléphone, donc qui n'ont pas peur d'avoir leur réponse enregistrée avec leur numéro de téléphone. On oublie une grande part des 300 millions.
*Et même si le sondage est fait parfaitement au hasard, le fait que l'estimation obtenue est aléatoire, et qu'on obtient au mieux une fourchette, c'est à dire un intervalle qui dépend de la confiance qu'on va accorder, par exemple, avec une confiance de 95%, on va dire (*) que le pourcentage de oui dans la population est entre 0 et 2,8; c'est à dire qu'en acceptant, dans ce genre de situation de se tromper une fois sur 20 en moyenne, on peut assurer qu'il y a moins de 2,8% des 300 millions qui auraient dit oui..

Cordialement.

(*) je fais un calcul grossier, qui est ici une erreur, mais qui donne une idée.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par grego Mar 23 Fév 2016 - 9:33

Merci pour votre réponse

en fait j'ai un ami qui est parti au USA et il est devenu pro-arme et il me dit que 3,5 millions de personnes utilisent leurs armes pour se défendre par an , et il se base sur un sondage par téléphone de 5000 personnes dont seulement  66 on répondu oui à la question puis il extrapole le résultat avec l'Intervalle de confiance pour 300 millions d'habitants. Donc si le résultat et de 0 à 2,8% le sondage ne correspond à rien de vraiment tangible puisque que l'on a entre  0 et 8 400 000 de personnes qui ont pu utiliser leurs arme personnelle de manière défensive .

grego

Nombre de messages : 5
Date d'inscription : 22/02/2016

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par droopy Mar 23 Fév 2016 - 13:22

Bonjour,

Comme l'a dit gg, un intervalle à 95% te dira qu'il y a 95% de chances que la proportion que tu cherches à estimer (celles sur les 300 milions de personnes) se situent entre telle valeur et telle valeur. Ce n'est pas une certitude, c'est juste qu'il y a de très fortes chances que la proportion qui t'intéresse soit entre ces deux valeurs.

Par exemple ici, ça donnerait que la proportion à 95% de chances de se trouver entre :
[0.01003652 ; 0.01636348], donc que sur 300 millions d'habitants il y aurait entre [3 010 957 ; 4 909 043] de personnes favorables.

Si tant est les conditions rappelées par gg (estimation non biaisée de la proportion).

Cordialement
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par grego Mar 23 Fév 2016 - 14:33

D'accord merci,

en fait il vaut mieux utiliser des données empiriques pour expliquer quelques chose  que faire un sondage qui peut être biaisée de différentes façons, comme par exemple sur les accidents de la circulation il vaut mieux avoir les données des assurances/police pour savoir combien il y a eu d'accidents par an, que faire un sondage sur 5000 personnes pour savoir si ils ont eu un accidents cette année ?

Cordialement.

grego

Nombre de messages : 5
Date d'inscription : 22/02/2016

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par droopy Mar 23 Fév 2016 - 15:13

Là c'est une autre question qui vient en amont de l'utilisation des intervalles de confiance : l'échantillonnage. Tout échantillonnage doit être penser pour réduire au maximum les biais dans l'estimation des paramètres qui t'intéressent. Il y a tout un tas de techniques plus ou moins complexes pour ça.
Je ne suis pas un spécialiste des sondages, mais je sais que pondre un bon sondage est quelque chose de complexe. Après il y a aussi des méthodes de corrections des biais, c'était notamment le cas des sondages d'opinion politique ou certains votes étaient sous estimés.

Ton exemple peut prêter à confusion. Si tu recenses tous les accidents qui ont lieu pour une année donnée, alors tu auras accès à toute la population et ici l'intervalle de confiance n'a plus de sens. Il est évident que si tu veux accéder à la vrai valeur de la population la meilleure façon d'y parvenir est d'étudier toute la population. Après si tu bases ton recensement que sur les déclarations auprès de la police ou des assurances tu vas peut-être compter deux fois certains accidents et ne pas en compter d'autres qui auront été réglé à l'amiable sans passer par une déclaration à l'assureur ni à la police.
Si tu fais un sondage auprès de 5000 personnes peut-être que tu auras ces accidents là de pris en compte, mais il te faudrait-être sur que tu n'interroges pas les deux protagonistes d'un même accident ce qui surévaluerait le taux d'accident.
Aucune méthode d'échantillonnage n'est parfaite par définition, mais elles tendent à limiter les biais liés à l'estimation du paramètre qui t'intéresse.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par gg Mar 23 Fév 2016 - 19:16

Difficile de dire ce que vaut le sondage, mais il est évident que extrapoler à 300 millions est une erreur. Les bébés ne répondent pas au téléphone, les grabataires rarement. de plus, on n'a pas le texte exact de la question.
Par contre, il est vrai que les américains des USA utilisent fortement leurs armes à feu (33636 décès en 2013), pas toujours pour se défendre.

Maintenant, discuter avec un américain pro-armes n'a aucun intérêt : Il ne peut pas imaginer qu'on peut se promener dans n'importe quelle rue d'une ville française sans se faire agresser, ni accepter que dans le monde, presque un prisonnier sur 4 est dans une prison américaine (23%, 16% pour la chine, 4% pour l'inde).

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par grego Mer 24 Fév 2016 - 12:14

Je mets le texte du sondage: "oui ou non quelqu'un dans le ménage a utilisé une arme à feu au cours de la dernière année ou dans les 5 dernières années pour se protéger ou protéger des biens contre une personne  qui veut commettre un crime ou un délit "

Voila le résonnement et le calcul pour arriver au résultat. 5000 personnes interrogées par téléphone ,4799 qui ont répondus.

-222 personnes ont répondus oui sur les 5 ans ,
- 66 pour l'année dernière.

cela fait 1.472 % des adultes aux USA qui ont répondus oui

on arrive a une estimation de 2,16 millions de personnes ayant utilisés leur arme de façon défensive avec un intervalle de confiance de 95% est de plus ou moins 0,32 %.

Le Bureau of Justice Statistics  dit qu'il y a 64700 utilisations d'armes défensives aux USA,  il utilisent les rapports de police de tous les USA ,donc une base de données très importantes.

Sur le sondage , on peut mentir ( faux positif ), dire que l'on a sortie son arme mais contre un chien, sortir son arme sans être en légitime défense etc...

Après je peux aussi faire un sondage sur 5000 personnes pour connaitre le nombres de personnes qui a eu entre 2010 et 2015 une relation sexuelle avec un poney trouver 66 personnes qui répondent oui et en conclure que statistiquement avec l'Intervalle de confiance il y a 2 millions de personnes aux USA qui ont une relation sexuelle avec un poney en 2015, personne ne peut prendre au sérieux cette statistique .

Cordialement et merci de vos réponses sur les statistiques .

grego

Nombre de messages : 5
Date d'inscription : 22/02/2016

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par gg Mer 24 Fév 2016 - 13:09

Attention,

la question est un peu floue, à cause de la notion de "ménage". Et les résultats sont incohérents : 66 sur l'année, on devrait arriver aux alentours de 330 pour les cinq dernières années.
En tout cas, ça fait un nombre élevé, dont la distorsion avec les autres statistiques peut avoir de nombreuses raisons : refus de répondre des anti-armes (donc biais fort), fantasmes divers (j'ai cru qu'il y avait quelqu'un dans le noir, j'ai tiré), etc.

Rappel : En décembre 1987, deux journaux titraient, à propos de la future élection présidentielle de 88 : "Mitterand battu" et "Mitterrand élu". Un des sondages était une simulation d'élection; l'autre posait la question "A votre avis, qui sera élu en 1988 ?"

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par grego Jeu 25 Fév 2016 - 9:26

Merci pour vos réponses, en fait une fois que l'on fait un sondage, les statistiques servent a confirmer le résultats du sondage sur un plus grand nombre, même si le sondage n'est pas fiable .

Cordialement.

grego

Nombre de messages : 5
Date d'inscription : 22/02/2016

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par droopy Jeu 25 Fév 2016 - 12:53

Le but d'un sondage c'est d'avoir une idée de ce qui se passe sur l'ensemble de la population, sur l'ensemble des votants par exemple. Comme très souvent tu ne peux pas avoir l'information sur toutes les personnes, tu en interroges un certain nombre et tu tires des conclusions sur tout le monde. C'est le propre des statistiques inférentielles : tirer des conclusions sur toute une population à partir d'un sous ensemble de cette population (échantillon).

Cordialement
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par Florent Aubry Jeu 25 Fév 2016 - 13:27

grego a écrit:en fait une fois que l'on fait un sondage, les statistiques servent a confirmer le résultats du sondage sur un plus grand nombre, même si le sondage n'est pas fiable .

Non, c'est un peu plus compliqué que cela. On peut avoir un sondage peu fiable mais qui répond exactement à la question posée, c'est-à-dire un sondage peu robuste. On peut aussi avoir un sondage biaisé, c'est-à-dire que son résultat est robuste mais en réalité, il ne répond pas à la question posée.
Je vais prendre un exemple pour m'expliquer. Je veux savoir si la valeur d'une caractéristique quantitative X me permet de distinguer deux sous groupes A et B (exemple, taille à l'intérieur d'une tranche d'âge et sexe). Je fais un tirage aléatoire de N individus dans chaque groupe (donc groupes équilibrés) et je mesure la taille sur ces individus. Je fais alors une Anova pour vérifier s'il existe une différence significative entre les groupes. Si N est suffisant grand, le résultat de l'Anova montre l'existence d'une différence significative et il est robuste mais la procédure employée ne répond pas à la question. Pour s'en convaincre, il suffit de générer 2 groupes de 10000 individus selon une loi gaussienne de variance unité, dont la moyenne diffère de 0.1. L'Anova est significative par contre l'aire sous la courbe ROC est de l'ordre de 0.5 (discrimination au hasard). A l'inverse si je fait par exemple une régression logistique avec les mêmes variables mais avec 10 individus dans chaque groupe, la procédure est plus correcte (encore que...) au moins dans sa philosophie mais pas robuste.

On peut bien entendu faire les deux erreurs à la fois. Donc au mieux, dans le cas que tu évoques, le traitement statistique, à condition d'avoir utilisé la bonne procédure, vise à inférer la réponse à la question posée sur une population pour laquelle l'échantillon est représentatif, c'est-à-dire présente les mêmes biais de réponse/refus de réponse, mensonge, etc. Et ce second point n'est pas le moins délicat.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Bonjour, une question de statistique Empty Re: Bonjour, une question de statistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum