Les posteurs les plus actifs de la semaine
joyeux_lapin13
 
zeu
 
gg
 
schlebe
 
zezima
 
Antoin123
 
Eric Wajnberg
 
Yacouba_KONE
 
rayanes159
 
noviceST
 


Peut-on définir un échantillon représentatif des électeurs ?

Voir le sujet précédent Voir le sujet suivant Aller en bas

Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Ven 18 Déc 2015 - 11:53

Bonjour,

Je me présente, je suis ingénieur et professeur de mathématiques (CAPES), je me permets de venir vous solliciter sur ce forum car je participe à un groupe de réflexion qui traite de la possibilité de créer une assemblée constituante afin d'écrire un projet de nouvelle constitution pour la France.
La question qui m'amène est donc de savoir s'il est possible de créer par tirage au sort un échantillon représentatif des 45 millions d'électeurs français afin que ceux-ci travaillent à l'élaboration de ce texte. En m'appuyant sur mes connaissances en statistiques - qui s'arrêtent au premier cycle universitaire - je pense que oui mais je fais face à de nombreux détracteurs qui me soutiennent le contraire.

D'où ma question : selon vous est-ce possible ? si oui à quelles conditions ? quelle devrait être la taille de l'échantillon ?

Merci de m'avoir lu et bonne journée,
Mbj

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par gg le Ven 18 Déc 2015 - 20:49

Bonjour.

Il ne faut pas trop donner de sens précis au "significatif" des statisticiens. Pour eux, le fait que l'échantillon soit tiré au hasard fait qu'il est représentatif.
Dans ton cas, la grosse difficulté est que la plupart des électeurs choisis ne participeront pas, voire même ne comprendront même pas ce qu'est une constitution (il n'est pas demandé d'être intelligent, ni instruit pour voter). Donc les participants, même choisis de la meilleure des façon ne seront plus représentatifs de l'ensemble des électeurs (dont certains d'ailleurs ne votent jamais).

Désolé si ça te déçoit, mais la constitution d'un échantillon utile est une des grandes difficultés des instituts de sondage. Pas réglée.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Ven 18 Déc 2015 - 22:10

Bonsoir et merci beaucoup pour cette réponse. Loin d'être décevante elle éclaire sous un angle très intéressant notre problématique, en effet j'en conclus que si l'on pouvait demander à tous les électeurs de participer à une constituante, beaucoup n'y participeraient pas, soit par manque d'envie de le faire, soit par ignorance ; et l'on retrouvera donc exactement le même phénomène à l'échelle d'un échantillon, qui de ce point de vue serait donc représentatif, non pas de la population des électeurs, mais de la population des électeurs ayant l'envie et les compétences pour participer à une constituante.
Ce raisonnement vous semble-t-il valide ?

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par Florent Aubry le Sam 19 Déc 2015 - 7:07

"Il ne faut pas trop donner de sens précis au "significatif" des statisticiens. Pour eux, le fait que l'échantillon soit tiré au hasard fait qu'il est représentatif." Si, en statistique, ce terme est précis, sauf qu'il faut entendre qu'il doit l'être asymptotiquement, c'est-à-dire que l'erreur doit décroitre vers zéro quand la taille de la population croit ou, ce qui revient au même, quand on augmente le nombre de tirage d'un échantillon de même taille. C'est sur cette propriété que se basent toutes les analyses statistiques, par exemple en épidémiologie, dans les essais cliniques ou pré-cliniques.

En ce qui concerne les instituts de sondages, ils pourraient utiliser les mêmes approches mais cela a un coût en temps et financier et ils veulent un résultat immédiat, même s'il est biaisé par le choix des questions (et des réponses possibles), par la procédure d'établissement de l'échantillon et par la procédure de traitement des données, d'où les "redressements" a posteriori qui ne relèvent pas de la science statistique mais du doigt mouillé et c'est pour cela que cela relève du secret parce que chaque institut a utilise sa propre technique.

En bref, la seule façon d'obtenir un échantillon représentatif de la population serait d'avoir à sa disposition une base complète et de tirer l'échantillon vraiment au hasard (d'où aucun sondage en ligne biaisé par nature), par exemple totalement soit par une méthode de stratification mais alors il faut déterminer les strates pertinentes. Les questions posées et réponses possibles (oui, non, vote blanc, vote nul, abstention au minimum), l'écart minimal entre ces réponses, notamment oui et non, le niveau du test pour les réponses exprimées et sa puissance détermineront alors la taille minimale de l'échantillon.

Ensuite, le problème de la participation relève de la sociologie et notamment de la question lancinante de l'existence ou non d'une opinion publique et de ses compétences pour répondre aux questions que se posent les commanditaires des sondages (par exemple, est-ce que la question qui préoccupe les commanditaires préoccupe aussi le public, quelle est la motivation de la personne qui répond, par exemple, répondre ce qu'elle aurait répondu si c'était un vote réel, répondre ce qu'elle souhaiterait comme résultat, avec éventuellement un calcul de type 'billard à plusieurs bandes', c'est-à-dire répondre B pour obtenir A un peu comme les trolls sur les forums qui se font passer pour ce qu'ils ne sont pas, ou biaiser le résultat. Et cela nécessite un autre arsenal comprenant notamment des questions permettant de valider le sondage. On comprend alors que les instituts de sondage qui veulent la réponse presque pour la veille n'entrent pas dans ces considérations.

Florent Aubry

Nombre de messages : 121
Date d'inscription : 02/11/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Sam 19 Déc 2015 - 11:28

Bonjour,

je pense que vous faites référence au Théorème central limite ? justement c'est une question, le TCL s'applique-t-il au cas de l’échantillonnage de la population des électeurs ? pourquoi ? pourquoi pas ?

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par gg le Sam 19 Déc 2015 - 12:15

Bonjour.

La théorie de l'échantillonnage ne se base pas sur le TCL, mais l'utilise souvent à des fins de simplification. D'ailleurs, comme les populations sont généralement finies, on ne peut pas avoir d'échantillon de taille infinie Smile
Donc la question de la représentativité de l'échantillon est bien de savoir si on peut faire ou non des inférences probabilistes à partir de l'échantillon qu'on va obtenir.

Pour ton raisonnement, Mbj335, il est un peu "limite", car justement, on n'aura pas pris un échantillon au hasard dans la population des électeurs ayant l'envie et les compétences pour participer à une constituante.
Un inconvénient évident : On ne sait pas, à priori, la taille de l'échantillon résultant.

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Sam 19 Déc 2015 - 13:52

Ok mais la statistique est la science de l'approximation si je ne m'abuse, on mesure des choses et les stats servent - entre autres - à estimer/encadrer l'erreur que l'on commet. Pour moi la question n'est pas de savoir si on atteint l'exactitude théorique - on sait que non - mais de savoir si les approximations faites sont valides. Et justement c'est ma question.

Concernant la taille de l'échantillon si on considère qu'à chaque fois qu'un tiré au sort refuse de participer on fait un nouveau tirage et ce jusqu'à atteindre la taille de l'échantillon prédéfini on résoud de fait l'inconvénient que vous évoquez, mais est-ce une démarche statistiquement valide ? (ou alors on tire 10 fois l'échantillon cible et dès qu'on atteint un nombre confirmé de tirés au sort égal à la taille de l'échantillon cible on s'arrête, peut-être plus réaliste en pratique : pour une taille d'échantillon fixée à 1000, on tire 10000 qu'on numérote et on prend les 1000 premiers confirmés)

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par gg le Sam 19 Déc 2015 - 15:46

Non, non,

en statistique, on n'encadre pas l'erreur, on parie sur le fait qu'elle est de tel ou tel ordre.

par exemple, en prenant 100 bulletins au hasard dans une élection présidentielle, on va pourvoir estimer le pourcentage de voix du candidat A; par exemple il a 30 voix sur ces bulletins, donc on estimera à 30% sont pourcentage national. On améliorera ça en calculant un intervalle de confiance, par exemple à 95% : Il y a 95% de chances que son pourcentage de voix soit entre 21% et 39%.
Mais il y a aussi 5% de risque que son pourcentage soit inférieur à 21% ou supérieur à 39%.
S'il y a 34 Millions d'électeurs, on peut déduire de l'échantillon une "fourchette" parfaitement sûre :[30, 33 999 930]. Fourchette parfaitement inutile Smile

Quant à la méthode que tu proposes (méthode du rejet) elle est effectivement utilisable, mais c'est difficile en pratique. Cependant, c'est ce que font les sondeurs des instituts de sondage, faute de mieux. Quant à prendre un échantillon 10 fois plus grand, ça pose un problème : de mise en œuvre (ça coûte très cher), et de démocratie (les refusés sont des exclus, alors qu'ils étaient volontaires), à moins de faire du choix 1 par 1, ce qui peut prendre un trop long temps.

Enfin, tout ça c'est de l'utopie, je réponds surtout pour parler de statistiques, fabriquer une constitution est déjà difficile pour des juristes, aucune assemblée n'a jamais fabriqué de constitution; tout au plus, certaines l'ont votée.

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Sam 19 Déc 2015 - 16:38

Merci pour ces précisions, il est vrai que pour parler statistiques quelques nombres ne sont pas superflus. Dans le système à l'étude il n'y a pas de volontaires, tout électeur est susceptible d'être appelé. S'il l'est il peut accepter ou refuser de participer. Il n'y a pas de refusé, à l'exception bien sûr des personnes ayant ou ayant eu un mandat sous la Vème république. Du point de vue de la mise en oeuvre je ne vois pas de difficultés, il faut tirer au sort 10 000 électeurs, leur envoyer à chacun une LR, laisser le temps de réfléchir, puis prendre les 1000 premières réponses positives dans l'ordre de numérotation du tirage au sort.
Sinon vous avez raison c'est de l'utopie, c'est pourquoi je m'y intéresse.

Bonnes fêtes,
Mbj

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par Florent Aubry le Dim 20 Déc 2015 - 8:55

1) On oublie presque toujours que les statistiques inférentielles supposent que l'échantillon est construit à partir d'un tirage aléatoire uniforme (ou stratifié ou par grappes pour les principales méthodes) avec remise alors qu'en pratique on utilise un échantillon sans remise. Pour être rigoureux, les lois sous-jacentes de tirage sont très différentes puisque dans le premier cas, la probabilité de tirer un individu donné est constante (dans la population, dans la strate, dans la grappe...) que l'on choisisse le premier individu ou le millionième (loi binomiale ou multinomiale en fonction du nombre de classes dans la population). Par contre, dans le second cas, il s'agit d'une loi hypergéométrique ou polyhypergéometrique. Dans ce cas, on montre qu'on doit utiliser pour la variance un facteur de correction  1 - N[echantillon] /  N[population] où N[x] désigne la taille de x (échantillon ou population). Cela signifie que quand "l'échantillon" est la population entière, la variance de l'estimateur est nulle. De plus, dans le cas d'un tirage avec remise, il est possible de construire des échantillons de taille supérieure à la population, ce qui est impossible dans le second cas. Et, en théorie, ce n'est que dans le cas du tirage avec remise que le TCL est applicable.
Pour s'en convaincre, voici deux exemples :
a) on veut vérifier qu'un dé n'est pas pipé. La taille de la population est de 6, les 6 faces, par contre on va lancer le dé par exemple 1000 fois, donc la taille de l'échantillon est de 1000 très supérieur à 6.
b) pourcentage de boules rouges et de boules noires dans une urne. On peut procéder par tirage avec remise mais généralement l'exercice spécifie qu'on fait un tirage sans remise. Il est évident, sans calcul, que plus on tire de boules, plus l'estimateur est précis et quand il ne reste plus aucune boule dans l'urne, on a la proportion exacte.

Notons que si la taille de l'échantillon est faible par rapport à celle de la population (largement inférieur au pour cent), on peut négliger le facteur de correction au regard d'autres erreurs comme l'erreur d'échantillonnage, l'erreur d'estimation...

Sur un aperçu rapide sur la théorie de l'échantillonnage, on peut se reporter au livre de J.J. Daudin, S. Robin et C. Vuillet, Statistique inférentielle. Idées, démarches, exemples. Presses Universitaires de Rennes. G. Saporta dans son livre aux éditions Technip, Probabilités, analyses des données et Statistiques aborde rapidement les méthodes de redressement. Une recherche même rapide sur la toile permet d'obtenir des documents complémentaires.

2) Le choix initial de 10000 personnes puis de 1000 personnes à partir des 10000 n'a pas vraiment de sens si ce tirage n'est effectué qu'une fois. De plus, la taille de l'échantillon de second ordre est grande par rapport à la population d'où il est tiré (10%) et on n'a plus le droit de négliger cet aspect. Dans ce cas, autant tirer tout de suite 1000 personnes. Cela aurait du sens s'il y avait plusieurs tirages aléatoires uniformes avec remise. La technique s'apparenterait alors aux techniques de bagging (bootstrap aggregating), voir par exemple Wolpert, D.H., Macready, W.G., 1996. Combining stacking with bagging to improve a learning algorithm. Technical report SFI-TR-96-03-123, Santa-Fe Institute, Santa Fe, New Mexico, URL ftp://ftp.santafe.edu/pub/wgm/bs.ps. ou Grandvalet, Y., 2004. Bagging equalizes influence. Machine Learning 55, 251-270.

3) Le refus de répondre s’apparente au problème des données manquantes, qui est un problème à part entière et non résolu à cette heure. Comme le dit gg, dans de nombreux cas, en pas seulement les instituts de sondages, on prévoit un échantillon plus grand pour pallier cette déficience mais ce n'est pas obligatoirement la meilleure manière de faire car il serait intéressant de connaître le profil et la motivation de ces refus (ou données manquantes). Voir notamment  le problème des 'perdus de vue' en suivi épidémiologique ou dans les essais cliniques.

4) Pour rester dans le domaine mathématique, il ne faut pas non plus oublier le problème du choix face à plusieurs possibilités concurrentes, notamment celui connu sous la forme du paradoxe de Condorcet. Ensuite, il fut aussi se poser les problèmes relevant de la sociologie que j'ai rapidement évoqué dans une intervention précédente et les problèmes juridiques évoqués par gg.

Florent Aubry

Nombre de messages : 121
Date d'inscription : 02/11/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par mbj335 le Dim 20 Déc 2015 - 9:53

Merci pour ces compléments, bien sûr la théorie impose des tirages avec remise pour avoir équiprobabilité entre les tirages, mais dans ce cas avec un échantillon très petit d'une population grande (1000 pour au moins 45 millions) cette approximation, qui est usuelle vu qu'on la retrouve dans les problèmes du baccalauréat, me semble valide. Du reste, s'il y avait remise, un électeur pourrait être tiré deux fois ce qui n'a pas de sens du point de vue de ce qui sera demandé à cet échantillon (un travail), du moins tant qu'il ne peut pas se cloner...
Donc après avoir dit qu'on ne peut pas théoriquement utiliser le TCL, c'est bien lui qu'on utilise n'est-ce pas ?

Dans les expérimentations d'assemblée citoyenne par tirage au sort qui ont été faites à ce jour il apparaît qu'en moyenne 1/3 des personnes accepte de participer, c'est pourquoi si l'on veut un échantillon de 1000 personnes il faut en tirer davantage pour palier les refus de participation, c'est pourquoi j'ai parlé de 10000 pour être "certain" d'avoir les 1000, dans un soucis de simplification de la procédure.
Pour prendre un autre exemple, si l'on veut faire une étude sur les gauchers mais qu'on a pas de listing de gauchers il faudra bien interroger un échantillon de toute la population en commençant par cette question "êtes-vous gaucher ?" si oui on poursuit le questionnaire, si non on s'arrête et on fait un nouveau tirage, non ? il faudra donc bien au total interroger environ 8 fois plus de personnes que l'échantillon requis (hypothèse : il y a environ 12% de gauchers dans la population) non ?
Et bien là c'est pareil, on a pas à priori de listing d'électeurs dont on sait qu'ils répondraient oui à l'invitation à participer à une constituante.

Concernant votre point 3/ je comprends ce que vous dîtes mais dans notre cas on ne pose aucune question aux tirés au sort.

Concernant votre point 4/ vous faites référence je pense aux travaux que l'échantillon aura à mener au sein de l'assemblée ? effectivement il faudra savoir comment organiser les votes et résoudre les paradoxes (méthode de Condorcet ou par pondération ou autre). je garde çà pour la suite on y est pas encore, la première étape étant de définir un processus constituant et surtout d'arracher un referendum d'initiative citoyenne posant la question de la création d'une assemblée constituante tirée au sort.

merci pour les références bibliographiques et bon dimanche,
Mbj

mbj335

Nombre de messages : 6
Date d'inscription : 18/12/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par Florent Aubry le Dim 20 Déc 2015 - 12:34

Premier paragraphe, réponse à la question : En effet, c'est ce qu'on fait et c'est ce que j'ai voulu dire en écrivant "Notons que si la taille de l'échantillon est faible par rapport à celle de la population (largement inférieur au pour cent), on peut négliger le facteur de correction au regard d'autres erreurs comme l'erreur d'échantillonnage, l'erreur d'estimation... ". Désolé de ne pas avoir été clair.

Pour le second paragraphe et l'exemple des gauchers, la réponse est non on ne fait pas comme tu dis. On commence par définir de la manière la plus exhaustive possible la population cible en définissant les critères d'inclusion et les critères d'exclusion (et en prime, les critères de sortie d'étude) et ce n'est que sur cette population qu'on travaille. La technique que tu mentionnes s'appelle de l'échantillonnage au fil de l'eau (entre autres dénominations). Si on veut être rigoureux, la bonne technique est de sélectionner la population des gauchers avant l'étude. Ceci peut paraître du pinaillage mais a des conséquences par exemple dans le cas des essais cliniques.

Le point 3, bien sûr que si, une ou des questions sont posées sinon à quoi sert de tirer au sort un échantillon. Le problème est de savoir si c'est un questionnaire fermé ou un questionnaire ouvert, ce qui semble être ce que tu veux. Il existe toute une théorie de traitement des questionnaires qui traite principalement des questionnaires fermés (par exemple des enquêtes de satisfaction) mais j'ai aussi vu quelques travaux sur les questionnaires ouverts. Par contre, cela n'est absolument pas mon domaine et je ne peux pas donner de références même comme point de départ.

En fait, ton approche est de déconnecter la constitution de l'échantillon de la raison pour laquelle il est constitué, mais c'est impossible car les critères servant à constituer l'échantillon (inclusion, exclusion, sortie) dépendent de l'objectif assigné à l'étude et dans ton cas, il faut prendre en compte les raisons d'acceptation ou de refus de faire partie de l'assemblée constituante. Tu te retrouves avec le même problème de fiabilité de l'échantillon que celui posé par les sondages par Internet, problème lié à des considérations sociologiques.

Bonne réflexion et bon dimanche

P.S. : Peut-être que des sites comme persée ou [url=/www.cairn.info]cairn[/url] (pour ceux que je connais) pourraient aussi t'être utiles.

Florent Aubry

Nombre de messages : 121
Date d'inscription : 02/11/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Peut-on définir un échantillon représentatif des électeurs ?

Message par Contenu sponsorisé Aujourd'hui à 20:22


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum