Les posteurs les plus actifs de la semaine
Pchalix
 
victornitho
 
joyeux_lapin13
 
zezima
 
c@ssoulet
 


question de vocabulaire

Voir le sujet précédent Voir le sujet suivant Aller en bas

question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 14:48

Bonjour,

Pour vous, la théorie des sondages est une partie de la statistiques descriptive ou inférentielle?

+ je lis partout que la statistiques inférentielle permet de généraliser les résultats d'un échantillon à l'ensemble de la population. ça voudrait dire qu'on ne pourrait pas faire de statistiques inférentielle sur la population totale?


Pour ma part la théorie des sondages est de la statistique inférentielle et descriptive (On se sert de la statistique inférentielle pour décrire une population je sais pas si je m'explique bien...).
Et les statistiques inférentielles pourraient également permettent de vérifier des hypothèses sur une population entière, non?

Merci

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Ayana le Mer 5 Nov 2014 - 15:15

Bonjour,

En statistiques, on a une population generale, qui est la population pour laquelle on aimerait connaitre la valeur d'un parametre. Comme en pratique on ne dispose quasiment jamais de l'information sur toute la population, on travaille sur un echantillon, et on utilise les statistiques inferentielles pour essayer de faire une inference (predire) la valeur sur la population. Donc non, quand tu as toute ta population, tu ne dois pas faire de tests car il n'y a pas de fluctuations d'echantillonage, tu sais que tu observes la vraie valeur du parametre.

Ayana

Ayana

Nombre de messages : 388
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 15:35

Ben c'est là que je ne suis pas d'accord...

Pourquoi tu ne pourrais pas tester si un paramètre n'es pas statistiquement différent d'une valeur donnée, même sur une population totale?
Surtout que la statistique inférentielle part du principe que tu as une population infinie...

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Nik le Mer 5 Nov 2014 - 15:55

Si tu considère que tu as vraiment toute la population de valeur au sens statistique du terme alors il ne peut plus y avoir de variabilité statistique : tu as LA valeur de ton paramètre et donc tu n'as pas à la comparer à quoique ce soit puisque c'est la seule et unique possible.

La notion essentielle est bien la "population", car par exemple si tu pèses toute la population française aujourd'hui, tu vas peut-être considérer que tu as pesé toute ta population mais tu n'auras pour autant pas toute la population statistique car demain le poids des français aura changé et donc tu auras une fluctuation statistique possible car tout simplement parce que tu ne pourras jamais avoir la totalité de la population statistique des valeurs de poids des français.

Nik

Nik

Nombre de messages : 1500
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Ayana le Mer 5 Nov 2014 - 16:06

Prenons un exemple. Tu veux connaitre la taille moyenne des femmes francaises. Comme tu as peu de chance de pouvoir mesurer toutes les femmes du pays, tu prends un echantillon (que tu esperes representatif), tu estimes la moyenne sur cette echantillon et l'intervalle de confiance. Admettons que tu trouves 164 cm et l'IC a 95% [160;168], tu sais que tu as 95% de chance que cet intervalle contienne la vraie valeur sur ta population. Quand tu augmentes la taille de ton echantillon, la largeur de l'IC diminue, et quand la taille de l'echantillon se rapproche de celle de la population, ca n'a plus vraiment de sens. Et lorsque tu as toute la population, tu sais que tu as la valeur exacte de la taille des francaises, donc pas besoin d'IC car tu n'as pas de variabilite. Admettons que ta valeur exacte sur la population soit 163.4, et que tu veuilles savoir si cette valeur est differente de la taille moyenne des suedoises qui est 167, du fait que les deux valeurs soit exactes, pas besoin de test. Tu sais que 167>163.4. En revanche, se pose la question de la pertinence de la difference. A partir de quelle difference on considere que c'est important...

Ayana

Nombre de messages : 388
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 16:13

Nik a écrit:Si tu considère que tu as vraiment toute la population de valeur au sens statistique du terme alors il ne peut plus y avoir de variabilité statistique : tu as LA valeur de ton paramètre et donc tu n'as pas à la comparer à quoique ce soit puisque c'est la seule et unique possible.

La notion essentielle est bien la "population", car par exemple si tu pèses toute la population française aujourd'hui, tu vas peut-être considérer que tu as pesé toute ta population mais tu n'auras pour autant pas toute la population statistique car demain le poids des français aura changé et donc tu auras une fluctuation statistique possible car tout simplement parce que tu ne pourras jamais avoir la totalité de la population statistique des valeurs de poids des français.

Nik

Ok, super explication.

Je me posais à la base la question : pourquoi n'utilise-t-on pas plus souvent la théorie des sondages pour estimer les paramètres d'une population dont on connaît le nombre total à partir d'un échantillon. Lorsqu'on calcul un intervalle de confiance, on le fait systématiquement avec la statistiques inférentielle ; c'est parce qu'on doit souvent être dans un cas similaire à l'exemple que tu as pris?

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 16:56

Ayana a écrit:Prenons un exemple. Tu veux connaitre la taille moyenne des femmes francaises. Comme tu as peu de chance de pouvoir mesurer toutes les femmes du pays, tu prends un echantillon (que tu esperes representatif), tu estimes la moyenne sur cette echantillon et l'intervalle de confiance. Admettons que tu trouves 164 cm et l'IC a 95% [160;168], tu sais que tu as 95% de chance que cet intervalle contienne la vraie valeur sur ta population. Quand tu augmentes la taille de ton echantillon, la largeur de l'IC diminue, et quand la taille de l'echantillon se rapproche de celle de la population, ca n'a plus vraiment de sens. Et lorsque tu as toute la population, tu sais que tu as la valeur exacte de la taille des francaises, donc pas besoin d'IC car tu n'as pas de variabilite. Admettons que ta valeur exacte sur la population soit 163.4, et que tu veuilles savoir si cette valeur est differente de la taille moyenne des suedoises qui est 167, du fait que les deux valeurs soit exactes, pas besoin de test. Tu sais que 167>163.4. En revanche, se pose la question de la pertinence de la difference. A partir de quelle difference on considere que c'est important...


là je l'aurai pris plus comme dans l'exemple Nik... en terme de population statistique (pour un individu, une mesure de la taille peut varier d'une mesure à l'autre). Et du coup tu ne sais pas si 167>163.4, et il faut faire un test stat pour le confirmer!

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Ayana le Mer 5 Nov 2014 - 17:46

Je suis d'accord que la mesure peut varier, mais n'oublions pas que l'erreur de mesure est d'esperance nulle. Donc a l'echelle de la population... pas d'impact...

Ayana

Nombre de messages : 388
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par gg le Mer 5 Nov 2014 - 21:38

niaboc a écrit:Ben c'est là que je ne suis pas d'accord...
...
Surtout que la statistique inférentielle part du principe que tu as une population infinie...

Drôle d'idée ! Non, on ne part pas du principe que la population est infinie. D'ailleurs, lorsque l'échantillon est une proportion non négligeable de la population, on tient bien compte du fait qu'on a choisi des individus distincts (Loi hypergéométrique pour estimer une proportion, par exemple).

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 22:57

gg a écrit:
niaboc a écrit:Ben c'est là que je ne suis pas d'accord...
...
Surtout que la statistique inférentielle part du principe que tu as une population infinie...

Drôle d'idée ! Non, on ne part pas du principe que la population est infinie. D'ailleurs, lorsque l'échantillon est une proportion non négligeable de la population, on tient bien compte du fait qu'on a choisi des individus distincts (Loi hypergéométrique pour estimer une proportion, par exemple).

Cordialement.

Non l'idée est sérieuse. Tu trouves plein d'exemple dans la littérature. Et l'idée de Nick avec sa population statistique se base sur cette idée, que la population est en fait infinie.
De plus les théorèmes tel que le théorème central limite etc. établisse des convergences avec des populations qui tendent vers l'infini.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Mer 5 Nov 2014 - 23:20

Et avec le raisonnement de Nick, la statistique inférentielle est toujours justifiable pour faire des tests sur une population entière.

De plus, je pense que l'utilisation de statistique inférentielle dans une population totale est justifiable (notamment lorsque la population totale est faible?)

Exemple : tu veux avoir la taille moyenne des ours  des Pyrénées (on connait la population totale exacte car il en existe peu)
Tu as 24 individus en 2013 qui font 1,98 mètre en moyenne. Tu as une moyenne, une variance. Tu peux toujours te demander si cette différence est statistiquement différente de 2 mètres.
=> il est vrai que la moyenne actuelle est réellement inférieure à 2 mètres, mais statistiquement la moyenne n'est pas différente de 2 mètres ; si d'autres ours étaient présents, la moyenne pourrait être de 2 mètres (surtout avec seulement 24 ours, mais c'est qd même la population totale)

Avec le même raisonnement et l'exemple d'Ayana :
il est vrai que la moyenne actuelle des français est de 167 cm, mais peut-être que l'intervalle de confiance construit avec la variance de l'estimateur de la moyenne est de +- 2 cm... (c'est un exemple) ce qui voudrait dire que si la population française augmentait alors la moyenne serait comprise entre 167+-2 cm.

Donc je pense que le fait d'avoir une population entière n'enlève en rien le fait de pouvoir continuer à faire de la statistique inférentielle, n'est-ce-pas? (je sais que je peux être chiant, mais j'ai envie de bien comprendre la chose... désolé pour ceux que j'embête avec mes questions :-S)


PAR CONTRE, en théorie des sondage, la variance de la moyenne est pondéré par 1-n/N => si nous avons la population entière alors l'intervalle de confiance n'existe plus ou plutôt alors correspond exactement à la moyenne+-0.

Là ça rejoint plus ce que disait Anaya... mais en suivant son raisonnement, on devrait TOUJOURS utiliser la théorie des sondages dans toutes nos estimations (sauf si nous avons un échantillon vraiment petit par rapport à la population totale, dans quel cas on peut considérer qu'on est dans le cas d'une population infinie...)

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par gg le Jeu 6 Nov 2014 - 10:17

Niaboc,

des exemples ne font pas une règle !!
D'autre part, Nik ne parle pas de population infinie. Seulement de fluctuations statistiques.

je crois que tu es en train de bien mélanger, faute de comprendre que les résultats d'une enquête exhaustive parlent vrai sur la population étudiée (donc rien d'inférentiel) et ne permettent pas d'inférence.
Par exemple les résultats sur le nombre de réussites au Capes de maths 2014 ne permettent pas de savoir combien il y en aura en 2015. Seulement des estimations grossières que tout le monde peut faire.
En effet, ce type de variabilité statistique est justement non contrôlée (contrairement à celle provenant d'un échantillon pris au hasard dans une population). C'est le grand problème des prévisionnistes de tout poil.

Si on rentre dans ta méthode (faire des stats inférentielles sur une enquête exhaustive), on a tout de suite fini : la variance des estimateurs est nulle (l'estimation est égale à la vraie valeur). D'ailleurs, il n'y a plus variation d'échantillon, il n'y en a qu'un seul : la population. Donc l'inférence est "Ce sera toujours comme ça". Et on sait que c'est faux.

En conclusion, je pense que tu perds ton temps et que tu compliques une situation très claire.

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Jeu 6 Nov 2014 - 12:03

Au contraire je trouve que tu simplifies le problème puisque je pense que ce n'est pas parce que tu as l'ensemble de la population que tu as la valeur exacte du paramètre... Si tu sais que tous les individus suivent une loi de moyenne M, la moyenne de l'ensemble des individus n'est pas forcément M.

Et la vraie valeur du paramètre n'est a priori jamais connue, puisqu'il existe une fluctuation statistique, et j'imagine que c'est aussi un des buts de la stat inférentielle.

En théorie des sondages, la variance est nulle lorsque l'on possède la population entière... donc tu raisonnerais avec cette théorie là, mais sans en utiliser les règles sitôt que tu travailles sur des échantillons (notamment pondérer la variance avec le taux de sondage)
C'est à dire que si tu possèdes 99,9% de la population, tu peux éventuellement avoir une forte variance, mais si tu possèdes 100% de la pop alors la variance tombe à 0 par principe. Si tu pondères par le taux de sondage par contre, tu auras une valeur forcément très proche de 0...


mais tu as surement raison, je me prends la tête beaucoup trop souvent et je complique surement des choses simples.

Donc je vais arrêter d'y penser et me convaincre de ta réponse; ce poste est donc résolu.

Niaboc

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par gg le Jeu 6 Nov 2014 - 12:29

Je prends note de ta dernière phrase, mais pour ce que tu dis au début (et qui la dément), quelques éléments :

Tu as déjà reproché à un de tes profs de ne pas avoir la moyenne exacte ?
Évidemment non. Quand tu as obtenu la valeur d'un caractère numérique pour tous les individus d'une population et que tu en fais la moyenne, tu obtiens bien la moyenne. Exacte.

la suite montre bien que tu mélanges des notions d'estimation ("puisqu'il existe une fluctuation statistique") mal comprises avec des notions très simples, évidentes, celles de la statistique descriptive. Où il n'y a pas de fluctuation, tout est connu.

Et ce que tu dissur la théorie des sondages est faux, sans doute faute d'avoir vraiment appris la théorie des estimateurs. Si tu as les valeurs pour 99,9% de la population, la variance de ton estimateur (disons de la moyenne) est très faible. Et elle tombe à 0 quand on a 100%, ce qui est très intuitif (si je sais la vraie valeur, il n'y a plus de variabilité statistique).

Mais tu as développé une thèse personnelle, et, pour la maintenir, tu te sens obligé de tordre la réalité, de refuser des évidences, de l'intuitif qui se démontre.

Allez, un exemple caricatural : Tu connais trois des 4 notes qui donnent la moyenne trimestrielle d'un élève : 12, 15 et 18. Une estimation de la moyenne est la moyenne de ces trois notes, 15. Un intervalle de confiance est obtenue en prenant 0 ou 20 pour la quatrième note, ce qui donne [11,25; 16,25]. Cet intervalle donne même une confiance à 100%. Je ne fais pas de modélisation statistique, dans ce cas, pour simplifier.
Maintenant, on apprend que la quatrième note est 19. On sait donc que la vraie moyenne est 16. Il n'y a pas d'autre estimation utile de la vraie moyenne que "elle est 16". Il n'y a même plus à faire d'estimation.
"oui, mais ça ne dit rien du trimestre suivant". Effectivement. Les stats inférentielles non plus.
" oui, mais la population des moyennes trimestrielles ..." Alors on a changé de problématique, on ne parle plus de la même chose.

Cordialement.


gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Jeu 6 Nov 2014 - 13:09

gg a écrit:Et ce que tu dissur la théorie des sondages est faux, sans doute faute d'avoir vraiment appris la théorie des estimateurs. Si tu as les valeurs pour 99,9% de la population, la variance de ton estimateur (disons de la moyenne) est très faible. Et elle tombe à 0 quand on a 100%, ce qui est très intuitif (si je sais la vraie valeur, il n'y a plus de variabilité statistique).

C'est exactement ce que je dis... avec la pondération en 1-n/N de la variance de l'estimateur de la moyenne. M'enfin...

Et je peux juste te dire que j'y ai passé énormément de temps sur la théorie des sondages. Je n'en sais rien pour toi, c'es tpour ça que je n'insinue pas sur ce que tu connais ou pas, et tu devrais en faire autant, surtout que tes remarques peuvent être blessantes et n'incitent pas à revenir sur le forum. Désolé de ne pas être aussi intelligent que toi.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par gg le Jeu 6 Nov 2014 - 13:32

Je ne parlais pas de la théorie des sondages, mais d'un de ses substrats, la théorie de l'estimation statistique.

Je ne comprends pas pourquoi tu disais "tu peux éventuellement avoir une forte variance" alors que tu avais l'outil (la pondération) qui dit qu'elle tend vers 0. Maintenant c'est "C'est exactement ce que je dis..".

Question intelligence, je n'en suis pas spécialement pourvu, pas plus que la plupart des gens, donc de toi. Et si je t'ai blessé par ma remarque sur la théorie des estimateurs, j'en suis désolé, je cherchais seulement une explication gentille à cette incohérence. Et une piste éventuelle pour toi pour approfondir la réflexion ...

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Jeu 6 Nov 2014 - 13:34

gg a écrit:
Je ne comprends pas pourquoi tu disais "tu peux éventuellement avoir une forte variance" alors que tu avais l'outil (la pondération) qui dit qu'elle tend vers 0. Maintenant c'est "C'est exactement ce que je dis..".

Je disais si justement tu n'utilises pas les principes de la théorie de sondage tu peux éventuellement avoir une forte variance, même en t'approchant de la population globale.

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par niaboc le Jeu 6 Nov 2014 - 13:35

Je me cite :

"mais sans en utiliser les règles sitôt que tu travailles sur des échantillons (notamment pondérer la variance avec le taux de sondage)
C'est à dire que si tu possèdes 99,9% de la population, tu peux éventuellement avoir une forte variance,"

niaboc

Nombre de messages : 865
Age : 29
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par gg le Jeu 6 Nov 2014 - 15:45

Désolé, je ne comprends pas.

Pondérer avec 0,999 ne change quasiment pas les valeurs. Et je ne comprends pas de quelle variance il s'agit si on n'utilise pas les méthodes d'estimation (donc la théorie des sondages).

Dernière chose : la variance n'a pas de signification directe (elle change, si on change d'unité). Donc la notion de forte variance est relative.

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Invité le Ven 7 Nov 2014 - 9:26

.


Dernière édition par bogette79 le Sam 22 Nov 2014 - 16:15, édité 1 fois

Invité
Invité


Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Nik le Ven 7 Nov 2014 - 10:25

oula, le sujet a pris de l'ampleur Wink

Je vais faire court :
-l'hypothèse de travail détermine quelle est la population statistique totale (ensemble des valeurs possibles)
-une variabilité statistique existe si on a pas l'ensemble de cette population statistique ie si on ne travaille que sur un échantillon.

Pour un petit exemple qui allonge le message:
Quand on travaille sur des statistiques de population, cette fois-ci au sens démographique, il faut bien veiller à ne pas se mélanger les pinceaux entre sens statistique et sens démographique. Car pour ce dernier, vous pouvez effectivement avoir pris l'ensemble des individus de Pierrefiche du Larzac (population beaucoup plus modeste que la France entière...Smile ) si vous vous intéressez à ce village (hameau ?!) en particulier mais votre mesure d'intérêt et la question scientifique associée va aussi déterminer quelle est la population statistique globale. Si vous mesurez la taille moyenne du 7 novembre 2014 à 23h00 alors vous avez de bonnes chances de pouvoir dire que vous avez eu l'ensemble de la population statistique. Par contre, si vous vous intéressez à la taille moyenne sur plusieurs années alors ça va être un peu plus complexe d'avoir la population statistique complète.

A mon avis, les cas où on dispose de la population globale sont très rares, notamment si on s'attaque à des stats qui intègrent un tant soit peu de vivant (humain, animal etc...).

Nik

Nombre de messages : 1500
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: question de vocabulaire

Message par Contenu sponsorisé Aujourd'hui à 8:08


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum