Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
test pour voir si un échantillon représente une population
2 participants
Page 1 sur 1
test pour voir si un échantillon représente une population
Bonjour à tous,
J'ai un petit souci et je n'ai pas réussi à trouver la réponse malgré mes recherches..
Je vous explique :
J'ai une population d'environs 37000 vitesses et le but est d'essayer de créer un échantillon (assez petit : de l'ordre de 10-30) afin de représenter au mieux la population. (je sais qu'un tel échantillon est petit mais on me l'impose). Je précise également que la méthode d'échantillonnage est aléatoire simple.
Mon problème est le suivant : je pense tester différents n et comparer à la population (moyenne et écart type), mais le souci est que je ne trouve pas de test statistique adéquat car j'ai d'un coté un échantillon très petit, et de l'autre un très grand. J'ai beaucoup chercher sur internet mais la plupart du temps, les échantillons sont de tailles assez équivalentes et du coup je ne sais pas lequel est viable pour ce que je souhaite faire.
Merci d'avance
J'ai un petit souci et je n'ai pas réussi à trouver la réponse malgré mes recherches..
Je vous explique :
J'ai une population d'environs 37000 vitesses et le but est d'essayer de créer un échantillon (assez petit : de l'ordre de 10-30) afin de représenter au mieux la population. (je sais qu'un tel échantillon est petit mais on me l'impose). Je précise également que la méthode d'échantillonnage est aléatoire simple.
Mon problème est le suivant : je pense tester différents n et comparer à la population (moyenne et écart type), mais le souci est que je ne trouve pas de test statistique adéquat car j'ai d'un coté un échantillon très petit, et de l'autre un très grand. J'ai beaucoup chercher sur internet mais la plupart du temps, les échantillons sont de tailles assez équivalentes et du coup je ne sais pas lequel est viable pour ce que je souhaite faire.
Merci d'avance
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Re: test pour voir si un échantillon représente une population
J'ai oublié de demander une autre chose :
J'ai vu qu'un test de Student était adapté aux petits échantillons mais qu'il était aussi fiable pour les grands échantillons (se rapproche d'un test Z).
Je me demande donc si je peux utiliser ce test pour comparer mon échantillon à ma population car la répartition est normale et les variances "égales".
Merci d'avance
J'ai vu qu'un test de Student était adapté aux petits échantillons mais qu'il était aussi fiable pour les grands échantillons (se rapproche d'un test Z).
Je me demande donc si je peux utiliser ce test pour comparer mon échantillon à ma population car la répartition est normale et les variances "égales".
Merci d'avance
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Re: test pour voir si un échantillon représente une population
Bonjour.
je ne vois pas trop l'intérêt de prendre un échantillon si tu disposes des valeurs de toute la population. mais pour savoir si un échantillon est proche en moyenne de la moyenne de la population (que tu connais), un test de comparaison de la moyenne à une valeur connue est utilisable.
En général, ce test utilise l'hypothèse que la répartition des valeurs dans la population est gaussienne; si tu ne peux pas l'assurer, avec 30 individus et une population ayant de nombreuses valeurs différentes, ce test est utilisable (la moyenne de l'échantillon de 30 suit approximativement une loi Normale).
On peut de même comparer les variances (mais je ne connais pas le test spécifique).
"je pense tester différents n " ?? Il y aura bien plus de variabilité due au choix de l'échantillon qu'au choix de la taille d'échantillon, tant qu'elle reste raisonnable (descendre en dessous de 20 nécessite d'être sûr que la population est quasiment gaussienne.
Cordialement.
NB : j'ai répondu, mais je ne comprend pas le sens statistique de la démarche.
je ne vois pas trop l'intérêt de prendre un échantillon si tu disposes des valeurs de toute la population. mais pour savoir si un échantillon est proche en moyenne de la moyenne de la population (que tu connais), un test de comparaison de la moyenne à une valeur connue est utilisable.
En général, ce test utilise l'hypothèse que la répartition des valeurs dans la population est gaussienne; si tu ne peux pas l'assurer, avec 30 individus et une population ayant de nombreuses valeurs différentes, ce test est utilisable (la moyenne de l'échantillon de 30 suit approximativement une loi Normale).
On peut de même comparer les variances (mais je ne connais pas le test spécifique).
"je pense tester différents n " ?? Il y aura bien plus de variabilité due au choix de l'échantillon qu'au choix de la taille d'échantillon, tant qu'elle reste raisonnable (descendre en dessous de 20 nécessite d'être sûr que la population est quasiment gaussienne.
Cordialement.
NB : j'ai répondu, mais je ne comprend pas le sens statistique de la démarche.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: test pour voir si un échantillon représente une population
Bonjour,
Merci beaucoup pour votre réponse.
Nous possédons en réalité toutes les valeurs seulement pour quelques points du parcours. Le but est donc de définir ce n pour pouvoir en déduire les vitesses de la population en tout point.
Je ne sais pas si mon explication est claire mais je l'espère...!
Du coup, le test de comparaison de moyenne reste valable?
Merci beaucoup
Merci beaucoup pour votre réponse.
Nous possédons en réalité toutes les valeurs seulement pour quelques points du parcours. Le but est donc de définir ce n pour pouvoir en déduire les vitesses de la population en tout point.
Je ne sais pas si mon explication est claire mais je l'espère...!
Du coup, le test de comparaison de moyenne reste valable?
Merci beaucoup
Dernière édition par Anna76 le Mer 16 Juil 2014 - 9:13, édité 1 fois
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Re: test pour voir si un échantillon représente une population
Alors ce n'est pas vraiment un problème de statistiques. Puisqu'il va falloir faire une extrapolation.
Donc tu voudrais avoir un ensemble de n individus qui représentent dans leur ensemble ce que fait l'ensemble de la population. Avec n le plus petit possible.
Si tu disposes d'une typologie des comportements des conducteurs, tu peux essayer de trouver des conducteurs qui sont de chacun des types (plusieurs par type) et utiliser ensuite des méthodes de quotas.
Si tu ne sais rien, la méthode habituelle est de choisir (au hasard) un échantillon pas trop petit (une trentaine est souvent la bonne idée) et de le supposer "représentatif". On peut évidemment tester avant de lancer l'expérience que ce groupe n'est pas trop particulier, en calculant, pour les données connues, la moyenne et l'écart type. Si ces valeurs ne sont pas dans les intervalles de confiance à 95% calculés à partir des données, il vaut mieux refaire un autre choix au hasard (il suffit d'un ou deux individus particuliers pour fausser les résultats sur un groupe aussi réduit).
Attention, si tu fais le test pour plusieurs points du parcours, tu augmentes vite la probabilité que pour au moins un point, on ne soit pas dans l'intervalle de confiance (d'autant qu'il y a deux tests, un sur la moyenne, l'autre sur l'écart type : Pour 4 points, ça fait 8 tests, le risque est passé de 10% à 34%).
Cordialement.
Donc tu voudrais avoir un ensemble de n individus qui représentent dans leur ensemble ce que fait l'ensemble de la population. Avec n le plus petit possible.
Si tu disposes d'une typologie des comportements des conducteurs, tu peux essayer de trouver des conducteurs qui sont de chacun des types (plusieurs par type) et utiliser ensuite des méthodes de quotas.
Si tu ne sais rien, la méthode habituelle est de choisir (au hasard) un échantillon pas trop petit (une trentaine est souvent la bonne idée) et de le supposer "représentatif". On peut évidemment tester avant de lancer l'expérience que ce groupe n'est pas trop particulier, en calculant, pour les données connues, la moyenne et l'écart type. Si ces valeurs ne sont pas dans les intervalles de confiance à 95% calculés à partir des données, il vaut mieux refaire un autre choix au hasard (il suffit d'un ou deux individus particuliers pour fausser les résultats sur un groupe aussi réduit).
Attention, si tu fais le test pour plusieurs points du parcours, tu augmentes vite la probabilité que pour au moins un point, on ne soit pas dans l'intervalle de confiance (d'autant qu'il y a deux tests, un sur la moyenne, l'autre sur l'écart type : Pour 4 points, ça fait 8 tests, le risque est passé de 10% à 34%).
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: test pour voir si un échantillon représente une population
Merci beaucoup pour votre réponse!
Effectivement c'est cela que je souhaite faire. Je ne sais rien sur les conducteurs je choisirai donc au hasard.
Pour tester justement la moyenne et l'écart type, il faut que j'utilise " les intervalles de confiance à 95% " :
j'ai trouvé la formule suivante ic =1,96*ecart-type/racine(n) (n étant le nombre total de ma population : ici 37000).
Donc si j'ai bien compris : pour tester la moyenne il suffit de faire ce calcul pour la population et vérifier si la moyenne de l'échantillon appartient à l'intervalle [m-ic;m+ic].
Mais en ce qui concerne l'écart type, comment puis je faire pour le tester? Un test F serait il approprié?
Merci pour la remarque de fin à laquelle je n'aurai pas pensé et encore merci pour l'aide que vous m'apportez!
Effectivement c'est cela que je souhaite faire. Je ne sais rien sur les conducteurs je choisirai donc au hasard.
Pour tester justement la moyenne et l'écart type, il faut que j'utilise " les intervalles de confiance à 95% " :
j'ai trouvé la formule suivante ic =1,96*ecart-type/racine(n) (n étant le nombre total de ma population : ici 37000).
Donc si j'ai bien compris : pour tester la moyenne il suffit de faire ce calcul pour la population et vérifier si la moyenne de l'échantillon appartient à l'intervalle [m-ic;m+ic].
Mais en ce qui concerne l'écart type, comment puis je faire pour le tester? Un test F serait il approprié?
Merci pour la remarque de fin à laquelle je n'aurai pas pensé et encore merci pour l'aide que vous m'apportez!
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Re: test pour voir si un échantillon représente une population
Autant pour moi je n'avais pas compris les intervalles de confiance. Il faut en fait l'appliquer à un échantillon. Si je prends un échantillon avec n = 30 dans une population de moyenne m, d'écart type 9.68, j'obtient ic = 1.96*9.68/racine(30)=3,46.
On en déduit donc que l'on a 95% de chance que, la moyenne de la population soit comprise entre [m-3.46;m+3.46] si je prends cet échantillon en particulier (ou si je prends juste n=30?)
Une des conclusions est elle bonne? Car j'ai eu un peu de mal à comprendre et j'aimerais bien être sûre...
Je ne dois pas vraiment tout saisir car je ne vois pas trop l'intérêt de cet intervalle étant donné que je connais déjà la moyenne de ma population... Pouvez vous m'éclairer à ce sujet?
merci d'avance !
On en déduit donc que l'on a 95% de chance que, la moyenne de la population soit comprise entre [m-3.46;m+3.46] si je prends cet échantillon en particulier (ou si je prends juste n=30?)
Une des conclusions est elle bonne? Car j'ai eu un peu de mal à comprendre et j'aimerais bien être sûre...
Je ne dois pas vraiment tout saisir car je ne vois pas trop l'intérêt de cet intervalle étant donné que je connais déjà la moyenne de ma population... Pouvez vous m'éclairer à ce sujet?
merci d'avance !
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Re: test pour voir si un échantillon représente une population
Bonjour.
Connaissant la moyenne et l'écart type de la population, tu peux trouver un intervalle de confiance sur la moyenne d'un échantillon pris au hasard (voir un cours de statistique). Si la moyenne de l'échantillon que tu as choisi n'est pas dans cet intervalle de confiance, on peut penser qu'il est un peu "particulier", et le rejeter, puis en prendre un autre.
Pour un intervalle de confiance à 95%, la bonne formule (c'est un intervalle, pas un nombre) est
ic =[m-1,96*ecart-type/racine(n);m+1,96*ecart-type/racine(n)]
où m est la moyenne de la population, et ecart-type est son écart type.
Cordialement.
Connaissant la moyenne et l'écart type de la population, tu peux trouver un intervalle de confiance sur la moyenne d'un échantillon pris au hasard (voir un cours de statistique). Si la moyenne de l'échantillon que tu as choisi n'est pas dans cet intervalle de confiance, on peut penser qu'il est un peu "particulier", et le rejeter, puis en prendre un autre.
Pour un intervalle de confiance à 95%, la bonne formule (c'est un intervalle, pas un nombre) est
ic =[m-1,96*ecart-type/racine(n);m+1,96*ecart-type/racine(n)]
où m est la moyenne de la population, et ecart-type est son écart type.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: test pour voir si un échantillon représente une population
Bonjour,
Une fois de plus merci d'avoir pris le temps de me répondre.
Je pense avoir compris. Il me reste à mettre en application!
Cordialement.
Une fois de plus merci d'avoir pris le temps de me répondre.
Je pense avoir compris. Il me reste à mettre en application!
Cordialement.
Anna76- Nombre de messages : 14
Date d'inscription : 04/07/2014
Sujets similaires
» Calcul de la taille d'un échantillon requis pour un test
» Quel test statistique pour ce petit échantillon?
» Quel test pour différences au sein d'un seul échantillon
» Représentativité d'un échantillon dans une population
» comparaison échantillon par rapport à une population
» Quel test statistique pour ce petit échantillon?
» Quel test pour différences au sein d'un seul échantillon
» Représentativité d'un échantillon dans une population
» comparaison échantillon par rapport à une population
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|