Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Pertinence de ma méthode d'échantillonnage
2 participants
Page 1 sur 1
Pertinence de ma méthode d'échantillonnage
Bonjour,
Je fais une étude sur une population d'environ 1500 individus. Cette population représente la population totale de l'objet de mon étude. Ces individus sont classés en fonction de leur sexe et du groupe dans lequel ils sont identifiés. J'ai 9 groupes qui ont des effectifs très variables (entre 2 et 700 selon le groupe). Certains ont plus de femmes, d'autres n'ont que des garçons mais j'ai une visibilité sur toutes ces données. J'ai aussi environ 300 personnes (soit 20%) qui ne sont dans aucun groupe (non-réponse) mais qu'on peut identifier par leur sexe quand même.
Je cherche à échantillonner cette population de façon à connaitre quelle est la probabilité de... :
- quand on est dans le groupe 1 et qu'on est un garçon
- quand on est dans le groupe 2 et qu'on est une fille
- quand on est dans le groupe 4
etc...
Il me semble logique de faire un échantillon par strates mais avec cette méthode, mon groupe 5 (qui n'a que 2 personnes et représente 0,1% de la population mère) me renvoie 0 personne de ce groupe dans mon échantillon, mon échantillon n'est donc pas entièrement représentatif. Je ne sais pas comment procéder alors. De plus, certains sont surreprésentés puisque leur groupe a un plus grand nombre de personnes. Est-il plus pertinent de faire un échantillonnage avec tirage aléatoire sans remise puisque j'ai une liste de toute la population ?
J'ai fait un test avec 300 individus mais il a été déterminé un peu au hasard (=20% de ma population), je ne sais pas si ce chiffre est pertinent ou non.
Merci à tous ceux et celles qui pourront m'apporter des éclaircissements
Je fais une étude sur une population d'environ 1500 individus. Cette population représente la population totale de l'objet de mon étude. Ces individus sont classés en fonction de leur sexe et du groupe dans lequel ils sont identifiés. J'ai 9 groupes qui ont des effectifs très variables (entre 2 et 700 selon le groupe). Certains ont plus de femmes, d'autres n'ont que des garçons mais j'ai une visibilité sur toutes ces données. J'ai aussi environ 300 personnes (soit 20%) qui ne sont dans aucun groupe (non-réponse) mais qu'on peut identifier par leur sexe quand même.
Je cherche à échantillonner cette population de façon à connaitre quelle est la probabilité de... :
- quand on est dans le groupe 1 et qu'on est un garçon
- quand on est dans le groupe 2 et qu'on est une fille
- quand on est dans le groupe 4
etc...
Il me semble logique de faire un échantillon par strates mais avec cette méthode, mon groupe 5 (qui n'a que 2 personnes et représente 0,1% de la population mère) me renvoie 0 personne de ce groupe dans mon échantillon, mon échantillon n'est donc pas entièrement représentatif. Je ne sais pas comment procéder alors. De plus, certains sont surreprésentés puisque leur groupe a un plus grand nombre de personnes. Est-il plus pertinent de faire un échantillonnage avec tirage aléatoire sans remise puisque j'ai une liste de toute la population ?
J'ai fait un test avec 300 individus mais il a été déterminé un peu au hasard (=20% de ma population), je ne sais pas si ce chiffre est pertinent ou non.
Merci à tous ceux et celles qui pourront m'apporter des éclaircissements
Serali- Nombre de messages : 3
Date d'inscription : 20/09/2012
Re: Pertinence de ma méthode d'échantillonnage
Bonjour.
Faire des statistiques sur un groupe de 2 semble assez limite, non ? Donc il conviendrait de sortir de l'enquête ce groupe, et éventuellement ceux de toute petit taille.
Que veut dire "j'ai une visibilité sur toutes ces données" ? Si tu as toutes les données, il n'y a plus besoin de sonder, seulement de traiter le fichier de données.
Sinon, un sondage sur 300 donne de bons résultats pour toutes les caractéristiques qui ne sont pas anecdotiques.
Cordialement
Faire des statistiques sur un groupe de 2 semble assez limite, non ? Donc il conviendrait de sortir de l'enquête ce groupe, et éventuellement ceux de toute petit taille.
Que veut dire "j'ai une visibilité sur toutes ces données" ? Si tu as toutes les données, il n'y a plus besoin de sonder, seulement de traiter le fichier de données.
Sinon, un sondage sur 300 donne de bons résultats pour toutes les caractéristiques qui ne sont pas anecdotiques.
Cordialement
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Pertinence de ma méthode d'échantillonnage
Bonjour gg,
Merci pour ta réponse. J'ai de la visibilité sur toutes ces données signifie que je suis capable de faire un tableau et de remplir les données précises pour chacun de mes groupes. Seulement je dois ensuite faire une recherche qualitative et donc aller chercher le dossier de toutes ces personnes pour analyser les données qui y sont contenues, il me faudra donc sélectionner un échantillon.
A partir de combien peut-on considérer qu'un groupe est de petite taille ? J'ai lu un minimum de 30 ? Car j'ai un groupe de 24 aussi.
Est-ce qu'un taux de non-réponses de 20% est considéré comme élevé pour tirer des conclusions ?
Merci !
Merci pour ta réponse. J'ai de la visibilité sur toutes ces données signifie que je suis capable de faire un tableau et de remplir les données précises pour chacun de mes groupes. Seulement je dois ensuite faire une recherche qualitative et donc aller chercher le dossier de toutes ces personnes pour analyser les données qui y sont contenues, il me faudra donc sélectionner un échantillon.
A partir de combien peut-on considérer qu'un groupe est de petite taille ? J'ai lu un minimum de 30 ? Car j'ai un groupe de 24 aussi.
Est-ce qu'un taux de non-réponses de 20% est considéré comme élevé pour tirer des conclusions ?
Merci !
Serali- Nombre de messages : 3
Date d'inscription : 20/09/2012
Re: Pertinence de ma méthode d'échantillonnage
La notion de "petite taille" est volontairement une notion floue (on ne voit pas ce qu'un individu de plus ou de moins peut changer). le minimum de 30 est classique dans certains tests où on veut utiliser l'approximation de la loi de la moyenne par une loi Normale. mais on travaille souvent avec des échantillons de taille inférieure.
Dans ton cas, le choix des groupes à garder est à faire en mettant en balance le travail pour récupérer les données de tout le groupe (rapide si les dossiers sont déjà rangés par groupe) avec la connaissance qu'on aura dans un échantillonnage (si on prend 20% dans l'échantillon, pour un groupe de 20 on aura aux environs de 4 sujets, ce qui fait qu'on n'en tirera pas grand chose !).
Pour le taux de non réponses, ça dépend tellement des situations que je n'en dirai rien. Par contre, ça influe fortement sur ce qu'on peut déduire pour l'ensemble ! par exemple ta classe de 2 est peut-être en réalité de 302, car quasiment tous les gens de cette classe n'ont pas voulu répondre.
Cordialement.
Dans ton cas, le choix des groupes à garder est à faire en mettant en balance le travail pour récupérer les données de tout le groupe (rapide si les dossiers sont déjà rangés par groupe) avec la connaissance qu'on aura dans un échantillonnage (si on prend 20% dans l'échantillon, pour un groupe de 20 on aura aux environs de 4 sujets, ce qui fait qu'on n'en tirera pas grand chose !).
Pour le taux de non réponses, ça dépend tellement des situations que je n'en dirai rien. Par contre, ça influe fortement sur ce qu'on peut déduire pour l'ensemble ! par exemple ta classe de 2 est peut-être en réalité de 302, car quasiment tous les gens de cette classe n'ont pas voulu répondre.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|