Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
sondage stratifié
3 participants
Page 1 sur 1
sondage stratifié
Bonjour a tous (desolé tout d'abord pour ce message qui est assez long)
Voici le theme de mon sujet : J'ai une base de donnée qui contient 50000 individus qui sont regroupés en 10 Branches et dans chaque Branche je dois effectuer un sondage stratifié (les limites des strates sont deja calculé et forcement le nombre de strate qui varie entre 2 et 4)
le tirage auquel je veux proceder est un tirage systématique dans chaque branche avec de probabilité de tirage qui différent d'une strate a une autre et cette différence est indépendante de la taille de tirage.
Pour ce tirage systématique je dois calculer le pas afin de proceder a une segmentation du cumul de la variable d'interet par exemple si ma strate contient 90 individus et que je dois en tirer 4 je fixe le premier qui est le plus important en terme de valeurs (j'ai trié mes données) et je tire les autres en fonction du pas.
bref j'aimeré bien une methode qui me permetterait de calculer les tailles d'échantillon nécessaire dans chaque strate afin d'avoir un échantillon représentatif (couvrir a peu pré 65% du totale de la variable d'interet de la population totale) sachant que le total de l'echantillon est fixé dans chaque branche .
merci d'avance
Voici le theme de mon sujet : J'ai une base de donnée qui contient 50000 individus qui sont regroupés en 10 Branches et dans chaque Branche je dois effectuer un sondage stratifié (les limites des strates sont deja calculé et forcement le nombre de strate qui varie entre 2 et 4)
le tirage auquel je veux proceder est un tirage systématique dans chaque branche avec de probabilité de tirage qui différent d'une strate a une autre et cette différence est indépendante de la taille de tirage.
Pour ce tirage systématique je dois calculer le pas afin de proceder a une segmentation du cumul de la variable d'interet par exemple si ma strate contient 90 individus et que je dois en tirer 4 je fixe le premier qui est le plus important en terme de valeurs (j'ai trié mes données) et je tire les autres en fonction du pas.
bref j'aimeré bien une methode qui me permetterait de calculer les tailles d'échantillon nécessaire dans chaque strate afin d'avoir un échantillon représentatif (couvrir a peu pré 65% du totale de la variable d'interet de la population totale) sachant que le total de l'echantillon est fixé dans chaque branche .
merci d'avance
hannibal- Nombre de messages : 3
Date d'inscription : 20/03/2010
Re: sondage stratifié
SI la question n'est pas claire ou vs voulez plus de précision faites le moi savoir merci
hannibal- Nombre de messages : 3
Date d'inscription : 20/03/2010
Re: sondage stratifié
Hello,
est ce que tu connais le nombre d'individu de chaque strate ? La variance de ta variable d'intérêt dans chaque strate ? Si oui, tu décides d'un niveau de précision (5% par exemple) et tu appliques l'allocation optimale de Neyman.
Regardes plus bas dans le forum il y a une réponse pour delphine85.
Bye
est ce que tu connais le nombre d'individu de chaque strate ? La variance de ta variable d'intérêt dans chaque strate ? Si oui, tu décides d'un niveau de précision (5% par exemple) et tu appliques l'allocation optimale de Neyman.
Regardes plus bas dans le forum il y a une réponse pour delphine85.
Bye
Rico- Nombre de messages : 13
Date d'inscription : 06/11/2007
Re: sondage stratifié
Merci de m'avoir repondu si vite effectivement ce que propose Neyman est assez interéssant et je suis tombé sur cette formule
nh=n*{(Nh*Sh)/(somme(Nh*Sh)}
somme allant de 1 à H=nombre de strate
avec
nh=taille de l'echantillon de la strate h
Nh=taille totale de la strate h
Sh la variance des individus pour chaque strate
J'ai trouvé cette formule interessante pour mon cas car elle ne prend pas en compte le cout budgétaire car j'en ai pas
et je l'ai appliqué sur excel avant de programmer sur R
elle me donne des resultats interessanant quand je l'applique sur une variable auxiliaire(j'ai pris comme variable auxiliaire le cumul de la variable d'interet sur lequel je compte effectuer le pas apres pour le tirage
mais le probleme est que le nombre d'individu qu'il affiche pour chaque strate depend surtout de la taille de la strate
par exemple pour la premiere strate qui contienT 4 individus il proppse comme taille d'echantillon 1 or jaimerai bien en prendre 3 ou méme la totalité car la strate 1 couvre le maximum de l'information dont j'ai besoin or pour la strate 4 qui contient 1227 individu il propose 32 indiv pour cette strate comme echantillon
(j'ai effectué le calcul sur une branche de toute la population et je fais le calcul pour 9 branches supplémentaires)
que faire pour augmenter la taille de l'echantillon de chaque strate en fonction de l'importance de chaque strate en terme de couverture par rapport a la population totale de la branche?y a t il un poids a calculer?ou..?
merci
nh=n*{(Nh*Sh)/(somme(Nh*Sh)}
somme allant de 1 à H=nombre de strate
avec
nh=taille de l'echantillon de la strate h
Nh=taille totale de la strate h
Sh la variance des individus pour chaque strate
J'ai trouvé cette formule interessante pour mon cas car elle ne prend pas en compte le cout budgétaire car j'en ai pas
et je l'ai appliqué sur excel avant de programmer sur R
elle me donne des resultats interessanant quand je l'applique sur une variable auxiliaire(j'ai pris comme variable auxiliaire le cumul de la variable d'interet sur lequel je compte effectuer le pas apres pour le tirage
mais le probleme est que le nombre d'individu qu'il affiche pour chaque strate depend surtout de la taille de la strate
par exemple pour la premiere strate qui contienT 4 individus il proppse comme taille d'echantillon 1 or jaimerai bien en prendre 3 ou méme la totalité car la strate 1 couvre le maximum de l'information dont j'ai besoin or pour la strate 4 qui contient 1227 individu il propose 32 indiv pour cette strate comme echantillon
(j'ai effectué le calcul sur une branche de toute la population et je fais le calcul pour 9 branches supplémentaires)
que faire pour augmenter la taille de l'echantillon de chaque strate en fonction de l'importance de chaque strate en terme de couverture par rapport a la population totale de la branche?y a t il un poids a calculer?ou..?
merci
hannibal- Nombre de messages : 3
Date d'inscription : 20/03/2010
Re: sondage stratifié
Je n'ai pas tout compris ...
La formule de Neyman est un point de départ.
Si elle te donne pour la strate 4 que l'optimum est de recruter 32 individus pour représenter 1227 il ne sert à rien d'en recruter plus.
Maintenant si tu juges pour n'importe qu'elle raison qu'il est important d'augmenter le nombre d'inidividu de l'échantillon ...FAIS LE
Enfin tu dois aussi penser à fusionner des strates ; une strate n'ayant que 4 individus à l'intérieur est suprenante ? Dois tu absolument conserver cette strate telle quelle ou pux tu la fusionner avec la strate la plus proche ? (a toi de définir le critère de proximité).
Enfin tu peux en parallele du nb total d'individus de l'échantillon donné par neyman le répartir proportionnellement et comparer les résultats.
BYE
La formule de Neyman est un point de départ.
Si elle te donne pour la strate 4 que l'optimum est de recruter 32 individus pour représenter 1227 il ne sert à rien d'en recruter plus.
Maintenant si tu juges pour n'importe qu'elle raison qu'il est important d'augmenter le nombre d'inidividu de l'échantillon ...FAIS LE
Enfin tu dois aussi penser à fusionner des strates ; une strate n'ayant que 4 individus à l'intérieur est suprenante ? Dois tu absolument conserver cette strate telle quelle ou pux tu la fusionner avec la strate la plus proche ? (a toi de définir le critère de proximité).
Enfin tu peux en parallele du nb total d'individus de l'échantillon donné par neyman le répartir proportionnellement et comparer les résultats.
BYE
Rico- Nombre de messages : 13
Date d'inscription : 06/11/2007
Re: sondage stratifié
slt
j'ai une question aussi à propos su sondage stratifié
au fait j'ai lu dans un document qu'on utilise la méthode de Neyman quand le phénomène étudié a une distribution très dissymétrique et on une utilise celle des allocation proportionnelle quand le phénomène a une distribution symétrique ,en posant cette question à mon prof elle m'a répondu après hésitation que symétrique veut dire que les tailles des strates sont soit grande ou petite et dissymétrique veut dire que les tailles sont très variées
donc est ce la bonne explication !!
merci
j'ai une question aussi à propos su sondage stratifié
au fait j'ai lu dans un document qu'on utilise la méthode de Neyman quand le phénomène étudié a une distribution très dissymétrique et on une utilise celle des allocation proportionnelle quand le phénomène a une distribution symétrique ,en posant cette question à mon prof elle m'a répondu après hésitation que symétrique veut dire que les tailles des strates sont soit grande ou petite et dissymétrique veut dire que les tailles sont très variées
donc est ce la bonne explication !!
merci
samsamo- Nombre de messages : 28
Age : 34
Localisation : algérie
Date d'inscription : 22/06/2009
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|