Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -43%
-100€ Pack rééquipement Philips Hue ...
Voir le deal
129.99 €

Surexpostition d'une tranche d'âge dans un échantillon

2 participants

Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Surexpostition d'une tranche d'âge dans un échantillon

Message par hello_moto Ven 22 Juil 2011 - 10:19

Bonjour à vous,

J'ai réalisé un questionnaire pour une partie de mon travail de fin d'étude. Le seul critère qui a guidé mon choix d'échantillon était l'âge, c'est à dire les personnes de 20 à 60 ans. J'ai procédé par un sondage via le web ou j'ai envoyé le questionnaire à des personnes dont je connaissais l'appartenance à cette tranche d'âge. Ces mêmes personnes ont ensuite fait suivre le questionnaires à d'autres appartenant également à la même tranche d'âge, ce qui constitue une méthode par boule de neige et donc j'ai en ma possession un échantillon de convenance.

Le professeur m'encadrant dans ce travail m'a demandé de comparer la composition de mon échantillon par rapport à la population générale en faisant des tests non paramétriques de Chi-Carré; dans le but de voir si il n'y a pas une surexposition d'une certaine tranche d'âge dans mon échantillon ( j'ai uniquement 2 tranches d'âge, 20-35 et 36-60).

Quelqu'un aurait une idée de la manière de procéder pour faire ce test? La conclusion de celui-ci me dira si la répartition de mon échantillon respecte la répartition de la population générale?


Un grand merci d'avance!

hello_moto

Nombre de messages : 4
Date d'inscription : 22/07/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par gg Ven 22 Juil 2011 - 13:38

Bonjour.

Il s'agit du test d'adéquation du Khi-deux, le test de base. Tu auras besoin d'avoir la répartition des 20-60 ans par tranche, qui te servira de modèle. Par exemple si dans les 20-60 ans il y a 40% de 20-35 ans, et que tu as un échantillon de 120 personnes dont 62 dans la classe 20-35, tu compareras les effectifs réels 62; 58 aux effectifs modèles 48;72 (48=40% de 120).
Tu peux aussi, si ton échantillon est d'au moins 30 dans chaque classe, pratiquer un test de comparaison de fréquence (comparer la fréquence des 20-35 ans de ton échantillon avec la fréquence dans la population française (40% dans mon exemple).

Par contre, ton échantillon est sans doute biaisé. mais tu en es conscient.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par hello_moto Ven 22 Juil 2011 - 17:37

Merci beaucoup!

J'ai encore juste besoin d'une petite précision si possible...

Pour donner toutes les informations, j'ai 240 réponses à mon enquête. 100 personnes faisant partie de la tranche 20-35 ans et 140 faisant partie de la tranche 36-60.

Faisant mes études en Belgique, la population totale des 20-35 est de 2 191 670 et celle des 36-60 de 3 128 184. 41% de 20-35 et 59% de 36-60 donc. J'ai donc des effectifs modèles de 41% de 240 = 98,4 pour les 20-35 et 59% de 240 = 141,6 pour les 35-60 ans.

Mais ensuite, ai-je besoin d'autres données ou bien en faisant le test dans SPSS j'aurais une valeur?
Bien que ma méthode d'échantillonnage implique un biais, est-ce possible de limiter ce biais au maximum ( en interrogeant d'autres personnes pour respecter encore plus la répartition par exemple?)

Encore merci pour votre aide!



hello_moto

Nombre de messages : 4
Date d'inscription : 22/07/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par gg Ven 22 Juil 2011 - 18:01

Avec ces données, tu peux facilement faire le test du khi-deux demandé, ou un test de comparaison de moyennes (la proportion est une moyenne : celle de la variable qui vaut 1 si l'individu est dans la classe, 0 sinon). En supposant que ton échantillon est bien pris au hasard.
Bien que ce ne soit pas nécessaire, les valeurs obtenue étant tellement proches des valeurs modèles. Le test du khi-deux comme la comparaison de moyennes montrent que ton échantillon ne diffère pas significativement de la population générale pour cette répartition d'âges. Il est même remarquablement proche !

Tu peux donc utiliser SPSS, si tu y tiens (c'est un gros outil pour aussi peu). Le vrai problème est que ton échantillon n'est pas biaisé pour la répartition, mais ça ne veut pas dire qu'il ne l'est pas pour d'autres questions que tu aurais posées aux gens. Si par exemple tu l'a fait passer par Internet, la réponse à la question "disposez-vous d'un ordinateur ?" est totalement biaisée. Le seul moyen d'avoir un échantillon non biaisé à priori est de tirer les personnes au hasard dans la population belge, en prenant 41% entre 20 et 35 ans et 59% entre 36 et 60 ans.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par hello_moto Ven 22 Juil 2011 - 20:29

Merci!

Je suis bien conscient que l'échantillon sera biaisé quoi qu'il arrive étant donné ma technique d’échantillonnage qui m'a mené à avoir en ma possession un échantillon de convenance.

Et c'est justement le fait d'avoir cette répartition d'âge proche qui me bloque pour réaliser le test du khi-deux...Ma licence SPSS ayant expiré, ce problème est résolu et je me suis donc réduit à utiliser excell. Cependant, étant donné que je ne dois pas comparer des observations à une moyenne par exemple, je ne perçois pas bien quelles données placer dans les composante de la fonction (plage_réelle; plage_attendue)...

Je continue de vous remercier pour votre aide précieuse!

hello_moto

Nombre de messages : 4
Date d'inscription : 22/07/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par gg Sam 23 Juil 2011 - 8:13

Bonjour.

Tu fais comme je l'ai fait hier pour voir ce que ça donne. Tu prends pour la plage réelle les deux cases contenant 100 et 140, et pour la plage attendue les deux cases contenant (même ordre) 98.4 et 141.6. la fonction TEST-KHI-DEUX (ou nom correspondant) donne la "p-value". Si tu fais le test au seuil de 5%, le test réussit (l'hypothèse d'adéquation n'est pas rejetée) si tu obtiens une valeur supérieure à 0,05. Or on obtient plus de 0,80 ! Donc aucune raison de rejeter l'idée que ta répartition est à peu près la même que celle de la population.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par hello_moto Sam 23 Juil 2011 - 16:24

C'est bien ce que je pensais, mais cette confirmation est la bienvenue!

Un très grand merci pour m'avoir aidé!

hello_moto

Nombre de messages : 4
Date d'inscription : 22/07/2011

Revenir en haut Aller en bas

Surexpostition d'une tranche d'âge dans un échantillon Empty Re: Surexpostition d'une tranche d'âge dans un échantillon

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum