Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment :
WD Green SN350 – Disque SSD interne NVMe M.2 ...
Voir le deal
99.99 €

Comparaison de deux échantillons liés

2 participants

Aller en bas

Comparaison de deux échantillons liés Empty Comparaison de deux échantillons liés

Message par Vaillant Dim 4 Sep 2011 - 14:29

Bonjour,

Je suis en train de rédiger ma thèse de médecine (précision justifiant donc que je ne suis pas un statisticien de métier) et j'essaye de savoir si il y a une différence significative entre mon échantillon national et mon échantillon local (qui est un sous-ensemble du précédent) pour plusieurs questions.

En pratique, j'ai fait une étude avec 1938 répondants au niveau national dont 82 de la ville de Nice.
Pour la question, où habitez-vous ? 1428 internes ont répondu "en zone urbaine" soit 73,7 % de mon échantillon national. Pour Nice, 55 des 82 répondants ont répondu la même chose soit 91,5 % de mon échantillon local.

Je voudrais donc savoir si ces données sont significativement différentes où si je ne peux exclure que ce ne soit que le hasard. Je rappelle que mon échantillon local est un sous ensemble du national ce qui participe en plus de mes lacunes de base à une céphalée majeure et persistante.

Merci par avance pour votre réponse !

Vaillant

Vaillant

Nombre de messages : 3
Date d'inscription : 04/09/2011

Revenir en haut Aller en bas

Comparaison de deux échantillons liés Empty Re: Comparaison de deux échantillons liés

Message par gg Dim 4 Sep 2011 - 16:45

Bonjour.

Il y a deux façons de traiter ton problème :
* Soit considérer que ton échantillon est biaisé (très naturellement, puisqu'il s'agit d'une sous-classe, celle des "niçois"). Et de se poser la question "sur quel domaine est-il représentatif ? (*)
* Soit considérer qu'il est effectivement comparable à l'échantillon global. Je vais utiliser cette hypothèse (que je ne peux justifier, je ne sais rien des conditions de recueil des données !) :
En prenant comme modèle la situation nationale (réponse "zone urbaine" dans 73,7 % des cas), le nombre de réponse "zône urbaine" dans un échantillon au hasard de 82 individus suit la loi Binomiale B(82;0,737). En utilisant l'approximation Normale (moyenne 60,434, écart type 3,987), on obtient un intervalle de confiance à 95% égal à [52.46;68,408].
Comme 55 est dans cet intervalle, on admet que l'échantillon ne se distingue pas de la situation nationale. par contre, si c'est 91.5% des 82 individus, soit 75 individus qu'il aurait fallu lire, alors il est improbable que cette situation soit le fait d'une règle globale applicable à cette partie de l'échantillon (**)

Cordialement.

(*) Je suppose implicitement que ton échantillon global est représentatif. C'est à dire tiré au hasard (éventuellement par une méthode de quotas) dans la population globale.
(**) La situation nationale étant probablement une moyenne des situations locales diverses, il est tout à fait logique d'aboutir dans de nombreux cas à cette situation.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Comparaison de deux échantillons liés Empty Re: Comparaison de deux échantillons liés

Message par Vaillant Dim 4 Sep 2011 - 17:51

Merci beaucoup pour la rapidité de la réponse !

C'était en effet 75 individus qu'il fallait lire. Par contre, je n'ai pas compris comment tu avais calculé l'intervalle de confiance !
En effet, j'ai plusieurs questions où j'aimerais faire ces calculs et autant j'ai réussi à reproduire l'approximation normale, autant je retrouve un IC beaucoup serré que le tien.

Merci encore !

Vaillant

Nombre de messages : 3
Date d'inscription : 04/09/2011

Revenir en haut Aller en bas

Comparaison de deux échantillons liés Empty Re: Comparaison de deux échantillons liés

Message par gg Dim 4 Sep 2011 - 18:18

C'est la formule habituelle :
Pour une loi normale de moyenne m et d'écart type s, 95% des valeurs sont dans l'intervalle [m-2s;m+2s].
Ici, la moyenne est 82*0,737, la variance 82*0,737*(1-0,737) proche de 16, donc l'écart type vaut environ 4. 60,4-8 = 52,4 et 60,4+8 = 68,4.

Cordialement.

NB : N'aurais-tu pas utilisé une formule sur l'intervalle de confiance sur la moyenne, qui n'est pas de mise ici ?

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Comparaison de deux échantillons liés Empty Re: Comparaison de deux échantillons liés

Message par Vaillant Dim 4 Sep 2011 - 20:18

Merci et si j'avais utilisé l'IC sur la moyenne, ce qui du coup donnait des IC beaucoup plus proche.

Très cordialement !

Vaillant

Nombre de messages : 3
Date d'inscription : 04/09/2011

Revenir en haut Aller en bas

Comparaison de deux échantillons liés Empty Re: Comparaison de deux échantillons liés

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum