Comparaison de deux proportions - tableau de contingence

par A.D. Lun 6 Juin 2011 - 13:48

Bonjour à tous,

Comme je l'avais expliqué dans un précédent message (ici pour ceux que ça intéresse), je travaille sur des tableaux de contingence de deux variables qualitatives et je cherche à réaliser des tests statistiques qui me permettent de tester si la différence entre deux "cases" d'une même ligne de mon tableau est significative.

Voici un exemple de tableau utilisé :

	A	O	Y	Tot
E	10	4	9	23
N	6	12	6	24
S	4	12	12	28
W	7	7	11	25
Tot	27	35	38	100

Je vais par exemple chercher à tester si la différence entre les proportions associées aux combinaisons E-A et E-O (première ligne du tableau, deux premières colonnes) est significative.

Pour cela, j'ai trouvé dans un document (dont j'ai malheureusement perdu la référence ... Embarassed

), la méthode suivante :

On calcule les proportions p1 et p2 comme suit :

p1 = effectif (E-A) / effectif total = 10 / 100 = 0.1
p2 = effectif (E-O) / effectif total = 4 / 100 = 0.04

La proportion "globale" p :

p = effectif (E) / effectif total = 23 / 100 = 0.23

On a alors : p1 - p2 qui suit une loi normale de moyenne 0 et d'écart-type sigma = sqrt [ p (1-p) ( (1/N1) + (1/N2) ) ].
Avec :

N1 : effectif (A) = 27
N2 : effectif (O) = 35

Ensuite, si : | p1 - p2 | > 2 * sigma , alors au risque 5% on rejettera l'hypothèse H0 : "Il n'y a pas de différence significative entre les proportions p1 et p2".

Ici, on a : | p1 - p2 | = 0.06 < 2 * sigma = 0.11 donc on ne peut pas rejeter H0.

Voilà, j'espère que c'est assez claire, et veuillez m'excuser pour la présentation médiocre, je suis limitée par les possibilités de traitement de texte du forum...

Donc, ma question est la suivante : j'aimerais avoir plus d'explications sur la manière dont est mené ce test. En effet, si je souhaite un risque de 1% au lieu de 5%, comment est-ce que je dois procéder (est-ce que le chiffre 2 dans le "2 * sigma" correspond en fait au 1.96 de la table de la loi normale centrée réduite pour un alpha de 5%?)? De plus, ce test a-t-il un nom particulier? Vous parait-il correct statistiquement parlant?

Je vous remercie par avance pour tout eclaircissement sur le sujet car j'avoue bien peiner à trouver l'information que je recherche...

[EDIT] : Après réflexion, mon exemple n'est pas très bien choisi car le test du Khi-deux "général" (ie. sur l'ensemble du tableau) est non significatif (à 1%, 5% ...), donc il n'y a pas lieu d'effectuer les tests sur chacune des cases, mais disons que c'était simplement pour contextualiser un peu mon problème. Désolée Embarassed

Cordialement,

A.D.

par leaticia Sam 11 Juin 2011 - 12:47

Bonjour,
j'effectue le même travail sur un tableau de contingence a trois dim, mais je n'ai fait qu'une analyse visuelles par ligne, je ne connais pas vraiment ce test mais pour le risque il me semble bien que 2*sigma correspond au 5%... seulement pourriez vous donné plus de détails, je vois bien que vs avez perdu les références...,mais un indice serai le bienvenu
Bon courage pour la suite et si vous avez déjà trouvé réponse a votre question merci de nous la faire parvenir :-)

Leaticia.

par gg Sam 11 Juin 2011 - 19:31

Bonsoir.

Merci d'avoir "exemplifié" ce que tu disais dans tes messages précédents. la méthode utilisée est une classique comparaison de moyennes (les proportions sont des moyennes; la proportion de E-A est la moyenne de la variable de Bernoulli qui vaut 1 si l'individu est dans la classe E6A et 0 sinon). Ces tests supposent des hypothèses fortes sur les variables utilisées : Normalité, ou à défaut, échantillon de grande taille. On retrouve ces hypothèses dans "p1 - p2 qui suit une loi normale de moyenne 0 et d'écart-type ...".
Or ici, les variables ne sont pas Normales (une variable qui n'a que deux valeur n'est pas continue), et l'utilisation de la grande taille des échantillons nécessite des classes de l'ordre de la centaine d'individu (par case du tableau, pas au total).
Sous cette condition, le test est proche du classique t-test (ou test de Fischer, ou test de Student), et le 2 est bien l'approximation du 1,96 de la loi Normale. Pour 1% on le remplacerait par 2,6.
Mais on a un peu trafiqué le test classique en supposant que la proportion de référence est celle de l'ensemble de la classe E. Or comme c'est une hypothèse majeure, il serait plus sain de vérifier quelles cases sont en accord avec cette hypothèse : Dans l'exemple, E-A a pour fréquence relative10/27=37% qui est très supérieur à 23% et E-O a pour fréquence 4/35=11,4% qui est très inférieur à 23%. J'ai bien évidemment fait les comparaisons de fréquences relativement à la marge du bas, puisqu'on travaille dans une ligne.

En bilan : Le test (sous réserve d'effectifs très élèves) compare bien les cases d'une même ligne. Mais qu'en déduire ? Je ne sais pas trop : Si une case a un effectif un peu fort, il est logique qu'au moins une des autres ait un effectif plus faible. Et il utilise en fait une hypothèse différente de celle testée.

Je suis dubitatif !

Cordialement.

par A.D. Lun 13 Juin 2011 - 8:51

Bonjour,

Tout d'abord, merci gg pour votre réponse, cela m'a quelque peu éclairci les idées.
D'ailleurs j'ai même retrouvé la référence du document dans lequel j'avais vu exposé cette méthode, il s'agit de "La procédure FREQ de SAS - Test d'indépendance et mesures d'association dans un tableau de contingence", par Josiane CONFAIS, Yvette GRELET et Monique LE GUEN.

Dans l'exemple utilisé dans ce document, le nombre minimum d'individu par "case" du tableau de contingence semble être de l'ordre de 40/50. Dans les cas que je suis amenée à traiter, il peut être beaucoup plus petit malheureusement...
Mon "objectif" est de reproduire sous R ce qui est fait avec un autre logiciel de tabulation en ce qui concerne les tableaux de contingence, or ce logiciel fourni les résultats d'un tel test et je me demandais donc comment il était réalisé.

Cordialement,

A.D.

par Contenu sponsorisé

Comparaison de deux proportions - tableau de contingence

Comparaison de deux proportions - tableau de contingence

Re: Comparaison de deux proportions - tableau de contingence

Re: Comparaison de deux proportions - tableau de contingence

Re: Comparaison de deux proportions - tableau de contingence

Re: Comparaison de deux proportions - tableau de contingence