Test exact de Fisher

par RoxB Sam 21 Mai 2016 - 7:55

Bonjour,

Je souhaite utiliser un test exact de Fisher pour tester l'indépendance entre deux variables qualitatives (type de modèle (3 possibilités) et classe de distance (4 possibilités)). J'ai donc une table de contingence plus grande que 2x2 et des observations inférieures à 5, raison pour laquelle je n'utilise pas un test du Chi². J'obtiens pour ce test de Fisher une p-value de 0,560 qui ne rejette donc pas l'hypothèse nulle d'indépendance. En pensant que c'était peut être dû à la faible taille d'échantillon, l'idée m'est venue de multiplier toutes les observations par un facteur 10. Et là, p-value < 0,0001. Je pensais que ça ne changerait rien, vu que je multiplie toutes les observations par un même facteur. Je ne comprends pas d'où peut venir ce phénomène, je crois qu'il me manque un fondement théorique.

Merci d'avance pour votre aide !

Dist 1Dist 2Dist 3Dist 4
Modèle 1 9 9 10 5
Modèle 2 5 8 6 8
Modèle 3 6 3 4 7

VS

Dist 1Dist 2Dist 3Dist 4
Modèle 1 90 90 100 50
Modèle 2 50 80 60 80
Modèle 3 60 30 40 70

par gg Sam 21 Mai 2016 - 12:04

Bonjour.

Prenons un cas simple : dans une population de grande taille, répartie en deux classes A et B, on tire un échantillon, qui donne pour les deux classes les effectifs 3 et 5. Sont-elles d'effectif nettement différent, ou bien peut-on facilement obtenir au hasard ces réalisations avec deux classes de même effectif global ?
Question simple, on tire 8 fois des individus avec la probabilité 1/2 d'en obtenir un de A. Le nombre des individus de A tirés suit la loi binomiale B(8,1/2); la probabilité d'en avoir 3 est forte : 21,9%. Il est normale qu'un test de Fischer ne rejette pas l'hypothèse.
Maintenant, si on a tiré 800 individus et que 300 sont dans A, la loi est B(800,1/2), approximable par la loi Normale de moyenne 400 et d'écart type racine(200) soit environ 14. 300 est à 7 écarts tgypes de la moyenne, donc la situation est dans les improbables.

Eh oui, dans ces questions où le fréquences interviennent, directement ou pas, les tailles d'échantillons sont primordiales.

Cordialement.

par Eric Wajnberg Lun 23 Mai 2016 - 12:50

Plus techniquement, le test ici n'est pas un test t (par exemple) mais un Chi2 (que le test soit un test exact ou non). Il faut voir ce chi2 comme un moyen de mesurer la distance entre la table observée et la table attendue s'il y avait totale indépendance entre les deux variables. Cette distance (dite du Chi2) n'est pas une distance euclidienne (comme celle qu'on peut mesurer avec un double-décimètre), parce qu'elle est - justement - pondérée par les effectifs. Du coup, on ne trouve absolument pas les mêmes distances si on multiplie préalablement les valeurs par une constante (alors que ceci ne changerait rien, effectivement et intuitivement, si la distance étant simplement euclidienne, comme la distance exprimée avec un double-décimètre).

HTH, Eric.

par niaboc Lun 23 Mai 2016 - 14:22

Eric Wajnberg a écrit:Plus techniquement, le test ici n'est pas un test t (par exemple)

Mais pour un test-t l'effectif rentre bien en compte dans le test il me semble, ce qui augmente la puissance du test?

Eric Wajnberg a écrit:mais un Chi2 (que le test soit un test exact ou non)

Même le test exact de Fisher?
De mémoire la p-value du test de Fisher correspond à une somme de proba de loi hypergéométrique... il n'y a pas de notion de distance du chi2?

par Eric Wajnberg Mar 24 Mai 2016 - 15:55

Ok, je n'ai pas été assez précis. Vos remarques sont pertinentes, je précise ce que je voulais dire :

niaboc a écrit:
Eric Wajnberg a écrit:Plus techniquement, le test ici n'est pas un test t (par exemple)

Mais pour un test-t l'effectif rentre bien en compte dans le test il me semble, ce qui augmente la puissance du test?

Oui ! Je voulais dire multiplier toutes les valeurs par une constante (c'est ainsi que la question initiale a été posée). Ceci ne change rien dans un test t (par exemple) or ca change dans un chi2, justement car dans ce dernier cas ca change les effectifs. Ma réponse n'était pas claire, j'espère qu'elle l'est davantage à présent.

niaboc a écrit:
Eric Wajnberg a écrit:mais un Chi2 (que le test soit un test exact ou non)

Même le test exact de Fisher?
De mémoire la p-value du test de Fisher correspond à une somme de proba de loi hypergéométrique... il n'y a pas de notion de distance du chi2?

Un test exact de Fisher passe par l'énumération de toutes les tables possibles, et ca revient donc au même que pour une distance de Chi2 car l'augmentation des effectifs augmente le nombre de tables à énumérer. Ici aussi, je n'avais pas été assez clair.

Merci de m'avoir forcé à préciser.

Eric.

par Contenu sponsorisé

Test exact de Fisher

Test exact de Fisher

Re: Test exact de Fisher

Re: Test exact de Fisher

Re: Test exact de Fisher

Re: Test exact de Fisher

Re: Test exact de Fisher