Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Test exact de Fisher
4 participants
Page 1 sur 1
Test exact de Fisher
Bonjour,
Je souhaite utiliser un test exact de Fisher pour tester l'indépendance entre deux variables qualitatives (type de modèle (3 possibilités) et classe de distance (4 possibilités)). J'ai donc une table de contingence plus grande que 2x2 et des observations inférieures à 5, raison pour laquelle je n'utilise pas un test du Chi². J'obtiens pour ce test de Fisher une p-value de 0,560 qui ne rejette donc pas l'hypothèse nulle d'indépendance. En pensant que c'était peut être dû à la faible taille d'échantillon, l'idée m'est venue de multiplier toutes les observations par un facteur 10. Et là, p-value < 0,0001. Je pensais que ça ne changerait rien, vu que je multiplie toutes les observations par un même facteur. Je ne comprends pas d'où peut venir ce phénomène, je crois qu'il me manque un fondement théorique.
Merci d'avance pour votre aide !
Dist 1Dist 2Dist 3Dist 4
Modèle 1 9 9 10 5
Modèle 2 5 8 6 8
Modèle 3 6 3 4 7
VS
Dist 1Dist 2Dist 3Dist 4
Modèle 1 90 90 100 50
Modèle 2 50 80 60 80
Modèle 3 60 30 40 70
Je souhaite utiliser un test exact de Fisher pour tester l'indépendance entre deux variables qualitatives (type de modèle (3 possibilités) et classe de distance (4 possibilités)). J'ai donc une table de contingence plus grande que 2x2 et des observations inférieures à 5, raison pour laquelle je n'utilise pas un test du Chi². J'obtiens pour ce test de Fisher une p-value de 0,560 qui ne rejette donc pas l'hypothèse nulle d'indépendance. En pensant que c'était peut être dû à la faible taille d'échantillon, l'idée m'est venue de multiplier toutes les observations par un facteur 10. Et là, p-value < 0,0001. Je pensais que ça ne changerait rien, vu que je multiplie toutes les observations par un même facteur. Je ne comprends pas d'où peut venir ce phénomène, je crois qu'il me manque un fondement théorique.
Merci d'avance pour votre aide !
Dist 1Dist 2Dist 3Dist 4
Modèle 1 9 9 10 5
Modèle 2 5 8 6 8
Modèle 3 6 3 4 7
VS
Dist 1Dist 2Dist 3Dist 4
Modèle 1 90 90 100 50
Modèle 2 50 80 60 80
Modèle 3 60 30 40 70
RoxB- Nombre de messages : 1
Date d'inscription : 21/05/2016
Re: Test exact de Fisher
Bonjour.
Prenons un cas simple : dans une population de grande taille, répartie en deux classes A et B, on tire un échantillon, qui donne pour les deux classes les effectifs 3 et 5. Sont-elles d'effectif nettement différent, ou bien peut-on facilement obtenir au hasard ces réalisations avec deux classes de même effectif global ?
Question simple, on tire 8 fois des individus avec la probabilité 1/2 d'en obtenir un de A. Le nombre des individus de A tirés suit la loi binomiale B(8,1/2); la probabilité d'en avoir 3 est forte : 21,9%. Il est normale qu'un test de Fischer ne rejette pas l'hypothèse.
Maintenant, si on a tiré 800 individus et que 300 sont dans A, la loi est B(800,1/2), approximable par la loi Normale de moyenne 400 et d'écart type racine(200) soit environ 14. 300 est à 7 écarts tgypes de la moyenne, donc la situation est dans les improbables.
Eh oui, dans ces questions où le fréquences interviennent, directement ou pas, les tailles d'échantillons sont primordiales.
Cordialement.
Prenons un cas simple : dans une population de grande taille, répartie en deux classes A et B, on tire un échantillon, qui donne pour les deux classes les effectifs 3 et 5. Sont-elles d'effectif nettement différent, ou bien peut-on facilement obtenir au hasard ces réalisations avec deux classes de même effectif global ?
Question simple, on tire 8 fois des individus avec la probabilité 1/2 d'en obtenir un de A. Le nombre des individus de A tirés suit la loi binomiale B(8,1/2); la probabilité d'en avoir 3 est forte : 21,9%. Il est normale qu'un test de Fischer ne rejette pas l'hypothèse.
Maintenant, si on a tiré 800 individus et que 300 sont dans A, la loi est B(800,1/2), approximable par la loi Normale de moyenne 400 et d'écart type racine(200) soit environ 14. 300 est à 7 écarts tgypes de la moyenne, donc la situation est dans les improbables.
Eh oui, dans ces questions où le fréquences interviennent, directement ou pas, les tailles d'échantillons sont primordiales.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Test exact de Fisher
Plus techniquement, le test ici n'est pas un test t (par exemple) mais un Chi2 (que le test soit un test exact ou non). Il faut voir ce chi2 comme un moyen de mesurer la distance entre la table observée et la table attendue s'il y avait totale indépendance entre les deux variables. Cette distance (dite du Chi2) n'est pas une distance euclidienne (comme celle qu'on peut mesurer avec un double-décimètre), parce qu'elle est - justement - pondérée par les effectifs. Du coup, on ne trouve absolument pas les mêmes distances si on multiplie préalablement les valeurs par une constante (alors que ceci ne changerait rien, effectivement et intuitivement, si la distance étant simplement euclidienne, comme la distance exprimée avec un double-décimètre).
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Test exact de Fisher
Eric Wajnberg a écrit:Plus techniquement, le test ici n'est pas un test t (par exemple)
Mais pour un test-t l'effectif rentre bien en compte dans le test il me semble, ce qui augmente la puissance du test?
Eric Wajnberg a écrit:mais un Chi2 (que le test soit un test exact ou non)
Même le test exact de Fisher?
De mémoire la p-value du test de Fisher correspond à une somme de proba de loi hypergéométrique... il n'y a pas de notion de distance du chi2?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Test exact de Fisher
Ok, je n'ai pas été assez précis. Vos remarques sont pertinentes, je précise ce que je voulais dire :
Merci de m'avoir forcé à préciser.
Eric.
Oui ! Je voulais dire multiplier toutes les valeurs par une constante (c'est ainsi que la question initiale a été posée). Ceci ne change rien dans un test t (par exemple) or ca change dans un chi2, justement car dans ce dernier cas ca change les effectifs. Ma réponse n'était pas claire, j'espère qu'elle l'est davantage à présent.niaboc a écrit:Eric Wajnberg a écrit:Plus techniquement, le test ici n'est pas un test t (par exemple)
Mais pour un test-t l'effectif rentre bien en compte dans le test il me semble, ce qui augmente la puissance du test?
Un test exact de Fisher passe par l'énumération de toutes les tables possibles, et ca revient donc au même que pour une distance de Chi2 car l'augmentation des effectifs augmente le nombre de tables à énumérer. Ici aussi, je n'avais pas été assez clair.niaboc a écrit:Eric Wajnberg a écrit:mais un Chi2 (que le test soit un test exact ou non)
Même le test exact de Fisher?
De mémoire la p-value du test de Fisher correspond à une somme de proba de loi hypergéométrique... il n'y a pas de notion de distance du chi2?
Merci de m'avoir forcé à préciser.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum