Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Erwan Delaune
Problème de chi2 Vote_lcapProblème de chi2 Voting_barProblème de chi2 Vote_rcap 
Eric Wajnberg
Problème de chi2 Vote_lcapProblème de chi2 Voting_barProblème de chi2 Vote_rcap 

Le Deal du moment : -56%
Trottinette électrique pliable – GO RIDE ...
Voir le deal
110 €

Problème de chi2

Aller en bas

Problème de chi2 Empty Problème de chi2

Message par preliator le Lun 25 Mai 2020 - 19:15

Bonjour, 

Je réalise un travail que je trouve passionnant !

Je dispose d'une base de données catégorielles répertoriant :
- Un état de santé mental (Très mal / Mal / Bien / Très bien) nommée "Etat_sante_mental"
- Un situation géographique du lieu de domicile (Campagne / Ville) nommée "Lieu"

Ma question est : Existe t-il une relation entre l'état de santé mentale et la situation géographique du lieu de domicile ?

Pour cela, j'utilise le test du Chi2 :

Code:
> chisq.test(data$etat_sante_mental, data$lieu, correct = FALSE)

 Pearson's Chi-squared test

data:  data$etat_sante_mental_bin and data$lieu
X-squared = 15.08, df = 3, p-value = 0.00175

Mon résultat est significatif, je rejette donc l'hypothèse d'indépendance. Jusque là, je pense avoir bien appris ma leçon Smile


Là où ça devient un peu plus compliqué pour moi, c'est en regardant un pdf sur internet qui propose de pousser l'analyse plus loin. On peut déterminer quelles modalités possèdent un caractère attractif (résidus positif) ou un caractère répulsif (résidus négatif) par rapport à une autre modalité.

Pour l'exemple, je crée mon tableau de contingence :
Code:
> khi2$observed
                          data$lieu
data$etat_sante_mental_bin A la campagne En ville
               1-TRES MAL             18        5
               2-MAL                  12        4
               3-BIEN                 62       32
               4-TRES BIEN           247       30


Je calcul mes résidus :
Code:
> khi2$residuals
                          data$lieu
data$etat_sante_mental_bin A la campagne    En ville
               1-TRES MAL    -0.24863849  0.54907532
               2-MAL         -0.06001056  0.13252300
               3-BIEN        -1.33288204  2.94344066
               4-TRES BIEN    0.85089588 -1.87905715

Et je représente ça graphiquement :
Problème de chi2 2020-010
La couleur bleu signifie une attraction, le rouge une répulsion. 

D'après mon interprétation, les personnes qui habitent en Ville possède une large attractivité à appartenir à la catégorie santé mentale "Bien". La situation est inversée pour la catégorie de Santé  mentale "Très Bien", où l'attraction est plus visible en campagne qu'en ville. Les autres modalités (Très mal et Mal) sont quasiment négligeable (car les résidus sont quasi-nulle, et donc qui correspondent aux valeurs espérées ?)

Je n'arrive pas à interpréter davantage. Mais j'ai quelques questions qui se posent :
- Comment interpréter le fait que la valeur de la catégorie "Bien" / "En Ville" (la valeur représenté par le gros cercle bleu) ait plus de "poids" que les autres ?
- Est-ce que cela lui donne plus "d'importance" ou de significativité ? (Selon moi, vu que c'est la valeur qui s'éloigne le plus du modèle d'indépendance, je dirais que oui).
- Si j'avais simplement comme objectif de représenter graphiquement la répartition des valeurs de "Etat_sante_mental" sur la variable "Lieu", qu'est ce qui différencie ce graphique d'attraction et de répulsion avec un barplot de ce type :

Code:
> barplot(khi2$observed)



Problème de chi2 2020-011
Je vous remercie énormément.

preliator

Nombre de messages : 39
Date d'inscription : 01/04/2019

Revenir en haut Aller en bas

Problème de chi2 Empty Re: Problème de chi2

Message par Eric Wajnberg le Mar 26 Mai 2020 - 10:45

Un chi2 se calcule, pour chaque case de la table de contingence, par (observé-théorique)^2/théorique. Par "théorique", j'entends les valeurs attendues sous l'hypothèse d’absence de relation (qui se récupèrent par khi2$expected).

Une "grosse" valeur d'un résidu peut donc être juste le résultat d'une faible valeur théorique, et ceci semble être le cas pour la catégorie "Bien" / "En Ville". C'est juste ceci que montre l'analyse des résidus, et votre interprétation semble la bonne.

Le deuxième graphique que vous montrez est bâti sur les effectifs, et ca n'a donc pas grand chose à voir avec l'analyse des résidus.

Il n'y a guère plus que vous pouvez faire.

Un dernier point : Du point de vu statistique, vous ne faites qu'une analyse globale. Les interprétations suivantes que vous développées ne s'appuient pas sur des tests, et vous ne pouvez guère conclure plus que ceci. Il faudrait tester les effets qui vous intéressent.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1177
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum