Les posteurs les plus actifs de la semaine
niaboc
 
gg
 
mamastat
 
Ayana
 
joyeux_lapin13
 
Maelys
 
Ginger Louis
 
François Collin
 
kokino
 
davro76
 


Classification après ACM : interprétation ?

Voir le sujet précédent Voir le sujet suivant Aller en bas

Classification après ACM : interprétation ?

Message par buliwyf le Mar 24 Avr 2012 - 14:44

Bonjour,

Je cherche à établir des profils de facteurs de risque sur une population donnée, et à voir si un sous-groupe particulier constitué d'ouvriers présente majoritairement un de ces profils de risque.
Sur le conseil de MMDM12 dans un précédent post, j'ai réalisé :
1/ une ACM avec des variables correspondant à des facteurs de risque d'une maladie, et la catégorie socio-professionnelle (5 modalités dont celle qui m'intéresse, la 2 = les ouvriers) :
Code:

# Avec R, mais peu importe le logiciel :
noms.ACM <- c("CSP", "sexe", "ageD", "tabagisme.actif", "obesite.poids", "DNID", "HTA", "hyper.LDL", "ATCD.ischemique", "heredite.coro")
etude.ACM.FDR <- etude[, noms.ACM]
etude.ACM.FDR <- na.omit(etude.ACM.FDR)
etude.ACM.FDR <- logique.2.facteur(etude.ACM.FDR)
res.mca = MCA(etude.ACM.FDR, graph=FALSE)

2/ Une classification :
Code:

res.hcpc = HCPC(res.mca, nb.clust=-1, graph=FALSE)

Visuellement sur le plan factoriel, la modalité "ouvriers" se trouve sur le 3e cluster.
Voici la description de ce 3e cluster obtenue avec la fonction
Code:
res.hcpc$desc.var
:

Code:
                                        Cla/Mod  Mod/Cla    Global      p.value    v.test
hyper.LDL=hyper.LDL_TRUE              53.395473 94.352941 57.503828 5.632196e-91  20.227283
tabagisme.actif=tabagisme.actif_TRUE  48.048452 84.000000 56.891271 7.237263e-46  14.216511
ATCD.ischemique=ATCD.ischemique_TRUE  47.081712 85.411765 59.035222 1.621038e-44  13.997213
HTA=HTA_FALSE                        41.811414 79.294118 61.715161 2.086527e-20  9.257818
obesite.poids=obesite.poids_FALSE    38.784067 87.058824 73.047473 2.277596e-16  8.206484
DNID=DNID_FALSE                      36.228070 97.176471 87.289433 3.034076e-16  8.171965
CSP=2                                48.113208 36.000000 24.349158 3.564957e-11  6.621117
ageD=(21,48]                          44.247788 47.058824 34.609495 1.133630e-10  6.447964
sexe=sexe_TRUE                        34.332425 88.941176 84.303216 1.424918e-03  3.189555
CSP=3                                40.609137 18.823529 15.084227 1.209867e-02  2.509253
sexe=sexe_FALSE                      22.926829 11.058824 15.696784 1.424918e-03  -3.189555
CSP=5                                22.164948 10.117647 14.854518 8.285090e-04  -3.343090
CSP=1                                10.204082  1.176471  3.751914 4.308841e-04  -3.520408
CSP=4                                26.277372 33.882353 41.960184 4.637482e-05  -4.073184
DNID=DNID_TRUE                        7.228916  2.823529 12.710567 3.034076e-16  -8.171965
obesite.poids=obesite.poids_TRUE      15.625000 12.941176 26.952527 2.277596e-16  -8.206484
ageD=(55,64]                          16.385542 16.000000 31.776417 2.086093e-18  -8.752537
HTA=HTA_TRUE                          17.600000 20.705882 38.284839 2.086527e-20  -9.257818
ATCD.ischemique=ATCD.ischemique_FALSE 11.588785 14.588235 40.964778 1.621038e-44 -13.997213
tabagisme.actif=tabagisme.actif_FALSE 12.078153 16.000000 43.108729 7.237263e-46 -14.216511
hyper.LDL=hyper.LDL_FALSE              4.324324  5.647059 42.496172 5.632196e-91 -20.227283

Puis-je écrire à peu près rigoureusement dans ma thèse : "Les ouvriers ont plus souvent un profil de risque comportant tabagisme, LDL-cholestérol, absence d'obésité" etc. ?

Merci d'avance !

Olivier

buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par joyeux_lapin13 le Mar 24 Avr 2012 - 16:46

Salut, je te recommande de mettre également tes modalités projetées dans le plan en 2 dimensions.

joyeux_lapin13

Nombre de messages: 1047
Age: 30
Localisation: Mayotte
Date d'inscription: 21/04/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par Hadrien35 le Mar 24 Avr 2012 - 18:16

Bonjour,

N'ayant pas très envie de rentrer dans le code, je me permets de poser une question, as-tu effectué une classification sur la base des données de profil de risque uniquement, où bien as-tu classifié sur la base du profil de risque+profil socio-demo?

Je te conseille la seconde option, au passage, qui te permet de mettre en évidence des profil de risque puis de voir, à l'aide de la CSP en illustratif par exemple, si tel profil est plus associé à telle CSP.

Concernant ton interprétation directe (en considérant que la démarche de classification est la bonne), je ne dirait pas que
"Les ouvriers ont plus souvent un profil de risque comportant tabagisme, LDL-cholestérol, absence d'obésité"
Mais plutot que le profil de risque comportant tabagisme, LDL-cholestérol [...] est significativement associé à CSP=2;3 et significativement peu associé à CSP=1;4;5

Bien cordialement

Hadrien35

Nombre de messages: 166
Date d'inscription: 31/03/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par buliwyf le Mer 25 Avr 2012 - 0:56

Bonjour,

D'abord pour joyeux lapin :
(je précise que la catégorie socioprofessionnelle CSP, l'âge et le sexe sont des variables illustratives ; alors que dans la description des dimensions plus haut, ces 3 variables étaient actives. je tatonne...) :



@Hadrien35 : et bien... je ne sais pas. J'ai assez peu de données socio-économiques hors de la CSP (juste quelques données comportementales, comme le temps avant l'appel des secours, etc.).
D'ailleurs j'ai une question à ce sujet (attention, cuisine inside âmes sensibles s'abstenir) : quand je mets la CSP en variable illustrative, la CSP 2 me parait dangereusement proche de l'origine du plan. Quand je fais de la CSP une variable active, la CSP 2 apparait plus bas sur le plan factoriel (cf figure). Que faire ?


Merci pour vos réponses. Je me démène un peu tout seul pour cette f... thèse d'exercice alors que je n'ai pas de connaissances en stats...


Dernière édition par buliwyf le Mer 25 Avr 2012 - 1:00, édité 1 fois

buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par buliwyf le Mer 25 Avr 2012 - 0:57

Un petit complément : le plan factoriel avec la représentation de la classification :


buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par Hadrien35 le Mer 25 Avr 2012 - 9:08

Bonjour,

Le plus juste est de mettre CSP, âge, sexe, revenus etc... (ce que j'appelle le socio-démo) en variables illustratives, et les différentes variables de "diagnostique santé" (désolé si ce n'est pas les mots que tu emploies).

Parce que si tu fais ça, tu as comme objectif de faire apparaître des profils de risque, et ensuite de les relier à des descriptions socio-demo..

Si tu mets tout en actif, les différents groupes seront des combinaisons de risques et de socio-demo... et tu pourrais (ce ne sera surement pas le cas, mais je grossis les traits pour te faire comprendre) te retrouver avec un groupe qui est caractérisé par son age, sexe et CSP, mais pas du tout par les facteurs de risque que tu étudies à l'origine... Est ce que cette démarche serait intéressante pour toi? Je ne pense pas mais je peux me tromper...


Ensuite, le fait que justement, quand tu le mets en actif, la CSP=2 est au centre est un résultat d'étude. Parmi les différents groupes que tu as mis en évidence sur la base des facteurs de risque, les ouvriers ne s'associent pas spécifiquement à tel et tel groupe.

Quand la CSP est entrée en variable illustrative, c'est tout à fait logique que ta modalité s'écarte du centre, étant donné que tu as autorisé le fait que l'ACM et donc ta classification soit construite sur la base de ta variable CSP.
Donc, quand tu dis "dangereusement proche", moi je dirai plutot "étrangement mais logiquement proche", car tu t'attendais surement à mettre en évidence le fait que les ouvriers aient un profil de risque spécifique...
Ce qui, on peut toujours rêver, est peut être le cas, si il se retrouve par hasard au centre car spécifiquement associé par exemple, au profil d'en haut à droite et d'en bas à gauche (pour vulgariser). A toi de rentrer dans tes listings pour tirer tout cela au clair Smile

A ta disposition si besoin,

Bien cordialement


NB: tes % d'inerties sont différents d'un graph à l'autre... ce qui suggère que dans un cas tu as mis la CSP en actif, dans l'autre en illustratif...

Hadrien35

Nombre de messages: 166
Date d'inscription: 31/03/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par buliwyf le Mer 25 Avr 2012 - 19:39

Merci pour cette réponse intéressante.

Pour le choix des variables illustratives : c'est juste, mais l'âge, le sexe (et même dans une moindre mesure la CSP) sont des facteurs de risque.

J'aimerais te poser (ou aux autres !) une question : quelle valeur numérique permet d'interpréter la force d'association d'une CSP à une ou plusieurs classes ? R me renvoie plusieurs valeurs (que je donne dans mon 1er message) : Cla/Mod - Mod/Cla - Global - p.value - v.test

Cordialement,

NB : tu as raison Smile

buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par Hadrien35 le Jeu 26 Avr 2012 - 11:11

Alors, pour ce qui est des indicateurs:

Cla/Mod : Pourcentage des individus faisant partie du groupe, parmi les individus ayant la modalité.
Mod/Cla : Pourcentage des individus ayant la modalité, parmi les individus du groupe
Global: Aucune idée Wink
p-value : probabilité critique, indique si la modaliité est significativement associée à la classe
v-test: grossièrement, cela traduit la probabilité critique en un ordre de grandeur, soit positif (significativement associé), soit négatif (significativement peu associé). Pour mémo, une v-test de 1.96 en valeur absolue, c'est une p-value de 5%.

Bien cordialement

Hadrien35

Nombre de messages: 166
Date d'inscription: 31/03/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par buliwyf le Ven 4 Mai 2012 - 14:13

Super merci !

buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par buliwyf le Ven 4 Mai 2012 - 15:38

Ah j'ai quand même une petite question...
J'utilise la fonction R "Hierarchical Clustering on Principle Components (HCPC)".

Je suppose que les techniques de classification s'appliquent autant à l'ACM qu'à l'ACP ?


buliwyf

Nombre de messages: 18
Date d'inscription: 09/08/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Classification après ACM : interprétation ?

Message par joyeux_lapin13 le Ven 4 Mai 2012 - 15:46

Le clustering bosse sur la proximité, donc tant que tu as des coordonnées dans un plan, tu peux faire du clustering, c'est une vision simpliste mais qui explique l'existence du pool de ces méthodes avec des outils exploratoires.

joyeux_lapin13

Nombre de messages: 1047
Age: 30
Localisation: Mayotte
Date d'inscription: 21/04/2010

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum