Les posteurs les plus actifs de la semaine
Stanlgn
 
zezima
 


ACP sur R

Aller en bas

ACP sur R

Message par lelenou le Lun 5 Mar 2018 - 10:10

Bonjour,

Je souhaite effectuer une ACP sur un jeu de données constitué de 10 méthodes (individus) classées en 3 types d'approches (approche 1, approche 2, approche 3) décrites à travers 19 indicateurs (variables) avec des modalités correspondant chacune à une note et classés en 3 types d'indicateurs (type 1, type 2, type 3). Je souhaiterai obtenir un graphe des variables et un graphes des individus. Mon jeu de données ressemble donc à :
                         type1        type2         type3
                   var1  var2   var3  var4   var5  var6
approche1  meth1    note  note   note note   note  note
               meth2    ...etc
approche2  meth3
               meth4
approche3  meth5
               meth6

3  questions posées :
- De quelle(s) variable(s) dépendent le plus les 3 types de variables ?
- Quelles méthodes répondent le mieux aux 3 types de variables et par quelles variables ?
- Quelles approches répondent le mieux aux 3 types de variables et par quelles variables ?

Je suis pour l'instant partie dans l'idée de sortir le graphe des variables et celui des individus comme cela :



J'ai effectué une acp avec ade4 mais ce n'est pas concluant, je vous montre le jeu de données :
var1 var2 var3 var4 var5 var6
meth1 note note note note note note
meth2 ...etc
meth3
meth4
meth5
meth6

et le script :
Code:
acp2<- dudi.pca(don2)
z<- dudi.pca(don, center = T, scale = T, scannf = F)
inertia.dudi(acp2)
s.corcircle(acp2$co,clabel = 0.7)
s.corcircle(acp2$li,clabel = 0.8)



Pourriez-vous m'indiquer la démarche à suivre pour répondre au mieux à mes questions si cela est possible ?
- Pourquoi les méthodes sortent du cadre du graphe des individus ? Faut-il centrer/réduire ?
- Ne faut-il pas passer par des pourcentages plutôt que par des notes ?
- Comment tenir compte également des types de variables et des approches ? Obligé de passer par un autre tableau de données ?

Merci d'avance pour la lecture de mon post !

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par droopy le Mar 6 Mar 2018 - 14:03

Bonjour,

- Pourquoi les méthodes sortent du cadre du graphe des individus ? Faut-il centrer/réduire ?
Parce qu'il n'y a aucune raison pour les individus soient dans le cercle contrairement aux variables (si elles ont été centrées réduites). Par défaut la fonction dudi.pca centre et réduit. D'ailleurs c'est souvent l'option par défaut des fonctions qui font des ACP, mais cette transformation se fait au niveau des variables et non pas au niveau des individus. Tu peux parfois centré par individu mais ce sont des cas particuliers d'ACP.

Cordialement
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par lelenou le Mar 6 Mar 2018 - 14:16

Bonjour Droopy,

Merci d'avoir pris le temps de me lire et de me répondre.

Si j'ai bien compris il n'y a pas à centrer/réduire puisque que cette opération est déjà intégrée par défaut dans les fonctions ACP.

Je suis en train de creuser et je crois avoir trouvé une solution pour intégrer les types de méthodes (=approches), le fait d'insérer une variable qualitative complémentaire, j'ai essayé cette fois ci avec la fonction PCA() de FactoMineR :
Code:
res.pca = PCA(don2[,1:19], scale.unit=TRUE, ncp=5, graph=T)
res.pca = PCA(don2, scale.unit=TRUE, ncp=5, quali.sup=c(20,), graph=T)
Cela me donne seulement un vecteur type_meth et non 3 vecteurs avec les 3 types de méthodes. Je ne comprends pas...
Quelqu'un pourrait-il m'aiguiller sur ça ?

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par droopy le Mar 6 Mar 2018 - 14:44

Une ACP est faite pour des variables quantitatives, sur un tableau avec des individus en lignes et des variables en colonne.
Si tes méthodes sont des individus alors il n'y a rien d'autres à faire que de les représenter sur le plan factoriel, par exemple avec la fonction s.label de ade4 (il y en a une autre équivalente dans adegraphics, avec plus de possibilités).
Si tes méthodes ne correspondent pas à des individus mais à une variable, alors la première question à se poser est :
- est-ce que le l'lntègre à l'analyse ?
- est-ce que c'est une information complémentaire que je souhaire faire afficher sur le résultat de l'analyse ?

Ces deux options sont très différentes. Dans le premier cas le résultat dépendra de l'ajout de ta/tes variables qualitatives, dans le second cas le résultat ne dépendra pas de cette, ces variables.
Pour le premier cas ça serait typiquement un tableau sur des individus avec des variables quantitatives (Taille, Poids) et qualitatives (groupe sanguin) et toutes ces variables sont importantes. Ici tu regarderas si certaines modalités de ta/tes variable(s) qualitative(s) (groupe sanguin) sont liées avec des variables quantitatives (Taille, Poids).


Dans le deuxième cas, seules les variables quantitatives sont importantes (Taille, Poids) et la variable qualitative peut représenter des groupes (Pays, Sexe) et tu cherches à savoir si tu retrouves ces groupes au sein des individus. Par exemple est-ce qu'on voit un dimorphisme sexuelle dans les données corporelles. Ici si tu intègres le Sexe comme variable au sein de l'analyse bah forcément tu vas l'observer cet effet.

Dans le premier cas, tu peux t'orienter vers une analyse MFA ou analyse de Hill & smith.
Dans le deuxième cas il s'agit de représentation graphique, par exemple tu représentes tous tes individus sur le plan factoriel et tu différencies tes groupes en coloriant les individus en fonction de leur modalité (H = bleu, F =rose), tu peux représenter les barycentres (les positions moyennes par groupes), des ellipses de confiance, des enveloppes convexes, etc.

Cordialement


Dernière édition par droopy le Mer 7 Mar 2018 - 8:04, édité 1 fois
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par Eric Wajnberg le Mer 7 Mar 2018 - 6:59

droopy a écrit:Une ACP est faite pour des variables qualitatives, sur un tableau avec des individus en lignes et des variables en colonne.
quantitatives, je pense.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 964
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par droopy le Mer 7 Mar 2018 - 8:03

Eric Wajnberg a écrit:
droopy a écrit:Une ACP est faite pour des variables qualitatives, sur un tableau avec des individus en lignes et des variables en colonne.
quantitatives, je pense.

Eric.
Tout a fait :-)
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par lelenou le Mer 7 Mar 2018 - 10:25

Bonjour,

Merci beaucoup pour cette réponse, je l'ai lu et relu avec grande attention. Je suis dans le second cas où le type de méthode correspond à un groupe d'individus et non à une variable.

En revanche, est-il possible d'intégrer également la notion de groupes de variables ?
Je suis allé voir ce qu'était une MFA et apparemment elle permettrait de pondérer les variables et de de ne pas biaiser l'analyse si le nombre de variables par groupe est différent. Est-il possible d'effectuer également une pondération des variables sur une PCA ?

Merci encore pour votre attention et temps.

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par droopy le Mer 7 Mar 2018 - 15:12

Est-il possible d'effectuer également une pondération des variables sur une PCA ?
Tout a fait. Par défaut la pondération est de 1, mais tu peux la changer avec l’argument col.w de la fonction dudi.pca.

Cordialement
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: ACP sur R

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum