Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Dendrogramme avec poids sur les individus
2 participants
Page 1 sur 1
Dendrogramme avec poids sur les individus
Bonjour à tous,
Je dispose d'un jeu de données composé de 518 individus et 36 variables. Les 36 variables représentent en fait 36 composantes obtenues après une analyse canonique.
Je souhaite ensuite réaliser une classification hierarchique sur ce jeu de données. Pour cela j'ai utilisé la fonction hclust et j'ai obtenu les résultats souhaités sans problème.
Ma question est la suivante : est-il possible d'inclure le poids des individus dans une telle classification?
En effet, je dispose d'un vecteur composé des poids associés à chacun de mes 518 individus et je n'arrive pas à déterminer la manière de les inclure dans une classification hierarchique (je n'ai pas trouvé de fonction R qui semble capable de faire une telle chose, mais peut-être que je me trompe d'approche).
J'avais pensé à multiplier les coordonnées (ligne de la matrice) de chaque individu par leur poids, et ensuite effectuer ma classification hierarchique sur ce nouveau tableau, mais je n'arrive pas à déterminer si cela est correct?
Je vous remercie par avance pour votre aide
Cordialement,
A.D.
Je dispose d'un jeu de données composé de 518 individus et 36 variables. Les 36 variables représentent en fait 36 composantes obtenues après une analyse canonique.
Je souhaite ensuite réaliser une classification hierarchique sur ce jeu de données. Pour cela j'ai utilisé la fonction hclust et j'ai obtenu les résultats souhaités sans problème.
Ma question est la suivante : est-il possible d'inclure le poids des individus dans une telle classification?
En effet, je dispose d'un vecteur composé des poids associés à chacun de mes 518 individus et je n'arrive pas à déterminer la manière de les inclure dans une classification hierarchique (je n'ai pas trouvé de fonction R qui semble capable de faire une telle chose, mais peut-être que je me trompe d'approche).
J'avais pensé à multiplier les coordonnées (ligne de la matrice) de chaque individu par leur poids, et ensuite effectuer ma classification hierarchique sur ce nouveau tableau, mais je n'arrive pas à déterminer si cela est correct?
Je vous remercie par avance pour votre aide
Cordialement,
A.D.
Re: Dendrogramme avec poids sur les individus
Bonjour,
à mon avis la solution consiste à intégrer les poids de tes individus dans l'analyse canoniques. Après 36 variables ... Tu dois en avoir un paquet qui ne reflète que le bruit et qui ne sont pas informatives.
à mon avis la solution consiste à intégrer les poids de tes individus dans l'analyse canoniques. Après 36 variables ... Tu dois en avoir un paquet qui ne reflète que le bruit et qui ne sont pas informatives.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
Merci pour ta réponse droopy.
Le soucis est que je ne sais pas du tout comment inclure les poids des individus dans l'analyse canonique non plus !
Je n'ai pas trouvé d'exemple où cela était fait et lorsque je regarde les descriptifs des fonctions R permettant de réaliser une analyse canonique ( fonction "cc" du package "CCA" par exemple ), il ne semble pas y avoir la possibilité de spécifier en argument un vecteur de poids.
Pour info, mes variables initiales sont de type qualitatif donc recodées en 0/1 ce qui me donne au final 76 variables. Le choix de garder 36 composantes issues de l'analyse canonique est peut-être discutable je l'avoue, mais pour le moment c'est ce qui m'a été demandé...
Voilà, si quelqu'un a un peu plus d'infos sur le sujet, je suis preneuse
D'ailleurs si quelqu'un a de la documentation sur la réalisation d'analyse canonique dans le cas de variables qualitatives, cela m'intéresse très fortement !
Cordialement,
A.D.
Le soucis est que je ne sais pas du tout comment inclure les poids des individus dans l'analyse canonique non plus !
Je n'ai pas trouvé d'exemple où cela était fait et lorsque je regarde les descriptifs des fonctions R permettant de réaliser une analyse canonique ( fonction "cc" du package "CCA" par exemple ), il ne semble pas y avoir la possibilité de spécifier en argument un vecteur de poids.
Pour info, mes variables initiales sont de type qualitatif donc recodées en 0/1 ce qui me donne au final 76 variables. Le choix de garder 36 composantes issues de l'analyse canonique est peut-être discutable je l'avoue, mais pour le moment c'est ce qui m'a été demandé...
Voilà, si quelqu'un a un peu plus d'infos sur le sujet, je suis preneuse
D'ailleurs si quelqu'un a de la documentation sur la réalisation d'analyse canonique dans le cas de variables qualitatives, cela m'intéresse très fortement !
Cordialement,
A.D.
Re: Dendrogramme avec poids sur les individus
re,
c'est vrai qu'après réflexion il n'est peut-être pas possible d'intégrer les poids comme ça. Quand tu parles d'analyse canonique tu sous entends quoi au juste parce qu'une analyse canonique se fait entre deux matrices.
c'est vrai qu'après réflexion il n'est peut-être pas possible d'intégrer les poids comme ça. Quand tu parles d'analyse canonique tu sous entends quoi au juste parce qu'une analyse canonique se fait entre deux matrices.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
Oui, autant pour moi, je me suis mal exprimée.
J'ai un jeu de données composé de 518 individus et 76 variables binaires que je sépare en deux matrices X et Y sur lesquelles j'effectue une analyse des corrélations canoniques.
Cela dit, j'avoue ne pas maitriser à 100% le fonctionnement profond de cette analyse...
En tout cas, merci d'essayer de m'aider
J'ai un jeu de données composé de 518 individus et 76 variables binaires que je sépare en deux matrices X et Y sur lesquelles j'effectue une analyse des corrélations canoniques.
Cela dit, j'avoue ne pas maitriser à 100% le fonctionnement profond de cette analyse...
En tout cas, merci d'essayer de m'aider
Re: Dendrogramme avec poids sur les individus
Que cherches-tu à faire exactement ?
Est-ce que tu cherches le lien entre tes deux tableaux ?
Faudrait m'en dire un peu plus pour voir ce que tu peux faire (dans la mesure de mes compétences).
Est-ce que tu cherches le lien entre tes deux tableaux ?
Faudrait m'en dire un peu plus pour voir ce que tu peux faire (dans la mesure de mes compétences).
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
En fait, on m'a demandé de fournir les résultats d'une analyse canonique : corrélations canoniques, composantes pour X, composantes pour Y, corrélations entre X et les "covariates" de X, corrélations entre Y et les "covariates" de Y. Et c'est tout Ce n'est pas moi qui suit en charge de l'interprétation (je trouve ça étrange de fonctionner comme cela mais bon...), mais le but final est de pouvoir déterminer des liens entre des variables de comportement et des variables d'attitude.
Avec la fonction "cc" du package "CCA" sous R j'arrive à obtenir les résultats souhaités, mais je ne tiens pas compte des poids des individus.
Cependant, je n'arrive pas bien à voir comment ces poids pourraient être intégrés dans une telle analyse (que je ne maîtrise pas parfaitement).
Ensuite, je dois réaliser une classification de mes individus dont je récupère les "coordonnées" selon les composantes pour X et les composantes pour Y, issues de l'analyse canonique effectuée.
Avec la fonction "cc" du package "CCA" sous R j'arrive à obtenir les résultats souhaités, mais je ne tiens pas compte des poids des individus.
Cependant, je n'arrive pas bien à voir comment ces poids pourraient être intégrés dans une telle analyse (que je ne maîtrise pas parfaitement).
Ensuite, je dois réaliser une classification de mes individus dont je récupère les "coordonnées" selon les composantes pour X et les composantes pour Y, issues de l'analyse canonique effectuée.
Re: Dendrogramme avec poids sur les individus
effectivement plus je réfléchis à la question moins ils me semblent évident d'intégrer le poids des individus dans l'analyse canonique. Est-ce que tu es aller voir sur l'adelist pour voir si un sujet similaire avait été traité ?
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
Je ne connaissais pas "adelist" ! J'ai effectué une brève recherche avec divers mots-clés mais n'ai rien trouvé qui semble correspondre...
Affaire à suivre ^^
Affaire à suivre ^^
Re: Dendrogramme avec poids sur les individus
Je serais toi je m'incrirais sur l'adelist et je poserais directement la question ! Tu as des gens vraiment très fort en analyse multivariée qui pourront surement te filer un coup de main.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
au moins maintenant tu as une réponse claire sur la question !
Tu devrais la poster sur les différents forums ou tu as posée cette question. Tout le monde n'est pas forcément inscrit sur l'adelist.
Tu devrais la poster sur les différents forums ou tu as posée cette question. Tout le monde n'est pas forcément inscrit sur l'adelist.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Dendrogramme avec poids sur les individus
Une solution pour calculer les composantes de l'analyse des corrélations canoniques dans le cas d'individus avec des poids m'a été donnée par un des membres de l'"adelist".
Je vous l'indique ci-dessous (pour X et Y les deux matrices sur lesquelles on souhaite réaliser l'analyse canonique, et D la matrice des poids) :
Cordialement,
A.D.
Je vous l'indique ci-dessous (pour X et Y les deux matrices sur lesquelles on souhaite réaliser l'analyse canonique, et D la matrice des poids) :
- Code:
X <- scale(X)
Y <- scale(Y)
D <- D/sum(D)
tabcross <- t(X) %*% D%*% Y
CX <- t(X) %*% D%*% X
CY <- t(Y) %*% D%*% Y
library(MASS)
svdX <- svd(CX)
svdY <- svd(CY)
nXpos <- sum(svdX$d>1e-7)
nYpos <- sum(svdY$d>1e-7)
CXinvsqrt <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(-0.5)) %*% t(svdX$u[,1:nXpos] )
CYinvsqrt <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(-0.5)) %*% t(svdY$u[,1:nYpos] )
CXsqrt <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(0.5)) %*% t(svdX$u[,1:nXpos] )
CYsqrt <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(0.5)) %*% t(svdY$u[,1:nYpos] )
CXinv <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(-1)) %*% t(svdX$u[,1:nXpos] )
CYinv <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(-1)) %*% t(svdY$u[,1:nYpos] )
res <- svd(CXinvsqrt %*% tabcross %*% CYinvsqrt)
res$xcoef <- CXinvsqrt %*% res$u
res$ycoef <- CYinvsqrt %*% res$v
Cordialement,
A.D.
Sujets similaires
» CAH combinée avec ACP : que faire des individus supplémentai
» Dendrogramme
» commande dendrogramme sous R
» Notation basée sur une moyenne de poids
» poids et accouplement [débutant]
» Dendrogramme
» commande dendrogramme sous R
» Notation basée sur une moyenne de poids
» poids et accouplement [débutant]
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum