Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment :
SSD interne Crucial BX500 2,5″ SATA – 500 ...
Voir le deal
29.99 €

Dendrogramme avec poids sur les individus

2 participants

Aller en bas

Dendrogramme avec poids sur les individus Empty Dendrogramme avec poids sur les individus

Message par A.D. Mer 2 Fév 2011 - 11:18

Bonjour à tous,


Je dispose d'un jeu de données composé de 518 individus et 36 variables. Les 36 variables représentent en fait 36 composantes obtenues après une analyse canonique.
Je souhaite ensuite réaliser une classification hierarchique sur ce jeu de données. Pour cela j'ai utilisé la fonction hclust et j'ai obtenu les résultats souhaités sans problème.

Ma question est la suivante : est-il possible d'inclure le poids des individus dans une telle classification?

En effet, je dispose d'un vecteur composé des poids associés à chacun de mes 518 individus et je n'arrive pas à déterminer la manière de les inclure dans une classification hierarchique (je n'ai pas trouvé de fonction R qui semble capable de faire une telle chose, mais peut-être que je me trompe d'approche).
J'avais pensé à multiplier les coordonnées (ligne de la matrice) de chaque individu par leur poids, et ensuite effectuer ma classification hierarchique sur ce nouveau tableau, mais je n'arrive pas à déterminer si cela est correct?

Je vous remercie par avance pour votre aide Smile


Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Mer 2 Fév 2011 - 11:58

Bonjour,

à mon avis la solution consiste à intégrer les poids de tes individus dans l'analyse canoniques. Après 36 variables ... Tu dois en avoir un paquet qui ne reflète que le bruit et qui ne sont pas informatives.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par A.D. Mer 2 Fév 2011 - 12:10

Merci pour ta réponse droopy.

Le soucis est que je ne sais pas du tout comment inclure les poids des individus dans l'analyse canonique non plus ! confused
Je n'ai pas trouvé d'exemple où cela était fait et lorsque je regarde les descriptifs des fonctions R permettant de réaliser une analyse canonique ( fonction "cc" du package "CCA" par exemple ), il ne semble pas y avoir la possibilité de spécifier en argument un vecteur de poids.

Pour info, mes variables initiales sont de type qualitatif donc recodées en 0/1 ce qui me donne au final 76 variables. Le choix de garder 36 composantes issues de l'analyse canonique est peut-être discutable je l'avoue, mais pour le moment c'est ce qui m'a été demandé...

Voilà, si quelqu'un a un peu plus d'infos sur le sujet, je suis preneuse Smile
D'ailleurs si quelqu'un a de la documentation sur la réalisation d'analyse canonique dans le cas de variables qualitatives, cela m'intéresse très fortement !

Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Mer 2 Fév 2011 - 12:48

re,

c'est vrai qu'après réflexion il n'est peut-être pas possible d'intégrer les poids comme ça. Quand tu parles d'analyse canonique tu sous entends quoi au juste parce qu'une analyse canonique se fait entre deux matrices.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par A.D. Mer 2 Fév 2011 - 13:24

Oui, autant pour moi, je me suis mal exprimée.

J'ai un jeu de données composé de 518 individus et 76 variables binaires que je sépare en deux matrices X et Y sur lesquelles j'effectue une analyse des corrélations canoniques.
Cela dit, j'avoue ne pas maitriser à 100% le fonctionnement profond de cette analyse...

En tout cas, merci d'essayer de m'aider Smile


A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Mer 2 Fév 2011 - 13:25

Que cherches-tu à faire exactement ?
Est-ce que tu cherches le lien entre tes deux tableaux ?
Faudrait m'en dire un peu plus pour voir ce que tu peux faire (dans la mesure de mes compétences).
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par A.D. Mer 2 Fév 2011 - 13:34

En fait, on m'a demandé de fournir les résultats d'une analyse canonique : corrélations canoniques, composantes pour X, composantes pour Y, corrélations entre X et les "covariates" de X, corrélations entre Y et les "covariates" de Y. Et c'est tout Shocked Ce n'est pas moi qui suit en charge de l'interprétation (je trouve ça étrange de fonctionner comme cela mais bon...), mais le but final est de pouvoir déterminer des liens entre des variables de comportement et des variables d'attitude.

Avec la fonction "cc" du package "CCA" sous R j'arrive à obtenir les résultats souhaités, mais je ne tiens pas compte des poids des individus.
Cependant, je n'arrive pas bien à voir comment ces poids pourraient être intégrés dans une telle analyse (que je ne maîtrise pas parfaitement).

Ensuite, je dois réaliser une classification de mes individus dont je récupère les "coordonnées" selon les composantes pour X et les composantes pour Y, issues de l'analyse canonique effectuée.


A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Mer 2 Fév 2011 - 15:53

effectivement plus je réfléchis à la question moins ils me semblent évident d'intégrer le poids des individus dans l'analyse canonique. Est-ce que tu es aller voir sur l'adelist pour voir si un sujet similaire avait été traité ?
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par A.D. Mer 2 Fév 2011 - 16:13

Je ne connaissais pas "adelist" ! Very Happy J'ai effectué une brève recherche avec divers mots-clés mais n'ai rien trouvé qui semble correspondre...

Affaire à suivre ^^


A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Mer 2 Fév 2011 - 16:29

Je serais toi je m'incrirais sur l'adelist et je poserais directement la question ! Tu as des gens vraiment très fort en analyse multivariée qui pourront surement te filer un coup de main.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par droopy Jeu 3 Fév 2011 - 10:43

au moins maintenant tu as une réponse claire sur la question !
Tu devrais la poster sur les différents forums ou tu as posée cette question. Tout le monde n'est pas forcément inscrit sur l'adelist.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par A.D. Jeu 3 Fév 2011 - 10:55

Une solution pour calculer les composantes de l'analyse des corrélations canoniques dans le cas d'individus avec des poids m'a été donnée par un des membres de l'"adelist".
Je vous l'indique ci-dessous (pour X et Y les deux matrices sur lesquelles on souhaite réaliser l'analyse canonique, et D la matrice des poids) :

Code:
X <- scale(X)
Y <- scale(Y)
D <- D/sum(D)
tabcross <- t(X) %*% D%*% Y
CX <- t(X) %*% D%*% X
CY <- t(Y) %*% D%*% Y
library(MASS)
svdX <- svd(CX)
svdY <- svd(CY)

nXpos <- sum(svdX$d>1e-7)
nYpos <- sum(svdY$d>1e-7)

CXinvsqrt <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(-0.5)) %*% t(svdX$u[,1:nXpos] )
CYinvsqrt <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(-0.5)) %*% t(svdY$u[,1:nYpos] )

CXsqrt <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(0.5)) %*% t(svdX$u[,1:nXpos] )
CYsqrt <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(0.5)) %*% t(svdY$u[,1:nYpos] )


CXinv <- svdX$v[,1:nXpos] %*% diag(svdX$d[1:nXpos]^(-1)) %*% t(svdX$u[,1:nXpos] )
CYinv <- svdY$v[,1:nYpos] %*% diag(svdY$d[1:nYpos]^(-1)) %*% t(svdY$u[,1:nYpos] )

res <- svd(CXinvsqrt %*% tabcross %*% CYinvsqrt)

res$xcoef <- CXinvsqrt %*% res$u
res$ycoef <- CYinvsqrt %*% res$v

Cordialement,

A.D.


A.D.

Nombre de messages : 305
Age : 36
Localisation : Nantes
Date d'inscription : 02/12/2009

http://www.dacta.fr

Revenir en haut Aller en bas

Dendrogramme avec poids sur les individus Empty Re: Dendrogramme avec poids sur les individus

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum