Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Problème avec l'algorithme VarClus
Page 1 sur 1
Problème avec l'algorithme VarClus
Bonjour, l'algorithme VarClus permet de construire des clusters de variables en fonction de leur similarité.
L'algorithme commence par une ACP sur le jeu de variables complet et en extrait les 2 premières valeurs propres et les composantes principales (vecteurs propres associés). Mon souci est la phase suivante qui consiste à envoyer tel ou tel variable dans tel ou tel cluster en fonction du coefficient de corrélation linéaire entre la variable et la composante principale, en standardisant ce coefficient j'obtient donc 2 valeurs, une pour chacune des 2 composantes puis la valeur la plus grande me permet de déterminer si j'envoi ma variable dans le cluster 1 (associé à la composante 1) ou dans le 2.
Donc mon problème est que je n'arrive pas à trouver la formule du coefficient de corrélation linéaire dans le cas où j'ai deux vecteurs de tailles différentes... (ce qui l'est forcément puisqu'on nous avons d'un coté la variable de taille n x 1 et ma composante qui est de taille p x 1 où p désigne mon nombre de variable et n ma taille d'échantillon).
En vous remerciant d'avance.
NB: je n'exclus pas la possibilité d'avoir mal compris cette étape de l'algorithme, je suis preneur de rectification éventuelle.
L'algorithme commence par une ACP sur le jeu de variables complet et en extrait les 2 premières valeurs propres et les composantes principales (vecteurs propres associés). Mon souci est la phase suivante qui consiste à envoyer tel ou tel variable dans tel ou tel cluster en fonction du coefficient de corrélation linéaire entre la variable et la composante principale, en standardisant ce coefficient j'obtient donc 2 valeurs, une pour chacune des 2 composantes puis la valeur la plus grande me permet de déterminer si j'envoi ma variable dans le cluster 1 (associé à la composante 1) ou dans le 2.
Donc mon problème est que je n'arrive pas à trouver la formule du coefficient de corrélation linéaire dans le cas où j'ai deux vecteurs de tailles différentes... (ce qui l'est forcément puisqu'on nous avons d'un coté la variable de taille n x 1 et ma composante qui est de taille p x 1 où p désigne mon nombre de variable et n ma taille d'échantillon).
En vous remerciant d'avance.
NB: je n'exclus pas la possibilité d'avoir mal compris cette étape de l'algorithme, je suis preneur de rectification éventuelle.
Re: Problème avec l'algorithme VarClus
Toutes les réponses pour cet algorithme ici: http://www.math.u-bordeaux.fr/~vkuentz/SFC2007_Kuentz.pdf
Sujets similaires
» Problème avec R
» probleme avec loi exponentielle
» problème avec hypothèse de régression
» Problème avec ANOVA
» probléme avec les zéros!!!!
» probleme avec loi exponentielle
» problème avec hypothèse de régression
» Problème avec ANOVA
» probléme avec les zéros!!!!
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum