Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
classification ascendante hiérarchique
2 participants
Page 1 sur 1
classification ascendante hiérarchique
Bonjour,
Je suis entrain d'appliquer une CAH sur une grosse base de données avec (10 variables) et (3860 observations).
J'ai utilisé :
Du coup, j'ai procédé par le seuillage pour le découper et pour mieux étudier les liaisons entre les observations.
Merci de trouver, ci-joint, le graph de la projection de typologie obtenues selon les 4 premiers axes.
https://i.servimg.com/u/f84/19/42/18/63/rplot11.jpg
Ma question est la suivante :
Comment où avec quelle commande je pourrais savoir :
Merci,
Bien cordialement.
Je suis entrain d'appliquer une CAH sur une grosse base de données avec (10 variables) et (3860 observations).
J'ai utilisé :
- la library "ade4" pour faire l'ACM et calculer la matrice des distances
- la library "fastcluster" pour calculer et traçer le dendrogramme qui est, logiquement, non interprétable. ( la méthode utilisé est "Ward.D2")
Du coup, j'ai procédé par le seuillage pour le découper et pour mieux étudier les liaisons entre les observations.
Merci de trouver, ci-joint, le graph de la projection de typologie obtenues selon les 4 premiers axes.
https://i.servimg.com/u/f84/19/42/18/63/rplot11.jpg
Ma question est la suivante :
Comment où avec quelle commande je pourrais savoir :
- Gràce à quelles variables les classes sont obtenues dans le dendrogramme ?
- dans la projection des typologie, les classes, par exemple 2 et 5, sont trés proches par l'effet de quelles variables ?
Merci,
Bien cordialement.
elloumim- Nombre de messages : 6
Date d'inscription : 15/02/2016
Re: classification ascendante hiérarchique
Bonjour,
Une CAH ne permet pas d'obtenir directement le lien entre variables de départ et classes obtenues car tout simplement la CAH est faite sur la matrice de distance entre les objets et non sur la matrice des données de départ.
Si tu veux ce type d'info il faut partir sur d'autres méthodes que pour ma part je maitrise peu et qui permettent à la fois de générer une classification et d'avoir une info sur les contributions des variables (random forest, regression tree, réseau de neurones...)
A partir de ta CAH, tu peux regarder quelle classification explique le plus d'inertie dans le plan factoriel et regarder quelles variables contribuent aux axes pour avoir une idée des variables qui expliquent le mieux ta classification. Mais ce ne sera qu'indicatif à mon avis.
Nik
Une CAH ne permet pas d'obtenir directement le lien entre variables de départ et classes obtenues car tout simplement la CAH est faite sur la matrice de distance entre les objets et non sur la matrice des données de départ.
Si tu veux ce type d'info il faut partir sur d'autres méthodes que pour ma part je maitrise peu et qui permettent à la fois de générer une classification et d'avoir une info sur les contributions des variables (random forest, regression tree, réseau de neurones...)
A partir de ta CAH, tu peux regarder quelle classification explique le plus d'inertie dans le plan factoriel et regarder quelles variables contribuent aux axes pour avoir une idée des variables qui expliquent le mieux ta classification. Mais ce ne sera qu'indicatif à mon avis.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Classification R
» Classification
» Régression hierarchique bayesienne
» Classification
» ACM et classification
» Classification
» Régression hierarchique bayesienne
» Classification
» ACM et classification
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum