Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Manga Chainsaw Man : où acheter le Tome 17 édition Collector de ...
19.99 €
Voir le deal

classification ascendante hiérarchique

2 participants

Aller en bas

classification ascendante hiérarchique Empty classification ascendante hiérarchique

Message par elloumim Mer 17 Fév 2016 - 11:49

Bonjour,

Je suis entrain d'appliquer une CAH sur une grosse base de données avec (10 variables) et (3860 observations).

J'ai utilisé :

  • la library "ade4" pour faire l'ACM  et calculer la matrice des distances


  • la library "fastcluster" pour calculer et traçer le dendrogramme qui est, logiquement, non interprétable. ( la méthode utilisé est "Ward.D2")

Du coup, j'ai procédé par le seuillage pour le découper et pour mieux étudier les liaisons entre les observations.

Merci de trouver, ci-joint, le graph de la projection de typologie obtenues selon les 4 premiers axes.
https://i.servimg.com/u/f84/19/42/18/63/rplot11.jpg
classification ascendante hiérarchique Rplot12
Ma question est la suivante :

Comment où avec quelle commande je pourrais savoir  :

  • Gràce à quelles variables les classes sont obtenues dans le dendrogramme ?


  • dans la projection des typologie, les classes, par exemple 2 et 5, sont trés proches par l'effet de quelles variables ?

Merci,
Bien cordialement.

elloumim

Nombre de messages : 6
Date d'inscription : 15/02/2016

Revenir en haut Aller en bas

classification ascendante hiérarchique Empty Re: classification ascendante hiérarchique

Message par Nik Ven 19 Fév 2016 - 9:46

Bonjour,

Une CAH ne permet pas d'obtenir directement le lien entre variables de départ et classes obtenues car tout simplement la CAH est faite sur la matrice de distance entre les objets et non sur la matrice des données de départ.

Si tu veux ce type d'info il faut partir sur d'autres méthodes que pour ma part je maitrise peu et qui permettent à la fois de générer une classification et d'avoir une info sur les contributions des variables (random forest, regression tree, réseau de neurones...)

A partir de ta CAH, tu peux regarder quelle classification explique le plus d'inertie dans le plan factoriel et regarder quelles variables contribuent aux axes pour avoir une idée des variables qui expliquent le mieux ta classification. Mais ce ne sera qu'indicatif à mon avis.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum