Les posteurs les plus actifs de la semaine
lili33
 
gg
 
Eric Wajnberg
 
FannyM
 
stdenis90
 
solenef
 


Divers questions sur méthodes de classification

Aller en bas

Divers questions sur méthodes de classification

Message par Lili07 le Ven 26 Jan 2018 - 10:50

Bonjour à tous,
J'utilise XLstats comme logiciel et je dispose d'un jeu de données avec 100 patients et 7 variables, à partir desquels j'aimerais déterminer des groupes de patients qui présentent des profils similaires de métabolites donc mes 7 variables.
J'ai donc plusieurs questions :
1) certaines de mes variables suivent une loi normale d'autres non, dois-je utiliser des valeurs brutes ou log-transformées mes data avant de réaliser la classification ? si j'utilise la CAH je peux centrer-réduire mes data (colonnes ou lignes, je susspose que je dois sélectionner colonnes ?), est-ce suffisant?
2) Par ailleurs, compte-tenu du jeu de données dont je dispose, me recommandez-vous d'utiliser une CAH ou la méthode des k-moyennes, je sais également que l'on peut réaliser les deux méthodes en compléments mais je ne sais pas comment la réaliser.
Voilà, en bidouillant un petit peu j'ai trouvé une classification trés intéréssante mais j'avais sélectionné de centrer-réduire mes lignes et une troncature automatique en utilisant l'inertie, cependant plus je me renseigne et plus j'ai l'impression que ma classification n'est pas valide ...
Merci beaucoup pour votre aide Very Happy

Lili07

Nombre de messages : 1
Date d'inscription : 26/01/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum