Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Réalisation d'un clustering
3 participants
Page 1 sur 1
Réalisation d'un clustering
Bonjour à tous,
Dans le cadre de mes études, j'ai du réaliser une recherche concernant les types de carrières d'environ 400 travailleurs. Je compte utiliser une technique de clustering non supervisé pour regrouper les individus disposant de caractéristiques de carrières similaires, mais je n'ai aucune idée de comment choisir le type de cluster, l'algorithme, le type de mesure de distance ainsi que le critère d'agrégation à utiliser. Quelqu'un pourrait-il m'expliquer le processus de sélection de ces différents éléments?
De plus, je me demandais quelles autres types d'analyse je pourrais effectuer pour compléter ce clustering. Je pensais faire des analyses factorielles exploratoires, une analyse de la normalité ainsi que des régressions linéaires. Pensez-vous que cela soit suffisant?
Je ne sais pas si les informations que j'ai donné sont suffisantes pour répondre à ces questions, je peux donc en donner d'autres au besoin. Il s'agit de mon tout premier post, je m'excuse donc d'avance si j'ai pu commettre une quelconque maladresse dans sa rédaction.
Un tout grand merci!
Dans le cadre de mes études, j'ai du réaliser une recherche concernant les types de carrières d'environ 400 travailleurs. Je compte utiliser une technique de clustering non supervisé pour regrouper les individus disposant de caractéristiques de carrières similaires, mais je n'ai aucune idée de comment choisir le type de cluster, l'algorithme, le type de mesure de distance ainsi que le critère d'agrégation à utiliser. Quelqu'un pourrait-il m'expliquer le processus de sélection de ces différents éléments?
De plus, je me demandais quelles autres types d'analyse je pourrais effectuer pour compléter ce clustering. Je pensais faire des analyses factorielles exploratoires, une analyse de la normalité ainsi que des régressions linéaires. Pensez-vous que cela soit suffisant?
Je ne sais pas si les informations que j'ai donné sont suffisantes pour répondre à ces questions, je peux donc en donner d'autres au besoin. Il s'agit de mon tout premier post, je m'excuse donc d'avance si j'ai pu commettre une quelconque maladresse dans sa rédaction.
Un tout grand merci!
MatthDan- Nombre de messages : 2
Date d'inscription : 25/06/2017
Re: Réalisation d'un clustering
Bonjour,
parmi les différentes techniques de classification non supervisée tu as principalement la CAH et les k-means, il en existe d'autres mais ce sont là les deux plus répandues.
Si tu as des données qualitatives, il faut faire une ACM au préalable.
Ensuite il existe des méthodes statistiques (les "valeur-tests")pour pouvoir interpréter tes différentes classes vis-à-vis de ta populations globale.
Comme tu n'as que 400 lignes je te conseillerai de partir directement sur une CAH plutôt que la méthodes k-means.
Niaboc
parmi les différentes techniques de classification non supervisée tu as principalement la CAH et les k-means, il en existe d'autres mais ce sont là les deux plus répandues.
Si tu as des données qualitatives, il faut faire une ACM au préalable.
Ensuite il existe des méthodes statistiques (les "valeur-tests")pour pouvoir interpréter tes différentes classes vis-à-vis de ta populations globale.
Comme tu n'as que 400 lignes je te conseillerai de partir directement sur une CAH plutôt que la méthodes k-means.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Réalisation d'un clustering
Bonjour,
Pour des variables qualitatives tu peux aussi estimer des matrices de distances avec la distance de Gower, qui peut aussi permettre de prendre en compte des variables ordinales.
Après la logique derrière la CAH et la méthode k-means n'est pas la même non plus, tout dépendra de tes objectifs.
cdlt
Pour des variables qualitatives tu peux aussi estimer des matrices de distances avec la distance de Gower, qui peut aussi permettre de prendre en compte des variables ordinales.
Après la logique derrière la CAH et la méthode k-means n'est pas la même non plus, tout dépendra de tes objectifs.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Réalisation d'un clustering
Un tout grand merci pour vos réponses, ça m'aide beaucoup!
MatthDan- Nombre de messages : 2
Date d'inscription : 25/06/2017
Sujets similaires
» AFC et clustering sur pourcentages
» Clustering
» Réalisation de test pour un CSI
» Réalisation d'une typologie CAH?
» k-means clustering
» Clustering
» Réalisation de test pour un CSI
» Réalisation d'une typologie CAH?
» k-means clustering
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum