Les posteurs les plus actifs de la semaine
Pchalix
 
victornitho
 
joyeux_lapin13
 
zezima
 
c@ssoulet
 


Catégorisation par segments prédéfinis

Voir le sujet précédent Voir le sujet suivant Aller en bas

Catégorisation par segments prédéfinis

Message par hydre le Dim 17 Jan 2016 - 15:47

Bonjour Smile

Je dispose d'un jeu de données (ici, agence de voyage) de 1000 individus et 9 variables. Le but du jeu est de "catégoriser" les individus selon des segments prédéfinis.

Les variables :
NomID
Sexe (0=F,1=M)
Age
Nombre d'accompagnateurs
Nombre de Miles
Age du plus jeune enfant
Revenu
Longs trajets
Owner/Employee (0/1)

En l’occurrence, les segments qu'on m'impose sont :
1. Moins de 30 ans, 0 - 1 accompagnateurs, moins de 10,000 miles et Longs trajets <=1
2. Entre 30 - 50 ans, Longs trajets < 2, 2 + accompagnateurs, Revenu > 60,000
3. Plus de 40 ans, Longs trajets > 3, Revenu > 80,000, Employé, plus de 50,000 Miles
4. Plus de 60 ans, Pas d'enfants de moins de 16 ans, 0 -1 accompagnateurs, Revenu > 60,000

Alors je pense qu'on me demande de mettre chaque client dans l'un des 4, mais beaucoup ne rentrent dans aucun car ne respectent pas toutes les conditions (en fait 404 lignes sur les 1000 !).
Donc j'ai supposé qu'il fallait attribuer à chaque client le segment qui lui est le plus "proche", mais là je bloque... En supposant que chaque condition pour appartenir à l'un des segments
est d'importance identique, il me faudrait définir une "norme" pour mesurer la "distance d'un individu à ce segment" - mais je n'ai aucune idée de comment faire ça.

Toute aide serait la bienvenue ! (et même suggestion sur comment traiter la question différemment...)

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Catégorisation par segments prédéfinis

Message par c@ssoulet le Lun 18 Jan 2016 - 10:26

Tu supposes trop. On t'impose 4 catégories, tu décris l'effectif des 4 imposées et tu signales que 40.4 % des clients sont non classés.

La vraie question, c'est pourquoi ces 4 catégories sont imposées. Si il y a une vraie bonne raison, le fait que 40% des clients ne rentrent dans aucune catégorie prédéfinie est une information importante.

c@ssoulet

Nombre de messages : 647
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Catégorisation par segments prédéfinis

Message par hydre le Lun 18 Jan 2016 - 16:19

Merci beaucoup pour ta réponse c@ssoulet.

Tu as raison, en plus ces segments ne sont vraiment pas pertinents pour décrire l'ensemble des clients. Je vais faire comme ça, donner la répartition des clients par catégorie, et ensuite suggérer d'autres catégories en passant par une ACP (avec 5 axes j'ai 80% de variance expliquée, et 6 axes me donnent 88%).

Je ne sais pas s'il y a une bonne raison pour laquelle on m'impose ces 4 catégories, c'est un exercice pour un entretien d'embauche. La seule consigne est :
But : Catégoriser les membres de l'échantillon en 4 larges segments basés sur des variables données. De plus, construire un modèle pour prédire les segments des nouveaux membres en utilisant la relation entre les segments et les variables significatives.
(c'est une traduction de l'énoncé en anglais... c'est pour un entretien d'embauche...)

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Catégorisation par segments prédéfinis

Message par hydre le Lun 18 Jan 2016 - 20:49

En fait je viens de penser qu'on veut peut-être de moi que j'attribue effectivement une catégorie à chaque membre (je ne sais pas encore comment traiter les 40% qui ne rentrent pas parfaitement dans une catégorie), et ensuite que j'applique un algo d'apprentissage genre arbre de décision, catégorie ~ données.

Si je ne me trompe pas, ça veut dire qu'il faudrait que je trouve un moyen d'affecter quand-même une catégorie aux 40% en question...

Une idée ? Question Idea

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Catégorisation par segments prédéfinis

Message par Contenu sponsorisé Aujourd'hui à 8:10


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum