Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Catégorisation par segments prédéfinis
2 participants
Page 1 sur 1
Catégorisation par segments prédéfinis
Bonjour
Je dispose d'un jeu de données (ici, agence de voyage) de 1000 individus et 9 variables. Le but du jeu est de "catégoriser" les individus selon des segments prédéfinis.
Les variables :
NomID
Sexe (0=F,1=M)
Age
Nombre d'accompagnateurs
Nombre de Miles
Age du plus jeune enfant
Revenu
Longs trajets
Owner/Employee (0/1)
En l’occurrence, les segments qu'on m'impose sont :
1. Moins de 30 ans, 0 - 1 accompagnateurs, moins de 10,000 miles et Longs trajets <=1
2. Entre 30 - 50 ans, Longs trajets < 2, 2 + accompagnateurs, Revenu > 60,000
3. Plus de 40 ans, Longs trajets > 3, Revenu > 80,000, Employé, plus de 50,000 Miles
4. Plus de 60 ans, Pas d'enfants de moins de 16 ans, 0 -1 accompagnateurs, Revenu > 60,000
Alors je pense qu'on me demande de mettre chaque client dans l'un des 4, mais beaucoup ne rentrent dans aucun car ne respectent pas toutes les conditions (en fait 404 lignes sur les 1000 !).
Donc j'ai supposé qu'il fallait attribuer à chaque client le segment qui lui est le plus "proche", mais là je bloque... En supposant que chaque condition pour appartenir à l'un des segments
est d'importance identique, il me faudrait définir une "norme" pour mesurer la "distance d'un individu à ce segment" - mais je n'ai aucune idée de comment faire ça.
Toute aide serait la bienvenue ! (et même suggestion sur comment traiter la question différemment...)
Je dispose d'un jeu de données (ici, agence de voyage) de 1000 individus et 9 variables. Le but du jeu est de "catégoriser" les individus selon des segments prédéfinis.
Les variables :
NomID
Sexe (0=F,1=M)
Age
Nombre d'accompagnateurs
Nombre de Miles
Age du plus jeune enfant
Revenu
Longs trajets
Owner/Employee (0/1)
En l’occurrence, les segments qu'on m'impose sont :
1. Moins de 30 ans, 0 - 1 accompagnateurs, moins de 10,000 miles et Longs trajets <=1
2. Entre 30 - 50 ans, Longs trajets < 2, 2 + accompagnateurs, Revenu > 60,000
3. Plus de 40 ans, Longs trajets > 3, Revenu > 80,000, Employé, plus de 50,000 Miles
4. Plus de 60 ans, Pas d'enfants de moins de 16 ans, 0 -1 accompagnateurs, Revenu > 60,000
Alors je pense qu'on me demande de mettre chaque client dans l'un des 4, mais beaucoup ne rentrent dans aucun car ne respectent pas toutes les conditions (en fait 404 lignes sur les 1000 !).
Donc j'ai supposé qu'il fallait attribuer à chaque client le segment qui lui est le plus "proche", mais là je bloque... En supposant que chaque condition pour appartenir à l'un des segments
est d'importance identique, il me faudrait définir une "norme" pour mesurer la "distance d'un individu à ce segment" - mais je n'ai aucune idée de comment faire ça.
Toute aide serait la bienvenue ! (et même suggestion sur comment traiter la question différemment...)
hydre- Nombre de messages : 7
Date d'inscription : 14/08/2015
Re: Catégorisation par segments prédéfinis
Tu supposes trop. On t'impose 4 catégories, tu décris l'effectif des 4 imposées et tu signales que 40.4 % des clients sont non classés.
La vraie question, c'est pourquoi ces 4 catégories sont imposées. Si il y a une vraie bonne raison, le fait que 40% des clients ne rentrent dans aucune catégorie prédéfinie est une information importante.
La vraie question, c'est pourquoi ces 4 catégories sont imposées. Si il y a une vraie bonne raison, le fait que 40% des clients ne rentrent dans aucune catégorie prédéfinie est une information importante.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Catégorisation par segments prédéfinis
Merci beaucoup pour ta réponse c@ssoulet.
Tu as raison, en plus ces segments ne sont vraiment pas pertinents pour décrire l'ensemble des clients. Je vais faire comme ça, donner la répartition des clients par catégorie, et ensuite suggérer d'autres catégories en passant par une ACP (avec 5 axes j'ai 80% de variance expliquée, et 6 axes me donnent 88%).
Je ne sais pas s'il y a une bonne raison pour laquelle on m'impose ces 4 catégories, c'est un exercice pour un entretien d'embauche. La seule consigne est :
But : Catégoriser les membres de l'échantillon en 4 larges segments basés sur des variables données. De plus, construire un modèle pour prédire les segments des nouveaux membres en utilisant la relation entre les segments et les variables significatives.
(c'est une traduction de l'énoncé en anglais... c'est pour un entretien d'embauche...)
Tu as raison, en plus ces segments ne sont vraiment pas pertinents pour décrire l'ensemble des clients. Je vais faire comme ça, donner la répartition des clients par catégorie, et ensuite suggérer d'autres catégories en passant par une ACP (avec 5 axes j'ai 80% de variance expliquée, et 6 axes me donnent 88%).
Je ne sais pas s'il y a une bonne raison pour laquelle on m'impose ces 4 catégories, c'est un exercice pour un entretien d'embauche. La seule consigne est :
But : Catégoriser les membres de l'échantillon en 4 larges segments basés sur des variables données. De plus, construire un modèle pour prédire les segments des nouveaux membres en utilisant la relation entre les segments et les variables significatives.
(c'est une traduction de l'énoncé en anglais... c'est pour un entretien d'embauche...)
hydre- Nombre de messages : 7
Date d'inscription : 14/08/2015
Re: Catégorisation par segments prédéfinis
En fait je viens de penser qu'on veut peut-être de moi que j'attribue effectivement une catégorie à chaque membre (je ne sais pas encore comment traiter les 40% qui ne rentrent pas parfaitement dans une catégorie), et ensuite que j'applique un algo d'apprentissage genre arbre de décision, catégorie ~ données.
Si je ne me trompe pas, ça veut dire qu'il faudrait que je trouve un moyen d'affecter quand-même une catégorie aux 40% en question...
Une idée ?
Si je ne me trompe pas, ça veut dire qu'il faudrait que je trouve un moyen d'affecter quand-même une catégorie aux 40% en question...
Une idée ?
hydre- Nombre de messages : 7
Date d'inscription : 14/08/2015
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|