Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

-40%
Le deal à ne pas rater :
-40% sur le Pack Gaming Mario PDP Manette filaire + Casque filaire ...
29.99 € 49.99 €
Voir le deal

Catégorisation par segments prédéfinis

2 participants

Aller en bas

Catégorisation par segments prédéfinis Empty Catégorisation par segments prédéfinis

Message par hydre Dim 17 Jan 2016 - 15:47

Bonjour Smile

Je dispose d'un jeu de données (ici, agence de voyage) de 1000 individus et 9 variables. Le but du jeu est de "catégoriser" les individus selon des segments prédéfinis.

Les variables :
NomID
Sexe (0=F,1=M)
Age
Nombre d'accompagnateurs
Nombre de Miles
Age du plus jeune enfant
Revenu
Longs trajets
Owner/Employee (0/1)

En l’occurrence, les segments qu'on m'impose sont :
1. Moins de 30 ans, 0 - 1 accompagnateurs, moins de 10,000 miles et Longs trajets <=1
2. Entre 30 - 50 ans, Longs trajets < 2, 2 + accompagnateurs, Revenu > 60,000
3. Plus de 40 ans, Longs trajets > 3, Revenu > 80,000, Employé, plus de 50,000 Miles
4. Plus de 60 ans, Pas d'enfants de moins de 16 ans, 0 -1 accompagnateurs, Revenu > 60,000

Alors je pense qu'on me demande de mettre chaque client dans l'un des 4, mais beaucoup ne rentrent dans aucun car ne respectent pas toutes les conditions (en fait 404 lignes sur les 1000 !).
Donc j'ai supposé qu'il fallait attribuer à chaque client le segment qui lui est le plus "proche", mais là je bloque... En supposant que chaque condition pour appartenir à l'un des segments
est d'importance identique, il me faudrait définir une "norme" pour mesurer la "distance d'un individu à ce segment" - mais je n'ai aucune idée de comment faire ça.

Toute aide serait la bienvenue ! (et même suggestion sur comment traiter la question différemment...)

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Revenir en haut Aller en bas

Catégorisation par segments prédéfinis Empty Re: Catégorisation par segments prédéfinis

Message par c@ssoulet Lun 18 Jan 2016 - 10:26

Tu supposes trop. On t'impose 4 catégories, tu décris l'effectif des 4 imposées et tu signales que 40.4 % des clients sont non classés.

La vraie question, c'est pourquoi ces 4 catégories sont imposées. Si il y a une vraie bonne raison, le fait que 40% des clients ne rentrent dans aucune catégorie prédéfinie est une information importante.

c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Catégorisation par segments prédéfinis Empty Re: Catégorisation par segments prédéfinis

Message par hydre Lun 18 Jan 2016 - 16:19

Merci beaucoup pour ta réponse c@ssoulet.

Tu as raison, en plus ces segments ne sont vraiment pas pertinents pour décrire l'ensemble des clients. Je vais faire comme ça, donner la répartition des clients par catégorie, et ensuite suggérer d'autres catégories en passant par une ACP (avec 5 axes j'ai 80% de variance expliquée, et 6 axes me donnent 88%).

Je ne sais pas s'il y a une bonne raison pour laquelle on m'impose ces 4 catégories, c'est un exercice pour un entretien d'embauche. La seule consigne est :
But : Catégoriser les membres de l'échantillon en 4 larges segments basés sur des variables données. De plus, construire un modèle pour prédire les segments des nouveaux membres en utilisant la relation entre les segments et les variables significatives.
(c'est une traduction de l'énoncé en anglais... c'est pour un entretien d'embauche...)

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Revenir en haut Aller en bas

Catégorisation par segments prédéfinis Empty Re: Catégorisation par segments prédéfinis

Message par hydre Lun 18 Jan 2016 - 20:49

En fait je viens de penser qu'on veut peut-être de moi que j'attribue effectivement une catégorie à chaque membre (je ne sais pas encore comment traiter les 40% qui ne rentrent pas parfaitement dans une catégorie), et ensuite que j'applique un algo d'apprentissage genre arbre de décision, catégorie ~ données.

Si je ne me trompe pas, ça veut dire qu'il faudrait que je trouve un moyen d'affecter quand-même une catégorie aux 40% en question...

Une idée ? Question Idea

hydre

Nombre de messages : 7
Date d'inscription : 14/08/2015

Revenir en haut Aller en bas

Catégorisation par segments prédéfinis Empty Re: Catégorisation par segments prédéfinis

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum