Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Arbre de décision (?) pour profil clients?
2 participants
Page 1 sur 1
Arbre de décision (?) pour profil clients?
Bonjour tout le monde,
Voilà j'essaye de segmenter ma population en : acheteurs/non acheteurs (limite scoring d'appétence) pour un client qui fait du e commerce.
J'ai à ma disposition pour chaque personne qui a cliqué sur son site le nombre de fois où la personne a cliqué, le nombre d'achats (si il y a achat), le(s) montant(s), les dates de clics et d'achats, si il est venu par un moteur de recherche ou directement sur le site.
Du coup j'ai la date à laquelle je l'ai vu pour la première fois, pour la dernière fois, idem pour les achats, son "taux de conversion" (i.e. le nombre d'achats/le nombre de visites sur le sites), etc.
Très franchement j'ai du mal à voir comment une segmentation ici peut être "intéressante" sans être purement déterministe?
Ma variable à "prédire" (ou à expliquer) est dans un premier temps le fait d'acheter ou pas (puis après si la personne achète beaucoup ou pas) mais vraiment je ne vois pas d'autres indicateurs qui pourraient être intéressants à partir de mes données (comme me créer une fréquence de visites? fréquence d'achats?).
Si quelqu'un a une idée je suis preneur, pour le moment je pense à un arbre de décision (un peu "bête") avec comme variable à expliquer l'Achat (ou non) et voir suivant tout ça où j'ai le plus gros taux d'acheteurs dans les groupes crées.
Any idea?
Cordialement,
Qualitative
Voilà j'essaye de segmenter ma population en : acheteurs/non acheteurs (limite scoring d'appétence) pour un client qui fait du e commerce.
J'ai à ma disposition pour chaque personne qui a cliqué sur son site le nombre de fois où la personne a cliqué, le nombre d'achats (si il y a achat), le(s) montant(s), les dates de clics et d'achats, si il est venu par un moteur de recherche ou directement sur le site.
Du coup j'ai la date à laquelle je l'ai vu pour la première fois, pour la dernière fois, idem pour les achats, son "taux de conversion" (i.e. le nombre d'achats/le nombre de visites sur le sites), etc.
Très franchement j'ai du mal à voir comment une segmentation ici peut être "intéressante" sans être purement déterministe?
Ma variable à "prédire" (ou à expliquer) est dans un premier temps le fait d'acheter ou pas (puis après si la personne achète beaucoup ou pas) mais vraiment je ne vois pas d'autres indicateurs qui pourraient être intéressants à partir de mes données (comme me créer une fréquence de visites? fréquence d'achats?).
Si quelqu'un a une idée je suis preneur, pour le moment je pense à un arbre de décision (un peu "bête") avec comme variable à expliquer l'Achat (ou non) et voir suivant tout ça où j'ai le plus gros taux d'acheteurs dans les groupes crées.
Any idea?
Cordialement,
Qualitative
Qualitative- Nombre de messages : 25
Date d'inscription : 21/12/2012
Re: Arbre de décision (?) pour profil clients?
Salut,
Si ton client ne sait pas ce qui l'intéresse à partir de ses données, ce n'est pas au statisticien de lui fournir les questions qu'il doit se poser.
Sans questionnement, pas de stats.
Donc si pour le moment il s'agit de faire de la classification de type oui/non et de savoir quelle(s) variable(s) explique(nt) cette classification alors une "simple" régression logistique fera très bien ça.
Après des méthodes de classification il y a en a beaucoup donc on peut vite partir dans bcp de tests de différentes méthodes...mais ça n'a que rarement d'intérêt
Nik
Si ton client ne sait pas ce qui l'intéresse à partir de ses données, ce n'est pas au statisticien de lui fournir les questions qu'il doit se poser.
Sans questionnement, pas de stats.
Donc si pour le moment il s'agit de faire de la classification de type oui/non et de savoir quelle(s) variable(s) explique(nt) cette classification alors une "simple" régression logistique fera très bien ça.
Après des méthodes de classification il y a en a beaucoup donc on peut vite partir dans bcp de tests de différentes méthodes...mais ça n'a que rarement d'intérêt
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Arbre de décision (?) pour profil clients?
C'est un peu mon idée oui.
Je crois que ce qu'il souhaite c'est surtout prédire les BONS acheteurs des "MAUVAIS" acheteurs donc la variable à prédire n'est plus du tout la même.
Ici on est sur l'idée que telle personne achète plus en moyenne que la moitié de la population ou quelque chose dans le genre. Enfin j'imagine.
Et dans ce cas le moyen le plus "visuel" (derrière c'est du commercial) c'est plus un arbre de décision non? Ou autre chose?
Par contre je n'ai pas bien suivi le coup de la régression logistique? Là très franchement j'ai du mal à voir quelle(s) variable(s) expliquent l'achat ou non à la vue des variables à disposition.
A la limite je le ferai et j'essaierai de lui expliquer cela ... mais c'est pas gagné, l'impression que je suis madame soleil parfois.
En vous remerciant encore,
Qualitative
Je crois que ce qu'il souhaite c'est surtout prédire les BONS acheteurs des "MAUVAIS" acheteurs donc la variable à prédire n'est plus du tout la même.
Ici on est sur l'idée que telle personne achète plus en moyenne que la moitié de la population ou quelque chose dans le genre. Enfin j'imagine.
Et dans ce cas le moyen le plus "visuel" (derrière c'est du commercial) c'est plus un arbre de décision non? Ou autre chose?
Par contre je n'ai pas bien suivi le coup de la régression logistique? Là très franchement j'ai du mal à voir quelle(s) variable(s) expliquent l'achat ou non à la vue des variables à disposition.
A la limite je le ferai et j'essaierai de lui expliquer cela ... mais c'est pas gagné, l'impression que je suis madame soleil parfois.
En vous remerciant encore,
Qualitative
Qualitative- Nombre de messages : 25
Date d'inscription : 21/12/2012
Re: Arbre de décision (?) pour profil clients?
Là très franchement j'ai du mal à voir quelle(s) variable(s) expliquent l'achat ou non à la vue des variables à disposition.
Peut-être aucune...il tu peux regarder au moins si le fait de cliquer souvent engendre un achat plus souvent ou non, s'il y a des périodes plus propices aux achats que d'autres. Pour ton client ça peut l'aider à redéfinir sa stratégie commerciale.
Bref demande lui avant tout ce qu'il attend de ces données car ça orientera nécessairement ta façon de voir les données.
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Arbre de décision (?) pour profil clients?
Nik a écrit:Là très franchement j'ai du mal à voir quelle(s) variable(s) expliquent l'achat ou non à la vue des variables à disposition.
Peut-être aucune...il tu peux regarder au moins si le fait de cliquer souvent engendre un achat plus souvent ou non, s'il y a des périodes plus propices aux achats que d'autres. Pour ton client ça peut l'aider à redéfinir sa stratégie commerciale.
Bref demande lui avant tout ce qu'il attend de ces données car ça orientera nécessairement ta façon de voir les données.
nik
Bon l'idée est à partir des données présentes de catégoriser les acheteurs des non acheteurs et les bons acheteurs des mauvais acheteurs (en gros un bon acheteur donne beaucoup d'argent, et il va acheter souvent) pour pouvoir mieux cibler le client et lui proposer un achat en rapport avec ses moyens.
Forcément la période des soldes biaisent tous les résultats et je pensais les "virer" pour voir en dehors de cette période ce qui se passe.
J'ai fait des régressions logistiques du style expliquer la variable en fonction d'une seule autre (et cela pour chaque variable explicative à ma disposition) et rien n'en sort.
Enfin si parfois j'ai des coefficients (paramètres estimés pour le modèle) aux alentours de 0.05 (grand max) mais derrière un très (trop?) grand AIC ou même une déviation nulle et une déviation résiduelle super élevées (en même temps plus de 100000 individus ça peut jouer).
Je n'ai pas normaliser mes données pour le moment (souvent des % pour les indicateurs, et des € pour le montant, le reste étant des variables quali.) ... est-ce correct de le faire comme ça où y'a t'il une erreur?
Si vous avez des idées pour la segmentation je suis preneur, là je patauge encore plus.
Cdlt,
Qualitative
Qualitative- Nombre de messages : 25
Date d'inscription : 21/12/2012
Re: Arbre de décision (?) pour profil clients?
c'est pas clairEnfin si parfois j'ai des coefficients (paramètres estimés pour le modèle) aux alentours de 0.05 (grand max) mais derrière un très (trop?) grand AIC ou même une déviation nulle et une déviation résiduelle super élevées (en même temps plus de 100000 individus ça peut jouer).
ça veut pas dire qu'en multivarié ça ne va pas donner des choses différentes. Il faut construire tes modèles selon des hypothèses raisonnables et pas partir au pif...
J'ai fait des régressions logistiques du style expliquer la variable en fonction d'une seule autre (et cela pour chaque variable explicative à ma disposition) et rien n'en sort.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Arbre de décision (?) pour profil clients?
[quote="Nik"]
Maintenant le calcul de l'AIC me donne quelque chose de super élevé aussi et c'est plus ça qui m'inquiète.
Je sais mais que ce soit en multivariée, en univariée, etc. ça me donne pas grand chose de "super" exploitable. Après si je pars un peu en testant tout c'est que j'ai aucune idée de quelle(s) variable(s) explicative(s) va/peut jouer un rôle ou non. C'est pas quelque chose du style "expliquer la variable X en fonction des variables Y et Z pour que je comprenne ..." que le client me demande. C'est beaucoup moins précis, beaucoup plus "macro" à savoir explorer les données et les éventuelles relations.
Cdlt,
Qualitative
c'est pas clairEnfin si parfois j'ai des coefficients (paramètres estimés pour le modèle) aux alentours de 0.05 (grand max) mais derrière un très (trop?) grand AIC ou même une déviation nulle et une déviation résiduelle super élevées (en même temps plus de 100000 individus ça peut jouer).
Effectivement c'est pas clair, désolé. Lorsque je fais ma régression logistique en multivariée (ou en univariée), les paramètres estimés de mon modèle sont très faible, mais en même temps j'ai beaucoup de variables donc ça peut jouer.
Maintenant le calcul de l'AIC me donne quelque chose de super élevé aussi et c'est plus ça qui m'inquiète.
Nik a écrit:ça veut pas dire qu'en multivarié ça ne va pas donner des choses différentes. Il faut construire tes modèles selon des hypothèses raisonnables et pas partir au pif...
J'ai fait des régressions logistiques du style expliquer la variable en fonction d'une seule autre (et cela pour chaque variable explicative à ma disposition) et rien n'en sort.
Je sais mais que ce soit en multivariée, en univariée, etc. ça me donne pas grand chose de "super" exploitable. Après si je pars un peu en testant tout c'est que j'ai aucune idée de quelle(s) variable(s) explicative(s) va/peut jouer un rôle ou non. C'est pas quelque chose du style "expliquer la variable X en fonction des variables Y et Z pour que je comprenne ..." que le client me demande. C'est beaucoup moins précis, beaucoup plus "macro" à savoir explorer les données et les éventuelles relations.
Cdlt,
Qualitative
Qualitative- Nombre de messages : 25
Date d'inscription : 21/12/2012
Re: Arbre de décision (?) pour profil clients?
non le nb de variable n'influe pas directement la valeur des paramètres. Cela vient plutôt du déséquilibre dans le plan d'expérience.les paramètres estimés de mon modèle sont très faible, mais en même temps j'ai beaucoup de variables donc ça peut jouer.
L'AIC dépend des données et n'est interprétable que comparativement à une autre valeur d'AIC calculée sur les mêmes données pour la variable expliquée.Maintenant le calcul de l'AIC me donne quelque chose de super élevé aussi et c'est plus ça qui m'inquiète.
C'est à toi aussi de lui apprendre comment on fait des stats. Il faut faire passer le message que les stats ce n'est pas de la magie. S'il a mesuré ces variables, c'est bien qu'il supposait quelque part qu'il pouvait y avoir un lien avec l'achat. Donc fais lui sortir d'une manière ou d'une autre ce qui pourrait correspondre aux hypothèses qu'il pose inconsciemment. Il faut que tu arrives à lui faire préciser.C'est pas quelque chose du style "expliquer la variable X en fonction des variables Y et Z pour que je comprenne ..." que le client me demande. C'est beaucoup moins précis, beaucoup plus "macro" à savoir explorer les données et les éventuelles relations
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Profil de clients
» Comment créer un arbre de décision - méthode des graphs ?
» Elagage d'un arbre de décision
» arbre de décision de type CART
» Evaluation d'un modèle de classification (arbre de décision)
» Comment créer un arbre de décision - méthode des graphs ?
» Elagage d'un arbre de décision
» arbre de décision de type CART
» Evaluation d'un modèle de classification (arbre de décision)
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum