Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
SSD interne Crucial BX500 2,5″ SATA – 500 Go à 29,99€
29.99 €
Voir le deal

Profil de clients

3 participants

Aller en bas

Profil de clients Empty Profil de clients

Message par damgui Jeu 14 Juin 2012 - 13:27

Bonjour tout le monde,

Je souhaite caractérisé des clients qui ne viennent pas à l’événement alors qu'ils sont invités afin de modifier mes campagnes marketing pour qu'ils viennent.
Mon problème est le choix de la méthode stat.
J'hésite entre :
- une régression logistique sur une variable venu : oui/non. Puis je reprend la probabilité de la régression et je la décompose en 3, 4 ou 5 groupes que je caractérise derriere.
- Une ACM car j'ai que des variables quali
- Un arbre de décision
(jeu de données : 50 variables quali et environ 10 000 lignes)

Voila je suis un peu bloqué par ce choix cornélien. En espérant être clair.

Merci de vos futurs réponse. Smile

damgui

Nombre de messages : 39
Age : 34
Date d'inscription : 14/06/2012

http://www.apprenti-webmarketeur.com

Revenir en haut Aller en bas

Profil de clients Empty Re: Profil de clients

Message par niaboc Ven 15 Juin 2012 - 15:31

Un arbre de régression peut-être une bonne méthode dans ton cas je pense car tu auras directement une vue des types de personnes qui viennent ou pas selon les variables les plus discriminantes.
Cette méthode est plus efficace si tu as pas mal de données, et que ton nombre d'invitation est important (si t'as invité le Tout-Paris).

La régression logstique sera mieux si tu as moins de données, mais ça suppose une corrélation linéaire entre le logit de la probabilité -log(p/(1-p)- et les variables explicatives. Mais cette méthode sera meilleure si tu veux prédire pour ta prochaine collation les gens qui vont venir ou pas.
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Profil de clients Empty Re: Profil de clients

Message par damgui Ven 15 Juin 2012 - 16:05

Merci pour ta réponse,
Je pensais faire une sélection de variable pas à pas avant la régression logistique. Ce qui m'embête un peu dans les arbres c'est qu'on a pas le choix du nombre de groupes, on peut se retrouver avec 7 ou 8 groupes et pour les différencier c'est un peu galère.
Quel est la méthode sous R pour faire un arbre de décision?

damgui

Nombre de messages : 39
Age : 34
Date d'inscription : 14/06/2012

http://www.apprenti-webmarketeur.com

Revenir en haut Aller en bas

Profil de clients Empty Re: Profil de clients

Message par niaboc Sam 16 Juin 2012 - 10:03

Tu peux choisir à peu près le nombre de groupe pour un arbre de décision en "élaguant" l'arbre optimal.

Sinon la sélection de variables tu peux la faire avec la régression logistique à l'aide des méthode stepwise, backward ou forward.

Pour un arbre de décision sous R, je ne sais pas le code, mais d'autres personnes du forum le connaissent :-).
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Profil de clients Empty Re: Profil de clients

Message par startr Jeu 28 Juin 2012 - 18:57

Pour faire un arbre de classification:

Utilise le package rpart.

Notamment les fonctions rpart et prune

Cordialement,

_________________
Formation et Consulting en R
http://www.startr.fr

startr

Nombre de messages : 3
Date d'inscription : 07/06/2012

http://www.startr.fr

Revenir en haut Aller en bas

Profil de clients Empty Re: Profil de clients

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum