Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
LEGO Icons 10331 – Le martin-pêcheur
35 €
Voir le deal
Le deal à ne pas rater :
LEGO Icons 10331 – Le martin-pêcheur
35 €
Voir le deal

Choix analyse multivariée pour variables qualitatives

2 participants

Aller en bas

Choix analyse multivariée pour variables qualitatives  Empty Choix analyse multivariée pour variables qualitatives

Message par Qualitative Lun 7 Jan 2013 - 16:58

Bonsoir tout le monde,

Voilà j'ai une population (très très large) et un grand nombre de variables. Afin d'y voir plus clair et de voir quelle(s) variable(s) est utile/inutile j'aurai aimé créer des groupes (ou clusters?) de ces individus.
Par la suite j'aimerai faire de la modélisation prédictive.

Donc est-ce utile de faire une analyse factorielle pour connaitre les composantes principales? Mais après comment les interpréter et s'en servir? Je veux dire qu'ok j'aurai des axes principaux de variabilité mais bon ... euh c'est de la description seulement.

Donc pourquoi pas me lancer dans autre chose comme la classification ou le clustering mais n'ayant pas d'expérience là dedans je vous demande si ça a un sens ou non d'après vous?
Ou direct aller vers des méthodes du type régression logistique/arbre de décision/réseau de neurones/forêt aléatoire/régression logistique PLS/etc. ?

Merci pour tout renseignement Wink

Cdlt,

Kali


Qualitative

Nombre de messages : 25
Date d'inscription : 20/12/2012

Revenir en haut Aller en bas

Choix analyse multivariée pour variables qualitatives  Empty Re: Choix analyse multivariée pour variables qualitatives

Message par joyeux_lapin13 Ven 11 Jan 2013 - 10:06

J'ai du mal à suivre, es-tu dans une configuration pour faire de l'analyse supervisée (présence d'une variable à expliquer/réponse/un Y quoi) ou bien pour faire de l'analyse non supervisée (pas de Y)?

Si tu as une variable que tu cherches à expliquer alors l'analyse non supervisée ne fera jamais aussi bien que l'analyse supervisée et c'est logique.

Dans le cas d'analyse non supervisée on filtre les variables en fonction de l'analyse factorielle en général, en conservant uniquement les variables qui contribuent le plus aux divers axes retenus. Si tu es dans le cas d'analyse supervisée alors on procède en général par une analyse différentielle univariée voir des algorithmes de sélection de variables comme BACKWARD, FORWARD ou encore STEPWISE.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 41
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum