Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Choix analyse multivariée pour variables qualitatives
2 participants
Page 1 sur 1
Choix analyse multivariée pour variables qualitatives
Bonsoir tout le monde,
Voilà j'ai une population (très très large) et un grand nombre de variables. Afin d'y voir plus clair et de voir quelle(s) variable(s) est utile/inutile j'aurai aimé créer des groupes (ou clusters?) de ces individus.
Par la suite j'aimerai faire de la modélisation prédictive.
Donc est-ce utile de faire une analyse factorielle pour connaitre les composantes principales? Mais après comment les interpréter et s'en servir? Je veux dire qu'ok j'aurai des axes principaux de variabilité mais bon ... euh c'est de la description seulement.
Donc pourquoi pas me lancer dans autre chose comme la classification ou le clustering mais n'ayant pas d'expérience là dedans je vous demande si ça a un sens ou non d'après vous?
Ou direct aller vers des méthodes du type régression logistique/arbre de décision/réseau de neurones/forêt aléatoire/régression logistique PLS/etc. ?
Merci pour tout renseignement
Cdlt,
Kali
Voilà j'ai une population (très très large) et un grand nombre de variables. Afin d'y voir plus clair et de voir quelle(s) variable(s) est utile/inutile j'aurai aimé créer des groupes (ou clusters?) de ces individus.
Par la suite j'aimerai faire de la modélisation prédictive.
Donc est-ce utile de faire une analyse factorielle pour connaitre les composantes principales? Mais après comment les interpréter et s'en servir? Je veux dire qu'ok j'aurai des axes principaux de variabilité mais bon ... euh c'est de la description seulement.
Donc pourquoi pas me lancer dans autre chose comme la classification ou le clustering mais n'ayant pas d'expérience là dedans je vous demande si ça a un sens ou non d'après vous?
Ou direct aller vers des méthodes du type régression logistique/arbre de décision/réseau de neurones/forêt aléatoire/régression logistique PLS/etc. ?
Merci pour tout renseignement
Cdlt,
Kali
Qualitative- Nombre de messages : 25
Date d'inscription : 20/12/2012
Re: Choix analyse multivariée pour variables qualitatives
J'ai du mal à suivre, es-tu dans une configuration pour faire de l'analyse supervisée (présence d'une variable à expliquer/réponse/un Y quoi) ou bien pour faire de l'analyse non supervisée (pas de Y)?
Si tu as une variable que tu cherches à expliquer alors l'analyse non supervisée ne fera jamais aussi bien que l'analyse supervisée et c'est logique.
Dans le cas d'analyse non supervisée on filtre les variables en fonction de l'analyse factorielle en général, en conservant uniquement les variables qui contribuent le plus aux divers axes retenus. Si tu es dans le cas d'analyse supervisée alors on procède en général par une analyse différentielle univariée voir des algorithmes de sélection de variables comme BACKWARD, FORWARD ou encore STEPWISE.
Si tu as une variable que tu cherches à expliquer alors l'analyse non supervisée ne fera jamais aussi bien que l'analyse supervisée et c'est logique.
Dans le cas d'analyse non supervisée on filtre les variables en fonction de l'analyse factorielle en général, en conservant uniquement les variables qui contribuent le plus aux divers axes retenus. Si tu es dans le cas d'analyse supervisée alors on procède en général par une analyse différentielle univariée voir des algorithmes de sélection de variables comme BACKWARD, FORWARD ou encore STEPWISE.
Sujets similaires
» Analyse multivariée pour variables binaires
» Colinéarité variables qualitatives (pour régression logit)
» Choix de test pour variables binaires - écologie
» Choix d'une analyse multivariée
» Inter dépendance variables qualitatives
» Colinéarité variables qualitatives (pour régression logit)
» Choix de test pour variables binaires - écologie
» Choix d'une analyse multivariée
» Inter dépendance variables qualitatives
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum