Les posteurs les plus actifs de la semaine
c@ssoulet
ACP ou AFD? Vote_lcapACP ou AFD? Voting_barACP ou AFD? Vote_rcap 
preliator
ACP ou AFD? Vote_lcapACP ou AFD? Voting_barACP ou AFD? Vote_rcap 


ACP ou AFD?

Aller en bas

ACP ou AFD? Empty ACP ou AFD?

Message par niaboc le Jeu 12 Sep 2019 - 15:25

Bonjour,

j'ai une variable qualitative à expliquer par de nombreuses variables quantitatives.

Je me demandais, pour une première phase exploratoire s'il était plus pertinent de :
- lancer une ACP avec la variable à expliquer en variable supplémentaire pour me donner un aperçu des axes (et donc des variables) qui pourraient potentiellement expliquer la variable.
- lancer une analyse factorielle discriminante, qui me donnerait des axes (et donc des variables) qui discriminent le mieux ma variable à expliquer.

Qu'en pensez-vous?

Niaboc
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par Ayana le Jeu 12 Sep 2019 - 15:32

Allez, je me fais l'avocat du diable.
Pourquoi ne pas tenter une approche de type foret aleatoire et utiliser les mesures d'influence (variable importance) pour voir quelles sont les variables qui sont le plus predictives de l'outcome?
Ayana
Ayana
Ayana

Nombre de messages : 526
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par niaboc le Jeu 12 Sep 2019 - 18:06

Oui pourquoi pas essayer ça également. Je commence à switcher de SAS à R, et j'imagine qu'il existe de beaux packages pour les forêts aléatoires dans R, ça m'entrainera :-)

Même si au final, ça ne répond pas à la question (même si ce n'est qu'à titre informatif, car pour le coup les forêts aléatoires me tentent bien).
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par droopy le Ven 13 Sep 2019 - 7:30

Bonjour,

je pense que tu as répondu en partie à ta question. l'ACP ne va pas chercher à établir un lien entre ta variable qualitative et les autres, elle va chercher des axes qui expliquent le mieux la variabilité de tes variables qualitatives. Donc tu pourrais théoriquement avoir le cas ou ta variable est expliquée en grande partie par une variable qui ne participe que peu aux premiers axes de ton acp.

L'analyse discriminante, la régression logistique, les classifieurs bayesiens, les forets aléatoires, les boosting regression tree ou encore des gpls semblent plus indiquées.

Après l'acp ça peut-être une première étape dans l'analyse de tes données, suivi par exemple d'une analyse inter (between class analysis), mais il ne faut pas perdre de vue qu'au départ on établit pas directement un lien entre ton paquet de variables et la variable a expliquée.

droopy
droopy
droopy

Nombre de messages : 1129
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par Ayana le Ven 13 Sep 2019 - 9:23

Même si au final, ça ne répond pas à la question (même si ce n'est qu'à titre informatif, car pour le coup les forêts aléatoires me tentent bien).

Ah, alors j'ai peut-etre mal compris la question. Je pensais que tu cherchais a voir quelles variables (parmi un grand nombre) etaient associees (predictives) a ta variable qualitative. Meme si le but de la foret aleatoire et de faire de la prediction, tu peux determiner quelles variables contribuent le plus aux "splits", i.e. les variables les plus associees a ta variable qualitative.

Dans R, il y a pas mal de packages bien et assez intuitifs.

Ayana
Ayana
Ayana

Nombre de messages : 526
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par niaboc le Ven 13 Sep 2019 - 9:40

Si si tu réponds bien à la problématique que je me posais. Ca ne répondait juste pas spécifiquement au cas particulier que je posais entre l'ACP et l'AFD.


Après la sélection de variables, je pensais partir sur un bagging de régressions logistiques pour pouvoir avoir un modèle prédictif simple à utiliser au final.

Du coup, une sélection de variables via une forêt aléatoire est-elle appropriée?

+Je me demandais s'il était intéressant d'utiliser le principe des forêts aléatoires sur un bagging de reg log, c'est à dire avoir des sélections aléatoires de variables en plus du bootstrap sur les individus. On lance des régressions logistiques avec sélections de variables automatiques et on étudie l'ensemble des résultats? N'ayant pas le côté 'conditionnel' d'un arbre, la méthode n'améliore peut-être pas sensiblement les résultats?

Niaboc
niaboc
niaboc

Nombre de messages : 969
Age : 32
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ACP ou AFD? Empty Re: ACP ou AFD?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum