Régression en composantes principales

Voir le sujet précédent Voir le sujet suivant Aller en bas

Régression en composantes principales

Message par CupOfAppleTea le Jeu 7 Fév 2013 - 17:57

Bonjour,
J'aurais souhaiter discuter de régression en composantes principales. Je ne trouve que très peu d'informations sur internet.
Je dispose d'un jeu de données avec 5 fois plus de variables que d'échantillons et d'après ce que j'ai pu lire jusque là, cette méthode s'applique tout à fait à ce type de données.
Cependant, je souhaiterais avoir quelques clarifications. J'utilise R pour toutes mes analyses mais je souhaiterais ici discuter plus globalement de cette méthode.
Si je comprends bien, elle consiste à procéder à une ACP, pour récupérer 1, 2, n axes qui permettent d'expliquer une part suffisante de la variabilité de mon jeu de données.
Il faut ensuite procéder à une régression multiple sur la base des coordonnées de mes points (=observations) en fonction des axes sélectionnés pendant l'ACP.
Si je comprends bien, la régression en composante principale consiste simplement à procéder à une ACP pour réduire la complexité du jeu de données avant de faire une régression.

Merci pour votre aide et si par ailleurs vous disposez de doc sur ce sujet je suis preneur!


Dernière édition par CupOfAppleTea le Ven 8 Fév 2013 - 8:05, édité 1 fois

CupOfAppleTea

Nombre de messages : 28
Date d'inscription : 14/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression en composantes principales

Message par Nik le Jeu 7 Fév 2013 - 20:01

il n'y a rien de particulier à dire là dessus. Ce n'est pas un type particulier de régression.
L'avantage c'est que les composantes sont indépendantes ce qui est souhaitable pour des prédicteurs dans une régression. Effectivement ça permet de combiner des variables colinéaires.
Mais de mon point de vue ça s'arrête là car les composantes sont souvent peu interprétables et donc la régression n'a plus de sens. C'est plutôt une technique qui correspond à fermer les yeux, cliquer sur un bouton et espérer que ça donne quelque chose. Ou alors il faut vraiment que le degré de colinéarité soit important. Et même dans ce cas autant ne choisir qu'une des variables, ce sera toujours plus interprétable.

Nik


Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum