Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse en composantes principales sur les rangs
3 participants
Page 1 sur 1
Analyse en composantes principales sur les rangs
Bonjour J'ai une grosse base de données à explorer avec pas mal de valeurs aberrantes. J'ai commencé par appliquer une Analyse en composantes principales classique et j'ai lu dans un article qu'il existait une façon "non paramétrique" pour calculer les composantes, dans le but d'atténuer l'importance des valeurs aberrantes lorsque l'on construit les composantes.
Il s'agit de remplacer la matrice de corrélation (de Pearson), par la matrice de corrélation de Spearman (ou de Kendall). Ensuite, on calcule les vecteurs propres et tout, de la même façon qu'une ACP classique.
Je me demandais si cette technique "non paramétrique" était utilisée en pratique, si vous l'avez déjà testé et si oui qu'est-ce que vous en pensez ?
En vous remerciant
Adrien
Il s'agit de remplacer la matrice de corrélation (de Pearson), par la matrice de corrélation de Spearman (ou de Kendall). Ensuite, on calcule les vecteurs propres et tout, de la même façon qu'une ACP classique.
Je me demandais si cette technique "non paramétrique" était utilisée en pratique, si vous l'avez déjà testé et si oui qu'est-ce que vous en pensez ?
En vous remerciant
Adrien
AdrienC- Nombre de messages : 93
Date d'inscription : 15/03/2018
Re: Analyse en composantes principales sur les rangs
Oui, c'est très courant. Il y a plein de textes là-dessus. Une recherche sur Google vous serait utile, je pense.
Voir par exemple, ici.
HTH, Eric.
Voir par exemple, ici.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Analyse en composantes principales sur les rangs
Je vous remercie de cette réponse . J'ai fait quelques recherches sur internet et je ne vois pas trop quelle commande utiliser sur R ?
J'ai l'habitude pour mes analyses factorielles, d'utiliser le package factomineR. Cependant dans la commande PCA, on ne peut pas le forcer à utiliser une matrice de corrélation (il la calcule tout seul).
Dois je le programmer moi même ??
Encore merci et bonne journée à vous
J'ai l'habitude pour mes analyses factorielles, d'utiliser le package factomineR. Cependant dans la commande PCA, on ne peut pas le forcer à utiliser une matrice de corrélation (il la calcule tout seul).
Dois je le programmer moi même ??
Encore merci et bonne journée à vous
AdrienC- Nombre de messages : 93
Date d'inscription : 15/03/2018
Re: Analyse en composantes principales sur les rangs
Je n'ai jamais fait ça dans R, mais apparemment on peut s'en sortir avec princomp() et rentrer la matrice de correlation qui convient avec l'argument covmat. Voir par exemple une discussion sur ce point ici.
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Analyse en composantes principales sur les rangs
Merci beaucoup !!
AdrienC- Nombre de messages : 93
Date d'inscription : 15/03/2018
Re: Analyse en composantes principales sur les rangs
Bonjour,
une alternative est d'utiliser une estimation robuste (covRob du package robust) de la ta matrice de corrélation.
cdlt
une alternative est d'utiliser une estimation robuste (covRob du package robust) de la ta matrice de corrélation.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyse en composantes principales sur les rangs
Bonjour, je complète mon post afin d'aider ceux qui cherchent la commande de R pour le faire.
En fait c'est très simple, il suffit juste de transformer chaque variable par les variables de rang (avec la commande rank). Et on fait une ACP avec la commande PCA de R (du package FactoMineR) sur la matrice des rangs.
En effet la corrélation de Spearman est égale à celle de Pearson que l'on fait sur les variables rangs.
Encore merci tout le monde
En fait c'est très simple, il suffit juste de transformer chaque variable par les variables de rang (avec la commande rank). Et on fait une ACP avec la commande PCA de R (du package FactoMineR) sur la matrice des rangs.
En effet la corrélation de Spearman est égale à celle de Pearson que l'on fait sur les variables rangs.
Encore merci tout le monde
AdrienC- Nombre de messages : 93
Date d'inscription : 15/03/2018
Sujets similaires
» Questions sur les composantes principales d'une ACP
» Utilisation de rangs moyens ???
» Analyse en composantes principales
» Régression en composantes principales
» Analyse en composantes principales
» Utilisation de rangs moyens ???
» Analyse en composantes principales
» Régression en composantes principales
» Analyse en composantes principales
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum