Analyse en composantes principales sur les rangs

Aller en bas

Analyse en composantes principales sur les rangs

Message par AdrienC le Jeu 24 Mai 2018 - 11:52

Bonjour Smile J'ai une grosse base de données à explorer avec pas mal de valeurs aberrantes. J'ai commencé par appliquer une Analyse en composantes principales classique et j'ai lu dans un article qu'il existait une façon "non paramétrique" pour calculer les composantes, dans le but d'atténuer l'importance des valeurs aberrantes lorsque l'on construit les composantes.

Il s'agit de remplacer la matrice de corrélation (de Pearson), par la matrice de corrélation de Spearman (ou de Kendall). Ensuite, on calcule les vecteurs propres et tout, de la même façon qu'une ACP classique.

Je me demandais si cette technique "non paramétrique" était utilisée en pratique, si vous l'avez déjà testé et si oui qu'est-ce que vous en pensez ?

En vous remerciant

Adrien
avatar
AdrienC

Nombre de messages : 64
Date d'inscription : 15/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par Eric Wajnberg le Jeu 24 Mai 2018 - 12:08

Oui, c'est très courant. Il y a plein de textes là-dessus. Une recherche sur Google vous serait utile, je pense.

Voir par exemple, ici.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 950
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par AdrienC le Jeu 24 Mai 2018 - 12:31

Je vous remercie de cette réponse Smile. J'ai fait quelques recherches sur internet et je ne vois pas trop quelle commande utiliser sur R ?

J'ai l'habitude pour mes analyses factorielles, d'utiliser le package factomineR. Cependant dans la commande PCA, on ne peut pas le forcer à utiliser une matrice de corrélation (il la calcule tout seul).

Dois je le programmer moi même ??

Encore merci et bonne journée à vous
avatar
AdrienC

Nombre de messages : 64
Date d'inscription : 15/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par Eric Wajnberg le Jeu 24 Mai 2018 - 13:08

Je n'ai jamais fait ça dans R, mais apparemment on peut s'en sortir avec princomp() et rentrer la matrice de correlation qui convient avec l'argument covmat. Voir par exemple une discussion sur ce point ici.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 950
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par AdrienC le Jeu 24 Mai 2018 - 13:08

Merci beaucoup !!
avatar
AdrienC

Nombre de messages : 64
Date d'inscription : 15/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par droopy le Jeu 24 Mai 2018 - 20:28

Bonjour,

une alternative est d'utiliser une estimation robuste (covRob du package robust) de la ta matrice de corrélation.

cdlt
avatar
droopy

Nombre de messages : 1107
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par AdrienC le Sam 26 Mai 2018 - 11:12

Bonjour, je complète mon post afin d'aider ceux qui cherchent la commande de R pour le faire.

En fait c'est très simple, il suffit juste de transformer chaque variable par les variables de rang (avec la commande rank). Et on fait une ACP avec la commande PCA de R (du package FactoMineR) sur la matrice des rangs.

En effet la corrélation de Spearman est égale à celle de Pearson que l'on fait sur les variables rangs.


Encore merci tout le monde Smile
avatar
AdrienC

Nombre de messages : 64
Date d'inscription : 15/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyse en composantes principales sur les rangs

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum