Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -17%
SSD interne Crucial SSD P3 1To NVME à ...
Voir le deal
49.99 €
Le Deal du moment : -19%
PC portable MSI Gaming Pulse 16” -Ultra7 155H ...
Voir le deal
1299 €

Analyse en composantes principales sur les rangs

3 participants

Aller en bas

Analyse en composantes principales sur les rangs Empty Analyse en composantes principales sur les rangs

Message par AdrienC Jeu 24 Mai 2018 - 11:52

Bonjour Smile J'ai une grosse base de données à explorer avec pas mal de valeurs aberrantes. J'ai commencé par appliquer une Analyse en composantes principales classique et j'ai lu dans un article qu'il existait une façon "non paramétrique" pour calculer les composantes, dans le but d'atténuer l'importance des valeurs aberrantes lorsque l'on construit les composantes.

Il s'agit de remplacer la matrice de corrélation (de Pearson), par la matrice de corrélation de Spearman (ou de Kendall). Ensuite, on calcule les vecteurs propres et tout, de la même façon qu'une ACP classique.

Je me demandais si cette technique "non paramétrique" était utilisée en pratique, si vous l'avez déjà testé et si oui qu'est-ce que vous en pensez ?

En vous remerciant

Adrien
AdrienC
AdrienC

Nombre de messages : 93
Date d'inscription : 15/03/2018

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par Eric Wajnberg Jeu 24 Mai 2018 - 12:08

Oui, c'est très courant. Il y a plein de textes là-dessus. Une recherche sur Google vous serait utile, je pense.

Voir par exemple, ici.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par AdrienC Jeu 24 Mai 2018 - 12:31

Je vous remercie de cette réponse Smile. J'ai fait quelques recherches sur internet et je ne vois pas trop quelle commande utiliser sur R ?

J'ai l'habitude pour mes analyses factorielles, d'utiliser le package factomineR. Cependant dans la commande PCA, on ne peut pas le forcer à utiliser une matrice de corrélation (il la calcule tout seul).

Dois je le programmer moi même ??

Encore merci et bonne journée à vous
AdrienC
AdrienC

Nombre de messages : 93
Date d'inscription : 15/03/2018

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par Eric Wajnberg Jeu 24 Mai 2018 - 13:08

Je n'ai jamais fait ça dans R, mais apparemment on peut s'en sortir avec princomp() et rentrer la matrice de correlation qui convient avec l'argument covmat. Voir par exemple une discussion sur ce point ici.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par AdrienC Jeu 24 Mai 2018 - 13:08

Merci beaucoup !!
AdrienC
AdrienC

Nombre de messages : 93
Date d'inscription : 15/03/2018

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par droopy Jeu 24 Mai 2018 - 20:28

Bonjour,

une alternative est d'utiliser une estimation robuste (covRob du package robust) de la ta matrice de corrélation.

cdlt
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par AdrienC Sam 26 Mai 2018 - 11:12

Bonjour, je complète mon post afin d'aider ceux qui cherchent la commande de R pour le faire.

En fait c'est très simple, il suffit juste de transformer chaque variable par les variables de rang (avec la commande rank). Et on fait une ACP avec la commande PCA de R (du package FactoMineR) sur la matrice des rangs.

En effet la corrélation de Spearman est égale à celle de Pearson que l'on fait sur les variables rangs.


Encore merci tout le monde Smile
AdrienC
AdrienC

Nombre de messages : 93
Date d'inscription : 15/03/2018

Revenir en haut Aller en bas

Analyse en composantes principales sur les rangs Empty Re: Analyse en composantes principales sur les rangs

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum