Redondance dans une analyse factorielle

Voir le sujet précédent Voir le sujet suivant Aller en bas

Redondance dans une analyse factorielle

Message par Nicozeyo le Mer 14 Déc 2016 - 13:44

Bonjour,

Supposons que je dispose d'un jeu de 10-15 variables quantitatives continues. Je constate par de simples analyses bivariées que certaine variables sont fortement corrélées linéairement (et donc porteuse de la même information.)

Est-il utile de les retirer avant de faire une ACP sur le jeu de variable ? Alors, vous me direz que de toute façon l'ACP va les ranger dans la même composante, je suis OK, mais cela va faire gonfler inutilement l'inertie de cette composante non ?

Cordialement

Nicozeyo

Nombre de messages : 11
Date d'inscription : 21/10/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Redondance dans une analyse factorielle

Message par zezima le Mer 14 Déc 2016 - 14:08

Bonjour,

Le fait que tes variables soient très corrélées ne veut pas dire qu'elles apportent la même info.
Au contraire, il est possible que tes variables définissent mieux tes groupes au sein de l'ACP.

Ce qu'il faut éviter, ce sont les variables doublons, définies à partir de la même information (exemple : la taille et le BMI, le BMI est créé à partir de la taille, c'est là qu'est la redondance et il faut choisir une des deux variables, sinon les groupes seront surexprimés sur ton ACP).
avatar
zezima

Nombre de messages : 628
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Redondance dans une analyse factorielle

Message par Nicozeyo le Mer 14 Déc 2016 - 14:29

Justement, je soupçonne ces variables fortement corrélées d'être en faites redondantes car identique dans ce qu'elle représente, mais je ne puis en être sûr. Les corrélation est quasi égale à 1.

Nicozeyo

Nombre de messages : 11
Date d'inscription : 21/10/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Redondance dans une analyse factorielle

Message par zezima le Mer 14 Déc 2016 - 15:28

A quoi correspondent ces variables ?
Est-ce qu'une des deux variables est construite à partir de l'autre ?
avatar
zezima

Nombre de messages : 628
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Redondance dans une analyse factorielle

Message par Eric Wajnberg le Jeu 15 Déc 2016 - 5:29

Rien n’empêche de faire une ACP sur une structure de données fortement corrélée. Au pire la dimension de l'espace (nombre de valeurs propres non nulles) sera plus faible que le nombre de variables. Mais ce n'est qu'un détail technique. Oui, les variables corrélées seront chargées sur le même axe (ou le même jeu d'axes), mais ca ne pose pas de problème.

Même plus, l'ACP peut être parfois considéré comme un moyen de décorréler un jeu de données, et les calculs qui suivent (par exemple ANOVA, etc.) sont alors faits sur les ordinations sur les (premiers) axes (par construction non corrélés) plutôt que sur les données d'origine.

Donc pas de problème à priori.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 513
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Redondance dans une analyse factorielle

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum