Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -50%
-50% sur les sacs à dos pour ordinateur ...
Voir le deal
19.99 €
-15%
Le deal à ne pas rater :
(Adhérents Fnac) LEGO® Star Wars™ 75367 Le croiseur d’assaut de ...
552.49 € 649.99 €
Voir le deal

Redondance dans une analyse factorielle

3 participants

Aller en bas

dans - Redondance dans une analyse factorielle Empty Redondance dans une analyse factorielle

Message par Nicozeyo Mer 14 Déc 2016 - 13:44

Bonjour,

Supposons que je dispose d'un jeu de 10-15 variables quantitatives continues. Je constate par de simples analyses bivariées que certaine variables sont fortement corrélées linéairement (et donc porteuse de la même information.)

Est-il utile de les retirer avant de faire une ACP sur le jeu de variable ? Alors, vous me direz que de toute façon l'ACP va les ranger dans la même composante, je suis OK, mais cela va faire gonfler inutilement l'inertie de cette composante non ?

Cordialement

Nicozeyo

Nombre de messages : 11
Date d'inscription : 21/10/2015

Revenir en haut Aller en bas

dans - Redondance dans une analyse factorielle Empty Re: Redondance dans une analyse factorielle

Message par zezima Mer 14 Déc 2016 - 14:08

Bonjour,

Le fait que tes variables soient très corrélées ne veut pas dire qu'elles apportent la même info.
Au contraire, il est possible que tes variables définissent mieux tes groupes au sein de l'ACP.

Ce qu'il faut éviter, ce sont les variables doublons, définies à partir de la même information (exemple : la taille et le BMI, le BMI est créé à partir de la taille, c'est là qu'est la redondance et il faut choisir une des deux variables, sinon les groupes seront surexprimés sur ton ACP).
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

dans - Redondance dans une analyse factorielle Empty Re: Redondance dans une analyse factorielle

Message par Nicozeyo Mer 14 Déc 2016 - 14:29

Justement, je soupçonne ces variables fortement corrélées d'être en faites redondantes car identique dans ce qu'elle représente, mais je ne puis en être sûr. Les corrélation est quasi égale à 1.

Nicozeyo

Nombre de messages : 11
Date d'inscription : 21/10/2015

Revenir en haut Aller en bas

dans - Redondance dans une analyse factorielle Empty Re: Redondance dans une analyse factorielle

Message par zezima Mer 14 Déc 2016 - 15:28

A quoi correspondent ces variables ?
Est-ce qu'une des deux variables est construite à partir de l'autre ?
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

dans - Redondance dans une analyse factorielle Empty Re: Redondance dans une analyse factorielle

Message par Eric Wajnberg Jeu 15 Déc 2016 - 5:29

Rien n’empêche de faire une ACP sur une structure de données fortement corrélée. Au pire la dimension de l'espace (nombre de valeurs propres non nulles) sera plus faible que le nombre de variables. Mais ce n'est qu'un détail technique. Oui, les variables corrélées seront chargées sur le même axe (ou le même jeu d'axes), mais ca ne pose pas de problème.

Même plus, l'ACP peut être parfois considéré comme un moyen de décorréler un jeu de données, et les calculs qui suivent (par exemple ANOVA, etc.) sont alors faits sur les ordinations sur les (premiers) axes (par construction non corrélés) plutôt que sur les données d'origine.

Donc pas de problème à priori.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

dans - Redondance dans une analyse factorielle Empty Re: Redondance dans une analyse factorielle

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum