Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Redondance dans une analyse factorielle
3 participants
Page 1 sur 1
Redondance dans une analyse factorielle
Bonjour,
Supposons que je dispose d'un jeu de 10-15 variables quantitatives continues. Je constate par de simples analyses bivariées que certaine variables sont fortement corrélées linéairement (et donc porteuse de la même information.)
Est-il utile de les retirer avant de faire une ACP sur le jeu de variable ? Alors, vous me direz que de toute façon l'ACP va les ranger dans la même composante, je suis OK, mais cela va faire gonfler inutilement l'inertie de cette composante non ?
Cordialement
Supposons que je dispose d'un jeu de 10-15 variables quantitatives continues. Je constate par de simples analyses bivariées que certaine variables sont fortement corrélées linéairement (et donc porteuse de la même information.)
Est-il utile de les retirer avant de faire une ACP sur le jeu de variable ? Alors, vous me direz que de toute façon l'ACP va les ranger dans la même composante, je suis OK, mais cela va faire gonfler inutilement l'inertie de cette composante non ?
Cordialement
Nicozeyo- Nombre de messages : 11
Date d'inscription : 21/10/2015
Re: Redondance dans une analyse factorielle
Bonjour,
Le fait que tes variables soient très corrélées ne veut pas dire qu'elles apportent la même info.
Au contraire, il est possible que tes variables définissent mieux tes groupes au sein de l'ACP.
Ce qu'il faut éviter, ce sont les variables doublons, définies à partir de la même information (exemple : la taille et le BMI, le BMI est créé à partir de la taille, c'est là qu'est la redondance et il faut choisir une des deux variables, sinon les groupes seront surexprimés sur ton ACP).
Le fait que tes variables soient très corrélées ne veut pas dire qu'elles apportent la même info.
Au contraire, il est possible que tes variables définissent mieux tes groupes au sein de l'ACP.
Ce qu'il faut éviter, ce sont les variables doublons, définies à partir de la même information (exemple : la taille et le BMI, le BMI est créé à partir de la taille, c'est là qu'est la redondance et il faut choisir une des deux variables, sinon les groupes seront surexprimés sur ton ACP).
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Redondance dans une analyse factorielle
Justement, je soupçonne ces variables fortement corrélées d'être en faites redondantes car identique dans ce qu'elle représente, mais je ne puis en être sûr. Les corrélation est quasi égale à 1.
Nicozeyo- Nombre de messages : 11
Date d'inscription : 21/10/2015
Re: Redondance dans une analyse factorielle
A quoi correspondent ces variables ?
Est-ce qu'une des deux variables est construite à partir de l'autre ?
Est-ce qu'une des deux variables est construite à partir de l'autre ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Redondance dans une analyse factorielle
Rien n’empêche de faire une ACP sur une structure de données fortement corrélée. Au pire la dimension de l'espace (nombre de valeurs propres non nulles) sera plus faible que le nombre de variables. Mais ce n'est qu'un détail technique. Oui, les variables corrélées seront chargées sur le même axe (ou le même jeu d'axes), mais ca ne pose pas de problème.
Même plus, l'ACP peut être parfois considéré comme un moyen de décorréler un jeu de données, et les calculs qui suivent (par exemple ANOVA, etc.) sont alors faits sur les ordinations sur les (premiers) axes (par construction non corrélés) plutôt que sur les données d'origine.
Donc pas de problème à priori.
HTH, Eric.
Même plus, l'ACP peut être parfois considéré comme un moyen de décorréler un jeu de données, et les calculs qui suivent (par exemple ANOVA, etc.) sont alors faits sur les ordinations sur les (premiers) axes (par construction non corrélés) plutôt que sur les données d'origine.
Donc pas de problème à priori.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Sujets similaires
» Analyse Factorielle des Correspondances
» analyse factorielle des correspondances
» analyse factorielle
» ACP et analyse factorielle
» Analyse factorielle des correspondances
» analyse factorielle des correspondances
» analyse factorielle
» ACP et analyse factorielle
» Analyse factorielle des correspondances
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum