Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le deal à ne pas rater :
KTC Écran PC Gaming 24″ (1920 x 1080) 100Hz, dalle VA à 67,39
67.39 €
Voir le deal

question sur ACP

2 participants

Aller en bas

question sur ACP Empty question sur ACP

Message par lauriane Ven 8 Jan 2010 - 17:34

bonjour,
Je voulais savoir si quelqu'un pouvait me dire la différence entre une ACP sur corrélation et une ACP sur covariance???
merci

lauriane

Nombre de messages : 1
Date d'inscription : 08/01/2010

Revenir en haut Aller en bas

question sur ACP Empty Re: question sur ACP

Message par droopy Sam 9 Jan 2010 - 13:12

Dans un cas tu auras standardisé tes variables (corrélation) et pas dans l'autre (covariance). Si tes variables sont dans la même échelle ou mesure la même chose (exemple des pourcentages) alors tu n'as pas besoin d'utiliser une matrice de corrélation, mais si tu as des échelles différentes (exemple une variable en m et l'autre en °C) alors si tu utilises la matrice de covariance, ce sont les variables avec la plus grande variance qui vont participé le plus a ton analyse, alors que lorsque tu utilises les corrélations les variables ont toutes le même "poids" au départ puisque leur variance est ramenée à 1. Un exemple assez simple pour voir la différence entre les deux. Tu prends ton tableau de variable et tu fais une première ACP sur matrice de cov, tu reprends le même tableau et tu multiplies par 10 ou 20 une des variables qui participaient bien au premier axe de ta première ACP et tu refais une deuxième ACP sur matrice de covariance et compart les résultats. La variable que tu auras multipliées participera beaucoup plus à l'analyse que dans la première ACP. Ce qui n'a pas forcément de sens. Dans ce cas la tu es confronté à un effet taille. Ainsi la même variable selon ces unités ne participera de la même manière à l'analyse. Un autre exemple si tu as une variable de distance, selon si tu l'exprimes en km ou en cm, alors son influence sera différente car sa vairance sera très différent dans les deux cas. Refait les deux ACP sur les deux tableaux (avant et après multiplication) avec une matrice de corrélation et la tu veras que tu obtiendras le même résultat parce que les variables seront standardisées (variance ramenée à 1), donc ici plus de problème d'échelle.

A toi de voir donc selon le type de variable que tu as.

Je te conseille de jetter un oeil ici : http://pbil.univ-lyon1.fr/R/enseignement.html, dans les différentes rubriques (cours, TD, etc.) il y as pas mal de fiche expliquant les ACP, dont une sur l'importance du centrage.
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum