Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -50%
-50% sur les sacs à dos pour ordinateur ...
Voir le deal
19.99 €
-15%
Le deal à ne pas rater :
(Adhérents Fnac) LEGO® Star Wars™ 75367 Le croiseur d’assaut de ...
552.49 € 649.99 €
Voir le deal

Besoin d'aide en urgence pour analyse d'une ACP

2 participants

Aller en bas

POUR - Besoin d'aide en urgence pour analyse d'une ACP Empty Besoin d'aide en urgence pour analyse d'une ACP

Message par Celine Faure Mer 15 Sep 2010 - 7:38

Bonjour,

je suis actuellement en train de terminer mon stage de fin d'études cependant, je n'arrive pas à traiter mes analyses statistiques!
En 2 mots, mon étude porte sur l'impact des herbivores et plus particulièrement des cervidés sur la régénération forestière en montagne.
J'ai donc réalisé des relevé de la consommation d'essences d'arbre préalablement définies sur plus d'une centaine de placettes. J'aimerais maintenant savoir si des variables abiotiques du milieu (altitude, exposition, volume de bois sur pied ou pente) ont une influence sur la consommation de ces essences d'arbre. J'ai donc fait une ACP dont j'ai mis un des exemples ci dessous:

[img]POUR - Besoin d'aide en urgence pour analyse d'une ACP Cercle10[/img]
[img]POUR - Besoin d'aide en urgence pour analyse d'une ACP Nuage_10[/img]
iasp= indice de consommation du sapin
surf_ter=volume de bois sur pied

Voici maintenant mes questions:
- dans le cercle de corrélation, la variable iasp se trouve dans la meme direction de la variable pente --> est ce que je peux dire que l'indice de consommation du sapin augmente quand la pente augmente?
- mon nuage de points n'est pas facile à interpréter, je voulais donc faire un kmeans à partir des coordonnées des points de l'acp pour qu'il me fasse apparaitre des groupes, mais est ce que je peux faire ça? et surtout est ce que si mon groupe se trouve plus ou moins réparti vers le haut de mon graphique dans l'exemple du dessus, je peux dire que ces placettes ont une forte consommation de sapin et qu'elles ont une pente élevée?
- j'ai intégré la variable consommation alors que je veux interpréter la consommation en fonction des autres variables --> est ce qu'il fallait que je la mette en variable supplémentaire?
- j'ai regardé la qualité de tous mes points et il se trouve que beaucoup d'entre eux (peut être plus de 50 sur les 125 au total) ont une valeur inférieur à 0.4 donc ne sont pas bien représentés sur la dimension 1, mais bien représenté sur la dimension 2, ou mal représenté sur les deux dimensions --> est ce qu'il faut que j'enlève ces points de l'analyse en les mettant en données supplémentaires?

Je sais les questions paraissent peut être bete mais cela fait un moment que je n'ai plus fait d'ACP et j'espère que quelqu'un pourra m'aider rapidement car je dois rendre mon rapport mercredi 22 septembre au plus tard!

Merci d'avance à celui ou celle qui pourra me sortir de là!

Celine Faure

Nombre de messages : 1
Date d'inscription : 15/09/2010

Revenir en haut Aller en bas

POUR - Besoin d'aide en urgence pour analyse d'une ACP Empty Re: Besoin d'aide en urgence pour analyse d'une ACP

Message par joyeux_lapin13 Mer 15 Sep 2010 - 13:34

Bonjour,

étant dans le cirage je répond à la question général de ton topic (interprétation de l'ACP sur tes données)

Donc en gros tu peux conclure que les variables alt et surf_ter sont trés liées entre elles ainsi qu'avec la variable expo qui va en fait se comporter de façon inverse aux deux premières. Exemple, pour les deux premières donc, quand l'une est positif l'autre le sera aussi contrairement à ta variable expo où quand elles seront positives celle-ci sera négative. Bon c'est un exemple, aprés les corrélations sont basées sur celles de Pearson soit des liaisons linéaires donc ça serait plus des interprétations en terme de pente, tu peux avoir une illustration bien pratique si tu tapes PROC CORR SAS et que tu regardes le lien lié au support SAS.

De même les variables pente et iasp sont liées entre elles mais indépendantes des 3 autres variables (angle à 45°).

En ACP plus une variable voir groupe de variables contribue à la formation d'un axe plus elles sont proches en terme de corrélation, l'ACP projetant les variables selon une métrique basé sur la matrice de corrélations (le terme est peut-être utilisé de façon maladroite mais il me semble que ça se dit littéralement comme ça, du moins l'idée est celle-là).

La part de variance expliquée par tes deux axes (28%) est relativement basse, je pense qu'en regardant le graphe des parts de variances (valeurs propres) cumulées tu peux rajouter au moins 2 voir 3 axes dans ton analyse. Ou alors faire une analyse en univariée (coefficients de corrélation avec test de Pearson) pour déceler certaines relations que l'analyse multivariée a zappé à cause, justement, de cette part de variance insuffisante (part de variance = information conservée, en fait tu diminues ton espace pour avoir une représentation visuel, ce qui implique une perte d'information dans le processus qui consiste en une suite de projections orthogonals).

Concernant tes points, il faut savoir que ces derniers servent à calculer les valeurs propres, soit le système solution permettant d'annuler chaque équation. En gros on calcul des composantes qui sont censées réduire au maximum X, donc c'est ce qui explique que tes points sont concentrés autour de 0 et c'est pourquoi un point loin du nuage global, et en fait plus particulièrement loin de l'origine de ton graphe, est considéré atypique, car d'une certaine façon ses coordonnées ne font pas partie de la masse d'individus considérée comme normal et qui a permis de réduire le système et donc de sortir les valeurs propres.

Personnellement j'aurais tendance à dire que globalement il n'y a pas d'individus atypiques ormi 11-249 et 11-105.

Voilà, aprés je te conseil, oui je sais je dis toujours ça, de voir également l'avis d'autres forumeurs pour confirmer mes dires qui sont, pour la plupart, basés sur des choses que j'ai remarqué et que j'ai généralisé à force de les voir, donc il se peut trés bien que certaines choses soit plus moins incorrect.

J'espère t'avoir aidé.
joyeux_lapin13
joyeux_lapin13

Nombre de messages : 1927
Age : 40
Localisation : Mayotte
Date d'inscription : 21/04/2010

https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum