Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Evaluation qualité eau et ACP
2 participants
Page 1 sur 1
Evaluation qualité eau et ACP
Bonjour,
J'ai quelques problèmes pour les analyses que je souhaite effectuer et comme je ne suis pas un pro des stats, j'ai quelques doutes sur ma méthode.
Je dispose des données de suivi de la qualité de l'eau sur un BV (Température, concentration O2, nitrates, phosphore, etc...).
J'ai 50 stations réparties sur mon bassin avec plusieurs mesures chaque années.
Mon tableau est organisé tq: une ligne = une station par année (Sauf que : toutes les stations ne sont pas échantillonnées chaque année).
Je souhaite identifier :
- des groupes de stations qui présentent les mêmes caractéristiques.
- les paramètres qui décrivent le mieux ces stations.
J'ai commencé a réaliser une ACP avec factomineR.
J'ai mis mes paramètres en tant que variables quantitatives, mon code station en tant que qualitative, et l'année en tant que quantitative supplémentaire.
Est-ce que cela vous semble correct? le modèle et la caractérisation des variables?
J'aimerai bien avoir la confirmation (ou non...) avant d'aller plus loin! J'espère que j'ai été clair
Merci d'avance.
J'ai quelques problèmes pour les analyses que je souhaite effectuer et comme je ne suis pas un pro des stats, j'ai quelques doutes sur ma méthode.
Je dispose des données de suivi de la qualité de l'eau sur un BV (Température, concentration O2, nitrates, phosphore, etc...).
J'ai 50 stations réparties sur mon bassin avec plusieurs mesures chaque années.
Mon tableau est organisé tq: une ligne = une station par année (Sauf que : toutes les stations ne sont pas échantillonnées chaque année).
Je souhaite identifier :
- des groupes de stations qui présentent les mêmes caractéristiques.
- les paramètres qui décrivent le mieux ces stations.
J'ai commencé a réaliser une ACP avec factomineR.
J'ai mis mes paramètres en tant que variables quantitatives, mon code station en tant que qualitative, et l'année en tant que quantitative supplémentaire.
Est-ce que cela vous semble correct? le modèle et la caractérisation des variables?
J'aimerai bien avoir la confirmation (ou non...) avant d'aller plus loin! J'espère que j'ai été clair
Merci d'avance.
mamastat- Nombre de messages : 3
Date d'inscription : 16/07/2014
Re: Evaluation qualité eau et ACP
Bonjour,
Je confirme ! La seule chose un peu discutable serait l'année qu'il pourrait être intéressant de retrouver dans le nuage des individus en l'ajoutant en variable qualitative. Figurerons ainsi dans ton plan d'ACP les années au barycentre de ses individus.
Bon courage
Je confirme ! La seule chose un peu discutable serait l'année qu'il pourrait être intéressant de retrouver dans le nuage des individus en l'ajoutant en variable qualitative. Figurerons ainsi dans ton plan d'ACP les années au barycentre de ses individus.
Bon courage
Re: Evaluation qualité eau et ACP
Merci pour cette réponse.
J'ai donc avancé un peu et maintenant j'ai de nouvelles questions !
Toujours avec le module factomineR, une fois mon modèle ACP calculé. J'ai différents résultat et c'est là que j'ai besoin d'explication.
dimdesc(res.pca1) qui me donne
- quelles sont les variables qui participent le plus à la construction des axes
- quelles sont mes stations (variables qualitative) significativement corrélées à mes axes (dim1, dim2...)
Je vérifie ensuite avec res.pca1$quali.sup
- quelles sont les contributions par station a mes axes avec la colonne coord.,
- si c'est significatif avec la colonne v.test.
En fonction, je peux déterminer mes stations qui sont "similaires" selon mon modèle.
Est-ce que la démarche vous semble correcte?
Merci d'avance et j'aurais rapidement de nouvelles questions.
J'ai donc avancé un peu et maintenant j'ai de nouvelles questions !
Toujours avec le module factomineR, une fois mon modèle ACP calculé. J'ai différents résultat et c'est là que j'ai besoin d'explication.
dimdesc(res.pca1) qui me donne
- quelles sont les variables qui participent le plus à la construction des axes
- quelles sont mes stations (variables qualitative) significativement corrélées à mes axes (dim1, dim2...)
Je vérifie ensuite avec res.pca1$quali.sup
- quelles sont les contributions par station a mes axes avec la colonne coord.,
- si c'est significatif avec la colonne v.test.
En fonction, je peux déterminer mes stations qui sont "similaires" selon mon modèle.
Est-ce que la démarche vous semble correcte?
Merci d'avance et j'aurais rapidement de nouvelles questions.
mamastat- Nombre de messages : 3
Date d'inscription : 16/07/2014
Re: Evaluation qualité eau et ACP
Le plus simple est de continuer l'analyse par une Classification Ascendante Hiérarchique. En effet, l'ACP fourni un espace dans lequel la distance euclidienne entre individus peut être déterminée : les individus (les stations) sont plus ou moins proches (du points de vue de leurs profils). En utilisant cette distance, conjointement à un critère d'agrégation (ce qui dicte les priorités pour regrouper les individus, par exemple l'indice de ward) on peut calculer une CAH.
La CAH défini un arbre de classification dont le niveau de coupe va construire des groupes (cf le site internet de FactoMineR). Le niveau de coupe (= le nombre de groupes) peut être déterminé objectivement sur le critère d'inertie intra / inertie inter groupes, ou manuellement.
Ensuite, une méthode similaire à dimdesc(res.pca1) va pouvoir associer des caractéristiques significatives aux groupes de stations formées.
Bonne chance
La CAH défini un arbre de classification dont le niveau de coupe va construire des groupes (cf le site internet de FactoMineR). Le niveau de coupe (= le nombre de groupes) peut être déterminé objectivement sur le critère d'inertie intra / inertie inter groupes, ou manuellement.
Ensuite, une méthode similaire à dimdesc(res.pca1) va pouvoir associer des caractéristiques significatives aux groupes de stations formées.
Bonne chance
Re: Evaluation qualité eau et ACP
Merci encore pour cette réponse.
J'ai donc fait un CAH avec res.hcpc=HCPC(res.pca) où res.pca est le résultat de mon ACP...
la formule res.hcpc$data.clust me permet savoir quel prélèvement appartient a quel groupe.
la formule res.hcpc$desc.var me permet de décrire mes groupes.
Jusque là ça marche, sauf que c'est pas vraiment ce que j'attends:
La CAH me donne des groupes de prélèvements qui sont similaires.
Sauf que j'ai plusieurs prélèvements par stations
Je souhaite avoir des groupes de stations, et non des groupes de prélèvements.
Est ce que c'est possible de faire une CAH par stations et par année afin de savoir
quelles sont les stations qui présentent les "mêmes" variations selon les années?
Pour rappel, mon ACP est telle que avec 50 stations 1600 lignes.:
Station Année NO3, NO2, Ptot, etc...
Sta1 1998 2 0.1 0.01 ...
...
Sta1 2000 1 0.2 0.02 ...
Sta20 1999 0.5 0.05 0.1 ...
Sta21 2000 0.2 0.1 0.04 ...
...
Avec Station et année en tant que variables quali.sup
N'hésitez pas si vous avez besoin de plus d'infos sur mes données.
Merci d'avance
J'ai donc fait un CAH avec res.hcpc=HCPC(res.pca) où res.pca est le résultat de mon ACP...
la formule res.hcpc$data.clust me permet savoir quel prélèvement appartient a quel groupe.
la formule res.hcpc$desc.var me permet de décrire mes groupes.
Jusque là ça marche, sauf que c'est pas vraiment ce que j'attends:
La CAH me donne des groupes de prélèvements qui sont similaires.
Sauf que j'ai plusieurs prélèvements par stations
Je souhaite avoir des groupes de stations, et non des groupes de prélèvements.
Est ce que c'est possible de faire une CAH par stations et par année afin de savoir
quelles sont les stations qui présentent les "mêmes" variations selon les années?
Pour rappel, mon ACP est telle que avec 50 stations 1600 lignes.:
Station Année NO3, NO2, Ptot, etc...
Sta1 1998 2 0.1 0.01 ...
...
Sta1 2000 1 0.2 0.02 ...
Sta20 1999 0.5 0.05 0.1 ...
Sta21 2000 0.2 0.1 0.04 ...
...
Avec Station et année en tant que variables quali.sup
N'hésitez pas si vous avez besoin de plus d'infos sur mes données.
Merci d'avance
mamastat- Nombre de messages : 3
Date d'inscription : 16/07/2014
Sujets similaires
» évaluation de la performance d'un modèle de prédiction
» Evaluation de l'hétérogénéité d'une variable à la baseline
» Evaluation de résidus dans un modèle
» Critéres d'évaluation de l'état des eaux / pesticides
» Evaluation d'un modèle de classification (arbre de décision)
» Evaluation de l'hétérogénéité d'une variable à la baseline
» Evaluation de résidus dans un modèle
» Critéres d'évaluation de l'état des eaux / pesticides
» Evaluation d'un modèle de classification (arbre de décision)
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum