Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Ordination : quelle méthode utiliseriez-vous ?
2 participants
Page 1 sur 1
Ordination : quelle méthode utiliseriez-vous ?
Bonjour,
j'ai besoin d'aide pour des données d'écologie à analyser.
J’ai des relevés faunistiques (à 11 dates) et des mesures de paramètres environnementaux (pH, Température, etc... seulement pour 2 dates) pour 6 plans d'eau.
J'ai aussi des variables telles que "la distance à l'industrie" pour voir l'éventuel impact de cette activité sur la composition des communautés.
Je dois dégager les patrons de distribution des taxons, identifier les facteurs environnementaux intervenant dans cette distribution, dégager des groupes de plans d'eau qui partagent des caractéristiques communes, et si possible mettre en évidence un effet de l'activité industrielle proche.
MA DEMARCHE :
1. J’ai fait une ACP préliminaire sur la matrice faune pour voir si je pouvais faire abstraction de l’effet saison, mais a priori il faut considérer ce facteur
2. J’ai fait une DCA sur la matrice faune pour analyser mes gradients. L’analyse révèle que les axes sont courts (le plus long : 2.41 ; inférieur à 3).
3. Je partirai donc sur une méthode d’ordination linéaire : RDA, en incluant les données des deux saisons pour lesquelles j'ai la chimie complète. Puis test de Monte Carlo et clustering (algorithme de Ward)
Et vous, que feriez-vous comme analyses ?
Sachant que :
- Mon jeu de données est très petit : je n’ai que 6 plans d'eau (échantillonnées 11 fois pour la faune, mais seulement 2 fois pour la chimie). Peut-être devrais-je me contenter d'ACP ??
- Il y a visiblement un effet saison à ne pas négliger, mais quelle méthode d'ordination serait la plus appropriée pour considérer ce facteur qualitatif ?
- Aussi, certaines variables environnementales, telles que "la distance à la zone indus" ont des valeurs en double dans la matrice pour un même plan d'eau (la distance reste inchangée d'une saison à l'autre pour un même plan d'eau). Cela peut-il impacter mes analyses ?
Pour le moment, mes tableaux de données ressemblent à ça (matrice faune+ matrice environnement+le plan) : cf. image
J'aimerais connaitre la démarche que vous adopteriez.
Par avance merci pour vos réponses,
Caroline
j'ai besoin d'aide pour des données d'écologie à analyser.
J’ai des relevés faunistiques (à 11 dates) et des mesures de paramètres environnementaux (pH, Température, etc... seulement pour 2 dates) pour 6 plans d'eau.
J'ai aussi des variables telles que "la distance à l'industrie" pour voir l'éventuel impact de cette activité sur la composition des communautés.
Je dois dégager les patrons de distribution des taxons, identifier les facteurs environnementaux intervenant dans cette distribution, dégager des groupes de plans d'eau qui partagent des caractéristiques communes, et si possible mettre en évidence un effet de l'activité industrielle proche.
MA DEMARCHE :
1. J’ai fait une ACP préliminaire sur la matrice faune pour voir si je pouvais faire abstraction de l’effet saison, mais a priori il faut considérer ce facteur
2. J’ai fait une DCA sur la matrice faune pour analyser mes gradients. L’analyse révèle que les axes sont courts (le plus long : 2.41 ; inférieur à 3).
3. Je partirai donc sur une méthode d’ordination linéaire : RDA, en incluant les données des deux saisons pour lesquelles j'ai la chimie complète. Puis test de Monte Carlo et clustering (algorithme de Ward)
Et vous, que feriez-vous comme analyses ?
Sachant que :
- Mon jeu de données est très petit : je n’ai que 6 plans d'eau (échantillonnées 11 fois pour la faune, mais seulement 2 fois pour la chimie). Peut-être devrais-je me contenter d'ACP ??
- Il y a visiblement un effet saison à ne pas négliger, mais quelle méthode d'ordination serait la plus appropriée pour considérer ce facteur qualitatif ?
- Aussi, certaines variables environnementales, telles que "la distance à la zone indus" ont des valeurs en double dans la matrice pour un même plan d'eau (la distance reste inchangée d'une saison à l'autre pour un même plan d'eau). Cela peut-il impacter mes analyses ?
Pour le moment, mes tableaux de données ressemblent à ça (matrice faune+ matrice environnement+le plan) : cf. image
J'aimerais connaitre la démarche que vous adopteriez.
Par avance merci pour vos réponses,
Caroline
- Fichiers joints
CaroB- Nombre de messages : 1
Date d'inscription : 10/09/2015
Re: Ordination : quelle méthode utiliseriez-vous ?
Bonjour,
C'est un peu compliqué de te suivre dans ton mail même en étant du domaine.
Comme souvent quand on pose une question de stats, on va d'abord essayer de comprendre les objectifs de base. Comme tu le sais sans doute, les stats ne font pas de miracle donc il faut bien rationaliser tes objectifs par rapport à tes données et à la construction du plan d'échantillonnage.
Si je reprends tes objectifs
2e point : si tu n'as les données enviro que pour 2 dates, tu peux d'ores et déjà écarter ces paramètres de ton analyse car tu ne pourras rien en faire sans supprimer des données faunistiques en quantité. Les liens avec les paramètres enviro sont toujours faibles donc la connaissance sur 2 dates ne te diras rien ou presque de ce que tu pourras attendre pour les 9 autres dates. Cet objectif me parait donc compromis.
3e point : les carac communes, cela sous-entend sur la physico-chimie ? Car sinon tu les as par l'ACP sur la faune.
4e point: on voit ensuite ce point une fois qu'on est bien sûr d'avoir compris ta problématique.
Pour finir, chaque statisticien aura ses propres petites manies sur le type d'analyse à employer. Ce qu'il faut c'est bien clarifier les objectifs de l'étude car vu l'exposé des données j'ai l'impression que les données n'ont pas été construites pour répondre aux questions posées. Au passage, as-tu des étangs de référence (des témoins) pour lesquels tu peux supposer l'absence d'impact d'une activité industrielle? Car sinon je ne vois pas comment tu vas pouvoir isoler l'effet de la variabilité naturelle des populations d'un réel effet "industrie". Même avec des situations de référence on a souvent du mal à évaluer la part de l'un ou de l'autre car il y a forcément une interaction qui vient tout compliquer.
Nik
C'est un peu compliqué de te suivre dans ton mail même en étant du domaine.
Comme souvent quand on pose une question de stats, on va d'abord essayer de comprendre les objectifs de base. Comme tu le sais sans doute, les stats ne font pas de miracle donc il faut bien rationaliser tes objectifs par rapport à tes données et à la construction du plan d'échantillonnage.
Si je reprends tes objectifs
Premier point : Une ACP sur la faune te donneras une typologie faunistique de tes étangs. L'effet saison peut être traité via une ACP intra-saison puis une ACP inter-étang sur la sortie l'ACP intra. Cela te donnera quelle espèce contribue le plus à la différenciation des étangs.
Je dois dégager les patrons de distribution des taxons,
identifier les facteurs environnementaux intervenant dans cette distribution,
dégager des groupes de plans d'eau qui partagent des caractéristiques communes,
et si possible mettre en évidence un effet de l'activité industrielle proche.
2e point : si tu n'as les données enviro que pour 2 dates, tu peux d'ores et déjà écarter ces paramètres de ton analyse car tu ne pourras rien en faire sans supprimer des données faunistiques en quantité. Les liens avec les paramètres enviro sont toujours faibles donc la connaissance sur 2 dates ne te diras rien ou presque de ce que tu pourras attendre pour les 9 autres dates. Cet objectif me parait donc compromis.
3e point : les carac communes, cela sous-entend sur la physico-chimie ? Car sinon tu les as par l'ACP sur la faune.
4e point: on voit ensuite ce point une fois qu'on est bien sûr d'avoir compris ta problématique.
Pour finir, chaque statisticien aura ses propres petites manies sur le type d'analyse à employer. Ce qu'il faut c'est bien clarifier les objectifs de l'étude car vu l'exposé des données j'ai l'impression que les données n'ont pas été construites pour répondre aux questions posées. Au passage, as-tu des étangs de référence (des témoins) pour lesquels tu peux supposer l'absence d'impact d'une activité industrielle? Car sinon je ne vois pas comment tu vas pouvoir isoler l'effet de la variabilité naturelle des populations d'un réel effet "industrie". Même avec des situations de référence on a souvent du mal à évaluer la part de l'un ou de l'autre car il y a forcément une interaction qui vient tout compliquer.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Quelle démarche me conseillez-vous?
» Quelle méthode utiliser?
» Quelle méthode à utiliser
» Quelle méthode statistique utiliser?
» Quelle méthode d'analyse choisir ?
» Quelle méthode utiliser?
» Quelle méthode à utiliser
» Quelle méthode statistique utiliser?
» Quelle méthode d'analyse choisir ?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum