Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Cartes Pokémon 151 : où trouver le coffret Collection Alakazam-ex ?
Voir le deal

Statistiques écologie

2 participants

Aller en bas

Statistiques écologie Empty Statistiques écologie

Message par HenriCATHALA Mer 29 Juin 2016 - 13:58

Bonjour,
Je travaille actuellement sur le suivi de la flore de prairies afin de connaître leur évolution dans le temps.
J'ai réalisé une AFC avec ces données. J'ai un tableau de contingence avec en ligne le nom de mes espèces de flore (48 espèces) et en colonne le nom de mes parcelles associé aux années d'inventaires (9 parcelles avec 5 ou 6 années d'inventaire chacune = 52 colonnes), les données représentent l'abondance des espèces dans la parcelle.
L'addition des pourcentages associés à mes 2 premiers axes de l'AFC arrive à peine à 30%. On m'a suggéré de faire un test du Khi2 pour vérifier l'indépendance des parcelles. J'aurais déjà aimé savoir si vous pensez que c'est le bon test?
Ensuite j'ai essayé de l'effectuer sur R, mais sans succès. J'ai importé mon tableau de contingence dans R, puis quand je rentre la ligne de commande "chisq.test(tableau)" il me dit: Error in chisq.test(tableau) : toutes les valeurs de 'x' doivent être positives ou nulles et définies
Pourtant je n'ai pas de cellule vide ni de valeur négative.
Merci de votre précieuse aide.
Henri

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Mer 29 Juin 2016 - 14:55

Comment est construit ce tableau car l'erreur pourrait signifier qu'il a certaines cases dont la valeur n'est pas spécifiée ? Sous R, il faut utiliser la fonction table.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 7:19

Je vous envoie le fichier excel de mon tableau de contingence, peut-être que ce sera plus efficace qu'une explication.
Voici également les lignes de commande que j'ai entré dans R:
read.csv2("Tableau_contingence_flore.csv", sep=";", header=TRUE)->tableau
chisq.test(tableau)

Merci beaucoup
Henri
Fichiers joints
Statistiques écologie Attachment
Tableau_contingence_flore.xlsx Vous n'avez pas la permission de télécharger les fichiers joints.(24 Ko) Téléchargé 2 fois

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Jeu 30 Juin 2016 - 7:47

Quand j'ouvre le fichier, je vois que les valeurs non nulles contiennent des virgules. Est-ce à dire que ce sont des valeurs fractionnaires ? Si c'est le cas, ce n'est pas un tableau de contingence puisque par définition, un tableau de contingence est construit à partir d'un dénombrement (comptage) et ne contient donc que des valeurs entières positives ou nulles.

Le test du khi2 a pour argument tout le tableau, c'est-à-dire qu'il doit analyser toutes les colonnes dont la première qui est la dénomination des parcelles (chaines de caractères ou facteur). Or un khi2 ne travaille que sur des valeurs numériques. La solution est donc :
Code:
chisq.test( tableau[,-1])
Mais vu le tableau, j'utiliserai plutôt l'option de simuler les p.value :
Code:
chisq.test( tableau[,-1], simulate=TRUE)

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 10:09

Ce sont des pourcentages d'abondance des espèces sur les parcelles.
Le code chisq.test( tableau[,-1], simulate=TRUE) fonctionne. Voilà les sorties:
Pearson's Chi-squared test with simulated p-value (based on 2000
        replicates)

data:  tableau[, -1]
X-squared = 6955.3, df = NA, p-value = 0.0004998

Je vous tire mon chapeau, et vous remercie chaleureusement de cette aide précieuse.
Avec une p-value de cette valeur, puis-je conclure que mon AFC est valable?

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Jeu 30 Juin 2016 - 10:31

Ce sont des pourcentages d'abondance des espèces sur les parcelles
Donc on devrait avoir 100 comme soit comme somme des lignes (sur la parcelle 1, il y a a% de l'espèce a, b% de l'espèce b ...) ou comme somme des colonnes (l'espèce a se répartit à p1% sur la parcelle 1, p2% sur la parcelle 2...) or le tableau ne répond à aucun des deux cas. Cela constitue donc un premier problème car le tableau ne semble pas correspondre avec ce qu'il est censé représenter.

Si l'affirmation des pourcentages est vrai, cela signifie que les colonnes ou les lignes sont liées entre elles et non pas indépendantes. Cela constitue un second problème. Pour que tu puisses conclure, il faut repartir des comptages.

Pour revenir à l'AFC, sur quoi as-tu travaillé ? Si c'est directement sur ton data.frame tableau, il y a les mêmes problèmes que pour les test du khi2.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 10:53

Les parcelles sont en ligne. Effectivement la somme des pourcentages n'arrive pas à 100 car certaines espèces ont été supprimées car leur fréquence était inférieure à 5%. Il faut que je calcule à nouveau les pourcentages sans ces espèces peut-être du coup?

Qu'est-ce que tu entends par "il faut repartir des comptages"?

Pour l'AFC j'ai travaillé avec le même tableau que le Khi2.

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Jeu 30 Juin 2016 - 11:38

La somme de certaines colonnes va de 72.13 à 101.87. Celles des lignes va de 2.48 à 905.48. Il y a un problème si ce sont des pourcentages.

Ce que j'entends par "il faut repartir des comptages" est que le tableau analysé doit contenir le nombre d'individus de l'espèce (colonne) dans la parcelle (ligne). C'est cela qui constitue un tableau de contingence et c'est lui qui doit être analysé.

Pour finir, l'élimination d'espèces de fréquence inférieure à 5% n'est pas un bon critère. En effet, 5% de 1000 et 90% de 10 ne sont pas comparables. A la rigueur, tu peux éliminer les espèces dont on a compté au maximum dans les parcelles 5 ou 10 individus, mais tu ne peux certainement pas te baser sur les fréquences pour cela.

En l'état actuel, on ne peut rien dire de l'AFC ni du test du khi2 sur le tableau utilisé.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 12:58

Bon ben j'ai bien fait de m'inscrire sur ce forum, je m’apprêtais à faire des choses totalement fausses alors.
J'ai refait un tableau de contingence avec le nombre de fois où l'espèce a été détectée dans les échantillons sur la parcelle. Et sans enlever aucune espèce. Voilà les résultats du Khi2 avec le code chisq.test( tableau[,-1])
X-squared = 12565, df = 4131, p-value < 2.2e-16

Tu me sauves vraiment la mise. Merci beaucoup de ton aide.
Qu'en penses-tu maintenant?
Fichiers joints
Statistiques écologie Attachment
Tableau_contingence_flore.xlsx Vous n'avez pas la permission de télécharger les fichiers joints.(22 Ko) Téléchargé 1 fois

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Jeu 30 Juin 2016 - 13:39

Vu le nombre de cellules vides (environ 80%), le résultat était prévisible et n'a pas de sens. Le nombre d'individus comptés par espèce est assez homogène (entre 70 et 403), tandis que celui par parcelles est totalement hétérogène (entre 1 et plus de 1500). Il y a ici un gros problème. Personnellement, je ne raisonnerai que sur les parcelles sur lesquelles on a compté au moins 100 à 150 individus. 100 signifie qu'il y a un facteur 1 à 16 entre le plus petit et le plus grand comptage et 15, un facteur 1 à 10.

A ce moment tu peux compléter ton analyse AFC par une classification hiérarchique (procédure HCPC du package FactoMineR) soit sur ton tableau, soit sur le transposé, ce qui te donneras en plus des affinités. A toi de les interpréter.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 13:59

Ce serait plutôt l'inverse, c'est le nombre d'individu compté par parcelle qui est compris entre 70 et 403 tandis que celui par espèce est entre 1 et + de 1500. Ce qui est logique, il y a des espèces qui sont très fréquentes sur l'ensemble des parcelles car elles n'ont pas des exigences très précises alors que d'autres ont une écologie très stricte et ne tolèrent que des conditions étroites.

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Florent Aubry Jeu 30 Juin 2016 - 14:24

Il y a donc un problème d'intitulé dans tes colonnes puisque dans le premier fichier, la première colonne est intitulée 'Parcelles' et c'est bien en faisant la somme par ligne qu'on compte entre 1 et plus de 1500 individus tandis qu'il y a le même nombre de colonnes.

Indépendamment du problème d'intitulés des lignes et des colonnes, il y a un problème de comptage tellement hétérogène avec tellement de zéro que le résultat n'a pas grand sens. Il faut élimine les lignes qui on trop peu d'individus pour qu'on puisse dire quelque chose. Donc, si les lignes correspondent aux espèces, il y a environ 3/4 des espèces qui sont tellement peu présentes que cela n'a pas de sens de vouloir les analyser avec les autres. Une solution pourrait être d'analyser à part les espèces d'effectifs supérieur à 150 (par exemple) et celles d'effectifs entre 15/20 et la limite, en supprimant les parcelles de comptage trop faible pour réduire le nombre de zéro à un nombre raisonnable.

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par HenriCATHALA Jeu 30 Juin 2016 - 15:03

Effectivement, autant pour moi, je n'ai pas été rigoureux dans l'intitulé des colonnes.
OK, je vais me lancer dans cette direction.
Merci beaucoup encore pour ton aide et tes explications.
Il est possible que tu me revois rapidement sur le forum ;-) les stats sont quelque peu obscurs pour moi.

HenriCATHALA

Nombre de messages : 7
Date d'inscription : 29/06/2016

Revenir en haut Aller en bas

Statistiques écologie Empty Re: Statistiques écologie

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum