Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment :
Réassort du coffret Pokémon 151 ...
Voir le deal
Le Deal du moment : -40%
Tefal Ingenio Emotion – Batterie de cuisine 10 ...
Voir le deal
59.99 €

Analyse de données aviaires

4 participants

Aller en bas

Analyse de données aviaires Empty Analyse de données aviaires

Message par lelenou Dim 13 Mar 2016 - 16:21

Bonjour à tous,

J'ai besoin de votre aide pour savoir si mon raisonnement est pertinent d'un point de vue statistique et si une technique ne serait pas plus appropriée s'il vous plaît.

On m'a fourni un jeu de données d'Ecologie à analyser concernant les effets de l'urbanisation sur les communautés d'oiseaux dans les villes d'Amérique du Sud qui forment de véritables mosaïques d'habitats différents. Trois types de milieu ont été étudiés : boulevard/avenue, parcs urbains, prairies/champs. Pour chaque milieu, on a prospecté 2 ou 3 sites différents et noté

   le nombre espèces d'oiseaux total,
   le nombre d'espèces de plantes,
   la hauteur moyenne des plantes,
   la hauteur maximum chez les plantes,
   les pourcentages de recouvrement d'herbacées (plantes pas plus hautes que 1,5 mètres environ),
   le pourcentage de recouvrement du feuillage des arbres et celui du ciment
   Enfin, pour chaque site on a noté le nombre d'espèces par régime alimentaire : omnivore, carnivore, frugivore etc...



Je suis partie sur des ANOVA en prenant comme

   facteurs explicatifs : milieu, nombre d'espèces de plantes, hauteur moyenne des plantes, hauteur maximum des plantes, les pourcentages de recouvrement d'herbacées, des feuilles d'arbres et ciment,
 facteurs à expliquer : le nombre d'espèces d'oiseaux, et le nombre d'espèces par régime alimentaire transformé en fréquence.


Pour les ANOVA, je voulais transformer les fréquences en arcsin, et les pourcentages en (Les pourcentages doivent être transformés en quoi ?), et tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également.

- Les variables sont dépendantes pour moi et les facteurs sont également tous dépendants du type de milieu, cela pose-t-il un problème pour faire une ANOVA ?
- Cela revient à faire énormément d'ANOVA, et produire une grande quantité de résultats significatifs ou non pas forcément exploitables dans leur ensemble. Y aurait-il une technique pour tester statistiquement toutes les variables avec tous les facteurs ?
- Quelqu'un verrait-il une technique pour rassembler les fréquences de régime alimentaire afin de créer une variable unique ou vaut mieux t-il laisser cela en différentes variables ?
- Enfin, y a-t-il un effet "site" ? Si oui, comment le considérer ? En l'incluant en tant que facteur explicatif ?

Merci d'avance pour ceux qui auront le courage de me lire et d'essayer de répondre à mes questions.

En vous souhaitant une agréable fin de journée, bien cordialement,

Hélène


Dernière édition par lelenou le Lun 14 Mar 2016 - 22:17, édité 1 fois

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par Nik Lun 14 Mar 2016 - 8:44

Bonjour Hélène,

Je te fais une première réponse rapide car je n'ai pour le moment pas le temps de répondre à toutes tes questions. Je reprendrais plus tard ou d'autres complèteront/corrigeront ce que j'écris.

A mon avis l'ANOVA, c'est à dire un modèle linéaire avec une variable explicative qualitative, ne sera pas adaptée du fait de la nature des variables à expliquer. Ce sont des comptage ou des variables à réponse multiples tes fréquences).

Pour les régimes alimentaires, je partirais sur une analyse multivariée permettant de lier 2 tableaux (type Co-inertie, AFM, ACC) : celui des régimes alimentaires et celui des variables explicatives afin de dégrossir le travail. Si les auteurs de l'étude cherchent juste à savoir si un lien se dégage dans les données ce sera alors bien suffisant comme analyse. Tu pourras tester l'effet site via une analyse intra/inter classe.

Pour le nb d'espèce, un GLM binomial (ou GLMM si tu veux prendre en compte l'effet site via un facteur aléatoire) avec un processus de sélection de modèle (stepwise, ou construction de modèles candidats via des hypothèses à co-élaborer avec les biologistes).

Il manque une info cruciale dans ce que tu donnes : le nombre de valeurs avec une idée du plan d'expérience.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par lelenou Lun 14 Mar 2016 - 22:26

Bonjour Nik,

Tout d'abord je vous remercie beaucoup pour avoir pris le temps de me répondre. Je vais donc creuser les pistes que vous m'avez donné.

Concernant l'analyse multivariée, auriez-vous des guides à me conseiller pour savoir comment procéder sur R ? Je n'ai pas encore vu ces notions. De plus, l'analyse intra/inter classe se fera-t-elle sur l'analyse multivariée elle-même ou à côté ?

Pour le GLM binomial, même question que pour l'analyse multivariée, connaissez-vous par hasard de bons guides pour ce genre d'analyses sur R ? Vous conseillez d'émettre des hypothèses préalablement aux analyses statistiques pour cibler l'analyse qu'on veut en faire c'est cela ?

Enfin pour répondre à votre question, il a été choisi 8 plots (500m² environ) sur un grand site, 2 présentant un milieu boulevard/avenue, 3 avec des champs/prairies et 3 autres situés dans des parcs urbains. Pour ces 8 plots, on a relevé toutes les valeurs que j'ai décrite précédemment c'est à dire nombre d'espèce de plante, hauteur moyenne des plantes, hauteur maximum des plantes...etc.

Merci d'avance.

Hélène

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par droopy Lun 14 Mar 2016 - 22:46

Bonjour,

le problème ici c'est que tu as 8 sites si j'ai bien compris. Avec 8 sites il y a toutes les raisons de croire qu'ils sont chacun singuliers et par conséquent tirer des conclusions sur un éventuel effet du degré d'ouverture et/ou d'urbanisation sur les peuplements s'avère risqué. Est-ce que l'on peut tirer des généralités à partir de 2 - 3 - 3 sites ? Au mieux tu pourras dire que les tendances que tu observes (gradient de xxx ou de yyy) devront être confirmés sur un jeu de données plus important.

Cdlt
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par Nik Mar 15 Mar 2016 - 8:15

Bonjour,

Comme le souligne droopy, avec seulement 8 sites, cela coupe court à toute réflexion stat d'une part d'un point de vue écologique et également sur le type d'analyse stat que tu pourras appliquer. En gros de simples graphiques pour illustrer les valeurs observées seront suffisant. Les tests n'apporteront rien si ce n'est de la confusion ou un faux crédit scientifique à l'étude. Le plan d'expérience est trop compliqué pour le peu de réplicats. Peut être as-tu des réplicats dans le temps mais ça te rajoutera encore un degré de complexité à ton plan d'expérience qu'il faudra prendre en compte.

Autre point sans lien avec l'analyse de ton jeu de données. Il est important de préciser ton niveau en stats. Si pour une analyse, tu devais t'approprier à partir de 0 les analyses multivariées et les GLM, tu ne pourrais jamais livrer en temps et en heure ton étude stats.

Sur un forum, on ne connait pas les gens donc il est important de bien préciser de quoi on part. Le niveau en stats est un des points essentiels.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par c@ssoulet Mar 15 Mar 2016 - 8:50

A mon sens il manque des variables dans ton modèle. Au moins la ville (chaque site est "nested within" chaque ville). Il faut aussi prendre en compte la répétition de 2-3 mesures pour chaque site.

Au feeling, quelle que soit l'analyse adaptée à tes données (ANOVA, GLM...) c'est déjà pas simple de tester l'effet de toutes tes covariables sur 1 seule variable dépendante.

Mais en plus, quand tu dis "tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également", je comprends grosso modo que le phénomène que tu étudies est caractérisé par la mesure de 7 variables, probablement corrélées entre elles. Ca orienterait vers de l'analyse multivariée, et là on part vers un modèle d'une complexité à te faire péter les veines du front, en tout cas à mon petit niveau.

Donc a mon sens, si tu veux t'en sortir honorablement, une étape préliminaire de simplification du modèle s'impose. Ca passe probablement par la définition de variables d'interet particulier (et l'élimination des autres, au moins en première analyse...) et surtout un travail au niveau de tes 7 variables indépendantes, tu ne t'en sortira pas si tu en gardes autant.

La solution peut passer par la définition d'un seul critère principal d'évaluation, c'est à dire baser ton analyse et ton interprétation sur une seule de ces 7 variables (LA variable d'interet particulier), définie par des arguments biblio. Ou la construction d'un score unique intégrant plusieurs variables, sur le modèle du "critère composite" de plus en plus souvent utilisé en recherche clinique.



c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par lelenou Mar 15 Mar 2016 - 15:35

Bonjour,
Je m'excuse pour mes imprécisions, je ne suis qu'en Master et ce ne sont que des données fournies afin de s'entraîner à l'analyse statistique, je cherche donc à faire des analyses relativement simples à mon niveau.

Suite à vos messages, j'ai pensé à faire une AFC avec les régimes alimentaires et les plots, cela peut être pertinent à votre avis ?

Ensuite, j'ai testé ma richesse spécifique en oiseaux avec un test de Normalité et il s'avère que la variable n'est pas normale, j'ai donc effectivement abandonné l'ANOVA, et je cherche un moyen de tester si il y a une différence de la richesse spécifique en fonction de chacun des facteurs explicatifs. Je pensais à faire du coup un test de Wilcoxon-Mann-Whitney...

Merci d'avance.

Hélène

lelenou

Nombre de messages : 6
Date d'inscription : 13/03/2016

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par Nik Mar 15 Mar 2016 - 16:35

As tu bien seulement 8 valeurs de richesse au total ?

Si oui, laisse tomber les tests.

J'ajoute que tester la normalité ne sert à rien non plus et ce n'est surtout pas ça qui te dit en premier lieu d'abandonner l'ANOVA type modèle linéaire.

Si tu dois te placer en tant que statisticienne, la première chose à faire vis à vis des biologistes est de les alerter sur l'inadéquation entre objectif visé et plan d'expérience. Dans un 2e temps tu leur livres une série de descripteurs statistiques des données mais garde toi bien de conclure sur un quelconque effet milieu.

Nik

PS: je m'interroge franchement sur l'intérêt de donner de tels jeux de données à des étudiants pour les "entrainer" à la pratique de l'analyse statistique.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par droopy Mer 16 Mar 2016 - 7:55

PS: je m'interroge franchement sur l'intérêt de donner de tels jeux de données à des étudiants pour les "entrainer" à la pratique de l'analyse statistique. a écrit:
+1
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Analyse de données aviaires Empty Re: Analyse de données aviaires

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum