Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse de données aviaires
4 participants
Page 1 sur 1
Analyse de données aviaires
Bonjour à tous,
J'ai besoin de votre aide pour savoir si mon raisonnement est pertinent d'un point de vue statistique et si une technique ne serait pas plus appropriée s'il vous plaît.
On m'a fourni un jeu de données d'Ecologie à analyser concernant les effets de l'urbanisation sur les communautés d'oiseaux dans les villes d'Amérique du Sud qui forment de véritables mosaïques d'habitats différents. Trois types de milieu ont été étudiés : boulevard/avenue, parcs urbains, prairies/champs. Pour chaque milieu, on a prospecté 2 ou 3 sites différents et noté
le nombre espèces d'oiseaux total,
le nombre d'espèces de plantes,
la hauteur moyenne des plantes,
la hauteur maximum chez les plantes,
les pourcentages de recouvrement d'herbacées (plantes pas plus hautes que 1,5 mètres environ),
le pourcentage de recouvrement du feuillage des arbres et celui du ciment
Enfin, pour chaque site on a noté le nombre d'espèces par régime alimentaire : omnivore, carnivore, frugivore etc...
Je suis partie sur des ANOVA en prenant comme
facteurs explicatifs : milieu, nombre d'espèces de plantes, hauteur moyenne des plantes, hauteur maximum des plantes, les pourcentages de recouvrement d'herbacées, des feuilles d'arbres et ciment,
facteurs à expliquer : le nombre d'espèces d'oiseaux, et le nombre d'espèces par régime alimentaire transformé en fréquence.
Pour les ANOVA, je voulais transformer les fréquences en arcsin, et les pourcentages en (Les pourcentages doivent être transformés en quoi ?), et tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également.
- Les variables sont dépendantes pour moi et les facteurs sont également tous dépendants du type de milieu, cela pose-t-il un problème pour faire une ANOVA ?
- Cela revient à faire énormément d'ANOVA, et produire une grande quantité de résultats significatifs ou non pas forcément exploitables dans leur ensemble. Y aurait-il une technique pour tester statistiquement toutes les variables avec tous les facteurs ?
- Quelqu'un verrait-il une technique pour rassembler les fréquences de régime alimentaire afin de créer une variable unique ou vaut mieux t-il laisser cela en différentes variables ?
- Enfin, y a-t-il un effet "site" ? Si oui, comment le considérer ? En l'incluant en tant que facteur explicatif ?
Merci d'avance pour ceux qui auront le courage de me lire et d'essayer de répondre à mes questions.
En vous souhaitant une agréable fin de journée, bien cordialement,
Hélène
J'ai besoin de votre aide pour savoir si mon raisonnement est pertinent d'un point de vue statistique et si une technique ne serait pas plus appropriée s'il vous plaît.
On m'a fourni un jeu de données d'Ecologie à analyser concernant les effets de l'urbanisation sur les communautés d'oiseaux dans les villes d'Amérique du Sud qui forment de véritables mosaïques d'habitats différents. Trois types de milieu ont été étudiés : boulevard/avenue, parcs urbains, prairies/champs. Pour chaque milieu, on a prospecté 2 ou 3 sites différents et noté
le nombre espèces d'oiseaux total,
le nombre d'espèces de plantes,
la hauteur moyenne des plantes,
la hauteur maximum chez les plantes,
les pourcentages de recouvrement d'herbacées (plantes pas plus hautes que 1,5 mètres environ),
le pourcentage de recouvrement du feuillage des arbres et celui du ciment
Enfin, pour chaque site on a noté le nombre d'espèces par régime alimentaire : omnivore, carnivore, frugivore etc...
Je suis partie sur des ANOVA en prenant comme
facteurs explicatifs : milieu, nombre d'espèces de plantes, hauteur moyenne des plantes, hauteur maximum des plantes, les pourcentages de recouvrement d'herbacées, des feuilles d'arbres et ciment,
facteurs à expliquer : le nombre d'espèces d'oiseaux, et le nombre d'espèces par régime alimentaire transformé en fréquence.
Pour les ANOVA, je voulais transformer les fréquences en arcsin, et les pourcentages en (Les pourcentages doivent être transformés en quoi ?), et tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également.
- Les variables sont dépendantes pour moi et les facteurs sont également tous dépendants du type de milieu, cela pose-t-il un problème pour faire une ANOVA ?
- Cela revient à faire énormément d'ANOVA, et produire une grande quantité de résultats significatifs ou non pas forcément exploitables dans leur ensemble. Y aurait-il une technique pour tester statistiquement toutes les variables avec tous les facteurs ?
- Quelqu'un verrait-il une technique pour rassembler les fréquences de régime alimentaire afin de créer une variable unique ou vaut mieux t-il laisser cela en différentes variables ?
- Enfin, y a-t-il un effet "site" ? Si oui, comment le considérer ? En l'incluant en tant que facteur explicatif ?
Merci d'avance pour ceux qui auront le courage de me lire et d'essayer de répondre à mes questions.
En vous souhaitant une agréable fin de journée, bien cordialement,
Hélène
Dernière édition par lelenou le Lun 14 Mar 2016 - 22:17, édité 1 fois
lelenou- Nombre de messages : 6
Date d'inscription : 13/03/2016
Re: Analyse de données aviaires
Bonjour Hélène,
Je te fais une première réponse rapide car je n'ai pour le moment pas le temps de répondre à toutes tes questions. Je reprendrais plus tard ou d'autres complèteront/corrigeront ce que j'écris.
A mon avis l'ANOVA, c'est à dire un modèle linéaire avec une variable explicative qualitative, ne sera pas adaptée du fait de la nature des variables à expliquer. Ce sont des comptage ou des variables à réponse multiples tes fréquences).
Pour les régimes alimentaires, je partirais sur une analyse multivariée permettant de lier 2 tableaux (type Co-inertie, AFM, ACC) : celui des régimes alimentaires et celui des variables explicatives afin de dégrossir le travail. Si les auteurs de l'étude cherchent juste à savoir si un lien se dégage dans les données ce sera alors bien suffisant comme analyse. Tu pourras tester l'effet site via une analyse intra/inter classe.
Pour le nb d'espèce, un GLM binomial (ou GLMM si tu veux prendre en compte l'effet site via un facteur aléatoire) avec un processus de sélection de modèle (stepwise, ou construction de modèles candidats via des hypothèses à co-élaborer avec les biologistes).
Il manque une info cruciale dans ce que tu donnes : le nombre de valeurs avec une idée du plan d'expérience.
Nik
Je te fais une première réponse rapide car je n'ai pour le moment pas le temps de répondre à toutes tes questions. Je reprendrais plus tard ou d'autres complèteront/corrigeront ce que j'écris.
A mon avis l'ANOVA, c'est à dire un modèle linéaire avec une variable explicative qualitative, ne sera pas adaptée du fait de la nature des variables à expliquer. Ce sont des comptage ou des variables à réponse multiples tes fréquences).
Pour les régimes alimentaires, je partirais sur une analyse multivariée permettant de lier 2 tableaux (type Co-inertie, AFM, ACC) : celui des régimes alimentaires et celui des variables explicatives afin de dégrossir le travail. Si les auteurs de l'étude cherchent juste à savoir si un lien se dégage dans les données ce sera alors bien suffisant comme analyse. Tu pourras tester l'effet site via une analyse intra/inter classe.
Pour le nb d'espèce, un GLM binomial (ou GLMM si tu veux prendre en compte l'effet site via un facteur aléatoire) avec un processus de sélection de modèle (stepwise, ou construction de modèles candidats via des hypothèses à co-élaborer avec les biologistes).
Il manque une info cruciale dans ce que tu donnes : le nombre de valeurs avec une idée du plan d'expérience.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Analyse de données aviaires
Bonjour Nik,
Tout d'abord je vous remercie beaucoup pour avoir pris le temps de me répondre. Je vais donc creuser les pistes que vous m'avez donné.
Concernant l'analyse multivariée, auriez-vous des guides à me conseiller pour savoir comment procéder sur R ? Je n'ai pas encore vu ces notions. De plus, l'analyse intra/inter classe se fera-t-elle sur l'analyse multivariée elle-même ou à côté ?
Pour le GLM binomial, même question que pour l'analyse multivariée, connaissez-vous par hasard de bons guides pour ce genre d'analyses sur R ? Vous conseillez d'émettre des hypothèses préalablement aux analyses statistiques pour cibler l'analyse qu'on veut en faire c'est cela ?
Enfin pour répondre à votre question, il a été choisi 8 plots (500m² environ) sur un grand site, 2 présentant un milieu boulevard/avenue, 3 avec des champs/prairies et 3 autres situés dans des parcs urbains. Pour ces 8 plots, on a relevé toutes les valeurs que j'ai décrite précédemment c'est à dire nombre d'espèce de plante, hauteur moyenne des plantes, hauteur maximum des plantes...etc.
Merci d'avance.
Hélène
Tout d'abord je vous remercie beaucoup pour avoir pris le temps de me répondre. Je vais donc creuser les pistes que vous m'avez donné.
Concernant l'analyse multivariée, auriez-vous des guides à me conseiller pour savoir comment procéder sur R ? Je n'ai pas encore vu ces notions. De plus, l'analyse intra/inter classe se fera-t-elle sur l'analyse multivariée elle-même ou à côté ?
Pour le GLM binomial, même question que pour l'analyse multivariée, connaissez-vous par hasard de bons guides pour ce genre d'analyses sur R ? Vous conseillez d'émettre des hypothèses préalablement aux analyses statistiques pour cibler l'analyse qu'on veut en faire c'est cela ?
Enfin pour répondre à votre question, il a été choisi 8 plots (500m² environ) sur un grand site, 2 présentant un milieu boulevard/avenue, 3 avec des champs/prairies et 3 autres situés dans des parcs urbains. Pour ces 8 plots, on a relevé toutes les valeurs que j'ai décrite précédemment c'est à dire nombre d'espèce de plante, hauteur moyenne des plantes, hauteur maximum des plantes...etc.
Merci d'avance.
Hélène
lelenou- Nombre de messages : 6
Date d'inscription : 13/03/2016
Re: Analyse de données aviaires
Bonjour,
le problème ici c'est que tu as 8 sites si j'ai bien compris. Avec 8 sites il y a toutes les raisons de croire qu'ils sont chacun singuliers et par conséquent tirer des conclusions sur un éventuel effet du degré d'ouverture et/ou d'urbanisation sur les peuplements s'avère risqué. Est-ce que l'on peut tirer des généralités à partir de 2 - 3 - 3 sites ? Au mieux tu pourras dire que les tendances que tu observes (gradient de xxx ou de yyy) devront être confirmés sur un jeu de données plus important.
Cdlt
le problème ici c'est que tu as 8 sites si j'ai bien compris. Avec 8 sites il y a toutes les raisons de croire qu'ils sont chacun singuliers et par conséquent tirer des conclusions sur un éventuel effet du degré d'ouverture et/ou d'urbanisation sur les peuplements s'avère risqué. Est-ce que l'on peut tirer des généralités à partir de 2 - 3 - 3 sites ? Au mieux tu pourras dire que les tendances que tu observes (gradient de xxx ou de yyy) devront être confirmés sur un jeu de données plus important.
Cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyse de données aviaires
Bonjour,
Comme le souligne droopy, avec seulement 8 sites, cela coupe court à toute réflexion stat d'une part d'un point de vue écologique et également sur le type d'analyse stat que tu pourras appliquer. En gros de simples graphiques pour illustrer les valeurs observées seront suffisant. Les tests n'apporteront rien si ce n'est de la confusion ou un faux crédit scientifique à l'étude. Le plan d'expérience est trop compliqué pour le peu de réplicats. Peut être as-tu des réplicats dans le temps mais ça te rajoutera encore un degré de complexité à ton plan d'expérience qu'il faudra prendre en compte.
Autre point sans lien avec l'analyse de ton jeu de données. Il est important de préciser ton niveau en stats. Si pour une analyse, tu devais t'approprier à partir de 0 les analyses multivariées et les GLM, tu ne pourrais jamais livrer en temps et en heure ton étude stats.
Sur un forum, on ne connait pas les gens donc il est important de bien préciser de quoi on part. Le niveau en stats est un des points essentiels.
Nik
Comme le souligne droopy, avec seulement 8 sites, cela coupe court à toute réflexion stat d'une part d'un point de vue écologique et également sur le type d'analyse stat que tu pourras appliquer. En gros de simples graphiques pour illustrer les valeurs observées seront suffisant. Les tests n'apporteront rien si ce n'est de la confusion ou un faux crédit scientifique à l'étude. Le plan d'expérience est trop compliqué pour le peu de réplicats. Peut être as-tu des réplicats dans le temps mais ça te rajoutera encore un degré de complexité à ton plan d'expérience qu'il faudra prendre en compte.
Autre point sans lien avec l'analyse de ton jeu de données. Il est important de préciser ton niveau en stats. Si pour une analyse, tu devais t'approprier à partir de 0 les analyses multivariées et les GLM, tu ne pourrais jamais livrer en temps et en heure ton étude stats.
Sur un forum, on ne connait pas les gens donc il est important de bien préciser de quoi on part. Le niveau en stats est un des points essentiels.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Analyse de données aviaires
A mon sens il manque des variables dans ton modèle. Au moins la ville (chaque site est "nested within" chaque ville). Il faut aussi prendre en compte la répétition de 2-3 mesures pour chaque site.
Au feeling, quelle que soit l'analyse adaptée à tes données (ANOVA, GLM...) c'est déjà pas simple de tester l'effet de toutes tes covariables sur 1 seule variable dépendante.
Mais en plus, quand tu dis "tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également", je comprends grosso modo que le phénomène que tu étudies est caractérisé par la mesure de 7 variables, probablement corrélées entre elles. Ca orienterait vers de l'analyse multivariée, et là on part vers un modèle d'une complexité à te faire péter les veines du front, en tout cas à mon petit niveau.
Donc a mon sens, si tu veux t'en sortir honorablement, une étape préliminaire de simplification du modèle s'impose. Ca passe probablement par la définition de variables d'interet particulier (et l'élimination des autres, au moins en première analyse...) et surtout un travail au niveau de tes 7 variables indépendantes, tu ne t'en sortira pas si tu en gardes autant.
La solution peut passer par la définition d'un seul critère principal d'évaluation, c'est à dire baser ton analyse et ton interprétation sur une seule de ces 7 variables (LA variable d'interet particulier), définie par des arguments biblio. Ou la construction d'un score unique intégrant plusieurs variables, sur le modèle du "critère composite" de plus en plus souvent utilisé en recherche clinique.
Au feeling, quelle que soit l'analyse adaptée à tes données (ANOVA, GLM...) c'est déjà pas simple de tester l'effet de toutes tes covariables sur 1 seule variable dépendante.
Mais en plus, quand tu dis "tester chaque variable soit 7 avec chaque facteur explicatif soit 7 également", je comprends grosso modo que le phénomène que tu étudies est caractérisé par la mesure de 7 variables, probablement corrélées entre elles. Ca orienterait vers de l'analyse multivariée, et là on part vers un modèle d'une complexité à te faire péter les veines du front, en tout cas à mon petit niveau.
Donc a mon sens, si tu veux t'en sortir honorablement, une étape préliminaire de simplification du modèle s'impose. Ca passe probablement par la définition de variables d'interet particulier (et l'élimination des autres, au moins en première analyse...) et surtout un travail au niveau de tes 7 variables indépendantes, tu ne t'en sortira pas si tu en gardes autant.
La solution peut passer par la définition d'un seul critère principal d'évaluation, c'est à dire baser ton analyse et ton interprétation sur une seule de ces 7 variables (LA variable d'interet particulier), définie par des arguments biblio. Ou la construction d'un score unique intégrant plusieurs variables, sur le modèle du "critère composite" de plus en plus souvent utilisé en recherche clinique.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Analyse de données aviaires
Bonjour,
Je m'excuse pour mes imprécisions, je ne suis qu'en Master et ce ne sont que des données fournies afin de s'entraîner à l'analyse statistique, je cherche donc à faire des analyses relativement simples à mon niveau.
Suite à vos messages, j'ai pensé à faire une AFC avec les régimes alimentaires et les plots, cela peut être pertinent à votre avis ?
Ensuite, j'ai testé ma richesse spécifique en oiseaux avec un test de Normalité et il s'avère que la variable n'est pas normale, j'ai donc effectivement abandonné l'ANOVA, et je cherche un moyen de tester si il y a une différence de la richesse spécifique en fonction de chacun des facteurs explicatifs. Je pensais à faire du coup un test de Wilcoxon-Mann-Whitney...
Merci d'avance.
Hélène
Je m'excuse pour mes imprécisions, je ne suis qu'en Master et ce ne sont que des données fournies afin de s'entraîner à l'analyse statistique, je cherche donc à faire des analyses relativement simples à mon niveau.
Suite à vos messages, j'ai pensé à faire une AFC avec les régimes alimentaires et les plots, cela peut être pertinent à votre avis ?
Ensuite, j'ai testé ma richesse spécifique en oiseaux avec un test de Normalité et il s'avère que la variable n'est pas normale, j'ai donc effectivement abandonné l'ANOVA, et je cherche un moyen de tester si il y a une différence de la richesse spécifique en fonction de chacun des facteurs explicatifs. Je pensais à faire du coup un test de Wilcoxon-Mann-Whitney...
Merci d'avance.
Hélène
lelenou- Nombre de messages : 6
Date d'inscription : 13/03/2016
Re: Analyse de données aviaires
As tu bien seulement 8 valeurs de richesse au total ?
Si oui, laisse tomber les tests.
J'ajoute que tester la normalité ne sert à rien non plus et ce n'est surtout pas ça qui te dit en premier lieu d'abandonner l'ANOVA type modèle linéaire.
Si tu dois te placer en tant que statisticienne, la première chose à faire vis à vis des biologistes est de les alerter sur l'inadéquation entre objectif visé et plan d'expérience. Dans un 2e temps tu leur livres une série de descripteurs statistiques des données mais garde toi bien de conclure sur un quelconque effet milieu.
Nik
PS: je m'interroge franchement sur l'intérêt de donner de tels jeux de données à des étudiants pour les "entrainer" à la pratique de l'analyse statistique.
Si oui, laisse tomber les tests.
J'ajoute que tester la normalité ne sert à rien non plus et ce n'est surtout pas ça qui te dit en premier lieu d'abandonner l'ANOVA type modèle linéaire.
Si tu dois te placer en tant que statisticienne, la première chose à faire vis à vis des biologistes est de les alerter sur l'inadéquation entre objectif visé et plan d'expérience. Dans un 2e temps tu leur livres une série de descripteurs statistiques des données mais garde toi bien de conclure sur un quelconque effet milieu.
Nik
PS: je m'interroge franchement sur l'intérêt de donner de tels jeux de données à des étudiants pour les "entrainer" à la pratique de l'analyse statistique.
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Analyse de données aviaires
+1PS: je m'interroge franchement sur l'intérêt de donner de tels jeux de données à des étudiants pour les "entrainer" à la pratique de l'analyse statistique. a écrit:
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» ACM CAH (données qualitatives & grosse base de données)
» HELP Données ACP AFC ACM
» données anthropométriques
» Représentativité de données
» Aide sur mes données SVP !
» HELP Données ACP AFC ACM
» données anthropométriques
» Représentativité de données
» Aide sur mes données SVP !
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum