Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
GLMM proportions non entières
3 participants
Page 1 sur 1
GLMM proportions non entières
Bonjour,
J'aurais besoin d'un peu d'aide pour analyser des données dont je ne suis pas sûre de la façon de les analyser. J'ai testé dix fois quinze sujets dans trois conditions expérimentales différentes et mon objectif est de comparer leurs comportements dans ces trois conditions différentes. Chaque essai expérimental n'ayant pas la même durée, et ayant relevé la durée des comportements qui m'intéressent pendant ces essais, je ne peux pas comparer directement les durées en faisant des LME. Par contre, je peux calculer des proportions de temps passé à faire ces comportements mais celles-ci ne sont pas entières. Par exemple un comportement durait 7,88 secondes durant un essai de 30,51s ce qui nous donnait une proportion de 0,26 pour ce comportement. Et lorsque j'essaie de faire un GLMM directement sur les proportions suivant la loi binomiale, j'obtiens le warning suivant puisque mes proportions ne sont pas entières: "« In eval (family$initalize, rho): non-integer # successes in a binomial glm! ». En multipliant mes durées de comportements et mes durées d'essais par 100 et en utilisant la fonction cbind, je peux faire tourner les GLMM puisque cela permet de calculer les proportions à partir de nombres entiers mais les résultats ne sont alors pas les mêmes et les différences sont toutes très significatives.
Ma question est donc: comment puis-je comparer des proportions non entières avec un GLMM si cela est possible? Ou via une autre méthode statistique permettant de prendre en compte les répétitions sur les individus? Sauriez-Vous quel est l'impact de ce warning message? Et comment cela se fait-il que j'obtienne des résultats différents via ces deux types de GLMM?
Merci beaucoup pour votre aide!
J'aurais besoin d'un peu d'aide pour analyser des données dont je ne suis pas sûre de la façon de les analyser. J'ai testé dix fois quinze sujets dans trois conditions expérimentales différentes et mon objectif est de comparer leurs comportements dans ces trois conditions différentes. Chaque essai expérimental n'ayant pas la même durée, et ayant relevé la durée des comportements qui m'intéressent pendant ces essais, je ne peux pas comparer directement les durées en faisant des LME. Par contre, je peux calculer des proportions de temps passé à faire ces comportements mais celles-ci ne sont pas entières. Par exemple un comportement durait 7,88 secondes durant un essai de 30,51s ce qui nous donnait une proportion de 0,26 pour ce comportement. Et lorsque j'essaie de faire un GLMM directement sur les proportions suivant la loi binomiale, j'obtiens le warning suivant puisque mes proportions ne sont pas entières: "« In eval (family$initalize, rho): non-integer # successes in a binomial glm! ». En multipliant mes durées de comportements et mes durées d'essais par 100 et en utilisant la fonction cbind, je peux faire tourner les GLMM puisque cela permet de calculer les proportions à partir de nombres entiers mais les résultats ne sont alors pas les mêmes et les différences sont toutes très significatives.
Ma question est donc: comment puis-je comparer des proportions non entières avec un GLMM si cela est possible? Ou via une autre méthode statistique permettant de prendre en compte les répétitions sur les individus? Sauriez-Vous quel est l'impact de ce warning message? Et comment cela se fait-il que j'obtienne des résultats différents via ces deux types de GLMM?
Merci beaucoup pour votre aide!
CC_05_2018- Nombre de messages : 2
Date d'inscription : 22/05/2018
Re: GLMM proportions non entières
Je vois plusieurs problème ici. Si je tire des billes dans une urne où il y a des billes rouges et des billes noires, la proportion de billes rouge tirée suit une loi binomiale. En revanche, si je dis qu'il y a dans l'air 20% d’oxygène, ce n'est pas un pourcentage binomial. Pourcentage ne veux pas dire automatiquement binomial. Vos proportions de temps sont bellement gaussiennes, je pense (comme la mesure de la proportion d'oxygène dans l'air).
Un autre point est que vous dites rien que le modèle mixte que vous utilisez. Je vois dans votre protocole un sérieux problème de pseudo-réplication. Les dix mesures faites sur chaque individu ne sont pas indépendantes, loin de là. Vous avec 10x15 valeurs, mais l'effectif de votre échantillon est 15 (pas 150). A ce stade, je ne vois rien d'autre à faire que de prendre la moyenne des 10 mesures par individu et de faire les calculs sur ces moyennes uniquement. Accessoirement, en vertu du théorème limite centrale, ces moyennes suivent à coup sûr des lois normales, ce qui vous simplifiera grandement la tâche.
HTH, Eric.
Un autre point est que vous dites rien que le modèle mixte que vous utilisez. Je vois dans votre protocole un sérieux problème de pseudo-réplication. Les dix mesures faites sur chaque individu ne sont pas indépendantes, loin de là. Vous avec 10x15 valeurs, mais l'effectif de votre échantillon est 15 (pas 150). A ce stade, je ne vois rien d'autre à faire que de prendre la moyenne des 10 mesures par individu et de faire les calculs sur ces moyennes uniquement. Accessoirement, en vertu du théorème limite centrale, ces moyennes suivent à coup sûr des lois normales, ce qui vous simplifiera grandement la tâche.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLMM proportions non entières
Merci pour votre message. Je sais que l'utilisation de la loi binomiale dans mon modèle pose problème, c'est la raison pour laquelle je pose ma question et cherche à savoir si un autre type d'analyse permettant de garder le maximum d'informations est possible.
Un GLMM permet justement de traiter le problème de pseudo-replication en mettant l'identité de l'individu en random factor, ce que j'ai fait. Mon modèle a la condition expérimentale en tant qu'effet fixe et l'individu en tant qu'effet aléatoire.
Passer à la moyenne me ferait perdre des informations et je souhaiterais ne pas résumer mes données, c'est la raison pour laquelle je m'étais tournée vers les GLMM...
Un GLMM permet justement de traiter le problème de pseudo-replication en mettant l'identité de l'individu en random factor, ce que j'ai fait. Mon modèle a la condition expérimentale en tant qu'effet fixe et l'individu en tant qu'effet aléatoire.
Passer à la moyenne me ferait perdre des informations et je souhaiterais ne pas résumer mes données, c'est la raison pour laquelle je m'étais tournée vers les GLMM...
CC_05_2018- Nombre de messages : 2
Date d'inscription : 22/05/2018
Re: GLMM proportions non entières
Vous ne m'avez pas compris, ou peut-être pas lu. Ce n'est pas que l'utilisation de la loi binomiale pose problème dans votre cas. C'est que vos données (pourcentage de temps) ne suivent pas une loi binomiale. Un modèle gaussien s'impose.CC_05_2018 a écrit:Je sais que l'utilisation de la loi binomiale dans mon modèle pose problème, c'est la raison pour laquelle je pose ma question et cherche à savoir si un autre type d'analyse permettant de garder le maximum d'informations est possible.
Oui, mais il reste qu'il y a pseudo-replication, que vous le veuillez ou non. Et effectivement, ca gonfle artificiellement l'effectif de vos échantillons, et du coup la puissance de vos tests, de manière erronée. A l'infini, il suffirait de faire de nombreuses répétitions sur chaque individu pour tomber sur des tests toujours significatifs. Par exemple, je pourrais mesurer des milliers de fois le niveau d'infection chez un seul individu qui a pris un antibiotique pour en démontrer statistiquement l'efficacité. Ca n'aurait aucune valeur et ça représente un usage erronée (et largement démontré et documenté comme tel) de l'outil statistique.CC_05_2018 a écrit:
Un GLMM permet justement de traiter le problème de pseudo-replication en mettant l'identité de l'individu en random factor, ce que j'ai fait. Mon modèle a la condition expérimentale en tant qu'effet fixe et l'individu en tant qu'effet aléatoire.
Passer à la moyenne me ferait perdre des informations et je souhaiterais ne pas résumer mes données, c'est la raison pour laquelle je m'étais tournée vers les GLMM...
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLMM proportions non entières
Bonjour,
tu dois pouvoir faire quelque chose d'approchant en modélisant le temps passé à un comportement en log et en mettant le log du temps total en variable dite 'offset'. Du coup ça attribuerait un coefficient de 1 à la variable log(temps total) et ça reviendrait à modéliser le log du ratio entre le temps et le temps total. Après je ne sais pas si c'est souhaitable ici, ni les conséquences sur la variance.
cdlt
tu dois pouvoir faire quelque chose d'approchant en modélisant le temps passé à un comportement en log et en mettant le log du temps total en variable dite 'offset'. Du coup ça attribuerait un coefficient de 1 à la variable log(temps total) et ça reviendrait à modéliser le log du ratio entre le temps et le temps total. Après je ne sais pas si c'est souhaitable ici, ni les conséquences sur la variance.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» Comparaison de moyennes sur des populations entieres
» GLMM pour détection de déclin de population (comptages)
» test sur des proportions
» GLMM: application/ groupes non équilibrés
» Test sur 2 proportions?
» GLMM pour détection de déclin de population (comptages)
» test sur des proportions
» GLMM: application/ groupes non équilibrés
» Test sur 2 proportions?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum