Les posteurs les plus actifs de la semaine
c@ssoulet
 
maplej0e
 
Eric Wajnberg
 
Florent Aubry
 
Mlbc
 


GLMM proportions non entières

Aller en bas

GLMM proportions non entières

Message par CC_05_2018 le Mar 22 Mai 2018 - 10:09

Bonjour,

J'aurais besoin d'un peu d'aide pour analyser des données dont je ne suis pas sûre de la façon de les analyser. J'ai testé dix fois quinze sujets dans trois conditions expérimentales différentes et mon objectif est de comparer leurs comportements dans ces trois conditions différentes. Chaque essai expérimental n'ayant pas la même durée, et ayant relevé la durée des comportements qui m'intéressent pendant ces essais, je ne peux pas comparer directement les durées en faisant des LME. Par contre, je peux calculer des proportions de temps passé à faire ces comportements mais celles-ci ne sont pas entières. Par exemple un comportement durait 7,88 secondes durant un essai de 30,51s ce qui nous donnait une proportion de 0,26 pour ce comportement. Et lorsque j'essaie de faire un GLMM directement sur les proportions suivant la loi binomiale, j'obtiens le warning suivant puisque mes proportions ne sont pas entières: "« In eval (family$initalize, rho): non-integer # successes in a binomial glm! ». En multipliant mes durées de comportements et mes durées d'essais par 100 et en utilisant la fonction cbind, je peux faire tourner les GLMM puisque cela permet de calculer les proportions à partir de nombres entiers mais les résultats ne sont alors pas les mêmes et les différences sont toutes très significatives.
Ma question est donc: comment puis-je comparer des proportions non entières avec un GLMM si cela est possible? Ou via une autre méthode statistique permettant de prendre en compte les répétitions sur les individus? Sauriez-Vous quel est l'impact de ce warning message? Et comment cela se fait-il que j'obtienne des résultats différents via ces deux types de GLMM?
Merci beaucoup pour votre aide!

CC_05_2018

Nombre de messages : 2
Date d'inscription : 22/05/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLMM proportions non entières

Message par Eric Wajnberg le Mar 22 Mai 2018 - 10:21

Je vois plusieurs problème ici. Si je tire des billes dans une urne où il y a des billes rouges et des billes noires, la proportion de billes rouge tirée suit une loi binomiale. En revanche, si je dis qu'il y a dans l'air 20% d’oxygène, ce n'est pas un pourcentage binomial. Pourcentage ne veux pas dire automatiquement binomial. Vos proportions de temps sont bellement gaussiennes, je pense (comme la mesure de la proportion d'oxygène dans l'air).

Un autre point est que vous dites rien que le modèle mixte que vous utilisez. Je vois dans votre protocole un sérieux problème de pseudo-réplication. Les dix mesures faites sur chaque individu ne sont pas indépendantes, loin de là. Vous avec 10x15 valeurs, mais l'effectif de votre échantillon est 15 (pas 150). A ce stade, je ne vois rien d'autre à faire que de prendre la moyenne des 10 mesures par individu et de faire les calculs sur ces moyennes uniquement. Accessoirement, en vertu du théorème limite centrale, ces moyennes suivent à coup sûr des lois normales, ce qui vous simplifiera grandement la tâche.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 889
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLMM proportions non entières

Message par CC_05_2018 le Mar 22 Mai 2018 - 10:29

Merci pour votre message. Je sais que l'utilisation de la loi binomiale dans mon modèle pose problème, c'est la raison pour laquelle je pose ma question et cherche à savoir si un autre type d'analyse permettant de garder le maximum d'informations est possible.
Un GLMM permet justement de traiter le problème de pseudo-replication en mettant l'identité de l'individu en random factor, ce que j'ai fait. Mon modèle a la condition expérimentale en tant qu'effet fixe et l'individu en tant qu'effet aléatoire.
Passer à la moyenne me ferait perdre des informations et je souhaiterais ne pas résumer mes données, c'est la raison pour laquelle je m'étais tournée vers les GLMM...

CC_05_2018

Nombre de messages : 2
Date d'inscription : 22/05/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLMM proportions non entières

Message par Eric Wajnberg le Mar 22 Mai 2018 - 12:07

CC_05_2018 a écrit:Je sais que l'utilisation de la loi binomiale dans mon modèle pose problème, c'est la raison pour laquelle je pose ma question et cherche à savoir si un autre type d'analyse permettant de garder le maximum d'informations est possible.
Vous ne m'avez pas compris, ou peut-être pas lu. Ce n'est pas que l'utilisation de la loi binomiale pose problème dans votre cas. C'est que vos données (pourcentage de temps) ne suivent pas une loi binomiale. Un modèle gaussien s'impose.
CC_05_2018 a écrit:
Un GLMM permet justement de traiter le problème de pseudo-replication en mettant l'identité de l'individu en random factor, ce que j'ai fait. Mon modèle a la condition expérimentale en tant qu'effet fixe et l'individu en tant qu'effet aléatoire.
Passer à la moyenne me ferait perdre des informations et je souhaiterais ne pas résumer mes données, c'est la raison pour laquelle je m'étais tournée vers les GLMM...
Oui, mais il reste qu'il y a pseudo-replication, que vous le veuillez ou non. Et effectivement, ca gonfle artificiellement l'effectif de vos échantillons, et du coup la puissance de vos tests, de manière erronée. A l'infini, il suffirait de faire de nombreuses répétitions sur chaque individu pour tomber sur des tests toujours significatifs. Par exemple, je pourrais mesurer des milliers de fois le niveau d'infection chez un seul individu qui a pris un antibiotique pour en démontrer statistiquement l'efficacité. Ca n'aurait aucune valeur et ça représente un usage erronée (et largement démontré et documenté comme tel) de l'outil statistique.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 889
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLMM proportions non entières

Message par droopy le Mar 22 Mai 2018 - 13:31

Bonjour,

tu dois pouvoir faire quelque chose d'approchant en modélisant le temps passé à un comportement en log et en mettant le log du temps total en variable dite 'offset'. Du coup ça attribuerait un coefficient de 1 à la variable log(temps total) et ça reviendrait à modéliser le log du ratio entre le temps et le temps total. Après je ne sais pas si c'est souhaitable ici, ni les conséquences sur la variance.

cdlt
avatar
droopy

Nombre de messages : 1097
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLMM proportions non entières

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum