Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
GLM binomiale
2 participants
Page 1 sur 1
GLM binomiale
Bonjour,
Actuellement en stage, je viens de créé un GLM binomial (lien probit) afin d'estimer les probabilités de nidification d'une espèce. Seulement mes résidus n'ont pas une distribution normale, ne sont pas indépendants, ni homoscédastiques. Est-ce que cela est normal et viens du fait que j'ai utilisé la famille binomiale (fonction de lien probit) ou comme je le crains, mon modèle n'est-il donc pas utilisable ?
Auquel cas, comment puis-je le modifier s'il vous plait ? J'ai essayé d'enlever toutes les variables une à une et certaines par groupe sans que cela ne change significativement le résultat de mes tests.
Merci par avance,
Tristan.
Actuellement en stage, je viens de créé un GLM binomial (lien probit) afin d'estimer les probabilités de nidification d'une espèce. Seulement mes résidus n'ont pas une distribution normale, ne sont pas indépendants, ni homoscédastiques. Est-ce que cela est normal et viens du fait que j'ai utilisé la famille binomiale (fonction de lien probit) ou comme je le crains, mon modèle n'est-il donc pas utilisable ?
Auquel cas, comment puis-je le modifier s'il vous plait ? J'ai essayé d'enlever toutes les variables une à une et certaines par groupe sans que cela ne change significativement le résultat de mes tests.
Merci par avance,
Tristan.
Tristan G.- Nombre de messages : 4
Date d'inscription : 06/08/2016
Re: GLM binomiale
La variable que vous expliquez est un pourcentage (distribution binomiale). Et c'est pour cela que vous ajustez un modèle binomial à vos données via un glm (régression logistique). On n'est plus du tout dans ce cas dans le cadre d'un modèle gaussien où les variances sont égales, etc. Les résidus, donc, ne sont pas attendus comme étant gaussiens, ni les variances égales (la variance d'une loi binomiale est (p(1-p))/n et devrait donc se rapprocher de zéro lorsque p se rapproche de 0.0 ou 1.0).
Si vraiment vous voulez "raffiner", vous pouvez ajuster votre modèle avec l'option family=quasibinomial et regarder la valeur du coefficient de dispersion estimée dans le summary de votre modèle. Si ce coefficient est proche de 1.0, alors vos données sont bien binomiales, etc.
HTH, Eric.
Si vraiment vous voulez "raffiner", vous pouvez ajuster votre modèle avec l'option family=quasibinomial et regarder la valeur du coefficient de dispersion estimée dans le summary de votre modèle. Si ce coefficient est proche de 1.0, alors vos données sont bien binomiales, etc.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLM binomiale
Merci beaucoup !
À un jour du rendu de mon rapport de stage, vous me sauvez la vie (ou presque) ! ^^
Du coup j'ai cherché sur internet il est expliqué le fonctionnement des fonctions (ce qui est un peu trop technique pour moi) mais sur quel type de données privilégie-t-on l'option binomial et sur quel type l'option quasi-binomial ?
Du coup, mes résidus n'étant pas normaux, je dois plutôt privilégier la fonction de lien logit plutôt que probit ?
À un jour du rendu de mon rapport de stage, vous me sauvez la vie (ou presque) ! ^^
Du coup j'ai cherché sur internet il est expliqué le fonctionnement des fonctions (ce qui est un peu trop technique pour moi) mais sur quel type de données privilégie-t-on l'option binomial et sur quel type l'option quasi-binomial ?
Du coup, mes résidus n'étant pas normaux, je dois plutôt privilégier la fonction de lien logit plutôt que probit ?
Tristan G.- Nombre de messages : 4
Date d'inscription : 06/08/2016
Re: GLM binomiale
La différence entre "binomial" et "quasibinomial" est que - dans le second cas - un paramètre supplémentaire est estimé à partir des données, c'est le coefficient de dispersion qui permet de voir si la variance de vos données (après ajustement) est conforme ou non à une loi binomiale. Ca ne change pas la valeur des paramètres de la régression estimés, mais ca change leur SE, et donc la significativité des tests. C'est tout.
Pour le lien probit ou logit, il n'y a pas de règle pré-établie. Ca dépend un peu de vos données et de vos habitudes de travail. Les toxicologistes privilégient le lien probit, sinon le lien logit est le choix le plus fréquent. Dans le cas binomial, il existe même d'autres fonctions de lien possibles. On peut même écrire sa propre fonction de lien (ce que je présente sur un autre post dans ce forum), mais je ne pense pas que ce soit votre cas. Rapidement, d'après ce que je comprends de votre problème, le lien logit est le bon choix.
HTH, Eric.
Pour le lien probit ou logit, il n'y a pas de règle pré-établie. Ca dépend un peu de vos données et de vos habitudes de travail. Les toxicologistes privilégient le lien probit, sinon le lien logit est le choix le plus fréquent. Dans le cas binomial, il existe même d'autres fonctions de lien possibles. On peut même écrire sa propre fonction de lien (ce que je présente sur un autre post dans ce forum), mais je ne pense pas que ce soit votre cas. Rapidement, d'après ce que je comprends de votre problème, le lien logit est le bon choix.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLM binomiale
Génial, merci beaucoup pour votre aide !!
Bonne journée,
Tristan.
Bonne journée,
Tristan.
Tristan G.- Nombre de messages : 4
Date d'inscription : 06/08/2016
Re: GLM binomiale
Par contre avec quasibinomial, j'obtiens un résultat totalement différent et qui n'a peu de sens. Serait-il juste de dire que cela vient du fait que j'ai des variables de différentes natures (présence d'éléments, surfaces de culture, densité d'élevages, distance de cours d'eau) et que donc leur variances sont trop différentes pour appliquer quasibinomial ?
En revanche, logit fonctionne fantastiquement bien ! Avec probit j'étais embêté car un message me disant quemon algorithme ne convergeais pas s'affichais mais il ne s'affiche plus avec logit !
En revanche, logit fonctionne fantastiquement bien ! Avec probit j'étais embêté car un message me disant quemon algorithme ne convergeais pas s'affichais mais il ne s'affiche plus avec logit !
Tristan G.- Nombre de messages : 4
Date d'inscription : 06/08/2016
Re: GLM binomiale
Quand je parle de variance, je parle de la variance de la variable à expliquer (la variable indépendante, binomiale), pas des variances des variables explicatives dépendantes. Oui, le résultat avec quasibinomial peut être différent, surtout si la (vraie) variance de votre variable dépendante s'écarte sensiblement d'une loi binomiale.
Cordialement, Eric.
Cordialement, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Sujets similaires
» loi binomiale
» loi binomiale
» Erreur régression binomiale R
» loi bêta-binomiale
» Loi binomiale ? loi normale?
» loi binomiale
» Erreur régression binomiale R
» loi bêta-binomiale
» Loi binomiale ? loi normale?
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum