Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Interprétation GLM -> AIC : Inf
2 participants
Page 1 sur 1
Interprétation GLM -> AIC : Inf
Bonjour à tous,
Je suis étudiante en dernière année en Sciences Biologiques. Je travaille actuellement sur les données de mon mémoire (que je dois terminer très bientôt =( ).
J'ai collecté des abeilles sauvages dans plusieurs sites et je désire déterminer si les éléments du paysage (le type de sol, ...) influence la rareté des individu collecté (indiqué par un coefficient : 0.0152 par exemple)
J'ai donc une variable quantitative (la rareté) et plusieurs variables explicatives (qualitatives). J'ai réalisé des glm afin de déterminer le meilleur modèle (en observant les AIC) et donc les variables explicatives pouvant influencer significativement la rareté.
Malheureusement lorsque je désire tester chaque variable séparément (afin de sélectionner celle pour démarrer mon modèle), l'AIC qui m'est renvoyé est "Inf" . Cela est identique pour mes 5 variables à tester et lorsque je veux ajouter des variables supplémentaires.
Je ne sais donc pas comment interpréter cette valeur "Inf".
Pourriez-vous me dire comment faire pour obtenir une valeur d'AIC "correct" pour continuer mon modèle ?
Pour information, j'ai 4 valeurs nulles pour la rareté, je ne sais pas si cela pourrait expliquer ce résultat, si oui, comment "contourner" le problème sans perdre d'information ?
Merci à tous pour votre aide et vos conseils, je suis preneuse afin d'avoir les meilleurs résultats possible.
Ln2323
Je suis étudiante en dernière année en Sciences Biologiques. Je travaille actuellement sur les données de mon mémoire (que je dois terminer très bientôt =( ).
J'ai collecté des abeilles sauvages dans plusieurs sites et je désire déterminer si les éléments du paysage (le type de sol, ...) influence la rareté des individu collecté (indiqué par un coefficient : 0.0152 par exemple)
J'ai donc une variable quantitative (la rareté) et plusieurs variables explicatives (qualitatives). J'ai réalisé des glm afin de déterminer le meilleur modèle (en observant les AIC) et donc les variables explicatives pouvant influencer significativement la rareté.
Malheureusement lorsque je désire tester chaque variable séparément (afin de sélectionner celle pour démarrer mon modèle), l'AIC qui m'est renvoyé est "Inf" . Cela est identique pour mes 5 variables à tester et lorsque je veux ajouter des variables supplémentaires.
Je ne sais donc pas comment interpréter cette valeur "Inf".
Pourriez-vous me dire comment faire pour obtenir une valeur d'AIC "correct" pour continuer mon modèle ?
Pour information, j'ai 4 valeurs nulles pour la rareté, je ne sais pas si cela pourrait expliquer ce résultat, si oui, comment "contourner" le problème sans perdre d'information ?
Merci à tous pour votre aide et vos conseils, je suis preneuse afin d'avoir les meilleurs résultats possible.
Ln2323
Ln2323- Nombre de messages : 5
Date d'inscription : 20/07/2017
Re: Interprétation GLM -> AIC : Inf
voilà le résultat obtenu pour que vous puissiez mieux visualiser mon problème.
Ln2323- Nombre de messages : 5
Date d'inscription : 20/07/2017
Re: Interprétation GLM -> AIC : Inf
Je vois deux problèmes ici.
Vous dites que vous chercher à modéliser la rareté, et vous donnez par exemple une rareté de 0.0152. Cependant, vous ajustez un glm pour variable de Poisson, qui - par définition - représente des comptages. Un comptage prend des valeurs entières. Un comptage ne peux pas prendre, par exemple, la valeur 0.0152. Il y a un problème (sérieux) ici, je pense.
Par ailleurs, l'idée de rechercher le modèle le plus parcimonieux avec un AIC n'a d'intérêt que si on a beaucoup de variables explicatives. Ici, vous n'en avez que très peu, et même un seul facteur fixe. La recherche du modèle le plus parcimonieux peut se faire facilement "à la main". Pas besoin de méthode élaborée pour ceci.
(enfin, l'utilisation d'un critère AIC n'est pas forcément simple dans un modèle mixte..).
HTH, Eric.
Vous dites que vous chercher à modéliser la rareté, et vous donnez par exemple une rareté de 0.0152. Cependant, vous ajustez un glm pour variable de Poisson, qui - par définition - représente des comptages. Un comptage prend des valeurs entières. Un comptage ne peux pas prendre, par exemple, la valeur 0.0152. Il y a un problème (sérieux) ici, je pense.
Par ailleurs, l'idée de rechercher le modèle le plus parcimonieux avec un AIC n'a d'intérêt que si on a beaucoup de variables explicatives. Ici, vous n'en avez que très peu, et même un seul facteur fixe. La recherche du modèle le plus parcimonieux peut se faire facilement "à la main". Pas besoin de méthode élaborée pour ceci.
(enfin, l'utilisation d'un critère AIC n'est pas forcément simple dans un modèle mixte..).
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Interprétation GLM -> AIC : Inf
Bonjour,
Merci beaucoup pour votre réponse rapide.
Je suis totalement débutante en GLM même si j'ai eu un cours de statistiques durant mes études.
En effet, j'ai utilisé poisson car j'ai fait auparavant un glm sur l'abondance en individu qui est donc un comptage, je n'ai pas pensé à cela en réalisant ce deuxième GLM. En considérant cela, quel élément dois-je utiliser entre gaussian, binomial, poisson, ... ? Existe-il un test pour le valider ?
Prendre en compte l'AIC pour déterminer le meilleur modèle m'a été conseillé mais ne semble pas être idéal. Comment je peux alors voir "à la main" si une variable influence mon abondance ou ma rareté ?
Je m'excuse de mes questions qui peuvent être "bêtes" ...
Bien à vous et merci de votre aide
Merci beaucoup pour votre réponse rapide.
Je suis totalement débutante en GLM même si j'ai eu un cours de statistiques durant mes études.
En effet, j'ai utilisé poisson car j'ai fait auparavant un glm sur l'abondance en individu qui est donc un comptage, je n'ai pas pensé à cela en réalisant ce deuxième GLM. En considérant cela, quel élément dois-je utiliser entre gaussian, binomial, poisson, ... ? Existe-il un test pour le valider ?
Prendre en compte l'AIC pour déterminer le meilleur modèle m'a été conseillé mais ne semble pas être idéal. Comment je peux alors voir "à la main" si une variable influence mon abondance ou ma rareté ?
Je m'excuse de mes questions qui peuvent être "bêtes" ...
Bien à vous et merci de votre aide
Ln2323- Nombre de messages : 5
Date d'inscription : 20/07/2017
Re: Interprétation GLM -> AIC : Inf
Pour la distribution à utiliser, il n'y a pas de tests (en fait, il y en a, mais en pratique ils ne peuvent guère être utilisés). Ca dépend généralement de l'unité dans laquelle votre variable d'intérêt est exprimée. Par défaut, il semble utile de partir sur un modèle simplement gaussien.
"A la main", rapidement, ça veut juste dire ajuster le modèle avec ou sans une variable et voir si ça change quelque chose (par un test de rapport de vraisemblance, par exemple). Si ça change quelque chose, alors la variable doit rester dans le modèle, sinon elle peut être virer.
HTH, Eric.
"A la main", rapidement, ça veut juste dire ajuster le modèle avec ou sans une variable et voir si ça change quelque chose (par un test de rapport de vraisemblance, par exemple). Si ça change quelque chose, alors la variable doit rester dans le modèle, sinon elle peut être virer.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Interprétation GLM -> AIC : Inf
"Ajuster le modèle", c'est ajouter une variable au modèle et réaliser, par exemple, une anova pour voir si il y a une amélioration par rapport au modèle de départ ?
Merci encore de vos réponse
J'avoue avoir du mal avec les GLM mais je veux faire au mieux pour mon mémoire (les stats ne sont pas le fort de mes professeurs non plus) =/
Merci encore de vos réponse
J'avoue avoir du mal avec les GLM mais je veux faire au mieux pour mon mémoire (les stats ne sont pas le fort de mes professeurs non plus) =/
Ln2323- Nombre de messages : 5
Date d'inscription : 20/07/2017
Re: Interprétation GLM -> AIC : Inf
"Ajuster le modèle" c'est juste lancer l'instruction glmer() ou glm(). Ces modèles sont des modèles de régression. Et ajuster veut dire estimer les paramètres de ces régressions.
"Ajuster le modèle" ne veux donc pas dire "ajouter une variable", etc..
Enfin, si vous rester sur le cas gaussien, vous n'êtes plus vraiment dans le cadre du glm (vous y être en fait comme un cas particulier, mais c'est une autre histoire). C'est juste de la régression linéaire, au sens large (ANOVA, etc.). Ca simplifie pas mal les choses.
Eric.
"Ajuster le modèle" ne veux donc pas dire "ajouter une variable", etc..
Enfin, si vous rester sur le cas gaussien, vous n'êtes plus vraiment dans le cadre du glm (vous y être en fait comme un cas particulier, mais c'est une autre histoire). C'est juste de la régression linéaire, au sens large (ANOVA, etc.). Ca simplifie pas mal les choses.
Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Interprétation GLM -> AIC : Inf
Pour estimer les paramètres des régressions, de manière générale (dans un glm ou autre), quelle(s) valeur(s) doivent être observée au niveau des résultats obtenu afin de savoir si la variables influence ou pas ?
Je suis un peu perdue car on m'avait dit que l'AIC devait être le plus bas possible et qu'en "essayant" les différentes associations possibles avec mes variables je pouvais obtenir le "meilleur" modèle et donc savoir quelles variables étaient importantes pour expliquer les valeurs de l'abondance par exemple.
En gros, j'ai utilisé toutes les formules possibles pour déterminer laquelle était la "meilleure" en fonction de l'AIC et d'anova réalisés entre les modèles obtenus (afin de vérifier si les modèles étaient significativement différents [seuil de 5%] lorsqu'une variable était ajoutée).
J'ai l'impression que le travail fait jusqu'ici ne correspond pas à ce qu'il faut que je fasse...
Est-ce bien de cette manière que je dois avancer pour déterminer les facteurs influençant mon abondance, ... ?
Je m'excuse si mes explications ne sont pas très claires ...
Je suis un peu perdue car on m'avait dit que l'AIC devait être le plus bas possible et qu'en "essayant" les différentes associations possibles avec mes variables je pouvais obtenir le "meilleur" modèle et donc savoir quelles variables étaient importantes pour expliquer les valeurs de l'abondance par exemple.
En gros, j'ai utilisé toutes les formules possibles pour déterminer laquelle était la "meilleure" en fonction de l'AIC et d'anova réalisés entre les modèles obtenus (afin de vérifier si les modèles étaient significativement différents [seuil de 5%] lorsqu'une variable était ajoutée).
J'ai l'impression que le travail fait jusqu'ici ne correspond pas à ce qu'il faut que je fasse...
Est-ce bien de cette manière que je dois avancer pour déterminer les facteurs influençant mon abondance, ... ?
Je m'excuse si mes explications ne sont pas très claires ...
Ln2323- Nombre de messages : 5
Date d'inscription : 20/07/2017
Re: Interprétation GLM -> AIC : Inf
La démarche est de faire ce qu'on appelle un test du rapport de vraisemblance. Sous R, ca se fait simplement comme ça :
Vous ajustez votre modèle avec une variable que vous voulez tester (et d'autres si vous le voulez), et stockez le résultat dans un objet, par exemple "model1". Vous réajustez ce même modèle sans la variable que vous voulez tester (et les autres si vous le voulez) et stockez le résultat dans un autre objet, par exemple "model2".
Le test de la différence (i.e., d'efficacité à décrire les données) entre ces deux modèles (test du rapport de vraisemblance) se fait alors avec la commande R suivante :
De proche en proche, on arrive rapidement au modèle le plus parcimonieux.
Ceci implique que vous ajustiez le "bon" modèle dans tous les cas, je veux dire avec la bonne distribution pour les erreurs, etc.
HTH, Eric.
Vous ajustez votre modèle avec une variable que vous voulez tester (et d'autres si vous le voulez), et stockez le résultat dans un objet, par exemple "model1". Vous réajustez ce même modèle sans la variable que vous voulez tester (et les autres si vous le voulez) et stockez le résultat dans un autre objet, par exemple "model2".
Le test de la différence (i.e., d'efficacité à décrire les données) entre ces deux modèles (test du rapport de vraisemblance) se fait alors avec la commande R suivante :
- Code:
anova(model1,model2)
De proche en proche, on arrive rapidement au modèle le plus parcimonieux.
Ceci implique que vous ajustiez le "bon" modèle dans tous les cas, je veux dire avec la bonne distribution pour les erreurs, etc.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Sujets similaires
» interprétation ACM
» Interprétation GLM
» Interprétation d'une ACP
» Interprétation
» ACP interpretation
» Interprétation GLM
» Interprétation d'une ACP
» Interprétation
» ACP interpretation
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum