Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Erreur régression binomiale R
2 participants
Page 1 sur 1
Erreur régression binomiale R
Bonjour,
Je souhaite faire une régression binomial avec une fonction lien logit sous R, ma variable explicative est une proportion. J'ai lu sur différents sites que l'on peut mettre une proportion si on mettait un "weights" ce que j'ai fait ci-dessous. Mon modèle est le suivant :
mod2=glm(part_arbitre~CD_SEXE +Fourgous + option + Classe + annee + CD_DIM + CD_PRD_ + pre_part_uc_contrat + Pre_UC , family= binomial(link="logit"),data=apprentissage_2, weights=Pre_Total)
Cependant j'ai un warning me disant que mes variables ne sont pas entières (normal vu que ce sont des proportions)
Warning message:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
Savez-vous d'où provient ce warning et ai-je bien le droit de mettre comme variable à expliquer une proportion dans une régression binomiale?
Merci de votre aide
Julie
Je souhaite faire une régression binomial avec une fonction lien logit sous R, ma variable explicative est une proportion. J'ai lu sur différents sites que l'on peut mettre une proportion si on mettait un "weights" ce que j'ai fait ci-dessous. Mon modèle est le suivant :
mod2=glm(part_arbitre~CD_SEXE +Fourgous + option + Classe + annee + CD_DIM + CD_PRD_ + pre_part_uc_contrat + Pre_UC , family= binomial(link="logit"),data=apprentissage_2, weights=Pre_Total)
Cependant j'ai un warning me disant que mes variables ne sont pas entières (normal vu que ce sont des proportions)
Warning message:
In eval(expr, envir, enclos) : non-integer #successes in a binomial glm!
Savez-vous d'où provient ce warning et ai-je bien le droit de mettre comme variable à expliquer une proportion dans une régression binomiale?
Merci de votre aide
Julie
julie_tey- Nombre de messages : 7
Date d'inscription : 26/07/2017
Re: Erreur régression binomiale R
Le problème de la variable non entière ne concerne pas les variables explicatives, mais la variable à expliquer "part_arbitre". C'est une variable binomiale par définition, et - par définition - ce doit être un entier.
Sous R, il y a deux façon d'ajuster une régression logistique. Ou bien la variable à expliquer est constituée de 0 et de 1, selon que l'évènement est observé ou non. Ou bien elle est constituée par deux variables entières (reliées par un cbind()) qui donne le nombre de succès et d'échecs dans chaque cas. Il y a plein d'exemples sur le web.
HTH, Eric.
Sous R, il y a deux façon d'ajuster une régression logistique. Ou bien la variable à expliquer est constituée de 0 et de 1, selon que l'évènement est observé ou non. Ou bien elle est constituée par deux variables entières (reliées par un cbind()) qui donne le nombre de succès et d'échecs dans chaque cas. Il y a plein d'exemples sur le web.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Erreur régression binomiale R
Merci pour votre réponse,
Est-il quand même possible de modéliser une proportion avec une régression binomiale?
Je cherche à modéliser une part arbitrée c'est-à-dire un montant arbitrée divisé par un montant total.
Si j'utilise le cbind, que pour le nombre de succès je mets le montant arbitrée et que pour le nombre d'échecs je mets la différence entre le montant total et le montant arbitré, est-il juste de tourner le problème de cette façon?
Julie,
Est-il quand même possible de modéliser une proportion avec une régression binomiale?
Je cherche à modéliser une part arbitrée c'est-à-dire un montant arbitrée divisé par un montant total.
Si j'utilise le cbind, que pour le nombre de succès je mets le montant arbitrée et que pour le nombre d'échecs je mets la différence entre le montant total et le montant arbitré, est-il juste de tourner le problème de cette façon?
Julie,
julie_tey- Nombre de messages : 7
Date d'inscription : 26/07/2017
Re: Erreur régression binomiale R
La proportion modélisée doit être binomiale, c'est-à-dire correspondre à l'apparition d'un évènement parmi deux possible. Je ne pense pas que ce que vous appelez "part arbitrée" rentre dans ce cas (si j'ai bien compris), et donc pourrait en fait être simplement un trait distribué de manière gaussienne. Dans ce cas, on retombe sur un modèle de type ANOVA, plus simple à mettre en oeuvre et plus facile à interpréter.
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Erreur régression binomiale R
J'ai continué des recherches sur le modèle binomial, sur la page 9 de ce document ils utilisent bien comme variable expliquée une proportion et un weights
http://www.ressources-actuarielles.net/EXT/ISFA/fp-isfa.nsf/2b0481298458b3d1c1256f8a0024c478/0c451ff8029cba20c1257da7005d70e4/$FILE/GLM.pdf
http://www.ressources-actuarielles.net/EXT/ISFA/fp-isfa.nsf/2b0481298458b3d1c1256f8a0024c478/0c451ff8029cba20c1257da7005d70e4/$FILE/GLM.pdf
julie_tey- Nombre de messages : 7
Date d'inscription : 26/07/2017
Re: Erreur régression binomiale R
Sur la page 9 de ce document, la proportion est bien binomiale "b/n".
Il semble qu'il y ait ici une confusion sur le terme "proportion".
Si je mets dans une urne des billes rouges et des billes noires et que je fais plusieurs tirages avec remise, à chaque fois je compte le nombre de billes rouges sur le total des billes tirées. Nous sommes sur une proportion binomiale (pourcentage de billes rouges), et les nombres de billes tirées sont bien des entiers. Dans ce cas la régression logistique (avec ou sans pondérations, c'est une autre histoire) s'applique.
Maintenant, si je suis moniteur de plongée sous-marine (ce qui est mon cas), et que j'enseigne à mes élèves que l'air qu'on respire a 20% d'oxygène, je suis alors également avec une proportion, mais elle n'est pas binomiale. Si je fais de nombreuses mesures de cette proportion, les valeurs obtenues (qui ne sont pas des entiers) suivront une belle courbe de Gauss. Nous ne sommes pas dans le cas d'un tirage de deux évènements possibles (personnes ne compte les molécules d'oxygène..). Dans ce cas, c'est un modèle gaussien qui convient (avec ou sans pondérations, c'est ici aussi une autre histoire).
Je pense que vous êtes dans ce second cas, et pas dans le cas binomial (ou dans le cas que vous citez dans le document). Ou bien je n'ai pas compris ce que vous mesurez.
HTH, Eric.
Il semble qu'il y ait ici une confusion sur le terme "proportion".
Si je mets dans une urne des billes rouges et des billes noires et que je fais plusieurs tirages avec remise, à chaque fois je compte le nombre de billes rouges sur le total des billes tirées. Nous sommes sur une proportion binomiale (pourcentage de billes rouges), et les nombres de billes tirées sont bien des entiers. Dans ce cas la régression logistique (avec ou sans pondérations, c'est une autre histoire) s'applique.
Maintenant, si je suis moniteur de plongée sous-marine (ce qui est mon cas), et que j'enseigne à mes élèves que l'air qu'on respire a 20% d'oxygène, je suis alors également avec une proportion, mais elle n'est pas binomiale. Si je fais de nombreuses mesures de cette proportion, les valeurs obtenues (qui ne sont pas des entiers) suivront une belle courbe de Gauss. Nous ne sommes pas dans le cas d'un tirage de deux évènements possibles (personnes ne compte les molécules d'oxygène..). Dans ce cas, c'est un modèle gaussien qui convient (avec ou sans pondérations, c'est ici aussi une autre histoire).
Je pense que vous êtes dans ce second cas, et pas dans le cas binomial (ou dans le cas que vous citez dans le document). Ou bien je n'ai pas compris ce que vous mesurez.
HTH, Eric.
Dernière édition par Eric Wajnberg le Mer 23 Aoû 2017 - 16:12, édité 1 fois
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Erreur régression binomiale R
Si je considère un contrat avec 100€ dessus que je vais découper en 100 unités (on prend pas en compte les centimes). Et que chaque unités peut soit être arbitré soit ne pas être arbitré. Je cherche à calculer le nombre d'unité arbitré sur le nombre d'unité total du contrat. En posant le problème de cette manière je suis bien dans le 1er cas?
Je suis désolée d’insister, mais comme j'ai vu que la régression binomial avait utilisé dans ce cas dans un mémoire, je cherche à comprendre comment on peut tourner le problème afin de pouvoir l'appliquer.
Julie
Je suis désolée d’insister, mais comme j'ai vu que la régression binomial avait utilisé dans ce cas dans un mémoire, je cherche à comprendre comment on peut tourner le problème afin de pouvoir l'appliquer.
Julie
julie_tey- Nombre de messages : 7
Date d'inscription : 26/07/2017
Re: Erreur régression binomiale R
Oui, mais alors ça veut dire que chaque euro est indivisible (comme les billes dans mon exemple). Il n'y a pas de centimes, etc. Il faut que ca soit des entiers, et que ça ait un sens. Ca me parait personnellement tiré par les cheveux, mais à vous de voir.julie_tey a écrit:Si je considère un contrat avec 100€ dessus que je vais découper en 100 unités (on prend pas en compte les centimes). Et que chaque unités peut soit être arbitré soit ne pas être arbitré. Je cherche à calculer le nombre d'unité arbitré sur le nombre d'unité total du contrat. En posant le problème de cette manière je suis bien dans le 1er cas?
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Erreur régression binomiale R
Ou alors considérer que le mémoire qui vous sert de référence traite les données de manière erronée, ce qui est malheureusement très (très!) fréquent..julie_tey a écrit:Je suis désolée d’insister, mais comme j'ai vu que la régression binomial avait utilisé dans ce cas dans un mémoire, je cherche à comprendre comment on peut tourner le problème afin de pouvoir l'appliquer
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: Erreur régression binomiale R
Très bien merci pour toutes vos réponses, je vais abandonner cette idée et essayer plutôt de faire une régression Bêta qui semble mieux s'adapter à mon problème.
Julie
Julie
julie_tey- Nombre de messages : 7
Date d'inscription : 26/07/2017
Sujets similaires
» GLM binomiale
» Interprétation régression logistique binomiale
» binomiale negative vs regression logistique
» Regression Poisson erreur R
» loi binomiale
» Interprétation régression logistique binomiale
» binomiale negative vs regression logistique
» Regression Poisson erreur R
» loi binomiale
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|