Les posteurs les plus actifs de la semaine
Aytan
GLM Vote_lcapGLM Voting_barGLM Vote_rcap 
c@ssoulet
GLM Vote_lcapGLM Voting_barGLM Vote_rcap 
Eric Wajnberg
GLM Vote_lcapGLM Voting_barGLM Vote_rcap 
Adddd
GLM Vote_lcapGLM Voting_barGLM Vote_rcap 
gg
GLM Vote_lcapGLM Voting_barGLM Vote_rcap 


GLM

Aller en bas

GLM Empty GLM

Message par Ninine le Mer 29 Mai 2019 - 18:29

Bonsoir à tous !

Dans le cadre de mon mémoire (dont le thème est la modélisation d'une prime pure pour un portefeuille de complémentaire santé), je dois effectuer un GLM sur le nombre de sinistres sur R.
Pour cela j'ai utilisé 2 variables: Sexe,et type de bénéficiaire.

Après avoir fait la régression sur R, je constate que pour chacune des 2 variables (sexe et type de bénéficiaire) il m'enlève une modalité.

>freq(BDD_GLM$sexe)
n % val%
F 48299 43.3 43.3
H 63181 56.7 56.7

> freq(BDD_GLM$benef)
n % val%
Adh 35089 31.5 31.5
Ascendent 5153 4.6 4.6
Conjoint(e) 35014 31.4 31.4
Desc 36224 32.5 32.5

>glm2(Nbr_Total~sexe+benef,family=poisson(),BDD_GLM)

Call: glm2(formula = Nbr_Total ~ sexe + benef, family = poisson(),
data = BDD_GLM)

Coefficients:
(Intercept) sexeH benefAscendent benefConjoint(e) benefDesc
-0.25660 -0.74625 -0.37334 0.02396 -0.62659

Degrees of Freedom: 111479 Total (i.e. Null); 111475 Residual
Null Deviance: 263100
Residual Deviance: 252700 AIC: 289000

Il y a la modalité Sexe Femme et Type de bénéf Adhérent qui manquent.

J'aimerai comprendre pourquoi? Et si y a pas moyen d'afficher les coefficient des deux ?
Car par exemple pour la prime pure d'une garantie "maternité" j'aurai besoin du coefficient de Sexe femme et non pas de sexe homme.

Merci par avance pour vos réponses.
Bonne soirée.

P.S: Je tiens à préciser que c'est ma première utilisation sur R. je suis débutante.

Ninine

Nombre de messages : 1
Date d'inscription : 29/05/2019

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

GLM Empty Re: GLM

Message par Florent Aubry le Jeu 30 Mai 2019 - 14:29

R n'enlève aucune modalité. Ce que donne gml, ce sont les coefficients estimés par la procédure et non les valeurs moyennes associées aux niveaux des facteurs. Ces coefficients sont des contrastes et par défaut, R utilise le contraste traitement (contr.treatment), les coefficients estimés sont alors les différences entre la valeur d'un niveau et le premier niveau du facteur. Dans ces conditions, l'intercept est la valeur du premier groupe défini par les niveau sexe Femme et bénéf Adhérent puisque par défaut pour R, les niveaux sont triés par l'ordre lexicographique.

De plus, ton analyse est insuffisante. Il faut d'abord vérifier que les facteurs sont significatifs puis pour les facteurs significatifs, et seulement pour ceux-là, tu peux chercher les valeurs des groupes associés à chaque niveau et les différences significatives entre niveaux.

Pour le premier point, tu dois utiliser la fonction anova avec l'argument test="Chisq" ou car::Anova.
Pour le second, utilise les tests post-hoc (librairie emmeans par exemple)

Florent Aubry

Nombre de messages : 242
Date d'inscription : 02/11/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum