Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
zezima
 
Nik
 
margotte185
 
c@ssoulet
 
Coco
 
Ayana
 


Modèle GLM facteur censuré (coefficient absent).

Voir le sujet précédent Voir le sujet suivant Aller en bas

Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Sam 9 Sep 2017 - 15:51

Bonjour,
Savez vous comment faire apparaitre le coefficient pour un facteur censuré.
Par exemple lorsque l'on utilise la fonction GLM et qu'une de nos variable est qualitative à 2 facteurs, lorsque l'on va afficher le summary du modèle seulement le coefficient pour un seul facteur va apparaitre, comment fait-on pour connaître le second ?
Merci

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Eric Wajnberg le Sam 9 Sep 2017 - 16:46

Un modèle d'ANOVA, de GLM, etc., est - par définition - surdimensionné. On ne peut estimer autant de paramètres que de modalités lorsqu'il s'agit de traiter une variable explicative qualitative. La solution est de prendre une modalité qui sert de référence (baseline, en anglais). Les coefficients estimés sont donc à interpréter par rapport à la modalité qui sert de référence. Il n'y a rien de caché, et rien de censuré. Dans R, et par défaut, la modalité qui sert de référence est la première par ordre alphabétique (mais on peut changer ça si nécessaire).

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 694
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Lun 11 Sep 2017 - 7:06

Bonjour,
Comment connaitre le coefficient estimé de ma modalité qui sert de référence.
Merci

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par droopy le Lun 11 Sep 2017 - 8:23

Bonjour,

Par défaut elle le coefficient est celui de l'intercept parce que c'est à cet intercept que tu vas rajouter ou non la valeur associée à la modalité 2 si ton individu est de cette modalité.
Tu as un modèle qui est de la forme : y ~ intercept + b*modalité2 + ...
Si tu es de la modalité 1 alors tu as la valeur 0 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b * 0 + ... --> y ~ intercept + ...
Si tu es de la modalité 2 alors tu as la valeur 1 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b *1 + ... --> y ~ (intercept + b) + ...

C'est ainsi que sont construits par défaut ce qu'on appelle les contrastes.

Pour s'en convaincre simulons deux groupes avec des moyennes différentes :
Code:
x1 <- rnorm(100, 5) #moyenne théorique de 5
mean(x1)
[1] 4.95096
x2 <- rnorm(100, 20) # moyenne théorique de 20
mean(x2)
[1] 19.81179
# on les regroupe en un seul et même vecteur
x <- c(x1, x2)
# crée le facteur pour différencier les groupes a et b
fac <- factor(rep(c("a", "b"), each = 100))

coef(lm(x ~ fac))
(Intercept)        facb
    4.95096    14.86083
4.95096 c'est bien la moyenne du groupe a le groupe de référence et 4.95096 + 14.86083 la moyenne du groupe b, 14.86083 étant l'écart entre les deux groupes.

cdlt
avatar
droopy

Nombre de messages : 1070
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Lun 11 Sep 2017 - 12:15

Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Eric Wajnberg le Lun 11 Sep 2017 - 13:21

Bibilerikiki a écrit:Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.
Mais de quel GLM s'agit-il? Est un glm sur des données gaussiennes ? Si ce n'est pas le cas, il y a une transformation en plus, et on peut retomber sur des valeurs négatives même si toutes les données sont positives. Donner des exemples numériques serait utile ici (et des sortie de R).

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 694
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Mar 12 Sep 2017 - 7:54

Bonjour,
Oui c'est sur des variables non gaussiennes.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Eric Wajnberg le Mar 12 Sep 2017 - 7:59

Donc quel GLM avez vous utilisé ? Quelle est la fonction de lien ? Sans cette information, il va devenir difficile de faire progresser cette discussion.

Cordialement, Eric.
avatar
Eric Wajnberg

Nombre de messages : 694
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Mar 12 Sep 2017 - 8:23

J'ai utilisé la famille gaussian avec le lien identité.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par droopy le Mar 12 Sep 2017 - 8:56

Bibilerikiki a écrit:Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.

Ce n'est pas ce que j'ai dit mais je t'ai donné la méthode pour comprendre comment interpréter les coefficients définis par défaut, illustré par un exemple qui n'est pas forcément représentatif du tien. Si tu as d'autres variables alors il te faut aussi tenir compte de ces valeurs et des coefficients associés à ces variables.

De plus c'est assez confus parce que d'une part tu parles de variables "non gaussiennes" et tu dis avoir utilisé "la famille gaussian avec le lien identité". Si tu as utilisé la famille gaussian alors tu as réalisé un modèle linéaire classique. Si tu utilises une autre famille, il te faut en plus de la manipulation que j'ai montré, utilisée l'inverse de la fonction de lien.

cdlt
avatar
droopy

Nombre de messages : 1070
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Mar 12 Sep 2017 - 11:48

C'est un modèle pour effectuer des prédictions, mes résultats sont meilleurs avec la famille gaussian.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par droopy le Mar 12 Sep 2017 - 14:43

re,

on ne choisit pas une famille en fonction d'un critère comme celui-ci mais en fonction des a priori que l'on a sur la distribution de la variable que l'on cherche à expliquer. Si tu as tout lieu de croire que ta variable est distribuée normalement alors ok pour la famille gaussian, si ce n'est pas le cas alors ça n'a pas de sens (sans transformation préalable).

cdlt
avatar
droopy

Nombre de messages : 1070
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Mer 13 Sep 2017 - 12:23

Je voulais un modèle pour prédire, j'ai donc sélectionné celui offrant les meilleurs résultats.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par droopy le Mer 13 Sep 2017 - 14:31

C'est ce que je dis : ça n'a pas de sens ...

Une variable gaussienne n'a rien à voir avec une variable suivant une loi de poisson par exemple, et ce n'est pas un critère quelconque qui doit définir le choix mais la nature de la variable. Le choix de la distribution doit se faire à priori et non pas à posteriori, en plus j'imagine que selon le critère que tu choisis tu ne choisirais pas forcément toujours la même distribution. Par exemple avec l'AIC ou le RMSE tu ne retiendrais pas forcément le même modèle.

Avec ton raisonnement, tu pourrais sélectionner un modèle linéaire pour une variable qui représente un comptage et donc avoir potentiellement des valeurs prédites négatives alors que dans la réalité ce n'est pas possible. En plus tout dépend comment tu as pris les valeurs prédites, sur l'espace du lien (par défaut avec la fonction predict) ou dans l'espace de la variable.

cdlt
avatar
droopy

Nombre de messages : 1070
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Bibilerikiki le Jeu 14 Sep 2017 - 7:15

J'ai utilisé la fonction predict sur la base de validation et sur la base de calibration.
J'ai pris la valeur absolue de la prédiction pour éviter tout problème et mes résultats sont meilleurs qu'avec la famille gamma.

Bibilerikiki

Nombre de messages : 56
Date d'inscription : 24/06/2017

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par droopy le Jeu 14 Sep 2017 - 7:58

J'ai pris la valeur absolue de la prédiction pour éviter tout problème
C'est de devoir recourir à ce genre de transformation qui me poserait problème.
avatar
droopy

Nombre de messages : 1070
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Eric Wajnberg le Jeu 14 Sep 2017 - 15:19

Et c'est justement l'objet du GLM d'éviter ce genre de "bidouillage".

Il faut trouver la bonne loi au départ (car pas gaussienne) et s'y tenir de bout en bout.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 694
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Modèle GLM facteur censuré (coefficient absent).

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum