Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Modèle GLM facteur censuré (coefficient absent).
3 participants
Page 1 sur 1
Modèle GLM facteur censuré (coefficient absent).
Bonjour,
Savez vous comment faire apparaitre le coefficient pour un facteur censuré.
Par exemple lorsque l'on utilise la fonction GLM et qu'une de nos variable est qualitative à 2 facteurs, lorsque l'on va afficher le summary du modèle seulement le coefficient pour un seul facteur va apparaitre, comment fait-on pour connaître le second ?
Merci
Savez vous comment faire apparaitre le coefficient pour un facteur censuré.
Par exemple lorsque l'on utilise la fonction GLM et qu'une de nos variable est qualitative à 2 facteurs, lorsque l'on va afficher le summary du modèle seulement le coefficient pour un seul facteur va apparaitre, comment fait-on pour connaître le second ?
Merci
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
Un modèle d'ANOVA, de GLM, etc., est - par définition - surdimensionné. On ne peut estimer autant de paramètres que de modalités lorsqu'il s'agit de traiter une variable explicative qualitative. La solution est de prendre une modalité qui sert de référence (baseline, en anglais). Les coefficients estimés sont donc à interpréter par rapport à la modalité qui sert de référence. Il n'y a rien de caché, et rien de censuré. Dans R, et par défaut, la modalité qui sert de référence est la première par ordre alphabétique (mais on peut changer ça si nécessaire).
HTH, Eric.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Modèle GLM facteur censuré (coefficient absent).
Bonjour,
Comment connaitre le coefficient estimé de ma modalité qui sert de référence.
Merci
Comment connaitre le coefficient estimé de ma modalité qui sert de référence.
Merci
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
Bonjour,
Par défaut elle le coefficient est celui de l'intercept parce que c'est à cet intercept que tu vas rajouter ou non la valeur associée à la modalité 2 si ton individu est de cette modalité.
Tu as un modèle qui est de la forme : y ~ intercept + b*modalité2 + ...
Si tu es de la modalité 1 alors tu as la valeur 0 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b * 0 + ... --> y ~ intercept + ...
Si tu es de la modalité 2 alors tu as la valeur 1 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b *1 + ... --> y ~ (intercept + b) + ...
C'est ainsi que sont construits par défaut ce qu'on appelle les contrastes.
Pour s'en convaincre simulons deux groupes avec des moyennes différentes :
cdlt
Par défaut elle le coefficient est celui de l'intercept parce que c'est à cet intercept que tu vas rajouter ou non la valeur associée à la modalité 2 si ton individu est de cette modalité.
Tu as un modèle qui est de la forme : y ~ intercept + b*modalité2 + ...
Si tu es de la modalité 1 alors tu as la valeur 0 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b * 0 + ... --> y ~ intercept + ...
Si tu es de la modalité 2 alors tu as la valeur 1 pour la modalité 2 et le modèle se simplifie par :
y ~ intercept + b *1 + ... --> y ~ (intercept + b) + ...
C'est ainsi que sont construits par défaut ce qu'on appelle les contrastes.
Pour s'en convaincre simulons deux groupes avec des moyennes différentes :
- Code:
x1 <- rnorm(100, 5) #moyenne théorique de 5
mean(x1)
[1] 4.95096
x2 <- rnorm(100, 20) # moyenne théorique de 20
mean(x2)
[1] 19.81179
# on les regroupe en un seul et même vecteur
x <- c(x1, x2)
# crée le facteur pour différencier les groupes a et b
fac <- factor(rep(c("a", "b"), each = 100))
coef(lm(x ~ fac))
(Intercept) facb
4.95096 14.86083
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modèle GLM facteur censuré (coefficient absent).
Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
Mais de quel GLM s'agit-il? Est un glm sur des données gaussiennes ? Si ce n'est pas le cas, il y a une transformation en plus, et on peut retomber sur des valeurs négatives même si toutes les données sont positives. Donner des exemples numériques serait utile ici (et des sortie de R).Bibilerikiki a écrit:Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Modèle GLM facteur censuré (coefficient absent).
Bonjour,
Oui c'est sur des variables non gaussiennes.
Oui c'est sur des variables non gaussiennes.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
Donc quel GLM avez vous utilisé ? Quelle est la fonction de lien ? Sans cette information, il va devenir difficile de faire progresser cette discussion.
Cordialement, Eric.
Cordialement, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Modèle GLM facteur censuré (coefficient absent).
J'ai utilisé la famille gaussian avec le lien identité.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
Bibilerikiki a écrit:Bonjour,
Intercept ne peut pas être uniquement la moyenne de ma première modalité, car dans mon cas elle est négative et j'effectue le modèle sur des temps.
Ce n'est pas ce que j'ai dit mais je t'ai donné la méthode pour comprendre comment interpréter les coefficients définis par défaut, illustré par un exemple qui n'est pas forcément représentatif du tien. Si tu as d'autres variables alors il te faut aussi tenir compte de ces valeurs et des coefficients associés à ces variables.
De plus c'est assez confus parce que d'une part tu parles de variables "non gaussiennes" et tu dis avoir utilisé "la famille gaussian avec le lien identité". Si tu as utilisé la famille gaussian alors tu as réalisé un modèle linéaire classique. Si tu utilises une autre famille, il te faut en plus de la manipulation que j'ai montré, utilisée l'inverse de la fonction de lien.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modèle GLM facteur censuré (coefficient absent).
C'est un modèle pour effectuer des prédictions, mes résultats sont meilleurs avec la famille gaussian.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
re,
on ne choisit pas une famille en fonction d'un critère comme celui-ci mais en fonction des a priori que l'on a sur la distribution de la variable que l'on cherche à expliquer. Si tu as tout lieu de croire que ta variable est distribuée normalement alors ok pour la famille gaussian, si ce n'est pas le cas alors ça n'a pas de sens (sans transformation préalable).
cdlt
on ne choisit pas une famille en fonction d'un critère comme celui-ci mais en fonction des a priori que l'on a sur la distribution de la variable que l'on cherche à expliquer. Si tu as tout lieu de croire que ta variable est distribuée normalement alors ok pour la famille gaussian, si ce n'est pas le cas alors ça n'a pas de sens (sans transformation préalable).
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modèle GLM facteur censuré (coefficient absent).
Je voulais un modèle pour prédire, j'ai donc sélectionné celui offrant les meilleurs résultats.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
C'est ce que je dis : ça n'a pas de sens ...
Une variable gaussienne n'a rien à voir avec une variable suivant une loi de poisson par exemple, et ce n'est pas un critère quelconque qui doit définir le choix mais la nature de la variable. Le choix de la distribution doit se faire à priori et non pas à posteriori, en plus j'imagine que selon le critère que tu choisis tu ne choisirais pas forcément toujours la même distribution. Par exemple avec l'AIC ou le RMSE tu ne retiendrais pas forcément le même modèle.
Avec ton raisonnement, tu pourrais sélectionner un modèle linéaire pour une variable qui représente un comptage et donc avoir potentiellement des valeurs prédites négatives alors que dans la réalité ce n'est pas possible. En plus tout dépend comment tu as pris les valeurs prédites, sur l'espace du lien (par défaut avec la fonction predict) ou dans l'espace de la variable.
cdlt
Une variable gaussienne n'a rien à voir avec une variable suivant une loi de poisson par exemple, et ce n'est pas un critère quelconque qui doit définir le choix mais la nature de la variable. Le choix de la distribution doit se faire à priori et non pas à posteriori, en plus j'imagine que selon le critère que tu choisis tu ne choisirais pas forcément toujours la même distribution. Par exemple avec l'AIC ou le RMSE tu ne retiendrais pas forcément le même modèle.
Avec ton raisonnement, tu pourrais sélectionner un modèle linéaire pour une variable qui représente un comptage et donc avoir potentiellement des valeurs prédites négatives alors que dans la réalité ce n'est pas possible. En plus tout dépend comment tu as pris les valeurs prédites, sur l'espace du lien (par défaut avec la fonction predict) ou dans l'espace de la variable.
cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modèle GLM facteur censuré (coefficient absent).
J'ai utilisé la fonction predict sur la base de validation et sur la base de calibration.
J'ai pris la valeur absolue de la prédiction pour éviter tout problème et mes résultats sont meilleurs qu'avec la famille gamma.
J'ai pris la valeur absolue de la prédiction pour éviter tout problème et mes résultats sont meilleurs qu'avec la famille gamma.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Modèle GLM facteur censuré (coefficient absent).
C'est de devoir recourir à ce genre de transformation qui me poserait problème.J'ai pris la valeur absolue de la prédiction pour éviter tout problème
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Modèle GLM facteur censuré (coefficient absent).
Et c'est justement l'objet du GLM d'éviter ce genre de "bidouillage".
Il faut trouver la bonne loi au départ (car pas gaussienne) et s'y tenir de bout en bout.
HTH, Eric.
Il faut trouver la bonne loi au départ (car pas gaussienne) et s'y tenir de bout en bout.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum