Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Montrer que deux modèles sont ou non emboîtés
3 participants
Page 1 sur 1
Montrer que deux modèles sont ou non emboîtés
Bonjour,
Je travaille sur des données de survie, et je souhaite tester deux modèles (de Cox): le premier contenant l'âge en variable quantitative (en continue), et le second modèle contenant l'âge en trois classes (utilisation de 2 indicatrices dans le modèle).
Les classes sont : 0 - <75 ans ; 1 - 75-80 ans et 2 - >= 80 ans. Il y a également d'autres variables mais les mêmes dans les deux modèles.
Selon moi ces modèles ne sont pas emboîtés, mais je ne sais pas comment le montrer.
Je pensais par exemple à ça :
- modèle 1 : risque quand on passe de 70 à 71 ans est exp(beta*1),
- modèle 2 : ce n'est pas possible puisque ces deux âges sont dans la même classe
Est ce un bon raisonnement ?
Merci de votre aide
Je travaille sur des données de survie, et je souhaite tester deux modèles (de Cox): le premier contenant l'âge en variable quantitative (en continue), et le second modèle contenant l'âge en trois classes (utilisation de 2 indicatrices dans le modèle).
Les classes sont : 0 - <75 ans ; 1 - 75-80 ans et 2 - >= 80 ans. Il y a également d'autres variables mais les mêmes dans les deux modèles.
Selon moi ces modèles ne sont pas emboîtés, mais je ne sais pas comment le montrer.
Je pensais par exemple à ça :
- modèle 1 : risque quand on passe de 70 à 71 ans est exp(beta*1),
- modèle 2 : ce n'est pas possible puisque ces deux âges sont dans la même classe
Est ce un bon raisonnement ?
Merci de votre aide
joanna20- Nombre de messages : 12
Date d'inscription : 09/04/2010
Re: Montrer que deux modèles sont ou non emboîtés
Salut,
je sais pas si c'est moi qui me trompe ou quoi mais effectivement on est absolument pas dans le cas des modèles emboités...ça n'a tout simplement rien à voir.
Deux modèles sont dit emboités si on peut dire que l'un est un sous ensemble de l'autre (dans l'espace des variables). par exemple :
mod 1 : Y~X1 + X2
mod 2 : Y~X1
Ici mod2 est emboité dans mod1 qui pourrait être le modèle complet.
Ton interrogation est tout simplement de savoir si tu catégorises ta variable age ou non. Faire des catégories dans une variable numérique (qui est discrète au passage) est toujours une perte d'information. Donc cela doit être motivé par des choix concernant en général le bon équilibre du plan d'échantillonnage. En outre l'analyse d'une variable catégorielle requiert toujours plus de valeurs qu'une variable numérique car on doit estimer un paramètre par catégorie. J'ajoute que tu es en plus dans le cas d'une variable ordinale (catégorielle ordonnée) ce qui ne facilité pas non plus les analyses car passer de la catégorie 1 à 2 n'est pas la même chose que de passer de la catégorie 1 à 3. Ceci oblige souvent à utiliser des contrastes polynomiaux afin de tenir compte de l'évolution entre catégorie.
voilà
Nik
je sais pas si c'est moi qui me trompe ou quoi mais effectivement on est absolument pas dans le cas des modèles emboités...ça n'a tout simplement rien à voir.
Deux modèles sont dit emboités si on peut dire que l'un est un sous ensemble de l'autre (dans l'espace des variables). par exemple :
mod 1 : Y~X1 + X2
mod 2 : Y~X1
Ici mod2 est emboité dans mod1 qui pourrait être le modèle complet.
Ton interrogation est tout simplement de savoir si tu catégorises ta variable age ou non. Faire des catégories dans une variable numérique (qui est discrète au passage) est toujours une perte d'information. Donc cela doit être motivé par des choix concernant en général le bon équilibre du plan d'échantillonnage. En outre l'analyse d'une variable catégorielle requiert toujours plus de valeurs qu'une variable numérique car on doit estimer un paramètre par catégorie. J'ajoute que tu es en plus dans le cas d'une variable ordinale (catégorielle ordonnée) ce qui ne facilité pas non plus les analyses car passer de la catégorie 1 à 2 n'est pas la même chose que de passer de la catégorie 1 à 3. Ceci oblige souvent à utiliser des contrastes polynomiaux afin de tenir compte de l'évolution entre catégorie.
voilà
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Montrer que deux modèles sont ou non emboîtés
Merci pour votre réponse.
Je me posais cette question car par exemple :
le modèle 1 : y ~ X1
où X1 vaut 0 si age<75 , 1 si age 75-80 ans et 2 si age > ou = 80 ans
et le modèle 2 : y ~ X'1 + X'2
où X'1 vaut 1 si age 75-80 ans et 0 sinon
et X'2 vaut 1 si age >=80 ans et 0 sinon
sont emboîtés.
Je me posais cette question car par exemple :
le modèle 1 : y ~ X1
où X1 vaut 0 si age<75 , 1 si age 75-80 ans et 2 si age > ou = 80 ans
et le modèle 2 : y ~ X'1 + X'2
où X'1 vaut 1 si age 75-80 ans et 0 sinon
et X'2 vaut 1 si age >=80 ans et 0 sinon
sont emboîtés.
joanna20- Nombre de messages : 12
Date d'inscription : 09/04/2010
Re: Montrer que deux modèles sont ou non emboîtés
le modèle 1 : y ~ X1
où X1 vaut 0 si age<75 , 1 si age 75-80 ans et 2 si age > ou = 80 ans
et le modèle 2 : y ~ X'1 + X'2
où X'1 vaut 1 si age 75-80 ans et 0 sinon
et X'2 vaut 1 si age >=80 ans et 0 sinon
sont emboîtés.
Non tu n'as pas du tout les mêmes variables comment veux tu que les modèles soient emboités ? Je le répète, tu te trompes de question : tu n'es pas en train de réfléchir sur l'emboitement de modèle mais sur la catégorisation de tes variables. Tu es donc en amont de tout problème d'emboitement de modèle.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Montrer que deux modèles sont ou non emboîtés
J'ai bien compris que la question était le choix d'une catégorisation de mes variables ou non. Le "problème" est que l'on me demande pour cela de me servir soit du test du rapport de vraisemblance (ce qui, je crois, n'est pas possible dans ce cas) et l'AIC (bien qu'il fasse débat).
Pour les deux derniers modèles que j'ai écrit, on peut vérifier l'emboitement en écrivant les paramètres du premier avec ceux du second (ou vice versa). J'avoue que pour moi aussi cela est "choquant", mais des spécialistes m'ont montré que c'est bien le cas.
Pour les deux derniers modèles que j'ai écrit, on peut vérifier l'emboitement en écrivant les paramètres du premier avec ceux du second (ou vice versa). J'avoue que pour moi aussi cela est "choquant", mais des spécialistes m'ont montré que c'est bien le cas.
joanna20- Nombre de messages : 12
Date d'inscription : 09/04/2010
Re: Montrer que deux modèles sont ou non emboîtés
Pour moi le second modèle correspond plus à une décomposition en indicatrice du premier modèle. Je ne vois pas en quoi le second modèle apporte une information complémentaire au premier et donc du coup comment tu pourras mettre en évidence un effet supplémentaire. Mais bon soit je ne suis pas non plus super calé côté maths.
Par contre, il est important que tu comprennes pourquoi l'un et l'autre sont emboités, donc il ne s'agit pas simplement que qqun te fasse la démonstration mais bien que toi tu sois en mesure de la reproduire pour parfaitement la comprendre.
Je ne sais pas si c'est bien le cas mais dans la construction des indicatrices, il faut bien faire attention à ce que le codage respecte la nature ordinale de la variable. Par exemple dans le codage de X'1 et X'2 tu ne peux pas avoir des 0 et des 1.
Si tu veux plus d'aide ici, il faudrait que tu nous donne l'écriture des modèles qui permet de voir l'emboitement afin de comprendre ce qui est testé au final car pour moi c'est vraiment pas clair et il faudrait que je fasse un calcul fastidieux pour arriver à tout décortiquer.
Donc pour ce qui est de la question du rapport des vraisemblances ou de l'AIC :
-le rapport exige des modèles emboités donc on en revient à ma dernière demande.
-l'AIC requiert simplement que les paramètres soient estimés sur les mêmes données. Par contre, je ne vois pas en quoi il fait débat, il faut juste très certainement prendre l'AICc (si n/k <40 ; n: nb de valeurs, k : nb de paramètres du modèle)
nik
Par contre, il est important que tu comprennes pourquoi l'un et l'autre sont emboités, donc il ne s'agit pas simplement que qqun te fasse la démonstration mais bien que toi tu sois en mesure de la reproduire pour parfaitement la comprendre.
Je ne sais pas si c'est bien le cas mais dans la construction des indicatrices, il faut bien faire attention à ce que le codage respecte la nature ordinale de la variable. Par exemple dans le codage de X'1 et X'2 tu ne peux pas avoir des 0 et des 1.
Si tu veux plus d'aide ici, il faudrait que tu nous donne l'écriture des modèles qui permet de voir l'emboitement afin de comprendre ce qui est testé au final car pour moi c'est vraiment pas clair et il faudrait que je fasse un calcul fastidieux pour arriver à tout décortiquer.
Donc pour ce qui est de la question du rapport des vraisemblances ou de l'AIC :
-le rapport exige des modèles emboités donc on en revient à ma dernière demande.
-l'AIC requiert simplement que les paramètres soient estimés sur les mêmes données. Par contre, je ne vois pas en quoi il fait débat, il faut juste très certainement prendre l'AICc (si n/k <40 ; n: nb de valeurs, k : nb de paramètres du modèle)
nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Montrer que deux modèles sont ou non emboîtés
Bonjour,
pour moi les deux modèles sont identiques, le deuxième permettant d'avoir un détail de la décomposition de la variance, exemple avec R:
pour moi les deux modèles sont identiques, le deuxième permettant d'avoir un détail de la décomposition de la variance, exemple avec R:
- Code:
f1 <- factor(rep(letters[1:3], each=30))
y <- rnorm(90, c(0,0.5,1)[as.numeric(f1)])
tapply(y, f1, mean)
a b c
-0.2760156 0.6004719 0.9021375
m1 <- lm(y~f1)
f1b <- ifelse(f1=="b", 1, 0)
f2b <- ifelse(f1=="c", 1, 0)
m2 <- lm(y~f1b+f2b)
anova(m1)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
f1 2 22.473 11.2364 9.1964 0.0002381 ***
Residuals 87 106.299 1.2218
anova(m2)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
f1b 1 1.652 1.6521 1.3522 0.2481
f2b 1 20.821 20.8207 17.0406 8.364e-05 ***
Residuals 87 106.299 1.2218
AIC(m1)
[1] 278.3893
AIC(m2)
[1] 278.3893
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Montrer que deux modèles sont ou non emboîtés
et dire que mon icône R me tendait ses petites pattes potelées !
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Comparaison de modèles de régression logistique NON emboités
» quand on peut dire que deux échantillons sont identiques?
» Facteurs emboités ou indépendant
» Comparer deux évolutions dans deux groupes différents ?
» mes données sont-il significativement différentent
» quand on peut dire que deux échantillons sont identiques?
» Facteurs emboités ou indépendant
» Comparer deux évolutions dans deux groupes différents ?
» mes données sont-il significativement différentent
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum