Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse de variance mixte
2 participants
Page 1 sur 1
Analyse de variance mixte
Bonjour =),
J'avais déjà posté il y a quelques temps sur le forum concernant des questions sur les ANOVA à plusieurs facteurs, mais étant donné l'intitulé du sujet qui ne reflète pas ma problématique j'ai préféré faire un nouveau topic. Les réponses que j'ai eu m'ont un peu aiguillée et j'ai creusé un peu plus dans des pistes des modèles mixtes. Mon niveau de stat reste encore hélas basique ^^
J'ai un jeu de données comme suit:
Ma variable réponse est la distance, soit euclidienne, soit en coûts cumulés.
J'ai donc des facteurs fixes:
1) Année: 4 années de mesures (1985, 1995, 2000, 2005), fixe
2) Scénario: 4 scénarios de matrices de coûts différents mesurés sur les 4 années, dans 3 secteurs d'études
Mes facteurs aléatoires:
3) Secteurs: 3 secteurs d'étude dans lesquels sont mesurées les distances de coûts en fonction des scénarios et pour chaque année
4) Couple: mes couples de points entre lesquels je mesure la distance au cours du temps et selon les scénarios. Ces couples de points sont hiérarchisés dans le facteur "Secteur".
Idéalement j'aurais aimé ajouter l'effet du Pourcentage de forêt mature dans l'analyse mais comme variable contrôle.... de ce que j'ai pu comprendre c'était alors une ANCOVA ... mais comment intégrer cela au modèle ... ?!
J'ai utilisé la fonction lmer() du package {lme4} de R.
Et voici la syntaxe de mon modèle:
J'ai vérifié les résidus cela n'est pas parfait mais c'est pas atroce (j'avais fait des tests de Friedman pour données appariées avant de m'embarquer dans les modèles mixtes), mais j'ai du mal à interpréter les sorties du logiciel, je pensais obtenir seulement si les facteurs "Année" puis "Scénario" avaient des différences entre eux deux à deux. Là j'obtiens une sortie "Année", puis 3 de mes scénarios ...?
Ainsi, je n'arrive pas à faire une analyse de contrastes (d'après ce que j'ai lu) pour évaluer entre quels et quels niveau de chaque facteur les moyennes diffèrent (une sorte de test post hoc de ce que j'ai pu comprendre).
Aussi je me pose une autre question, mon plan est débalancé, c-à-dire que j'ai 89 obs pour le secteur 1 contre 33 pour le secteur 3 par exemple ... l'analyse de contraste a l'air de demander des plans balancés ....
Une autre question serait pour une représentation graphique .... je ne vois pas comment représenter les résultats de tels tests. J'avais simplement représenté mes moyennes pour chaque année et chaque scénario avec l'intervalle de confiance .... y a t il une autre représentation possible?
Merci d'avance =)
J'avais déjà posté il y a quelques temps sur le forum concernant des questions sur les ANOVA à plusieurs facteurs, mais étant donné l'intitulé du sujet qui ne reflète pas ma problématique j'ai préféré faire un nouveau topic. Les réponses que j'ai eu m'ont un peu aiguillée et j'ai creusé un peu plus dans des pistes des modèles mixtes. Mon niveau de stat reste encore hélas basique ^^
J'ai un jeu de données comme suit:
- Code:
Couple Eucli Cout_CUM Cout_CUM85 Année Scénario Secteur Pourc_foma Cout_sur_CUM85 Ratio_Eucli
1 6003.674 282.0192 282.0192 1985 BI 1 0.74 1 0.0001665647
2 3889.602 225.5217 225.5217 1985 H1 1 0.74 1 0.0002570957
3 4009.801 672.7158 672.7158 1985 H2 1 0.74 1 0.0002493890
4 2313.115 727.0613 727.0613 1995 BI 1 0.018 1 0.0004323175
5 2630.779 112.7105 112.7105 2000 BI 1 0.11 1 0.0003801155
6 7625.667 306.0658 306.0658 2005 BI 1 0.08 1 0.0001311361
Ma variable réponse est la distance, soit euclidienne, soit en coûts cumulés.
J'ai donc des facteurs fixes:
1) Année: 4 années de mesures (1985, 1995, 2000, 2005), fixe
2) Scénario: 4 scénarios de matrices de coûts différents mesurés sur les 4 années, dans 3 secteurs d'études
Mes facteurs aléatoires:
3) Secteurs: 3 secteurs d'étude dans lesquels sont mesurées les distances de coûts en fonction des scénarios et pour chaque année
4) Couple: mes couples de points entre lesquels je mesure la distance au cours du temps et selon les scénarios. Ces couples de points sont hiérarchisés dans le facteur "Secteur".
Idéalement j'aurais aimé ajouter l'effet du Pourcentage de forêt mature dans l'analyse mais comme variable contrôle.... de ce que j'ai pu comprendre c'était alors une ANCOVA ... mais comment intégrer cela au modèle ... ?!
J'ai utilisé la fonction lmer() du package {lme4} de R.
Et voici la syntaxe de mon modèle:
- Code:
mod=lmer(log10(Ratio_Eucli) ~ Année + Scénario + (1 | Secteur/Couple), data=tout_ss85)
summary(mod)
Linear mixed model fit by REML ['lmerMod']
Formula: log10(Ratio_Eucli) ~ Année + Scénario + (1 | Secteur/Couple)
Data: tout_ss85
REML criterion at convergence: -3838.7
Scaled residuals:
Min 1Q Median 3Q Max
-3.1610 -0.6094 0.0055 0.6543 3.7984
Random effects:
Groups Name Variance Std.Dev.
Couple:Secteur (Intercept) 0.090591 0.30098
Secteur (Intercept) 0.023541 0.15343
Residual 0.009528 0.09761
Number of obs: 2736, groups: Couple:Secteur, 228; Secteur, 3
Fixed effects:
Estimate Std. Error t value
(Intercept) -2.553e+01 9.188e-01 -27.79
Année 1.122e-02 4.571e-04 24.54
ScénarioH1 -5.323e-02 5.278e-03 -10.09
ScénarioH2 -2.752e-01 5.278e-03 -52.15
ScénarioH3 -5.359e-01 5.278e-03 -101.54
Correlation of Fixed Effects:
(Intr) Année ScénH1 ScénH2
Année -0.995
ScénarioH1 -0.003 0.000
ScénarioH2 -0.003 0.000 0.500
ScénarioH3 -0.003 0.000 0.500 0.500
J'ai vérifié les résidus cela n'est pas parfait mais c'est pas atroce (j'avais fait des tests de Friedman pour données appariées avant de m'embarquer dans les modèles mixtes), mais j'ai du mal à interpréter les sorties du logiciel, je pensais obtenir seulement si les facteurs "Année" puis "Scénario" avaient des différences entre eux deux à deux. Là j'obtiens une sortie "Année", puis 3 de mes scénarios ...?
Ainsi, je n'arrive pas à faire une analyse de contrastes (d'après ce que j'ai lu) pour évaluer entre quels et quels niveau de chaque facteur les moyennes diffèrent (une sorte de test post hoc de ce que j'ai pu comprendre).
Aussi je me pose une autre question, mon plan est débalancé, c-à-dire que j'ai 89 obs pour le secteur 1 contre 33 pour le secteur 3 par exemple ... l'analyse de contraste a l'air de demander des plans balancés ....
Une autre question serait pour une représentation graphique .... je ne vois pas comment représenter les résultats de tels tests. J'avais simplement représenté mes moyennes pour chaque année et chaque scénario avec l'intervalle de confiance .... y a t il une autre représentation possible?
Merci d'avance =)
Delphine.Fa- Nombre de messages : 5
Date d'inscription : 09/04/2014
Re: Analyse de variance mixte
Bonsoir,
Ce n'est pas bien plus clair que ton autre post. Toujours pareil, tu livres tes questions comme elles te viennent, au fur et à mesure de ta réflexion stat. ça peut te sembler logique mais ça ne l'est pas pour ceux qui te lisent.
Par ex :
Si tu veux tester l'apport de chaque facteur globalement, il faut utiliser la commande anova sur des modèles emboités. Pour le moment tu as l'estimation des paramètres du modèle et pas vraiment le test des effets. Il te faut construire des modèles du plus simple au plus complexe et ensuite les comparer. La partie aléatoire peux aussi être testée en faisant un gls sans la partie aléatoire et en le comparant à un lmm estimé au maximum de vraisemblance et non par REML tel que le fait par défaut la fonction lmer.
Nik
Ce n'est pas bien plus clair que ton autre post. Toujours pareil, tu livres tes questions comme elles te viennent, au fur et à mesure de ta réflexion stat. ça peut te sembler logique mais ça ne l'est pas pour ceux qui te lisent.
Par ex :
On ne peut pas comprendre ce que tu souhaites. Si tu veux l'intégrer au modèle, libre à toi de l'intégrer si tu penses que cette hypothèse tient la route.Idéalement j'aurais aimé ajouter l'effet du Pourcentage de forêt mature dans l'analyse mais comme variable contrôle.... de ce que j'ai pu comprendre c'était alors une ANCOVA ... mais comment intégrer cela au modèle ... ?!
Si tu veux tester l'apport de chaque facteur globalement, il faut utiliser la commande anova sur des modèles emboités. Pour le moment tu as l'estimation des paramètres du modèle et pas vraiment le test des effets. Il te faut construire des modèles du plus simple au plus complexe et ensuite les comparer. La partie aléatoire peux aussi être testée en faisant un gls sans la partie aléatoire et en le comparant à un lmm estimé au maximum de vraisemblance et non par REML tel que le fait par défaut la fonction lmer.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum