Analyse de variance mixte

Aller en bas

Analyse de variance mixte Empty Analyse de variance mixte

Message par Delphine.Fa le Lun 5 Mai 2014 - 19:39

Bonjour =),

J'avais déjà posté il y a quelques temps sur le forum concernant des questions sur les ANOVA à plusieurs facteurs, mais étant donné l'intitulé du sujet qui ne reflète pas ma problématique j'ai préféré faire un nouveau topic. Les réponses que j'ai eu m'ont un peu aiguillée et j'ai creusé un peu plus dans des pistes des modèles mixtes. Mon niveau de stat reste encore hélas basique ^^

J'ai un jeu de données comme suit:

Code:
Couple    Eucli Cout_CUM Cout_CUM85 Année Scénario Secteur Pourc_foma Cout_sur_CUM85  Ratio_Eucli
1 6003.674 282.0192   282.0192  1985       BI       1       0.74              1 0.0001665647
2 3889.602 225.5217   225.5217  1985       H1      1       0.74              1 0.0002570957
3 4009.801 672.7158   672.7158  1985       H2      1       0.74              1 0.0002493890
4 2313.115 727.0613   727.0613  1995       BI       1       0.018            1 0.0004323175
5 2630.779 112.7105   112.7105  2000       BI       1       0.11              1 0.0003801155
6 7625.667 306.0658   306.0658  2005       BI       1       0.08              1 0.0001311361

Ma variable réponse est la distance, soit euclidienne, soit en coûts cumulés.

J'ai donc des facteurs fixes:
1) Année: 4 années de mesures (1985, 1995, 2000, 2005), fixe
2) Scénario: 4 scénarios de matrices de coûts différents mesurés sur les 4 années, dans 3 secteurs d'études

Mes facteurs aléatoires:
3) Secteurs: 3 secteurs d'étude dans lesquels sont mesurées les distances de coûts en fonction des scénarios et pour chaque année
4) Couple: mes couples de points entre lesquels je mesure la distance au cours du temps et selon les scénarios. Ces couples de points sont hiérarchisés dans le facteur "Secteur".

Idéalement j'aurais aimé ajouter l'effet du Pourcentage de forêt mature dans l'analyse mais comme variable contrôle.... de ce que j'ai pu comprendre c'était alors une ANCOVA ... mais comment intégrer cela au modèle ... ?!

J'ai utilisé la fonction lmer() du package {lme4} de R.
Et voici la syntaxe de mon modèle:
Code:
mod=lmer(log10(Ratio_Eucli) ~ Année + Scénario + (1 | Secteur/Couple), data=tout_ss85)

summary(mod)
Linear mixed model fit by REML ['lmerMod']
Formula: log10(Ratio_Eucli) ~ Année + Scénario + (1 | Secteur/Couple)
   Data: tout_ss85

REML criterion at convergence: -3838.7

Scaled residuals:
    Min      1Q  Median      3Q     Max
-3.1610 -0.6094  0.0055  0.6543  3.7984

Random effects:
 Groups         Name        Variance Std.Dev.
 Couple:Secteur (Intercept) 0.090591 0.30098
 Secteur        (Intercept) 0.023541 0.15343
 Residual                   0.009528 0.09761
Number of obs: 2736, groups: Couple:Secteur, 228; Secteur, 3

Fixed effects:
              Estimate Std. Error t value
(Intercept) -2.553e+01  9.188e-01  -27.79
Année        1.122e-02  4.571e-04   24.54
ScénarioH1  -5.323e-02  5.278e-03  -10.09
ScénarioH2  -2.752e-01  5.278e-03  -52.15
ScénarioH3  -5.359e-01  5.278e-03 -101.54

Correlation of Fixed Effects:
           (Intr) Année  ScénH1 ScénH2
Année      -0.995                    
ScénarioH1 -0.003  0.000              
ScénarioH2 -0.003  0.000  0.500      
ScénarioH3 -0.003  0.000  0.500  0.500

J'ai vérifié les résidus cela n'est pas parfait mais c'est pas atroce (j'avais fait des tests de Friedman pour données appariées avant de m'embarquer dans les modèles mixtes), mais j'ai du mal à interpréter les sorties du logiciel, je pensais obtenir seulement si les facteurs "Année" puis "Scénario" avaient des différences entre eux deux à deux. Là j'obtiens une sortie "Année", puis 3 de mes scénarios ...?
Ainsi, je n'arrive pas à faire une analyse de contrastes (d'après ce que j'ai lu) pour évaluer entre quels et quels niveau de chaque facteur les moyennes diffèrent (une sorte de test post hoc de ce que j'ai pu comprendre).

Aussi je me pose une autre question, mon plan est débalancé, c-à-dire que j'ai 89 obs pour le secteur 1 contre 33 pour le secteur 3 par exemple ... l'analyse de contraste a l'air de demander des plans balancés ....

Une autre question serait pour une représentation graphique .... je ne vois pas comment représenter les résultats de tels tests. J'avais simplement représenté mes moyennes pour chaque année et chaque scénario avec l'intervalle de confiance .... y a t il une autre représentation possible?

Merci d'avance =)

Delphine.Fa

Nombre de messages : 5
Date d'inscription : 09/04/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de variance mixte Empty Re: Analyse de variance mixte

Message par Nik le Lun 5 Mai 2014 - 20:57

Bonsoir,

Ce n'est pas bien plus clair que ton autre post. Toujours pareil, tu livres tes questions comme elles te viennent, au fur et à mesure de ta réflexion stat. ça peut te sembler logique mais ça ne l'est pas pour ceux qui te lisent.
Par ex :
Idéalement j'aurais aimé ajouter l'effet du Pourcentage de forêt mature dans l'analyse mais comme variable contrôle.... de ce que j'ai pu comprendre c'était alors une ANCOVA ... mais comment intégrer cela au modèle ... ?!
On ne peut pas comprendre ce que tu souhaites. Si tu veux l'intégrer au modèle, libre à toi de l'intégrer si tu penses que cette hypothèse tient la route.

Si tu veux tester l'apport de chaque facteur globalement, il faut utiliser la commande anova sur des modèles emboités. Pour le moment tu as l'estimation des paramètres du modèle et pas vraiment le test des effets. Il te faut construire des modèles du plus simple au plus complexe et ensuite les comparer. La partie aléatoire peux aussi être testée en faisant un gls sans la partie aléatoire et en le comparant à un lmm estimé au maximum de vraisemblance et non par REML tel que le fait par défaut la fonction lmer.

Nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum