Analyses mesures répétées et lme

Aller en bas

Analyses mesures répétées et lme

Message par Razowsky le Mar 29 Sep 2009 - 10:58

Bonjour à tous,

Je tente d'analyser mes données avec le logiciel R et j'aimerais savoir si ma démarche est correcte.

Je travaille sur un plan à mesures répétées à 4 variables. Tous les
participants réalisent toutes les combinaisons expérimentales.

Le plan est S12*L3*C3*R2*T2

Voici la commande que j'ai tapée :
Code:
summary(lme(vd ~ C * T * R * L, random = ~1|S))
Où S représente le facteur sujet.

En sachant que j'ai centré les vecteurs de données C, R, T et L sur leur moyenne.

J'aimerais savoir si c'est une bonne manière de faire et pourquoi les degrés de liberté dans la table résultante ne correspondent pas à ceux d'une table d'anova classique (nombre de modalité - 1) ?

Merci pour vos lumières,
Nicolas

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par droopy le Mar 29 Sep 2009 - 11:33

Il me semble que d'autres personnes, voir même peut-être les mêmes qu'ici ont déjà essayé de répondre à ta question. La réponse vient de la manière dont tu renseignes tes variables : des facteurs = des variables catégorielles ou des nombres = des variables quantitatives.

Un exemple :
Code:
y <- rnorm(100)
x <- sample(3,100,rep=T)
# premier modèle x est une variable continue :
anova(lm(y~x))
Analysis of Variance Table

Response: y
          Df  Sum Sq Mean Sq F value Pr(>F)
x          1  2.641  2.641  2.4152 0.1234
Residuals 98 107.176  1.094

ici qu'un seul degré de liberté parce que x est considéré comme une variable continue et donc le modèle est de la forme : y~ ax+b, une droite affine.

Si tu déclares x en facteur --> en variable catégorielle :
Code:
anova(lm(y~factor(x)))
Analysis of Variance Table

Response: y
          Df  Sum Sq Mean Sq F value Pr(>F)
factor(x)  2  3.322  1.661  1.513 0.2254
Residuals 97 106.495  1.098

Ici tu as bien 2 degrés de liberté à savoir n-1 modalités, parce qu'ici tu considères que x est une variable catégorielle alors que dans le premier modèle tu considères x comme une variable qualitative.
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Razowsky le Mar 29 Sep 2009 - 11:58

Ok, effectivement ça me semble normal maintenant.

Merci je viens de me rendre compte qu'on peut faire :
Code:
anova()

c'est beaucoup plus pratique et je vois qu'il y a les deux types de ddl. Du coup je comprend mieux.

Mais du coup comment choisit-on le type de donnée à utiliser : mes vi sont numériques mais je peux les transformer en variables catégorielles, non ? Et comme les résultats sont différents entre les deux appels qu'est-ce qui me garantit d'avoir fait le meilleur choix ?

Merci encore.

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par droopy le Mar 29 Sep 2009 - 12:17

En général ce sont les données elle même qui imposent le choix. Pour une variable catégorielle, le nombre ne représente rien, il peut être remplacer par des lettres ou tout autre codage.
Par exemple tu poses une question a choix multiple à des personnes du genre la couleur leurs yeux :
1) bleu
2) vert
3) marron
4) noir

tu peux assigner la valeur 1 pour quelqu'un qui a les yeux bleu, mais tu peux tout aussi bien assigner A ou encore "bleu", peut importe ici il s'agit effectivement d'une variable qui prend pour valeur des catégories. Les nombres ne représentent rien en soit, ils ne sont pas une mesure de quelque chose, ils ne sont qu'un alias pour spécifier une modalité de ta variable.

J'aurai tout aussi bien pu écrire :
1)marron
2)bleu
3)noir
4)vert

L'exemple inverse : tu demandes la taille des gens, leur nombre d'enfants, la température de l'air. Ces variables sont des variables quantitatives elle mesure quelque chose.

Parfois on peut être amené à transformer les variables quantitatives en variable catégorielle, mais la c'est autre chose.

Il faut donc bien faire le distinguo entre la nature de tes données d'une part et la façon de les codées dans R.

si je reprends l'exemple que je t'ai donné :
Code:
x1 <- sample(3,100,rep=T)
x2 <- factor(x1)

"Visuellement" ces deux vecteurs sont identiques, mais pourtant la classe des données qu'ils contiennent diffère :
Code:
class(x1)
[1] "integer"
 class(x2)
[1] "factor"
x1 contient des entiers alors que x2 contient un facteur avec 3 modalités. Je pourrais très bien changer le nom des modalités de x2 sans que ça change les résultats de l'analyse de variance :
Code:
y<- rnorm(100)
anova(lm(y~x2))
Analysis of Variance Table

Response: y
          Df Sum Sq Mean Sq F value Pr(>F)
x2        2  0.470  0.235  0.2766  0.759
Residuals 97 82.459  0.850

Si je mets des letters à la place des nombres :
Code:
x3 <- factor(x2,labels=letters[1:3])
Analysis of Variance Table

Response: y
          Df Sum Sq Mean Sq F value Pr(>F)
x3        2  0.470  0.235  0.2766  0.759
Residuals 97 82.459  0.850

A toi de connaître la nature de tes données et de bien prendre en compte leur nature dans R.

Après je ne connais pas grand chose au modèle linéaire mixte mais je sais que les gens qui s'en servent préfèrent se servir des fonctions des packages adaptés comme lmer et lme4 plutôt que de aov. Sur le net tu devrais trouvé pas mal de docs sur les syntaxes à employer pour la construction des modèles mixtes dans R.
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Razowsky le Mar 29 Sep 2009 - 12:28

Merci beaucoup.

En fait mes données sont vraiment de nature numérique. Il n'y a donc pas de raison de les transformer.

J'ai appris à "contraster" les modalités de mes variables expérimentales en les centrant sur leur moyenne (avant de faire l'analyse sous SPSS ou Statistica), est-ce que cela change quelque chose dans R ?

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par droopy le Mar 29 Sep 2009 - 12:45

Je crois que la première chose à faire n'est pas de se demander si ça change quoi que ce soit dans le logiciel, mais qu'est-ce que ça fait au niveau de mon analyse. Ensuite il faut effectivement voir comment tu l'intègres dans le logiciel. Il faut faire attention par ne pas se faire "phagocyter" par l'utilisation du logiciel.

Alors la question est : qu'est-ce que ça change au niveau des analyses ? --> sur l'anova ça ne change rien a priori, seuls les coefficients estimés par ton modèle devraient changer.

Un complément, s'il s'agit d'experience, par exemple à différente température, alors tu peux envisager effectivement de considérer cette variable soit d'un point de vue numérique soit d'un point de vue catégorielle : a chaque température une catégorie. Les hypothèse que tu fais derrière ça étant différente. Dans un cas tu considèreras que la variable dépendante est linéairement reliée à la température alors que dans le second cas non.

Je te conseille de lire des bouquins sur les plans d'expériences et leurs analyses.
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Razowsky le Mar 29 Sep 2009 - 13:07

droopy a écrit:
Alors la question est : qu'est-ce que ça change au niveau des analyses ? --> sur l'anova ça ne change rien a priori, seuls les coefficients estimés par ton modèle devraient changer.

En fait, c'est pour faire des contrastes orthogonaux avec un modèle résiduel.

droopy a écrit:
Un complément, s'il s'agit d'experience, par exemple à différente température, alors tu peux envisager effectivement de considérer cette variable soit d'un point de vue numérique soit d'un point de vue catégorielle : a chaque température une catégorie. Les hypothèse que tu fais derrière ça étant différente. Dans un cas tu considèreras que la variable dépendante est linéairement reliée à la température alors que dans le second cas non.

Je pensais que discrétiser une variable numérique provoquait seulement une perte de puissance (une augmentation du résidu du modèle). Je ne vois pas pourquoi ça change fondamentalement l'hypothèse car de toute façon tu as toujours un nombre fini de point... ?

droopy a écrit:
Je te conseille de lire des bouquins sur les plans d'expériences et leurs analyses.

Si tu as de bonnes ref, je suis preneur.

Merci.

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par droopy le Mar 29 Sep 2009 - 14:24

je te laisse méditer ces deux exemples :

exemple 1
Code:
set.seed(200)
x <- rep(1:4,25)
y <- rnorm(100,c(0,0,0,-3))
plot(y~factor(x))
lm0 <- lm(y~x)
abline(lm0)
anova(lm0)
lm1 <- lm(y~factor(x))
anova(lm1)
anova(lm0,lm1)

exemple2
Code:
set.seed(200)
x <- rep(1:4,25)
y <- rnorm(100,0:(-3))
plot(y~factor(x))
lm0 <- lm(y~x)
abline(lm0)
anova(lm0)
lm1 <- lm(y~factor(x))
anova(lm1)
anova(lm0,lm1)
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Razowsky le Mar 29 Sep 2009 - 15:06

Après une petite mais intense méditation :

Qu'est-ce que je dois comprendre ?

L'étagement des moyennes rend le modèle avec prédicateurs numériques plus explicatif des données que celui avec des facteurs car dans le deuxième cas il n'y a pas de relation d'ordre ?

Même si la droite de régression à une pente significative et similaire dans les deux cas... ?

Si je regarde le doigt au lieu de regarder la lune merci de me prévenir

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par droopy le Mar 29 Sep 2009 - 15:19

Dans les deux modèles lm0 l'hypothèse que tu fais est-celle d'un lien linéaire entre y et x, alors que dans le modèle lm1 tu ne fais plus une telle hypothèse. Dans lm1 tu fais l'hypothèse que les moyennes varient en fonction des modalités des facteurs.

Lorsque le lien est linéaire (2ème cas) alors le passage de variable continue à variable catégorielle n'apporte rien, si ce n'est comme tu l'as dit une perte de puissance. Par contre dans le cas ou le lien n'est pas linéaire (1er cas), comme par exemple dans le cas d'un effet seuil, alors la considérer la variable comme catégorielle apporte de l'information.
Dans le 2ème cas, tes données sont extrapolables, par exemple on pourrait prédire y pour un x de 2.5 alors que dans le deuxième cas on ne peut pas.

Alors à toi de voir comment tu considères tes variables. En général on se base aussi sur les connaissances a priori, mais la je m'aventure un peu trop loin pour moi car je ne manipule pas les plans d'expériences.
avatar
droopy

Nombre de messages : 1109
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Razowsky le Mer 30 Sep 2009 - 6:05

Ok, bien merci pour tous ces renseignements !

A bientôt,
n.

Razowsky

Nombre de messages : 6
Date d'inscription : 28/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Analyses mesures répétées et lme

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum