Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyses mesures répétées et lme
2 participants
Page 1 sur 1
Analyses mesures répétées et lme
Bonjour à tous,
Je tente d'analyser mes données avec le logiciel R et j'aimerais savoir si ma démarche est correcte.
Je travaille sur un plan à mesures répétées à 4 variables. Tous les
participants réalisent toutes les combinaisons expérimentales.
Le plan est S12*L3*C3*R2*T2
Voici la commande que j'ai tapée :
Où S représente le facteur sujet.
En sachant que j'ai centré les vecteurs de données C, R, T et L sur leur moyenne.
J'aimerais savoir si c'est une bonne manière de faire et pourquoi les degrés de liberté dans la table résultante ne correspondent pas à ceux d'une table d'anova classique (nombre de modalité - 1) ?
Merci pour vos lumières,
Nicolas
Je tente d'analyser mes données avec le logiciel R et j'aimerais savoir si ma démarche est correcte.
Je travaille sur un plan à mesures répétées à 4 variables. Tous les
participants réalisent toutes les combinaisons expérimentales.
Le plan est S12*L3*C3*R2*T2
Voici la commande que j'ai tapée :
Code: |
summary(lme(vd ~ C * T * R * L, random = ~1|S)) |
En sachant que j'ai centré les vecteurs de données C, R, T et L sur leur moyenne.
J'aimerais savoir si c'est une bonne manière de faire et pourquoi les degrés de liberté dans la table résultante ne correspondent pas à ceux d'une table d'anova classique (nombre de modalité - 1) ?
Merci pour vos lumières,
Nicolas
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Re: Analyses mesures répétées et lme
Il me semble que d'autres personnes, voir même peut-être les mêmes qu'ici ont déjà essayé de répondre à ta question. La réponse vient de la manière dont tu renseignes tes variables : des facteurs = des variables catégorielles ou des nombres = des variables quantitatives.
Un exemple :
ici qu'un seul degré de liberté parce que x est considéré comme une variable continue et donc le modèle est de la forme : y~ ax+b, une droite affine.
Si tu déclares x en facteur --> en variable catégorielle :
Ici tu as bien 2 degrés de liberté à savoir n-1 modalités, parce qu'ici tu considères que x est une variable catégorielle alors que dans le premier modèle tu considères x comme une variable qualitative.
Un exemple :
- Code:
y <- rnorm(100)
x <- sample(3,100,rep=T)
# premier modèle x est une variable continue :
anova(lm(y~x))
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x 1 2.641 2.641 2.4152 0.1234
Residuals 98 107.176 1.094
ici qu'un seul degré de liberté parce que x est considéré comme une variable continue et donc le modèle est de la forme : y~ ax+b, une droite affine.
Si tu déclares x en facteur --> en variable catégorielle :
- Code:
anova(lm(y~factor(x)))
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
factor(x) 2 3.322 1.661 1.513 0.2254
Residuals 97 106.495 1.098
Ici tu as bien 2 degrés de liberté à savoir n-1 modalités, parce qu'ici tu considères que x est une variable catégorielle alors que dans le premier modèle tu considères x comme une variable qualitative.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyses mesures répétées et lme
Ok, effectivement ça me semble normal maintenant.
Merci je viens de me rendre compte qu'on peut faire :
c'est beaucoup plus pratique et je vois qu'il y a les deux types de ddl. Du coup je comprend mieux.
Mais du coup comment choisit-on le type de donnée à utiliser : mes vi sont numériques mais je peux les transformer en variables catégorielles, non ? Et comme les résultats sont différents entre les deux appels qu'est-ce qui me garantit d'avoir fait le meilleur choix ?
Merci encore.
Merci je viens de me rendre compte qu'on peut faire :
- Code:
anova()
c'est beaucoup plus pratique et je vois qu'il y a les deux types de ddl. Du coup je comprend mieux.
Mais du coup comment choisit-on le type de donnée à utiliser : mes vi sont numériques mais je peux les transformer en variables catégorielles, non ? Et comme les résultats sont différents entre les deux appels qu'est-ce qui me garantit d'avoir fait le meilleur choix ?
Merci encore.
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Re: Analyses mesures répétées et lme
En général ce sont les données elle même qui imposent le choix. Pour une variable catégorielle, le nombre ne représente rien, il peut être remplacer par des lettres ou tout autre codage.
Par exemple tu poses une question a choix multiple à des personnes du genre la couleur leurs yeux :
1) bleu
2) vert
3) marron
4) noir
tu peux assigner la valeur 1 pour quelqu'un qui a les yeux bleu, mais tu peux tout aussi bien assigner A ou encore "bleu", peut importe ici il s'agit effectivement d'une variable qui prend pour valeur des catégories. Les nombres ne représentent rien en soit, ils ne sont pas une mesure de quelque chose, ils ne sont qu'un alias pour spécifier une modalité de ta variable.
J'aurai tout aussi bien pu écrire :
1)marron
2)bleu
3)noir
4)vert
L'exemple inverse : tu demandes la taille des gens, leur nombre d'enfants, la température de l'air. Ces variables sont des variables quantitatives elle mesure quelque chose.
Parfois on peut être amené à transformer les variables quantitatives en variable catégorielle, mais la c'est autre chose.
Il faut donc bien faire le distinguo entre la nature de tes données d'une part et la façon de les codées dans R.
si je reprends l'exemple que je t'ai donné :
"Visuellement" ces deux vecteurs sont identiques, mais pourtant la classe des données qu'ils contiennent diffère :
Si je mets des letters à la place des nombres :
A toi de connaître la nature de tes données et de bien prendre en compte leur nature dans R.
Après je ne connais pas grand chose au modèle linéaire mixte mais je sais que les gens qui s'en servent préfèrent se servir des fonctions des packages adaptés comme lmer et lme4 plutôt que de aov. Sur le net tu devrais trouvé pas mal de docs sur les syntaxes à employer pour la construction des modèles mixtes dans R.
Par exemple tu poses une question a choix multiple à des personnes du genre la couleur leurs yeux :
1) bleu
2) vert
3) marron
4) noir
tu peux assigner la valeur 1 pour quelqu'un qui a les yeux bleu, mais tu peux tout aussi bien assigner A ou encore "bleu", peut importe ici il s'agit effectivement d'une variable qui prend pour valeur des catégories. Les nombres ne représentent rien en soit, ils ne sont pas une mesure de quelque chose, ils ne sont qu'un alias pour spécifier une modalité de ta variable.
J'aurai tout aussi bien pu écrire :
1)marron
2)bleu
3)noir
4)vert
L'exemple inverse : tu demandes la taille des gens, leur nombre d'enfants, la température de l'air. Ces variables sont des variables quantitatives elle mesure quelque chose.
Parfois on peut être amené à transformer les variables quantitatives en variable catégorielle, mais la c'est autre chose.
Il faut donc bien faire le distinguo entre la nature de tes données d'une part et la façon de les codées dans R.
si je reprends l'exemple que je t'ai donné :
- Code:
x1 <- sample(3,100,rep=T)
x2 <- factor(x1)
"Visuellement" ces deux vecteurs sont identiques, mais pourtant la classe des données qu'ils contiennent diffère :
- Code:
class(x1)
[1] "integer"
class(x2)
[1] "factor"
- Code:
y<- rnorm(100)
anova(lm(y~x2))
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 2 0.470 0.235 0.2766 0.759
Residuals 97 82.459 0.850
Si je mets des letters à la place des nombres :
- Code:
x3 <- factor(x2,labels=letters[1:3])
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x3 2 0.470 0.235 0.2766 0.759
Residuals 97 82.459 0.850
A toi de connaître la nature de tes données et de bien prendre en compte leur nature dans R.
Après je ne connais pas grand chose au modèle linéaire mixte mais je sais que les gens qui s'en servent préfèrent se servir des fonctions des packages adaptés comme lmer et lme4 plutôt que de aov. Sur le net tu devrais trouvé pas mal de docs sur les syntaxes à employer pour la construction des modèles mixtes dans R.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyses mesures répétées et lme
Merci beaucoup.
En fait mes données sont vraiment de nature numérique. Il n'y a donc pas de raison de les transformer.
J'ai appris à "contraster" les modalités de mes variables expérimentales en les centrant sur leur moyenne (avant de faire l'analyse sous SPSS ou Statistica), est-ce que cela change quelque chose dans R ?
En fait mes données sont vraiment de nature numérique. Il n'y a donc pas de raison de les transformer.
J'ai appris à "contraster" les modalités de mes variables expérimentales en les centrant sur leur moyenne (avant de faire l'analyse sous SPSS ou Statistica), est-ce que cela change quelque chose dans R ?
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Re: Analyses mesures répétées et lme
Je crois que la première chose à faire n'est pas de se demander si ça change quoi que ce soit dans le logiciel, mais qu'est-ce que ça fait au niveau de mon analyse. Ensuite il faut effectivement voir comment tu l'intègres dans le logiciel. Il faut faire attention par ne pas se faire "phagocyter" par l'utilisation du logiciel.
Alors la question est : qu'est-ce que ça change au niveau des analyses ? --> sur l'anova ça ne change rien a priori, seuls les coefficients estimés par ton modèle devraient changer.
Un complément, s'il s'agit d'experience, par exemple à différente température, alors tu peux envisager effectivement de considérer cette variable soit d'un point de vue numérique soit d'un point de vue catégorielle : a chaque température une catégorie. Les hypothèse que tu fais derrière ça étant différente. Dans un cas tu considèreras que la variable dépendante est linéairement reliée à la température alors que dans le second cas non.
Je te conseille de lire des bouquins sur les plans d'expériences et leurs analyses.
Alors la question est : qu'est-ce que ça change au niveau des analyses ? --> sur l'anova ça ne change rien a priori, seuls les coefficients estimés par ton modèle devraient changer.
Un complément, s'il s'agit d'experience, par exemple à différente température, alors tu peux envisager effectivement de considérer cette variable soit d'un point de vue numérique soit d'un point de vue catégorielle : a chaque température une catégorie. Les hypothèse que tu fais derrière ça étant différente. Dans un cas tu considèreras que la variable dépendante est linéairement reliée à la température alors que dans le second cas non.
Je te conseille de lire des bouquins sur les plans d'expériences et leurs analyses.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyses mesures répétées et lme
droopy a écrit:
Alors la question est : qu'est-ce que ça change au niveau des analyses ? --> sur l'anova ça ne change rien a priori, seuls les coefficients estimés par ton modèle devraient changer.
En fait, c'est pour faire des contrastes orthogonaux avec un modèle résiduel.
droopy a écrit:
Un complément, s'il s'agit d'experience, par exemple à différente température, alors tu peux envisager effectivement de considérer cette variable soit d'un point de vue numérique soit d'un point de vue catégorielle : a chaque température une catégorie. Les hypothèse que tu fais derrière ça étant différente. Dans un cas tu considèreras que la variable dépendante est linéairement reliée à la température alors que dans le second cas non.
Je pensais que discrétiser une variable numérique provoquait seulement une perte de puissance (une augmentation du résidu du modèle). Je ne vois pas pourquoi ça change fondamentalement l'hypothèse car de toute façon tu as toujours un nombre fini de point... ?
droopy a écrit:
Je te conseille de lire des bouquins sur les plans d'expériences et leurs analyses.
Si tu as de bonnes ref, je suis preneur.
Merci.
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Re: Analyses mesures répétées et lme
je te laisse méditer ces deux exemples :
exemple 1
exemple2
exemple 1
- Code:
set.seed(200)
x <- rep(1:4,25)
y <- rnorm(100,c(0,0,0,-3))
plot(y~factor(x))
lm0 <- lm(y~x)
abline(lm0)
anova(lm0)
lm1 <- lm(y~factor(x))
anova(lm1)
anova(lm0,lm1)
exemple2
- Code:
set.seed(200)
x <- rep(1:4,25)
y <- rnorm(100,0:(-3))
plot(y~factor(x))
lm0 <- lm(y~x)
abline(lm0)
anova(lm0)
lm1 <- lm(y~factor(x))
anova(lm1)
anova(lm0,lm1)
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyses mesures répétées et lme
Après une petite mais intense méditation :
Qu'est-ce que je dois comprendre ?
L'étagement des moyennes rend le modèle avec prédicateurs numériques plus explicatif des données que celui avec des facteurs car dans le deuxième cas il n'y a pas de relation d'ordre ?
Même si la droite de régression à une pente significative et similaire dans les deux cas... ?
Si je regarde le doigt au lieu de regarder la lune merci de me prévenir
Qu'est-ce que je dois comprendre ?
L'étagement des moyennes rend le modèle avec prédicateurs numériques plus explicatif des données que celui avec des facteurs car dans le deuxième cas il n'y a pas de relation d'ordre ?
Même si la droite de régression à une pente significative et similaire dans les deux cas... ?
Si je regarde le doigt au lieu de regarder la lune merci de me prévenir
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Re: Analyses mesures répétées et lme
Dans les deux modèles lm0 l'hypothèse que tu fais est-celle d'un lien linéaire entre y et x, alors que dans le modèle lm1 tu ne fais plus une telle hypothèse. Dans lm1 tu fais l'hypothèse que les moyennes varient en fonction des modalités des facteurs.
Lorsque le lien est linéaire (2ème cas) alors le passage de variable continue à variable catégorielle n'apporte rien, si ce n'est comme tu l'as dit une perte de puissance. Par contre dans le cas ou le lien n'est pas linéaire (1er cas), comme par exemple dans le cas d'un effet seuil, alors la considérer la variable comme catégorielle apporte de l'information.
Dans le 2ème cas, tes données sont extrapolables, par exemple on pourrait prédire y pour un x de 2.5 alors que dans le deuxième cas on ne peut pas.
Alors à toi de voir comment tu considères tes variables. En général on se base aussi sur les connaissances a priori, mais la je m'aventure un peu trop loin pour moi car je ne manipule pas les plans d'expériences.
Lorsque le lien est linéaire (2ème cas) alors le passage de variable continue à variable catégorielle n'apporte rien, si ce n'est comme tu l'as dit une perte de puissance. Par contre dans le cas ou le lien n'est pas linéaire (1er cas), comme par exemple dans le cas d'un effet seuil, alors la considérer la variable comme catégorielle apporte de l'information.
Dans le 2ème cas, tes données sont extrapolables, par exemple on pourrait prédire y pour un x de 2.5 alors que dans le deuxième cas on ne peut pas.
Alors à toi de voir comment tu considères tes variables. En général on se base aussi sur les connaissances a priori, mais la je m'aventure un peu trop loin pour moi car je ne manipule pas les plans d'expériences.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Analyses mesures répétées et lme
Ok, bien merci pour tous ces renseignements !
A bientôt,
n.
A bientôt,
n.
Razowsky- Nombre de messages : 6
Date d'inscription : 28/09/2009
Sujets similaires
» ANOVA mesures répetées
» ANCOVA et mesures répétées
» ANOVA mesures répétées avec R
» ancova et anova a mesures répétées
» Anova à mesures répétées
» ANCOVA et mesures répétées
» ANOVA mesures répétées avec R
» ancova et anova a mesures répétées
» Anova à mesures répétées
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum