Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -23%
EVGA SuperNOVA 650 G6 – Alimentation PC 100% ...
Voir le deal
77.91 €

ANOVA plan déséquilibré

2 participants

Aller en bas

ANOVA plan déséquilibré Empty ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 13:14

Bonjour,

Je fais une ANOVA (plan désiquilibré) à plus de deux facteurs et j'ai du mal à interpréter certains paramètres.

en effet, si je calcule la moyenne de la variable à expliquer (un montant en euro) sur une première variable à 4 modalités j'ai en gros le résultat suivant:
1 ere modalité : 10 000€
2 ème modalité : 27 000€
3 ème modalité : 100€
4 ème modalité : 32 000€
(dans l'ordre nous avons 4,2,1 et 3)


Cependant, une fois mon ANOVA réalisée et que je regarde les paramètres estimés de cette variable, ils sont significatifs et les valeurs sont les suivantes (en gros):
1 ere modalité : -22 450
2 ème modalité : 14 202
3 ème modalité : -5 600
4 ème modalité : 0 (contrainte)
(dans l'ordre 2,4,3,1)

j'ai du mal à interpréter ça car les modalités ayant une plus forte moyenne n'ont pas les plus fort coefficient estimés.

Questions: la différence d'ordre décrite ci-dessus est-elle due aux autres facteurs explicatifs? est elle due au plan désiquilibré? (si le plan avait été équilibré, l'ordre aurait-il été respecté?)
si oui, comment interpréter un tel résultat? peut on dire: "l'effet principal de la première variable est que la modalité 2 engendre un montant plus élevé pour la variable à expliquer. Ce n'est pas le cas au final à cause des effets principaux des autres variables." ?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Invité Jeu 4 Juin 2009 - 13:52

bonjour,

ce n'est pas lié au déséquilibre de ton plan, c'est lié à la présence d'autres variables dans ton analyse. Il te suffit de refaire la même analyse mais juste avec ta variable et tu verras que tu retomberas sur le fait que les modas à plus fortes moyenne auront les plus forts coeffs.

Pour l'interprétation je ne sais pas si tu as beaucoup de facteurs alors ça devient assez complexe.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 14:00

j'ai 7 facteurs avec environ 5 modalités par facteurs... peut-on étudier la valeur des paramètres en disant que ceux sont les effets principaux de chaque facteur? et comparer ça aux moyennes pour chaque modalité en disant que ceux sont les effets (tout court) de la variable?

Si ce n'est pas lié au désiquilibre de mon plan, qu'elles sont les conséquences sur l'ANOVA d'un plan désiquilibré?

ps : Merci pour les réponses rapides
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Invité Jeu 4 Juin 2009 - 14:25

En tout cas j'espère que tu as un grand échantillon parce que ça fait pas mal de paramètres à estimer tout ça surtout si tu intègres les interactions ...

Les conséquence sont sur les décompositions de variance. Celles-ci risquent de varier en fonction de l'ordre d'entrer de tes variables dans ton anova. C'est relativement proche des conséquences de la colinéarité, mais ici il ne semble pas que ça modifie l'estimation des paramètres (à vérifier). Moralité, il se peut qu'une fois la variable X soit significative et que si tu changes l'ordre des variables, la variable X deviennent non significative. Attention la je parle de l'effet de la variable et non pas de son coefficient.

Ça risque aussi d'augmenter les écart types de tes paramètres et par conséquent ça peut jouier sur leurs significativités. Je pense que tu peux trouver une littérature abondante sur le sujet.

peut-on étudier la valeur des paramètres en disant que ceux sont les
effets principaux de chaque facteur? et comparer ça aux moyennes pour
chaque modalité en disant que ceux sont les effets (tout court) de la
variable?
Je ne pense pas.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 15:03

micros corpus a écrit:
peut-on étudier la valeur des paramètres en disant que ceux sont les
effets principaux de chaque facteur? et comparer ça aux moyennes pour
chaque modalité en disant que ceux sont les effets (tout court) de la
variable?
Je ne pense pas.

micros


Pourquoi on ne pourrait pas dire cela?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 15:04

et comment interpréter les coefficients? est ce que ça a un sens de les interpréter?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Invité Jeu 4 Juin 2009 - 16:00

Avec un exemple :
Code:
> y <- rnorm(100) # une v.a qui suit une loi normale centré réduite
> x1 <- factor(sample(letters[1:2],100,rep=T))
> x2 <- factor(sample(LETTERS[1:4],100,rep=T))

### moyennes par modaliés de x1
tapply(y,list(x1),mean)
        a          b
0.09890852 0.11088130

### moyennes par modalités de x2
tapply(y,list(x2),mean)
        A          B          C          D
-0.3180872  0.2344362  0.0809969  0.4135624

### moyennes croisées
tapply(y,list(x1,x2),mean)
          A          B          C          D
a -0.1882635 0.49526246 0.113001155 0.06767614
b -0.4379246 0.05386414 0.008987346 0.69027136

### ANOVA sans interaction :
Coefficients:
            Estimate Std. Error t value Pr(>|t|) 
(Intercept) -0.31085    0.22302  -1.394  0.16662 
x1b        -0.01392    0.20183  -0.069  0.94516 
x2B          0.55351    0.28797  1.922  0.05759 .
x2C          0.39613    0.27891  1.420  0.15880 
x2D          0.73214    0.27318  2.680  0.00868 **

J'ai du mal à voir a quoi peuvent correspondre les coefficients. Alors avec 7 facteurs ... Après tout dépend la question que tu te poses.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 16:56

Mais pourquoi on peut pas parler d'effet principal de chaque variable? Les plus forts coefficients représentant les modalités qui font augmenter la valeur de la variable à expliquer?

Pourquoi pourrait on étudier les paramètres estimés un à un d'une régression logistique par exemple et pas d'une ANOVA?
En régression logistique si le paramètre est élevé alors on dit que ce paramètre à tendance à faire augmenter la probabilité que Y=1. De même pourquoi on ne peut pas dire que si le paramètre estimé pour une ANOVA est élevé alors ce paramètre à tendance à augmenter la variable explicative?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Jeu 4 Juin 2009 - 19:55

j'avais aussi une autre question (en plus de celles juste au dessus): est il important de mettre dans le modèle les intéractions? quels sont les avantages et inconvénients?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Invité Ven 5 Juin 2009 - 7:55

Bon reprenons, après une vérification dans le bouquin "Le modèle linéaire par l'exemple", il se trouve qu'effectivement tu peux interpréter tes paramètres comme étant des "effets principaux". Ta remarque était pleinement justifiée.

La différence entre un modèle avec et sans interaction :
Dans un modèle sans interaction tu fais l'hypothèse que tes facteurs ont des effets additifs. Pour reprendre l'exemple plus haut : l'effet de x2.B par rapport a x2.A sera le même que tu sois x1.a ou x1.b. Tu obtiens des courbes parallèles de réponses. Cela signifie que pour toutes les modalités de l'un des facteurs, la différence de réponse moyenne entre deux modalités fixées de l'autre facteur reste constante. L'écart entre A.a et A.b est le même que entre B.a et B.b.
Code:
lm1 <- lm(y~x1+x2)
new <- expand.grid(x1=letters[1:2],x2=LETTERS[1:4])
pred <- predict(lm1,newdata=new)
test <- cbind(new,test=pred)
test <- test[do.call("order",test[,-3]),]
plot(c(1:4),rep(0,4),ylim=range(test$test),type="n",xlab="x2",ylab="x1",axes=F)
axis(1,at=1:4,labels=LETTERS[1:4])
box()
tapply(test$test,test$x1,function(x) lines(1:4,x))

Alors que dans le modèle avec interaction c'est écart n'est plus constant. Ici la réponse semble dépendre de chaque composant. Tu as donc une réponse propre pour chaque combinaison : A.a, A.b, B.a, B.b, etc.
Code:
lm2 <- lm(y~x1*x2)
pred <- predict(lm2,newdata=new)
test <- cbind(new,test=pred)
test <- test[do.call("order",test[,-3]),]
plot(c(1:4),rep(0,4),ylim=range(test$test),type="n",xlab="x2",ylab="x1",axes=F)
axis(1,at=1:4,labels=LETTERS[1:4])
box()
tapply(test$test,test$x1,function(x) lines(1:4,x))

Dans un cas à deux facteurs en général on teste d'abord s'il y a un effet de l'interaction et si celle-ci n'est pas significative alors on revient vers un modèle additif.

L'avantage d'un modèle avec interaction est que tu prends en compte la synergie qu'il peut y avoir entre deux facteurs. Par exemple tu utilises deux ypes de traitement, il se peut que le mélange de l'antibiotique1 avec la pommade 2 est bien plus grand effet que toutes les autres combinaisons parce que ces deux traitements interagissent entre eux.

L'inconvénient c'est que ça fait beaucoup plus de paramètres à estimer. Surtout qu'ici il te faudrait aussi prendre en compte les intéraction d'ordre supérieures :
interaction d'ordre 2 : interaction entre deux variables x1:x2
inetraction d'ordre 3 : interaction entre trois variables x1:x2:x3

Alors avec 7 facteurs ... tu imagines le nombre d'interaction qeu cela peut faire. L'autre inconvénient c'est que la les paramètres deviennennt difficilement interprétable.

Si tu te lances dans les modèles linéaires je te conseille vivement l'achat du bouquin (~30€), ou tu dois pouvoir le trouver en bibliothèque.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par c@ssoulet Ven 5 Juin 2009 - 8:30

Il y a aussi "regression methods in biostatistics" chez springer qui est remarquablement bien foutu à mon avis. Explique en termes simples, précis et sans équations abscondes des notions qui vont de la base à du relativement complexe (sélection des prédicteurs, effet médiateur, facteurs de confusion, interactions), avec de très bons exemples à l'appui (sous stata). Mais c'est en Anglais

c@ssoulet

Nombre de messages : 925
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Ven 5 Juin 2009 - 11:29

Micros corpus dit:
"il ne semble pas que (le plan désiquilibré) ça modifie l'estimation des paramètres"


1-cas:J'ai réalisé une ANOVA à 2 facteurs sans intéraction sur un plan équilibré puis (en modifiant légèrement les données) sur un plan désiquilibré. les estimations n'étaient pas les mêmes.

Cependant, j'ai remarqué qu'il y avait un effet d'intéraction sur mes 2 facteurs explicatifs.
2 cas: En refaisant la même chose sur une base dont les facteurs n'ont pas d'effets d'intéractions, les estimations étaient les mêmes pour le plan équilibré et désiquilibré.

(remarque: en faisant une ANOVA avec intéraction pour le premier cas, les estimations selon les deux plans de sondage donnent les mêmes résultats)

question : Pourquoi?

De plus, pour un plan équilibré, j'ai remarqué qu'il est possible de mesurer les paramètres "facilement" via des différences de moyennes. Pourquoi cela ne marche plus avec un plan désiquilibré?


merci pour vos réponses et les références ; je consulterais les livres sitôt que je pourrais!
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Invité Ven 5 Juin 2009 - 12:13

niaboc a écrit:Micros corpus dit:
"il ne semble pas que (le plan désiquilibré) ça modifie l'estimation des paramètres"

1-cas:J'ai réalisé une ANOVA à 2 facteurs sans intéraction
sur un plan équilibré puis (en modifiant légèrement les données) sur un
plan désiquilibré. les estimations n'étaient pas les mêmes.

Je parlais de l'ordre d'entrée des variables dans ton modèle qui ne change pas l'estimation des paramètres ... Si tu changes légèrement les variables il est normale que les valeurs des paramètres changent. Si tu fais une corrélation entre y et x puis entre y et x1 même si x et x1 sont corrélés à plus de 0.99 la valeur des paramètres va changer.

ce que je voulais dire :
Code:
y <- rnorm(100)
x1 <- factor(sample(letters[1:2],100,rep=T))
x2 <- factor(sample(LETTERS[1:4],100,rep=T))

lm1 <- lm(y~x1+x2)
lm2 <- lm(y~x2+x1)
lm1$coeff
(Intercept)        x1b        x2B        x2C        x2D
-0.25256251 -0.01165333  0.44231971  0.15780117 -0.01801134
lm2$coeff
(Intercept)        x2B        x2C        x2D        x1b
-0.25256251  0.44231971  0.15780117 -0.01801134 -0.01165333

Mais l'ordre des variables changent la décomposition des variances :
Code:
anova(lm1)
Analysis of Variance Table

Response: y
          Df Sum Sq Mean Sq F value Pr(>F)
x1        1  0.015  0.015  0.0156 0.9009
x2        3  3.230  1.077  1.1513 0.3326
Residuals 95 88.844  0.935             
anova(lm2)
Analysis of Variance Table

Response: y
          Df Sum Sq Mean Sq F value Pr(>F)
x2        3  3.241  1.080  1.1553 0.3310
x1        1  0.003  0.003  0.0036 0.9522
Residuals 95 88.844  0.935             


niaboc a écrit:2 cas: En refaisant la même chose sur une base dont les facteurs n'ont pas d'effets d'intéractions, les estimations étaient les mêmes pour le plan équilibré et désiquilibré.

(remarque: en faisant une ANOVA avec intéraction pour le premier cas, les estimations selon les deux plans de sondage donnent les mêmes résultats)

question : Pourquoi?

De plus, pour un plan équilibré, j'ai remarqué qu'il est possible de mesurer les paramètres "facilement" via des différences de moyennes. Pourquoi cela ne marche plus avec un plan désiquilibré?
Justement parce qu'il est déséquilibré.

J'ai pas compris ce que tu voulais dire dans ta remarque.

Après sur le net aussi tu trouveras pas mal de chose sur les modèles linéaires, voir les cours de Philippe Besse par exemple.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Ven 5 Juin 2009 - 14:34

Dans ma remarque je voulais dire que sitôt que le modèle est le bon alors les estimations ne changent pas si on a un plan équilibré ou pas... Est ce que cela est vrai?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty u

Message par Invité Lun 8 Juin 2009 - 7:00

les estimations vont forcément changer ... puisque dans les deux cas tu n'auras pas exactement les mêmes variables ... Les écart-type seront aussi différent. Tout sera différent parce que tu n'auras pas les mêmes modèles. Après il est très difficile de savoir dans quelle mesure ce feront ces changements.

micros

Invité
Invité


Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par niaboc Mar 9 Juin 2009 - 14:34

merci pour les réponses. j'ai une toute dernière question:

On estime les coefficients par la célèbre forume:
(X'X)-1 X'Y (X étant la matrice de 1 et 0 répartis selon la répartition des modalités des varaibles explicatives)

En fait on calcule l'inverse généralisée de X'X car la matrice n'est pas inversible.

Est-il possible de donner une interprétation des coefficients de la matrice inverse?
niaboc
niaboc

Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008

Revenir en haut Aller en bas

ANOVA plan déséquilibré Empty Re: ANOVA plan déséquilibré

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum