Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -50%
-50% Baskets Nike Air Huarache
Voir le deal
64.99 €

Anova appliquée sur un modèle de régression ?

2 participants

Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Anova appliquée sur un modèle de régression ?

Message par clemm Lun 17 Sep 2018 - 14:40

Bonjour,

Après avoir longtemps cherché sur internet, je n'ai pas trouvé la réponse à ma question.

J'ai une variable continue Y et 3 variables explicatives Xi, également continues.

Je souhaite quantifier l'influence de chacune des variables Xi sur Y.

Je sais que la méthode des indices de Sobol est adaptée au cas continu. J'aimerais aussi savoir si une anova a du sens dans ce contexte.
Dans R et Python on a la possibilité de créer un modèle de régression linéaire et d'appliquer ensuite une anova sur ce modèle. Cependant je n'arrive pas à bien comprendre comment l'anova est appliquée lorsque les variables Xi sont continues.

Dans une anova classique, sans tenir compte des interactions, pour déterminer la part de variance expliquée par la variable X1 il faut notamment calculer la différence entre le y moyen et le y_k moyen pour chaque modalité k de X1.

Mais comment généralise-t-on cela au cas continu ?


J'espère avoir été clair. Merci à vous

clemm

Nombre de messages : 7
Date d'inscription : 07/04/2017

Revenir en haut Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Re: Anova appliquée sur un modèle de régression ?

Message par clemm Mer 3 Oct 2018 - 15:17

Bonjour, je me permets de remonter mon sujet.

clemm

Nombre de messages : 7
Date d'inscription : 07/04/2017

Revenir en haut Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Re: Anova appliquée sur un modèle de régression ?

Message par Eric Wajnberg Jeu 4 Oct 2018 - 8:05

Une ANOVA et une régression sont deux déclinaisons du même modèle (que l'on nomme modèle linéaire général). Dans un cas la variable explicative est qualitative, dans l'autre elle est quantitative. Mais la théorie, les équations, les programmes informatiques, etc., sont exactement les mêmes dans les deux cas. Pour répéter, on peut calculer une régression avec un programme qui calcule une ANOVA, et calculer une ANOVA avec un programme qui calcule une régression.

Dans les deux cas, la principe est de décomposer la variance totale de la variable à expliquer, en variance due à la prise en compte de la variable explicative (qualitative ou quantitative) et ce qui reste (variance résiduelle). Et on peut donc, dans les deux cas, présenter les résultats sous forme d'un tableau d'ANOVA (ca ne revient pas à "appliquer ensuite une anova" comme vous dites ; ça revient juste à présenter les résultats sous la forme d'un tableau d'anova).

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Re: Anova appliquée sur un modèle de régression ?

Message par clemm Jeu 4 Oct 2018 - 9:59

Bonjour Eric, merci pour votre réponse. J'ai effectivement employé des formulations erronées et merci de m'avoir corrigé.

Cependant une incompréhension demeure. Sans parler de régression ni d'anova, mais seulement de modèle linéaire avec Y quantitatif ou qualitatif, j'aimerais savoir comment on arrive à calculer la somme des carrés expliquée par un facteur.

Dans le cas discret on n'a aucun mal à présenter une formule de décomposition de la variance par facteur, avec :

regression - Anova appliquée sur un modèle de régression ? Explai12

Dans le cas continu, en passant par l'estimateur des moindres carrés, le calcul de la somme des carrés expliqués par l'ensemble des variables explicatives est le suivant :

regression - Anova appliquée sur un modèle de régression ? Explai13

mais je ne trouve pas comment on décompose ensuite cette somme pour déterminer la variance expliquée par un facteur en particulier. En effet la formule du cas discret ne fonctionne plus ici car nous n'avons plus un facteur divisé en p modalités.

Quelle serait donc la formule générale de décomposition de la variance pour l'une des variables explicatives ? Est-ce simplement la SSE de la régression linéaire simple associée à cette variable ? Mais est-ce qu'en sommant les SSE de chaque facteur on retombera ensuite sur la variance totale expliquée par le modèle multiple ? Est-ce là où les différents types d'Anova (I, II, III) interviennent et donnent des réponses différentes ? Ca fait beaucoup de questions, mais elles me sont venues au fur et à mesure Laughing

clemm

Nombre de messages : 7
Date d'inscription : 07/04/2017

Revenir en haut Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Re: Anova appliquée sur un modèle de régression ?

Message par Eric Wajnberg Jeu 4 Oct 2018 - 13:15

Une fois encore, les deux cas reviennent au même modèle. En d'autres termes, un ANOVA s'ajuste également par moindres carrés.

Dans le cas d'une ANOVA, l'ajustement se fait sur des dummy variables qui sont des variables continues et transcrivent un facteur originellement exprimé en modalités. Pour un facteur à p modalités, il y a p-1 dummy variables. Dans R, par exemple, on peut récupérer ces variables comme ceci:

Code:
> y=rnorm(15)
> x=gl(3,5,labels=c("a","b","c"))
> summary(aov(y~x))
            Df Sum Sq Mean Sq F value Pr(>F)
x            2  2.535  1.2675   1.302  0.308
Residuals   12 11.685  0.9737              
> model.matrix(y~x)
   (Intercept) xb xc
1            1  0  0
2            1  0  0
3            1  0  0
4            1  0  0
5            1  0  0
6            1  1  0
7            1  1  0
8            1  1  0
9            1  1  0
10           1  1  0
11           1  0  1
12           1  0  1
13           1  0  1
14           1  0  1
15           1  0  1
attr(,"assign")
[1] 0 1 1
attr(,"contrasts")
attr(,"contrasts")$x
[1] "contr.treatment"
Et on se retrouve bien dans un schéma de régression.

Pour le reste de votre question, il faudrait que je me replonge dans mes cours de fac, mais je crois me souvenir que la contribution d'une variable se calcule en positionnant les autres à leur moyennes (mais je n'en suis plus très sûr).

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

regression - Anova appliquée sur un modèle de régression ? Empty Re: Anova appliquée sur un modèle de régression ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum