Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
droopy
 
Pierre-Louis
 
CC_05_2018
 
c@ssoulet
 
DIA
 
laura138
 
Pascalou
 
DocRe
 
oulachzhar
 


intéraction entre variables continues

Aller en bas

intéraction entre variables continues

Message par niaboc le Mar 12 Déc 2017 - 10:32

Bonjour,

dans une régression linéaire, si nous incluons un terme d'intéraction entre deux variables continues, est-il toujours légitime d'interpréter les coefficients des variables seules?

y=c + a*X + b*Y + d*X*Y

a, et b peuvent-il être interprétés seuls? Dans tous les cas?

L'interprétation n'est-elle pas plus aisée si l'on centre les variables au préalable?

Merci

Niaboc
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par c@ssoulet le Mar 12 Déc 2017 - 15:02

Imagine 2 prédicteurs a et b.

Si l'interaction est significative, ca signifie en clair que l'effet de a sur la variable dépendante est influencé par le niveau de b ou inversement (le plus simple est de penser à l'interaction médicamenteuse). Puisque a et b interagissent, estimer a et b sans tenir compte de l'interaction n'a pas vraiment de sens.

=> si tu veux essayer d'estimer l'effet de a et/ou de b "seuls", tu dois donc ajuster sur l'interaction (pour annuler son effet dans la mesure du possible). Donc inclure dans le modèle a, b, et a*b

Si l'interaction est non significative, tu peux ne pas en tenir compte et simplement inclure a et b dans ton modèle. Normalement, dans ce cas, les coeffs de a et de b ne devraient pas trop varier en incluant ou pas l'interaction dans le modèle.

c@ssoulet

Nombre de messages : 799
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par Eric Wajnberg le Mar 12 Déc 2017 - 16:02

C'est comme une ANOVA à deux facteurs avec interaction. Et, de fait, une ANOVA n'est rien d'autre qu'une régression.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 864
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par niaboc le Mar 12 Déc 2017 - 23:49

Ok, merci pour vos réponses.

Et imaginons que l'intéraction soit réelle et se retrouvent dans les résultats de la régression (significativité ok) :

y=2+3*x+2*z+0.5*x*z

peut-on interpréter les coefficient 3 et 2, de la même manière qu'une régression classique?

"si x augmente d'une unité quand z est à 0 alors y augmente de 3".

je me demandais s'il était légitime d'interpréter ces coefficients (3 et 2). Que se passe-t-il si :
- dans nos données, z ne vaut jamais 0?
- z ne vaut jamais 0 lorsque X >0.

Si on centre nos données, est-ce que l'interprétation est plus juste?


puis, j'imagine que mécaniquement x*z sera corrélée à x et à z (même si ces dernières ne sont pas corrélées entre elle, beaucoup plus si elles le sont un peu entre elles), donc n'est-il pas dangereux de vouloir interpréter les coefficients liés à x, z et x*z indépendamment les uns des autres?

Et là encore, en centrant les données et en reprenant la formule de la corrélation linéaire entre deux variables, il me semble que la corrélation entre x et z*x et z et x*z est nulle (si je n'ai pas fait d'erreur de raisonnement) et là encore ça aiderait peut-être à l'interprétation de l'ensemble des coefficients de notre modèle?

Niaboc
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par Eric Wajnberg le Mer 13 Déc 2017 - 5:38

Centrer les données ne change rien. C'est juste une translation.

Par ailleurs, oui, les interprétations sont comme dans une régression classique. D'ailleurs, c'est une régression classique dont nous parlons ici.

Enfin, les questions concernant la validité de tout ceci, "si z ne vaut jamais 0", sont comme une "régression classique" (justement) pour ce qui est de l'interpolation. Dans une régression linéaire simple (j'imagine que c'est ce que vous appelez "régression classique"), on calcule par exemple une ordonnée à l'origine, même si x peut ne jamais valoir zéro. Les précautions d'interprétation sont les mêmes, et - de fait - on est exactement dans le même type de modèle.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 864
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par niaboc le Mer 13 Déc 2017 - 9:17

OK
Un exemple concret auquel je pensais pourrait être un cas comme celui-ci :

y= Cste + 0.5*x + 2*z -1.5(x*z)
<=> y = Cste + (0.5-1.5*z)*x + 2*z

si le min(z)=1, alors une unité supplémentaire de x fait toujours diminuer y ; alors que si nous regardons seulement le coefficient 0.5 on dit l'inverse. C'est pour ça que je pensais qu'il n'était pas juste d'analyser ce coefficient 0.5 tout seul...

Mais ceci rentre dans "les précautions d'interprétation" j'imagine. Centrer les variables ne changent rien à la régression (et heureusement :-) ), mais je pensais que ça pouvait réduire les erreurs d'interprétation et dans ce sens, que l'interprétation du coefficient "seul" pouvait être plus légitime.
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par c@ssoulet le Mer 13 Déc 2017 - 9:38

Je ne vois pas ce qui choque. Dans ton exemple, la valeur de y augmentera de 0.5 chaque fois que x augmentera de 1 unité, en valeur ajustee sur tous les autres prédicteurs (z et x*z)

c@ssoulet

Nombre de messages : 799
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par niaboc le Mer 13 Déc 2017 - 9:43

Ben comme nous avons y = Cste + (0.5-1.5*z)*x + 2*z

si tu augmentes x d'une unité, alors (sachant que min(z)=1), nous avons y qui diminue d'au moins 1.
Je ne vois pas trop ce que tu veux dire par "en valeur ajustée sur tous les autres prédicteurs (z et x*z), mais si tu entends par là "toutes choses égales par ailleurs", ici tu ne peux pas le faire sachant que si x augmente d'une unité, x*z augmente forcément de z unités, non?
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par c@ssoulet le Mer 13 Déc 2017 - 12:26

je ne comprends pas ton raisonnement.

Si tu prends ton modèle de régression
y= Cste + 0.5*x + 2*z -1.5(x*z)

tu modélises un nuage de points dans un espace à 4 dimensions (y, x, z, et x*z) et tu traces ta droite de régression dans cet espace, certes pas facile à imaginer concrètement. Donc grosso-modo tu moyennes les variations simultanées de y, x, z et x*z dans un espace à 4 dimensions.

Si tu t'intéresses simplement à ton coeff 0.5 et ta variable dépendante (y), tout se passe comme si tu "projetais" cette droite sur un espace à 2 dimensions (x et y). Dans cet espace à 2 dimensions, si x augmente de 1 unité, y augmente de 0.5 unités. Autrement dit: une augmentation de x de 1 unité entraine une augmentation moyenne de y de 0.5 unités, toutes autres choses égales par ailleurs

si tu t'intéresses au coeff -1.5, tu projettes la droite de régression sur un autre espace à 2 dimensions (y, x*z) dans lequel toute augmentation de une unité de l'interaction se traduit par une diminution moyenne de y de 1.5 unités, toutes autres choses égales par ailleurs.

C'est comme si tu projetais ta droite de régression dans l'espace à 4 dimensions avec un spot sur un écran à 2 dimensions. Selon le coeff que tu regardes, tu bouges l'orientation du spot et de l'écran

C'est le principe même de la régression multiple. Je ne vois pas ce qui te semble illogique.

c@ssoulet

Nombre de messages : 799
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par niaboc le Mer 13 Déc 2017 - 13:00

c@ssoulet a écrit:
Si tu t'intéresses simplement à ton coeff 0.5 et ta variable dépendante (y), tout se passe comme si tu "projetais" cette droite sur un espace à 2 dimensions (x et y). Dans cet espace à 2 dimensions, si x augmente de 1 unité, y augmente de 0.5 unités. Autrement dit: une augmentation de x de 1 unité entraine une augmentation moyenne de y de 0.5 unités, toutes autres choses égales par ailleurs

Ce qui me semble illogique est le "toutes choses égales par ailleurs"... comment peux-tu considérer que x*z ne varie pas si tu dis d'un autre côté que x augmente d'une unité?
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par c@ssoulet le Mer 13 Déc 2017 - 15:25

C'est pas vraiment que x*z ne varie pas. C'est difficile d'expliquer ca en langage clair.

Quand tu définis l'équation de ta droite de régression dans l'espace à 4 dimensions, tu vas la faire passer par la trajectoire qui minimise les écarts des variations simultanées de l'ensemble des prédicteurs. Donc tu vas en quelque sorte faire passer ta droite par une trajectoire qui minimise l'effet simultané (qui moyenne l'effet...) de l'ensemble des covariables.

Une fois que c'est fait, cette droite ne bouge plus. L'effet de l'ensemble des covariables est déjà pris en compte, et le sera toujours. Quand tu choisis de braquer ton spot de telle façon que tu projettes cette droite sur l'espace x y, l'image de la droite que tu vois sur l'écran intègre déjà les variations des autres covariables (que tu ne vois pas sur l'écran, mais qui ont déjà "bougé" ta droite dans un sens ou dans l'autre)

Donc la pente de x (0.5) représente en quelque sorte la VARIATION MOYENNE de y ajustée sur les VARIATIONS MOYENNES de l'ensemble des autres prédicteurs introduits dans le modèle.

Ca ne veut pas dire que les autres prédicteurs ne varient pas, ca veut plutôt dire que le modèle, quand tu le regardes sous cet angle, "tient compte" ou "annule l'effet moyen" des variations simultanées des autres prédicteurs. Annuler l'effet, ca ne veut pas dire empêcher la variation. Ca veut dire "tenir compte de la variation". Si x*y ne variait pas, ca serait une constante.

c@ssoulet

Nombre de messages : 799
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par droopy le Jeu 14 Déc 2017 - 14:17

Bonjour,

Dans le cas d'une interaction je ne pense pas qu'on puisse raisonner de la même manière qu'avec des effets additifs simples des variables parce que comme le souligne niaboc, la pente de la relation entre y et x par exemple dépend forcément de la valeur de z et vice et versa.

Dans un cas ou z = 0 si on regarde ce qui se passe entre y et x, on aura y ~ 3x. Mais si z = 10, alors on aura y ~ 8x. Ce qui n'est pas du tout la même chose.

D'où le genre de représentations préconisées par Fox :
Code:
library(effects)
tab <- expand.grid(x = seq(0, 10, by = .25), z = seq(0, 10, by = .25))
tab$y <- with(tab, 2 + 3*x + 2*z + 6*x*z + rnorm(nrow(tab), 0, 0.25))
lm1 <- lm(y ~ x + z + x:z, data = tab)
plot(allEffects(lm1))
Cdlt
avatar
droopy

Nombre de messages : 1093
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par niaboc le Jeu 14 Déc 2017 - 14:24

Salut,

N'ayant pas accès au logiciel R, tu pourrais joindre le résultat de ton code pour voir ce que ça donne?

Merci!

Niaboc
avatar
niaboc

Nombre de messages : 944
Age : 31
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par droopy le Ven 15 Déc 2017 - 7:54

Voila ce que ça donne.

C'est très parlant aussi si tu traces le plan générer par x et z en 3d.


cdlt
avatar
droopy

Nombre de messages : 1093
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par c@ssoulet le Ven 15 Déc 2017 - 11:13

C'est évident que quand on visualise l'effet de l'interaction il peut être très spectaculaire. En revenant au réel un peu caricatural, si tu donnes x seul tu soignes, y seul ça fait rien et si tu donnes x+y tu envoies en réa. C'est rassurant de constater que cet effet est immanquable lorsque tu le regardes mathematiquement.
Exprimé autrement, si tu as un modèle avec interaction tres significative et que tu cherches à visualiser le seul effet de x, l'effet de l'interaction peut considérablement peser sur l'estimation de x.
Exprimé encore autrement, si tu veux mesurer le seul effet de x, le plus simple et le plus précis est de jouer sur la méthodo: injecter x seul, y seul et x+y. La tu vois tout.

c@ssoulet

Nombre de messages : 799
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par droopy le Ven 15 Déc 2017 - 14:50

Quelques éléments supplémentaires de discussion trouvés dans le livre "Applied Linear Statistical Model" 4th edition, Netter et al.

Page 309 concernant l'interprétation des coefficients de la régressions.
Il pose l'exemple suivant :


Je cite :
Neter et al. a écrit:The meaning of the regression coefficients beta1 and beta2 here is not the same as that given earlier (pour modèle additif) because of the interaction term beta3X1X2. The regression coefficients beta1 and beta2 no longer indicate the chage in the mean response with a unit increase of the predictor variable, with the other variable held constant at any given level ...
Hence, in regression model (avec interaction) both the effect of X1 for given level of X2 and the effect of X2 for given level of X1 depend on the level of the other predictor variable

cdlt
avatar
droopy

Nombre de messages : 1093
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: intéraction entre variables continues

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum