Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Transformation de BOX-COX
3 participants
Page 1 sur 1
Transformation de BOX-COX
Bonsoir,
J'ai trouvé un article intéressant sur la transformation de box-cox: https://www.minitab.com/fr-fr/Published-Articles/En-quoi-la-transformation-Box-Cox-peut-vous-%C3%AAtre-utile/
Et je me demandais si je pouvais l'utiliser pour réaliser ensuite une anova, ma variable est vraiment similaire à celle de l'article (proche d'une distribution gamma, gaussienne inverse, log normale) ?
Merci
J'ai trouvé un article intéressant sur la transformation de box-cox: https://www.minitab.com/fr-fr/Published-Articles/En-quoi-la-transformation-Box-Cox-peut-vous-%C3%AAtre-utile/
Et je me demandais si je pouvais l'utiliser pour réaliser ensuite une anova, ma variable est vraiment similaire à celle de l'article (proche d'une distribution gamma, gaussienne inverse, log normale) ?
Merci
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Transformation de BOX-COX
Bonjour,
Pour avoir utilisé et analysé l'intérêt de cette méthode, je dois te prévenir qu'il faut la prendre avec des pincettes.
La transformation Box-Cox marche avec le maximum de vraisemblance, elle va te donner un intervalle des transformations qui transformeront le mieux ta variable afin d'avoir une variable Gaussienne en aval.
Le maximum de vraisemblance va comparer plusieurs transformations de ta variable (Normale, Log-Normale, Racine, ...) avec une loi gaussienne et te dire quelles sont les transformations qui se rapprochent le plus de ta variable.
Il faut faire attention tout d'abord à ta taille d'échantillon qui peut te faire ressortir n'importe quelle transformation et au final la transformation ne marchera pas si tu la relances sur un autre échantillon issu de la même population.
Le Box-Cox ne te trouvera pas à tous les coups (je dirais même rarement sur les petits échantillons) la distribution d'où proviennent les données que tu as.
L'intervalle du paramètre lambda du Box-Cox (lambda détermine la transformation qu'il faut choisir) peut parfois être assez flou, tu auras ton lambda avec le maximum de vraisemblance mais également plusieurs lambdas de potentiels transformations qui marchent bien pour ta variable donc il faut faire très attention.
Le Box-Cox est souvent utilisé en routine sur plein de variables pour lesquelles on n'a pas le temps de faire une analyse visuelle de la distribution mais lorsqu'on peut prendre la peine de faire une analyse visuelle, il faut prioriser (de préférence sur un les résidus d'un modèle qui explique ta variable) :
- le QQplot
- le graphique des résidus prédits en fonction des observés
- un histogramme
- les valeurs de Skewness et de Kurtosis
Pour avoir utilisé et analysé l'intérêt de cette méthode, je dois te prévenir qu'il faut la prendre avec des pincettes.
La transformation Box-Cox marche avec le maximum de vraisemblance, elle va te donner un intervalle des transformations qui transformeront le mieux ta variable afin d'avoir une variable Gaussienne en aval.
Le maximum de vraisemblance va comparer plusieurs transformations de ta variable (Normale, Log-Normale, Racine, ...) avec une loi gaussienne et te dire quelles sont les transformations qui se rapprochent le plus de ta variable.
Il faut faire attention tout d'abord à ta taille d'échantillon qui peut te faire ressortir n'importe quelle transformation et au final la transformation ne marchera pas si tu la relances sur un autre échantillon issu de la même population.
Le Box-Cox ne te trouvera pas à tous les coups (je dirais même rarement sur les petits échantillons) la distribution d'où proviennent les données que tu as.
L'intervalle du paramètre lambda du Box-Cox (lambda détermine la transformation qu'il faut choisir) peut parfois être assez flou, tu auras ton lambda avec le maximum de vraisemblance mais également plusieurs lambdas de potentiels transformations qui marchent bien pour ta variable donc il faut faire très attention.
Le Box-Cox est souvent utilisé en routine sur plein de variables pour lesquelles on n'a pas le temps de faire une analyse visuelle de la distribution mais lorsqu'on peut prendre la peine de faire une analyse visuelle, il faut prioriser (de préférence sur un les résidus d'un modèle qui explique ta variable) :
- le QQplot
- le graphique des résidus prédits en fonction des observés
- un histogramme
- les valeurs de Skewness et de Kurtosis
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Transformation de BOX-COX
Mon échantillon est assez grand, mes résidus sont gaussiens, j'aimerais connaitre l'influence de chaque variable dans la construction du modèle.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Transformation de BOX-COX
Donc pourquoi vouloir faire du Box-Cox ?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Transformation de BOX-COX
Pour connaitre l'influence de chaque variable dans la construction du modèle.
Bibilerikiki- Nombre de messages : 56
Date d'inscription : 24/06/2017
Re: Transformation de BOX-COX
Box-Cox transformation = avoir une variable transformée qui suit une loi normale =/= connaître l'influence de chaque variable dans un modèle
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Transformation de BOX-COX
Si tes résidus sont gaussiens, tu peux faire une ANOVA (les assomptions sont les mêmes que pour une régression linéaire).
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Sujets similaires
» une transformation R->[0,1]
» Transformation colonne .
» La log-transformation est dangereuse ?
» Transformation: normalité et linéarité
» transformation pour ACP
» Transformation colonne .
» La log-transformation est dangereuse ?
» Transformation: normalité et linéarité
» transformation pour ACP
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum