Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
La Multicolinarité dans les modèles de regression multiple
2 participants
Page 1 sur 1
La Multicolinarité dans les modèles de regression multiple
Bonjour, étant en stage, je travaille sur un jeu de données Insee. Ces données ont la particularité d’être fortement corrélées entre elle.
Je voudrais savoir dans le cadre d’une modélisation par régression multiple.
Quels sont les effets néfastes de la multicolinarité ou peut-on l'accepté dans un modèle sur "jeu de données entreprise"?
Existe-il des transformations capable de corrigées les liaisons des variables entre elles.
Par exemple : transformer une variable quantitative en plusieurs variables dummy permettant de garder l’information des variables.
Merci d’avance pour vos réponses
Cdt
Je voudrais savoir dans le cadre d’une modélisation par régression multiple.
Quels sont les effets néfastes de la multicolinarité ou peut-on l'accepté dans un modèle sur "jeu de données entreprise"?
Existe-il des transformations capable de corrigées les liaisons des variables entre elles.
Par exemple : transformer une variable quantitative en plusieurs variables dummy permettant de garder l’information des variables.
Merci d’avance pour vos réponses
Cdt
LSL- Nombre de messages : 1
Date d'inscription : 24/07/2008
Re: La Multicolinarité dans les modèles de regression multiple
Voici un très bon document dont une bonne partie traite la colinéarité :
http://eric.univ-lyon2.fr/~ricco/cours/cours/La_regression_dans_la_pratique.pdf
bon courage
http://eric.univ-lyon2.fr/~ricco/cours/cours/La_regression_dans_la_pratique.pdf
bon courage
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: La Multicolinarité dans les modèles de regression multiple
la multicolinéarité en régression multiple c'est une des principales sources de confusions. Elle peut conduire à une mauvaise estimation des paramètres et peut aussi conduire à modifier les conclusions des tests associés à la régression multiple.
Pour "corriger" les corrélations des variables entre elles tu ne peux rien faire directement sur les variables. Si elles sont corrélées a priori elles le resteront. Passé en quantitatif des variables continues ne me semble jamais la bonne idée, mais ce n'est qu'un a priori personnel.
Sinon tu peux inclure tes variables dans une ACP récupéré les axes et faire ta régression multiple sur ces axes.
Sinon tu peux aussi t'orienter vers la PLS.
Tout dépend de ce que tu cherches à faire.
micros
Pour "corriger" les corrélations des variables entre elles tu ne peux rien faire directement sur les variables. Si elles sont corrélées a priori elles le resteront. Passé en quantitatif des variables continues ne me semble jamais la bonne idée, mais ce n'est qu'un a priori personnel.
Sinon tu peux inclure tes variables dans une ACP récupéré les axes et faire ta régression multiple sur ces axes.
Sinon tu peux aussi t'orienter vers la PLS.
Tout dépend de ce que tu cherches à faire.
micros
Invité- Invité
Sujets similaires
» régression multiple
» régression multiple
» régression multiple et régression logistique
» Regression: modèles significatifs, mais prédicteurs non!
» Comparaison de modèles de régression logistique NON emboités
» régression multiple
» régression multiple et régression logistique
» Regression: modèles significatifs, mais prédicteurs non!
» Comparaison de modèles de régression logistique NON emboités
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum