Les posteurs les plus actifs de la semaine
joyeux_lapin13
 
zeu
 
gg
 
schlebe
 
zezima
 
Yacouba_KONE
 
rayanes159
 
noviceST
 
Eric Wajnberg
 
Nik
 


Régression linéaire multiple

Voir le sujet précédent Voir le sujet suivant Aller en bas

Régression linéaire multiple

Message par MG le Jeu 28 Juin 2012 - 10:32

Salut tout le monde,

Besoin d'un petit éclairecissement éclaircissement. Voilà je cherche à expliquer une certaine variable par un ensemble d'autres variables dans le but de trouver un bon modèle qui ajuste bien mes données. J'ai donc pensé au modèle linéaire multiple et grâce à la méthode Backward, j'ai enlever au fur et à mesure les variables non significatives au risque de 5%.

Cependant le modèle de fin obtenu seulement avec des variables toutes significatives au risque de 5% me donne un R2= 0.1977 ( mauvais R2)
et l'étude des résidus (test de Shapiro Wilk) montre qu'ils ne sont pas distribués normalement.

Malgrè cela, est ce justifié de considérer ce modèle pour ajuster mes données et aussi est ce justifié de construire du coup des intervalles de confiance non normaux.

Je vous remercie d'avance d'avoir lu mon post et pour votre réponse.

MG

MG

Nombre de messages : 10
Date d'inscription : 22/06/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Régression linéaire multiple

Message par droopy le Jeu 28 Juin 2012 - 15:19

La sélection de variable est champ statistique très vaste et controversée. En général les méthodes de type backward, forward et stepwise sont plutôt utilisées avec des critères comme l'AIC plutôt que le R². Il te faut savoir que quelque soit la méthode utilisée, parmi les 3 citées, elles présentent toutes des biais dans la sélection des variables. Une méthode serait d'estimer des modèles à partir de différentes hypothèses a priori et de les confronter.

Pour les résidus, il te faut regarder comment ceux-ci sont distribués le long des valeurs prédites. Est-ce que tu observes un biais systématique, est-ce que la valeur des résidus augmentent ou diminuent le long des valeurs prédites (hétéroscédasticité), etc. C'est une étape obligatoire avant de pouvoir répondre à ta question.

droopy

Nombre de messages : 985
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum