Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -50%
-50% sur les sacs à dos pour ordinateur ...
Voir le deal
19.99 €

Anova // Regression linéaire : problème

Aller en bas

linéaire - Anova // Regression linéaire : problème Empty Anova // Regression linéaire : problème

Message par Lill0is59 Jeu 19 Juil 2012 - 13:40

Bonjour,

Je suis actuellement en train de préparer mon mémoire de fin d'étude mais j'ai un problème avec le traitement de mes données.
Voici ma situation : j'ai une donnée quantitative à expliquer (la rentabilité d'un système notée Rent) et une série de variables explicatives (secteur, UA, th et Cl) qui sont toutes des données qualitatives ayant entre 2 et 10 modalités.
Je dois chercher à montrer le lien entre ma variable à expliquer et les variables explicatives.
On m'a conseillé de faire une ANOVA sur ce type de données afin de montrer l'impact de secteur, UA, th et Cl sur Rent.
Le problème est que l'Anova ne me permet pas de savoir quelle modalité dans chaque variable a un véritable impact (en effet il est intéressant de savoir si l'UA à un impact mais il est encore plus intéressant de savoir que c'est la modalité 4 de l'UA qui a le véritable impact).
Cependant je n'arrive pas à savoir comme faire pour voir l'impact de chaque modalité sur ma rentabilité ?!
On m'a conseillé de faire une régression linéaire cependant quand je fait ma régression, celle-ci fait "disparaître" une modalité de chaque variable explicative et je ne peux donc pas connaitre la significativité de cette modalité (qui malheureusement parfois est une modalité importante...).

Je mets ci-dessous mes résultats sur R pour que ça parle plus :

Code:
> LinMod2 <- lm(Rent~Th+UA+Cl+Secteur,data=EI)
> Anova(LinMod2)
Anova Table (Type II tests)

Response: CatCC
          Sum Sq  Df F value    Pr(>F)   
Th          0.57  3  0.0862  0.96756   
UA          68.20  3 10.3552 1.203e-06 *** 
Cl      79.47  1 36.2001 3.168e-09 ***
Secteur    53.00  25  0.9656  0.51262   
Residuals 1264.55 576                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Grâce à ça je sais que UA et Cl ont un impact sur ma rentabilité, je cherche à savoir exactement quelle modalité dans UA et Cl ont un impact, je fais donc une régression linéaire :


Code:
summary(LinMod2)

Call:
lm(formula = CatCC ~ Th + UA + Marche + Age2 + Client + Secteur,
    data = EI)

Residuals:
    Min      1Q  Median      3Q    Max
-3.5249 -1.1178 -0.1825  1.2313  3.2859

Coefficients:
                                Estimate Std. Error t value Pr(>|t|)   
(Intercept)                    -1.98637    1.55207  -1.280  0.2011   
Th1                    -0.08427    0.34606  -0.244  0.8077   
Th2                    -0.03062    0.35412  -0.086  0.9311   
Th3                    -0.12079    0.30226  -0.400  0.6896   
UA1                    -2.00613    1.52218  -1.318  0.1881   
UA2              -2.26354    1.51904  -1.490  0.1367   
UA3              -1.23718    1.51285  -0.818  0.4138   
ClOui                        0.80258    0.13339  6.017 3.17e-09 ***
SecteurSEC 1            3.36645    1.52312  2.210  0.0275 * 
SecteurSEC 2          3.46746    1.59092  2.180  0.0297 * 
SecteurSEC 3        3.55219    1.52968  2.322  0.0206 * 
 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Mon problème est que normalement j'ai 4 UA et de plus dans ma régression aucune ne semble significative alors que dans mon Anova si.

Quelqu'un pourrait-il m'aider à comprendre comment faire apparaître la dernière modalité à chaque fois? ou me donner une autre méthode?

Un grand merci d'avance!


Dernière édition par A.D. le Ven 20 Juil 2012 - 9:59, édité 2 fois (Raison : balises "code")

Lill0is59

Nombre de messages : 3
Date d'inscription : 19/07/2012

Revenir en haut Aller en bas

linéaire - Anova // Regression linéaire : problème Empty Re: Anova // Regression linéaire : problème

Message par Invité Jeu 19 Juil 2012 - 15:58

Concernant le fait qu'une des modalités ne soit pas affichées, par défaut je crois que la modalité non présentée est égale à 0, et les valeurs des modalités restantes calculées par rapport à cette modalité référence.
Ceci à moins que tu aies défini par avance un paramètre (somme des modalités = 0) mais ça n'a pas l'air d'être le cas).

Concernant la méthodologie... Aie, Anova et régression sur les mêmes variables?
Outre le soucis de R, je trouve déjà ça un peu étrange... L'Anova est une bonne option, mais la régression ne s'applique pas à tes données à mon avis...

Invité
Invité


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum