Normalité_Résidus ou variable

Voir le sujet précédent Voir le sujet suivant Aller en bas

Normalité_Résidus ou variable

Message par CupOfAppleTea le Mar 29 Jan 2013 - 10:01

Bonjour,
Je me mélange un peu les pédales. Aussi j'aurais voulu savoir dans quels cas (i.e. pour quels tests) la normalité et l'homoscédasticité doivent être vérifiée sur les données brutes ou sur les résidus (obtenus après le-dit test).
Si je ne me trompe pas, pour tout ce qui est ANOVA (et donc régression) tout ceci doit être vérifié sur les résidus.

Merci pour votre aide!

CupOfAppleTea

Nombre de messages : 28
Date d'inscription : 14/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par gg le Mar 29 Jan 2013 - 12:22

Bonjour.

Je ne sais pas ce que tu appelles "résidus" pour l'anova. Je connais la notion pour les analyses de régression, mais pas pour un test.
Sinon, la normalité et l'homoscédasticité sont des hypothèses de base pour l'Anova. La normalité peut souvent être oubliée si on a des données nombreuses (tailles d'échantillons supérieures à 10 ou 15), car le test est robuste. Le fait que les variances soient très différentes est plus gênant, ne serait-ce que parce qu'il va rendre le test peu discriminatoire (faible puissance).

Sinon, pour la question globale du début, elle me semble trop globale pour être très utile.

Autre chose : La normalité est souvent une hypothèse, mais c'est la normalité de la population, pas la réussite ou l'échec d'un test sur l'échantillon qui est utile. Il y a souvent de bonnes raisons de pouvoir l'affirmer (retour d'expérience ou application des théorèmes centraux limite), ce qui est bien plus satisfaisant qu'une réussite d'un test de normalité (ce qui ne prouve rien !!!).

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par CupOfAppleTea le Mar 29 Jan 2013 - 13:37

Bonjour,
Ce que j'appelle "résidus", c'est l'erreur renvoyée par l'anova (ou "Residuals" dans R). De toute manière, si je ne me trompe pas la différence est mince entre régression et anova.

Je comprends bien qu'il ne faut pas aveuglément suivre les résultats que nous donnent les tests et faire preuve d'un minimum d'esprit critique, les cas particuliers sont en effet légions en statistiques. J'aurais peut-être du poser ma question comme cela :

Existe-t'il des cas où la normalité et l'homoscédasticité doivent être vérifiées sur la variable directement plutôt que sur les résidus (obtenus après réalisation du test)?

Bien cordialement,

CupOfAppleTea

Nombre de messages : 28
Date d'inscription : 14/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par gg le Mar 29 Jan 2013 - 15:41

Désolé,

mais je crains que tu mélanges diverses notions sans rapport :

"si je ne me trompe pas la différence est mince entre régression et anova." ???
L'analyse de régression est la fabrication d'un modèle. On peut ensuite tester la validité du modèle (entre autre sur les résidus) mais ce n'est plus la régression. Et ça n'a rien à voir avec l'anova qui est un test de comparaison d'échantillon par l'intermédiaire des variances.

Dans l'Anova, "résiduals" ne désigne à priori pas une "erreur", mais plus probablement la somme de carrés résiduelle. N'utilisant pas R, je n'en sais pas plus. mais tu ferais bien d'examiner sérieusement la méthode d'analyse de la variance (et, par ailleurs, le méthodes de régression.

Sinon, à ta nouvelle question : "Existe-t'il des cas où la normalité et l'homoscédasticité doivent être vérifiées sur la variable directement plutôt que sur les résidus (obtenus après réalisation du test)?" la réponse est oui. Et l'Anova est un exemple. D'autant qu'il n'y a pas de résidus Very Happy

Cordialement.

gg

Nombre de messages : 1775
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par droopy le Mar 29 Jan 2013 - 15:58

Bonjour,

si je ne me trompe pas la différence est mince entre régression et anova." ???
L'analyse de régression est la fabrication d'un modèle. On peut ensuite tester la validité du modèle (entre autre sur les résidus) mais ce n'est plus la régression. Et ça n'a rien à voir avec l'anova qui est un test de comparaison d'échantillon par l'intermédiaire des variances.
je ne partage pas ce point de vue.

Regression et anova sont toutes deux des modèles linéaires et sont donc assez semblables et avec les mêmes hypothèses.
Dans le cas de la regression tu as un modèle de la forme :
y ~ a + bX + e avec e l'erreur qui est approximée par les résidus et qui est censé suivre une loi normale de paramètre 0 et sigma²

Dans le cas de l'anova alors tu as :
y ~ a + biXi + e ou Xi est une variable indicatrice et bi sont coefficients associées. Il y a une indicatrice de mois que de catégories de la variable qualitative.

Dans les deux cas, l'homoscédasticité doit-être vérifié, variance des résidus invariantes le long des valeurs prédites pour la régression linéaire, et variance équivalente entre les niveaux de ton facteur pour l'anova. La normalité est aussi celle sur l'erreur, approximé par les résidus.

par contre comme la dit gg, souvent la question de la normalité est moins gênante que l'homoscédasticité.

Cordialement

droopy

Nombre de messages : 986
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par CupOfAppleTea le Mar 29 Jan 2013 - 16:09

Bonjour,
J'aurais aimé pouvoir le dire avec autant de clarté!

Le fait que normalité et homoscédasticité soient vérifiées sur les résidus découle-t-il du fait que les p-values sont calculées à partir des F-value elles-mêmes calculées à partir des résidus?

Dans ce cas, on se fiche totalement des données brutes puisque tout ce qui compte c'est que les résidus du modèle (pour la régression et pour l'anova) suivent une loi normal et respectent la condition d'homoscédasticité puisque c'est sur leur base que les tests de significativités seront effectués pour chacune des variables(tests qui nécessitent le respect de ces conditions)
--> Si ces conditions ne sont pas respectées, les résultats de l'anova ou de la régression ne peuvent être interprétés.
Fais-je fausse route? Smile

Merci d'avance pour toutes ces informations,

CupOfAppleTea

Nombre de messages : 28
Date d'inscription : 14/12/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par Nik le Mar 29 Jan 2013 - 16:42

Salut,

je suis plutôt d'accord avec droopy quand on replace l'ANOVA dans le cadre du modèle linéaire et pas dans le cadre du test du même nom où on considère un ratio de SCE. Pour moi c'est beaucoup plus simple de considérer l'ANOVA comme un cas particulire de régression linéaire où la variable prédictive est une variable qualitative. Ceci étant dit,

Le fait que normalité et homoscédasticité soient vérifiées sur les résidus découle-t-il du fait que les p-values sont calculées à partir des F-value elles-mêmes calculées à partir des résidus?
non. normalité et homoscédasticité des résidus garantissent la qualité des estimateurs des paramètres du modèle. Dans une régression on est pas du tout sur un test d'hypothèse et le but visé n'est pas une p-value regardée par rapport à un seuil donné mais bien une estimation de paramètres.

Nik

Nombre de messages : 1501
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Normalité_Résidus ou variable

Message par Contenu sponsorisé Aujourd'hui à 20:23


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum