Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Analyse de variance quand les ho d'application non vérifiées
5 participants
Page 1 sur 1
Analyse de variance quand les ho d'application non vérifiées
Bonjour,
j'ai une variable continue que je voudrais expliquer par des variables classes, la méthose statistique à utiliser est l'analyse de variance.
cette méthode se base d'abord sur deux hypothèses : la normalité de la distribution de la variable à expliquer dans chaque classe de la variable catégorielle, et l'égalité des variances également entre les classes
Or, sur mon exemple, la variable à expliquer n'a pas une distribution normale pour toutes les variables catégorielles (sur les classes de ces variables bien évidemment), je dois faire quoi dans ce cas, arreter l'analyse et dire c'est impossible de faire de l'analyse de variance???? (dans ce cas aucun travail ne peut être fait)
Ou bien faire l'anova et sortir des déduction qui risquent d'être tout à fait aberrantes?????
merci bien pour vos lumières
j'ai une variable continue que je voudrais expliquer par des variables classes, la méthose statistique à utiliser est l'analyse de variance.
cette méthode se base d'abord sur deux hypothèses : la normalité de la distribution de la variable à expliquer dans chaque classe de la variable catégorielle, et l'égalité des variances également entre les classes
Or, sur mon exemple, la variable à expliquer n'a pas une distribution normale pour toutes les variables catégorielles (sur les classes de ces variables bien évidemment), je dois faire quoi dans ce cas, arreter l'analyse et dire c'est impossible de faire de l'analyse de variance???? (dans ce cas aucun travail ne peut être fait)
Ou bien faire l'anova et sortir des déduction qui risquent d'être tout à fait aberrantes?????
merci bien pour vos lumières
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: Analyse de variance quand les ho d'application non vérifiées
en fait l'anova est relativement robuste à la non normalité des données mais pas à l'hétéroscédasticité. Donc si tes distributions ne s'éloignent pas trop de la loi normale ne te prends pas la tête.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
ANOVA de Kruskal-Wallis ou ANOVA de Friedman
Bonjour tout le monde,
merci bien droopy pour la réponse (par contre je n'ai pas encore vérifié l'égalité des variances)
donc ce que tu dis droopy : si la noramalité n'est pas vérifiée c'est pas très grave, or ce qui est plus gênant c'est l'égalité des varainces????
D'autre part, je trouve sur wikipédia ce passage :
La forme générale de l'analyse de variance repose sur le test de Fisher et donc sur la normalité des distributions et l'indépendance des échantillons.
*Normalité de la distribution : on suppose, sous l'hypothèse nulle, que les échantillons sont issus d'une même population et suivent une loi normale. Il est donc nécessaire de vérifier la normalité des distributions et l'homoscédasticité (homogénéité des variances, par des tests de Bartlett ou de Levene par exemple). Dans le cas contraire, on pourra utiliser les variantes non paramétriques de l'analyse de variance (ANOVA de Kruskal-Wallis ou ANOVA de Friedman).
Quelqu'un peut-il m'expliquer l'anova de Kruskal-Wallis ou l'Anova de Friedman et le code SAS correspondant?
merci infiniment pour vos lumières
merci bien droopy pour la réponse (par contre je n'ai pas encore vérifié l'égalité des variances)
donc ce que tu dis droopy : si la noramalité n'est pas vérifiée c'est pas très grave, or ce qui est plus gênant c'est l'égalité des varainces????
D'autre part, je trouve sur wikipédia ce passage :
La forme générale de l'analyse de variance repose sur le test de Fisher et donc sur la normalité des distributions et l'indépendance des échantillons.
*Normalité de la distribution : on suppose, sous l'hypothèse nulle, que les échantillons sont issus d'une même population et suivent une loi normale. Il est donc nécessaire de vérifier la normalité des distributions et l'homoscédasticité (homogénéité des variances, par des tests de Bartlett ou de Levene par exemple). Dans le cas contraire, on pourra utiliser les variantes non paramétriques de l'analyse de variance (ANOVA de Kruskal-Wallis ou ANOVA de Friedman).
Quelqu'un peut-il m'expliquer l'anova de Kruskal-Wallis ou l'Anova de Friedman et le code SAS correspondant?
merci infiniment pour vos lumières
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
ANOVA de Kruskal-Wallis ou ANOVA de Friedman
Bonjour,
merci droopy pour la rapidité de ta réponse, donc si je comprend bien, tu dis que quand la normalité n'est pas vériviée ce n'est pas très grave, ce qui est plus genant c'est si l'égalité des variances n'est pas vérifiée?????
donc on peut appliquer l'anova quand la normalité n'est pas vérifiée mais l'égalité des variances doit etre vérifiée???
D'autre part, je trouve sur wikipédia ce passage :
La forme générale de l'analyse de variance repose sur le test de Fisher et donc sur la normalité des distributions et l'indépendance des échantillons.
Quelqu'un peut il m'expliquer ANOVA de Kruskal-Wallis ou ANOVA de Friedman???? (éventuellement le code sas correspondant???)
merci pour vos lumières
merci droopy pour la rapidité de ta réponse, donc si je comprend bien, tu dis que quand la normalité n'est pas vériviée ce n'est pas très grave, ce qui est plus genant c'est si l'égalité des variances n'est pas vérifiée?????
donc on peut appliquer l'anova quand la normalité n'est pas vérifiée mais l'égalité des variances doit etre vérifiée???
D'autre part, je trouve sur wikipédia ce passage :
La forme générale de l'analyse de variance repose sur le test de Fisher et donc sur la normalité des distributions et l'indépendance des échantillons.
- Normalité de la distribution : on suppose, sous l'hypothèse nulle, que les échantillons sont issus d'une même population et suivent une loi normale. Il est donc nécessaire de vérifier la normalité des distributions et l'homoscédasticité (homogénéité des variances, par des tests de Bartlett ou de Levene par exemple). Dans le cas contraire, on pourra utiliser les variantes non paramétriques de l'analyse de variance (ANOVA de Kruskal-Wallis ou ANOVA de Friedman).
Quelqu'un peut il m'expliquer ANOVA de Kruskal-Wallis ou ANOVA de Friedman???? (éventuellement le code sas correspondant???)
merci pour vos lumières
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: Analyse de variance quand les ho d'application non vérifiées
Bonjour, alors je connais rien en ANOVA... ce qui est une absurdité étant donné que 70% des questions de ce forum sont sur cette méthode de prédiction, mais néanmoins j'ai déjà fait récemment des test de K-W et la proc sous SAS est N1PARWAY (pas de jeux de mot c'est texto ça), pour le reste je te conseil de t'orienter vers la doc du support SAS, histoire d'être sur que je ne t'ai pas dit n'importe quoi.
Enfin le test de K-W est, par déduction, l'alternative à certain tests de l'ANOVA étant donné qu'il est non paramétrique et donc se base sur le rang de tes données.
En espérant avoir pu t'aider.
Enfin le test de K-W est, par déduction, l'alternative à certain tests de l'ANOVA étant donné qu'il est non paramétrique et donc se base sur le rang de tes données.
En espérant avoir pu t'aider.
Re: Analyse de variance quand les ho d'application non vérifiées
ce que je dis c'est qu'effectivement la normalité des données est une des hypothèses sous-jacentes à l'anova, mais que cette analyse est relativement robuste à l violation de cette hypothèse (issus de mes cours et de la lecture de qq bouquins sur les modèles linéaires). Par conséquent si tes données ne s'éloignent pas top d'une loi normale tu peux pratiqué l'anova sans trop de soucis quand aux conclusions issus de ton analyse. Par contre l'hypothèse de l'égalité elle est fondamentale. Si elle n'est pas vérifiée alors les conclusions issues de l'anova n'ont pas de sens. Le test de kriskal wallis est l'équivalent non paramétrique de l'anova. Tu n'as donc plus ces hypothèses de normalité ni d'homoscédasticité mais tu perds en info puisque tu utilises des rangs.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
enrichissement de l'information
Bonjour,
dans un but d'enrichir la réponse appaortée par droopy (je te remercie bien droopy), voilà ce que j'ai trouvé dans des grands travaux de stat :
"The assumption of normality is needed for the F-tests;Experience has shown that the F-tests are not adversely affected by minor deviation from normality in the distribution of the residuals.But even though the F-tests have been found to be robust in this sense ,one should still examine the distribution of the residuals.one should watch for skewness and single values that lie far away from the rest of the data.for the futher discussion of the analysis of residuals,see Anscombe and Tukey " The examination and analysis of residuals"
Autrement dit, on peut se passer des deux hypothèses, normalité et égalité des variances pour faire l'anova, mais PAS de l'indépendance des échantillons
dans un but d'enrichir la réponse appaortée par droopy (je te remercie bien droopy), voilà ce que j'ai trouvé dans des grands travaux de stat :
"The assumption of normality is needed for the F-tests;Experience has shown that the F-tests are not adversely affected by minor deviation from normality in the distribution of the residuals.But even though the F-tests have been found to be robust in this sense ,one should still examine the distribution of the residuals.one should watch for skewness and single values that lie far away from the rest of the data.for the futher discussion of the analysis of residuals,see Anscombe and Tukey " The examination and analysis of residuals"
Autrement dit, on peut se passer des deux hypothèses, normalité et égalité des variances pour faire l'anova, mais PAS de l'indépendance des échantillons
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: Analyse de variance quand les ho d'application non vérifiées
je ne suis pas complètement d'accord avec toi. Comme le souligne ta citation (tu peux nous donner la référence ?) une déviation à la normalité n'est pas trop grave. Par contre l'égalité des variances est fondamentales, tout comme l'indépendance.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
la référence
Oui droopy, C'est édité par Sage publications ,serieQuantitative Applications in the social Sciences, ce que j'avais cité est dans le volume sur l'analyse de variance page 52.
Dernière édition par cocotta le Jeu 2 Sep 2010 - 13:28, édité 1 fois
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
la référence
voilà ma référence droopy, C'est édité par Sage publications ,serieQuantitative Applications in the social Sciences ce que j'ai cité se trouve Dans le volume sur l'analyse de variance page 52
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
référence
C'est édité par Sage publications droopy ,serie Quantitative Applications in the social Sciences.
Ce que j'ai cité se trouve dans le volume sur l'analyse de variance page 52
Ce que j'ai cité se trouve dans le volume sur l'analyse de variance page 52
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
nouvelle référence
Bonjour tout le monde,
voilà un nouveau passage droopy sur le fait qu'on peut s'en passer de la normalité et l'égalité des variances, qu'en penses tu au final???
Dans le volume sur l'analyse de covariance page 90 de la même édition on lit "The assumption concerning the independence of the errors term from the predictive elements of the model is a necessery requisite for conducting the statistical analysis both in analysis of variance and analysis of covariance .violation of this assumption may lead to serious consequences...Most researchers indicate that the analysis of covariance model is robust with respect to violations of the asumptions of normality and homogeneity of variance (of error),as in the analysis of variance model..Also,as in analysis of variance nonindependence of errors can have serious effects on the validity of probability statement relative to the statistical tests
merci
voilà un nouveau passage droopy sur le fait qu'on peut s'en passer de la normalité et l'égalité des variances, qu'en penses tu au final???
Dans le volume sur l'analyse de covariance page 90 de la même édition on lit "The assumption concerning the independence of the errors term from the predictive elements of the model is a necessery requisite for conducting the statistical analysis both in analysis of variance and analysis of covariance .violation of this assumption may lead to serious consequences...Most researchers indicate that the analysis of covariance model is robust with respect to violations of the asumptions of normality and homogeneity of variance (of error),as in the analysis of variance model..Also,as in analysis of variance nonindependence of errors can have serious effects on the validity of probability statement relative to the statistical tests
merci
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: Analyse de variance quand les ho d'application non vérifiées
Lis ca. Le chapitre "assumptions vith ANOVAs and what to do if they are violated" est bien.
http://homepage.mac.com/bradthiessen/stats/m301/4a.pdf
http://homepage.mac.com/bradthiessen/stats/m301/4a.pdf
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Analyse de variance quand les ho d'application non vérifiées
merci beaucoup c@ssoulet, celà confirme l'objet des passages que j'ai édité
merci infiniment
merci infiniment
cocotta- Nombre de messages : 41
Date d'inscription : 02/06/2010
Re: Analyse de variance quand les ho d'application non vérifiées
Salut,
Le document fourni comporte une légère erreur il me semble. L'hypothèse de normalité de l'ANOVA ne se fait pas sur les valeurs de la variable aléatoire considérée mais sur les termes d'erreur du modèle d'ANOVA.
Oui l'ANOVA est relativement robuste à la non-normalité si l'effectif total est grand et également à l'hétéroscédasticité si les effectifs de groupes sont très proches (et grands).
L'indépendance des résidus est effectivement incontournable et surtout quasi-impossible à corriger si elle est présente.
Pour ta citation de livre, tu indiques la série mais pas le titre du livre il me semble.
Nik
Le document fourni comporte une légère erreur il me semble. L'hypothèse de normalité de l'ANOVA ne se fait pas sur les valeurs de la variable aléatoire considérée mais sur les termes d'erreur du modèle d'ANOVA.
Oui l'ANOVA est relativement robuste à la non-normalité si l'effectif total est grand et également à l'hétéroscédasticité si les effectifs de groupes sont très proches (et grands).
L'indépendance des résidus est effectivement incontournable et surtout quasi-impossible à corriger si elle est présente.
Pour ta citation de livre, tu indiques la série mais pas le titre du livre il me semble.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Quand standardiser ?
» quand un individu extrême en ACP
» Régression logistique quand n < p
» Quand faire un Monte-Carlo ?
» Se faire encadrer quand on démarre
» quand un individu extrême en ACP
» Régression logistique quand n < p
» Quand faire un Monte-Carlo ?
» Se faire encadrer quand on démarre
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum