Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Inégalité de variance, ANOVA : quelle marge de tolérance ?
5 participants
Page 1 sur 1
Inégalité de variance, ANOVA : quelle marge de tolérance ?
Bonsoir à tous,
je m'interroge sur les exigences de l'ANOVA en terme d'égalité des variances.
J'ai deux groupes de personnes, A et B, avec une dizaine de personne dans chacun des groupes.
J'ai 140 mesures pour chaque personne (dans 2 conditions différentes).
Je souhaite réaliser un test ANOVA sur mes données, seulement je sais que pour cela mes variances doivent être comparables.
Or la variance de mon groupe A est environ de 2 fois celle de mon groupe B. A priori, un test F m'indique que les variances de mes groupes ne sont pas comparables.
Cependant, j'ai pu lire* que si mes groupes sont égaux (ce qui est mon cas), la variance d'un groupe peut être jusqu'à 4 fois celle de l'autre groupe sans que cela pose de problème.
J'aimerais donc savoir si dans mon cas je peux appliquer un ANOVA simple ou si une ANOVA de Welch est plus indiquée ou encore si je dois plutôt chercher à transformer mes données (mais avec quelle fonction ? Logarithme ?).
Je vous remercie par avance pour vos conseils et avis.
*Nouvellement inscrite, je ne peux pas poster de lien. L'ouvrage auquel je voulais faire référence est le cours "eric.univ-lyon2" sur les tests paramétriques (p.28)
je m'interroge sur les exigences de l'ANOVA en terme d'égalité des variances.
J'ai deux groupes de personnes, A et B, avec une dizaine de personne dans chacun des groupes.
J'ai 140 mesures pour chaque personne (dans 2 conditions différentes).
Je souhaite réaliser un test ANOVA sur mes données, seulement je sais que pour cela mes variances doivent être comparables.
Or la variance de mon groupe A est environ de 2 fois celle de mon groupe B. A priori, un test F m'indique que les variances de mes groupes ne sont pas comparables.
Cependant, j'ai pu lire* que si mes groupes sont égaux (ce qui est mon cas), la variance d'un groupe peut être jusqu'à 4 fois celle de l'autre groupe sans que cela pose de problème.
J'aimerais donc savoir si dans mon cas je peux appliquer un ANOVA simple ou si une ANOVA de Welch est plus indiquée ou encore si je dois plutôt chercher à transformer mes données (mais avec quelle fonction ? Logarithme ?).
Je vous remercie par avance pour vos conseils et avis.
*Nouvellement inscrite, je ne peux pas poster de lien. L'ouvrage auquel je voulais faire référence est le cours "eric.univ-lyon2" sur les tests paramétriques (p.28)
Grenouille- Nombre de messages : 4
Date d'inscription : 10/07/2015
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Salut,
il faut surtout vérifier si les distributions dans chacun des groupes sont comparables.
il faut surtout vérifier si les distributions dans chacun des groupes sont comparables.
FS- Nombre de messages : 163
Date d'inscription : 25/04/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Salut,
mes distributions sont globalement comparables, proches de la normalité.
Seulement, j'ai lu a de très nombreux endroits que l'homéoscédasticité étaient la condition la plus importante à remplir pour réaliser une ANOVA... =(
J'ai un peu avancé de mon côté, l'Anova de Welch me parais une idée intéressante pour le début, mais elle ne permet pas de vérifier l'existence d'éventuelles interactions, or c'est le plus important dans mon projet.
Peut-être pourrais-je simplement réduire mes données ? Ne vais-je pas perdre de l'information important avec cela ?
mes distributions sont globalement comparables, proches de la normalité.
Seulement, j'ai lu a de très nombreux endroits que l'homéoscédasticité étaient la condition la plus importante à remplir pour réaliser une ANOVA... =(
J'ai un peu avancé de mon côté, l'Anova de Welch me parais une idée intéressante pour le début, mais elle ne permet pas de vérifier l'existence d'éventuelles interactions, or c'est le plus important dans mon projet.
Peut-être pourrais-je simplement réduire mes données ? Ne vais-je pas perdre de l'information important avec cela ?
Grenouille- Nombre de messages : 4
Date d'inscription : 10/07/2015
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
140 mesures dans 2 conditions différentes pour chaque individu, c'est de l'ANOVA en mesures répétées. Tu ne trouveras pas d'équivalent en non paramétrique
C'est vraiment très difficile de compenser l'erreur liée aux variances inégales dans une ANOVA, avec des stratégies très statisticien-dépendantes.
Un petit exemple
http://www.ats.ucla.edu/stat/stata/library/homvar.htm
En clair, il faut un conseil très spécialisé qui se penche de près sur tes données pour sortir un résultat cohérent et surtout justifier la méthode employée.
C'est vraiment très difficile de compenser l'erreur liée aux variances inégales dans une ANOVA, avec des stratégies très statisticien-dépendantes.
Un petit exemple
http://www.ats.ucla.edu/stat/stata/library/homvar.htm
En clair, il faut un conseil très spécialisé qui se penche de près sur tes données pour sortir un résultat cohérent et surtout justifier la méthode employée.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Oh non...
Vraiment, aucun espoir du côté d'une réduction ?
Vraiment, aucun espoir du côté d'une réduction ?
Grenouille- Nombre de messages : 4
Date d'inscription : 10/07/2015
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
réduire tes données ???
En gros tu vas choisir les données du groupe A dans les bornes de la variance du groupe B ? Tu en conviendras, ce n'est pas très scientifique.
Par ailleurs, dès qu'on a une différence de variance:
1-ce n'est pas la fin du monde car les estimation des paramètres (valeurs moyennes par groupe) sont non-biaisées, "seuls" les tests statistiques sont faux en raison des mauvais estimateurs. Tu as donc au moins la moitié (voire plus, si tu considères que l'aspect test est très secondaire) de l'info que tu voulais !
2-il faut identifier au mieux la source de la variance notamment arriver à distinguer si l'information n'est pas dans cette différence de variance. En effet, certains phénomènes pourraient conduire à une différence de variance et pas vraiment à une différence de moyenne (les deux pouvant être concomitants si dans ta relation, moyenne et variance sont liées).
Une fois que tu as clarifié le second point (ce qui n'est évidemment pas simple), alors tu peux corriger, prendre en compte voire modéliser la variance.
Pour corriger, la méthode la plus brutale est de diviser les observations par la variance de chaque groupe. L'estimateur obtenu se base sur une démonstration asymptotique donc il faut beaucoup de valeurs pour que ça tienne la route. Donc le plus "sûr" est peut être d'utiliser les matrices de covariance corrigées (in english : Heteroscedasticity-Corrected Covariance Matrices). Pour cela il y a différents estimateurs qui ont été proposés. Tu peux trouver l'info via google assez facilement.
Enfin, tu peux te lancer dans les GLS ou encore les GLMM (ou autre...beaucoup de choses ont été développées sur cette question) mais là on tombe dans le domaine où un conseil par un statisticien est fortement conseillé. Et bien sûr comme tu peux t'en douter on en arrive souvent à se dire que ces méthodes sont celles qui semblent le mieux répondre à notre besoin.
Nik
En gros tu vas choisir les données du groupe A dans les bornes de la variance du groupe B ? Tu en conviendras, ce n'est pas très scientifique.
Par ailleurs, dès qu'on a une différence de variance:
1-ce n'est pas la fin du monde car les estimation des paramètres (valeurs moyennes par groupe) sont non-biaisées, "seuls" les tests statistiques sont faux en raison des mauvais estimateurs. Tu as donc au moins la moitié (voire plus, si tu considères que l'aspect test est très secondaire) de l'info que tu voulais !
2-il faut identifier au mieux la source de la variance notamment arriver à distinguer si l'information n'est pas dans cette différence de variance. En effet, certains phénomènes pourraient conduire à une différence de variance et pas vraiment à une différence de moyenne (les deux pouvant être concomitants si dans ta relation, moyenne et variance sont liées).
Une fois que tu as clarifié le second point (ce qui n'est évidemment pas simple), alors tu peux corriger, prendre en compte voire modéliser la variance.
Pour corriger, la méthode la plus brutale est de diviser les observations par la variance de chaque groupe. L'estimateur obtenu se base sur une démonstration asymptotique donc il faut beaucoup de valeurs pour que ça tienne la route. Donc le plus "sûr" est peut être d'utiliser les matrices de covariance corrigées (in english : Heteroscedasticity-Corrected Covariance Matrices). Pour cela il y a différents estimateurs qui ont été proposés. Tu peux trouver l'info via google assez facilement.
Enfin, tu peux te lancer dans les GLS ou encore les GLMM (ou autre...beaucoup de choses ont été développées sur cette question) mais là on tombe dans le domaine où un conseil par un statisticien est fortement conseillé. Et bien sûr comme tu peux t'en douter on en arrive souvent à se dire que ces méthodes sont celles qui semblent le mieux répondre à notre besoin.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Il ne faut peut etre pas s'affoler, et procéder avec méthode. Là, ca part dans tous les sens.
1- definis quelle analyse de variance est adaptée à ton plan d'expérience. J'ai l'impression que c'est de la mesure répétée, mais sans plus de plus de précisions je ne suis pas sur. C'est pas la peine d'aller plus loin tant que ce point n'est pas défini une bonne fois pour toutes.
2- verifie le respect des assomptions. En mesure répétée, l'ANOVA est relativement "robuste" vis à vis de violations modérées (et les assomptions ne sont pas tout à fait les memes que dans une ANOVA "classique"). Tes différences de variance ne sont pas phénoménales (dans l'exemple que je t'ai donné, c'est X6 entre les 2 groupes extremes) et dans un plan en mesures répétées c'est pas le truc le plus biaisant.
Avec un peu de bol et un conseil minimal, ca peut le faire sans se torturer.
1- definis quelle analyse de variance est adaptée à ton plan d'expérience. J'ai l'impression que c'est de la mesure répétée, mais sans plus de plus de précisions je ne suis pas sur. C'est pas la peine d'aller plus loin tant que ce point n'est pas défini une bonne fois pour toutes.
2- verifie le respect des assomptions. En mesure répétée, l'ANOVA est relativement "robuste" vis à vis de violations modérées (et les assomptions ne sont pas tout à fait les memes que dans une ANOVA "classique"). Tes différences de variance ne sont pas phénoménales (dans l'exemple que je t'ai donné, c'est X6 entre les 2 groupes extremes) et dans un plan en mesures répétées c'est pas le truc le plus biaisant.
Avec un peu de bol et un conseil minimal, ca peut le faire sans se torturer.
c@ssoulet- Nombre de messages : 925
Date d'inscription : 05/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Nik a écrit:
1-ce n'est pas la fin du monde car les estimation des paramètres (valeurs moyennes par groupe) sont non-biaisées, "seuls" les tests statistiques sont faux en raison des mauvais estimateurs. Tu as donc au moins la moitié (voire plus, si tu considères que l'aspect test est très secondaire) de l'info que tu voulais !
L'estimateur robuste de White peut permettre d'obtenir des tests plus fiables sur les estimations des paramètres.
Niaboc
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Sauf confusion de ma part, l'estimateur de White est une des méthodes de Heteroscedasticity-Corrected Covariance Matrices
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Oui c'est ça.
Je me trompe peut-être, mais son problème de base étant une inégalité des variances, tu peux le voir comme un problème d'hétéroscédasticité?
Je me trompe peut-être, mais son problème de base étant une inégalité des variances, tu peux le voir comme un problème d'hétéroscédasticité?
niaboc- Nombre de messages : 1001
Age : 37
Localisation : Paris
Date d'inscription : 05/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
oui .
la variance évolue en fonction de la variable explicative "groupe"
la variance évolue en fonction de la variable explicative "groupe"
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Nik a écrit:réduire tes données ???
En gros tu vas choisir les données du groupe A dans les bornes de la variance du groupe B ?
Nik
Non non je n'aurais surtout une idée pareille ! "Réduire" comme dans "centrer-réduire", diviser par la variance, simplement.
Étant donné la constitution de mes groupes, je ne suis pas vraiment surprise que la variance de l'un (pathologique) soit plus grande que celle de l'autre (témoins). Simplement, je ne pensais pas que cela prendrait ces proportions et j'avais pour hypothèse des différences de moyennes indépendamment de cela.
c@ssoulet a écrit:
1- definis quelle analyse de variance est adaptée à ton plan d'expérience. J'ai l'impression que c'est de la mesure répétée, mais sans plus de plus de précisions je ne suis pas sur.
Il me semble que c'est bien cette analyse de variance la plus adaptée à mon cas.
J'ai un plan d'expérience mixte à facteur répété avec deux groupes indépendants (un pathologique, A, et un de témoins, B) et tous font la même tâche dans 4 types de conditions correspondant au croisement de deux facteurs :
- visage heureux ou neutre
- affichage des yeux seulement ou de tout le visage.
Chaque personne voit 35 visages dans chaque condition, soit 140 visages en tout.
Je vais regarder de plus près cet estimateur de White mais effectivement je n'avais peut-être pas à m'affoler autant.
Un grand merci à tous
Grenouille- Nombre de messages : 4
Date d'inscription : 10/07/2015
Re: Inégalité de variance, ANOVA : quelle marge de tolérance ?
Donc fais bien attention à ce que ton résultat de test soit bien cohérent avec ton observation graphique (qui est souvent la plus utile).Étant donné la constitution de mes groupes, je ne suis pas vraiment surprise que la variance de l'un (pathologique) soit plus grande que celle de l'autre (témoins)
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Quelle ANOVA choisir?
» Problème ? quelle Anova ?
» Inégalité moyenne arithmético harmonique
» Marge d'erreur
» marge de victoire
» Problème ? quelle Anova ?
» Inégalité moyenne arithmético harmonique
» Marge d'erreur
» marge de victoire
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum