Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
GLM ou anova ?
3 participants
Page 1 sur 1
GLM ou anova ?
Bonjour,
souhaitant comparer le comportement d'une variable quantitative continue (pourcentage) en fonction de groupes (variables qualitatives nominales), j'ai eu recours a une anova accompagné de test post Hoc (test LSD de Fisher). On me reproche de ne pas utiliser dans ce cas un modèle linéaire généralisé. Il me semble que l'anova accompagné du test post hoc abouti au même résultat mais selon une procédure plus simple ? Quels seraient les arguments en faveur de l'utilisation de GLM plus pertinente que l'anova ?
Merci d'avance,
souhaitant comparer le comportement d'une variable quantitative continue (pourcentage) en fonction de groupes (variables qualitatives nominales), j'ai eu recours a une anova accompagné de test post Hoc (test LSD de Fisher). On me reproche de ne pas utiliser dans ce cas un modèle linéaire généralisé. Il me semble que l'anova accompagné du test post hoc abouti au même résultat mais selon une procédure plus simple ? Quels seraient les arguments en faveur de l'utilisation de GLM plus pertinente que l'anova ?
Merci d'avance,
Dernière édition par sunshine le Sam 9 Jan 2016 - 18:04, édité 1 fois
sunshine- Nombre de messages : 31
Date d'inscription : 17/05/2011
Re: GLM ou anova ?
Le modèle linéaire généralisé s’abrège, y compris chez les francophones, par "GLM". Je n'ai jamais vu l'abréviation "MLG", et j'ai mis du temps à comprendre ce que ça voulait dire dans votre post.
Une anova, et les tests post-hoc qui vont avec, repose sur l'hypothèse que la variable à expliquer suit des lois normales de même variance (par exemple pour chaque modalité de la variable qualitative explicative). Si la variable à expliquer est un pourcentage (binomial), l'ensemble de la procédure statistique que est mise en oeuvre par l'anova, et les tests post-hoc qui vont avec, est donc simplement fausse, et ne peut donc pas être utilisée (sauf dans certains cas où la distribution des pourcentages se rapproche à des lois normales). Une régression logistique (GLM pour données binomiales) fait l'ajustement d'un modèle de type anova, mais en gardant explicitement le fait que les données suivent des lois binomiales, donc non gaussiennes. Il existe des tests post-hoc qui vont avec.
HTH, Eric.
Une anova, et les tests post-hoc qui vont avec, repose sur l'hypothèse que la variable à expliquer suit des lois normales de même variance (par exemple pour chaque modalité de la variable qualitative explicative). Si la variable à expliquer est un pourcentage (binomial), l'ensemble de la procédure statistique que est mise en oeuvre par l'anova, et les tests post-hoc qui vont avec, est donc simplement fausse, et ne peut donc pas être utilisée (sauf dans certains cas où la distribution des pourcentages se rapproche à des lois normales). Une régression logistique (GLM pour données binomiales) fait l'ajustement d'un modèle de type anova, mais en gardant explicitement le fait que les données suivent des lois binomiales, donc non gaussiennes. Il existe des tests post-hoc qui vont avec.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLM ou anova ?
Bonjour,
merci pour votre réponse. J'ai corrigé l'erreur concernant l'abréviation du modèle linéaire généralisé.
Je ne suis pas sure de comprendre votre explication. Ce qui vous dites s'applique-t-il toujours dans le cas où les conditions de validité de l'anova sont vérifiées (homogénéité des variances selon les modalités de la variable qualitative) ? Vous semblez dire que le pourcentage est nécessairement binomial ?
Merci.
merci pour votre réponse. J'ai corrigé l'erreur concernant l'abréviation du modèle linéaire généralisé.
Je ne suis pas sure de comprendre votre explication. Ce qui vous dites s'applique-t-il toujours dans le cas où les conditions de validité de l'anova sont vérifiées (homogénéité des variances selon les modalités de la variable qualitative) ? Vous semblez dire que le pourcentage est nécessairement binomial ?
Merci.
sunshine- Nombre de messages : 31
Date d'inscription : 17/05/2011
Re: GLM ou anova ?
sunshine a écrit:Bonjour,
merci pour votre réponse. J'ai corrigé l'erreur concernant l'abréviation du modèle linéaire généralisé.
Je ne suis pas sure de comprendre votre explication. Ce qui vous dites s'applique-t-il toujours dans le cas où les conditions de validité de l'anova sont vérifiées (homogénéité des variances selon les modalités de la variable qualitative) ? Vous semblez dire que le pourcentage est nécessairement binomial ?
Merci.
L'anova s'applique toujours dans le cas où conditions de validité de l'anova sont vérifiées. Oui. C'est une tautologie.
Oui, un pourcentage suit nécessairement une distribution binomiale, dans le cas général, par définition. Il se trouve que, dans certaines conditions, une loi binomiale se rapproche d'une loi normale, mais ca reste dans ce cas une loi binomiale de toute façon.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: GLM ou anova ?
Bonjour,
je pense que je commence à comprendre.
Mais peut-on argumenter du fait que la variable quantitative exprimée en pourcentage se rapproche d'une loi normale ? Par rapport à la taille de l'échantillon par exemple ?
Ou alors une anova de Kruskal Wallis qui s'affranchit de l'impératif de normalité ?
je pense que je commence à comprendre.
Mais peut-on argumenter du fait que la variable quantitative exprimée en pourcentage se rapproche d'une loi normale ? Par rapport à la taille de l'échantillon par exemple ?
Ou alors une anova de Kruskal Wallis qui s'affranchit de l'impératif de normalité ?
sunshine- Nombre de messages : 31
Date d'inscription : 17/05/2011
Re: GLM ou anova ?
Bonjour,
Bonjour,
Tout depend de la variable. As-tu un pourcentage par individu ou un pourcentage par groupe? Si c'est un pourcentage par groupe, dans ce cas, Eric a raison, et il vaut mieux partir des donnees individuelles et faire une regression logistique. En revanche, si c'est un pourcentage par individu, une ANOVA peut eventuellement suffire si tes distributions de pourcentages par groupe respectent les conditions d'application. Certains pourcentages peuvent suivre une loi normale. Par exemple, si on a un groupe de 100 sujets et on leur fait passer un test de 100 questions, et qu'on regarde par individu le pourcentage de reponses correctes, il y a de fortes chances que les notes suivent une distribution normale (en supposant que le test est ni trop facile, ni infaisable). Donc peut-etre qu'une premiere chose a faire est de faire l'histogramme de ta variable et regarder si ca a l'air normal ou pas, et egalement nous en dire plus sur ce que tu regardes et mesures.
Ayana
Bonjour,
Tout depend de la variable. As-tu un pourcentage par individu ou un pourcentage par groupe? Si c'est un pourcentage par groupe, dans ce cas, Eric a raison, et il vaut mieux partir des donnees individuelles et faire une regression logistique. En revanche, si c'est un pourcentage par individu, une ANOVA peut eventuellement suffire si tes distributions de pourcentages par groupe respectent les conditions d'application. Certains pourcentages peuvent suivre une loi normale. Par exemple, si on a un groupe de 100 sujets et on leur fait passer un test de 100 questions, et qu'on regarde par individu le pourcentage de reponses correctes, il y a de fortes chances que les notes suivent une distribution normale (en supposant que le test est ni trop facile, ni infaisable). Donc peut-etre qu'une premiere chose a faire est de faire l'histogramme de ta variable et regarder si ca a l'air normal ou pas, et egalement nous en dire plus sur ce que tu regardes et mesures.
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: GLM ou anova ?
Ayana a écrit:Bonjour,
Bonjour,
Tout depend de la variable. As-tu un pourcentage par individu ou un pourcentage par groupe? Si c'est un pourcentage par groupe, dans ce cas, Eric a raison, et il vaut mieux partir des donnees individuelles et faire une regression logistique. En revanche, si c'est un pourcentage par individu, une ANOVA peut eventuellement suffire si tes distributions de pourcentages par groupe respectent les conditions d'application. Certains pourcentages peuvent suivre une loi normale. Par exemple, si on a un groupe de 100 sujets et on leur fait passer un test de 100 questions, et qu'on regarde par individu le pourcentage de reponses correctes, il y a de fortes chances que les notes suivent une distribution normale (en supposant que le test est ni trop facile, ni infaisable). Donc peut-etre qu'une premiere chose a faire est de faire l'histogramme de ta variable et regarder si ça a l'air normal ou pas, et également nous en dire plus sur ce que tu regardes et mesures.
Ayana
Bonjour,
mes données consistent en différents sites (une trentaine), pour chaque site je dispose d'une proportion d'individus (en %) et d'une variable qualitative à plusieurs modalités qui décrit l'appartenance du site à un groupe particulier. Soit:
Site 1 %site1 groupe A
Site 2 %site2 groupe B
Site 3 %site3 groupe B
... .... ....
Ma proportion d'individus sur l'ensemble des sites n'est pas normale mais asymétrique. En revanche la distribution de la proportion selon chaque groupe semble se rapprocher de la normalité. Je fais tourner l'ANOVA sur les groupes et le pourcentage des sites selon leur appartenance à chaque groupe. Je veux pouvoir évaluer si la proportion d'individus (ou plus précisément la moyenne) diffère significativement ou non par groupe. Ce n'est pas correct ?
Je précise également que j'ai des échantillons relativement petits (26 sites et 4 modalités pour la variable qualitative).
sunshine- Nombre de messages : 31
Date d'inscription : 17/05/2011
Sujets similaires
» Analyse résiduelle ANOVA 1 facteur / ANOVA 2 facteurs
» Analyse de variance quand les ho d'application non vérifiées
» ANOVA
» Anova
» anova glm
» Analyse de variance quand les ho d'application non vérifiées
» ANOVA
» Anova
» anova glm
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum