GLM ou anova ?

Voir le sujet précédent Voir le sujet suivant Aller en bas

GLM ou anova ?

Message par sunshine le Ven 8 Jan 2016 - 16:38

Bonjour,

souhaitant comparer le comportement d'une variable quantitative continue (pourcentage) en fonction de groupes (variables qualitatives nominales), j'ai eu recours a une anova accompagné de test post Hoc (test LSD de Fisher). On me reproche de ne pas utiliser dans ce cas un modèle linéaire généralisé. Il me semble que l'anova accompagné du test post hoc abouti au même résultat mais selon une procédure plus simple ? Quels seraient les arguments en faveur de l'utilisation de GLM plus pertinente que l'anova ?

Merci d'avance,


Dernière édition par sunshine le Sam 9 Jan 2016 - 18:04, édité 1 fois

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par Eric Wajnberg le Sam 9 Jan 2016 - 11:35

Le modèle linéaire généralisé s’abrège, y compris chez les francophones, par "GLM". Je n'ai jamais vu l'abréviation "MLG", et j'ai mis du temps à comprendre ce que ça voulait dire dans votre post.

Une anova, et les tests post-hoc qui vont avec, repose sur l'hypothèse que la variable à expliquer suit des lois normales de même variance (par exemple pour chaque modalité de la variable qualitative explicative). Si la variable à expliquer est un pourcentage (binomial), l'ensemble de la procédure statistique que est mise en oeuvre par l'anova, et les tests post-hoc qui vont avec, est donc simplement fausse, et ne peut donc pas être utilisée (sauf dans certains cas où la distribution des pourcentages se rapproche à des lois normales). Une régression logistique (GLM pour données binomiales) fait l'ajustement d'un modèle de type anova, mais en gardant explicitement le fait que les données suivent des lois binomiales, donc non gaussiennes. Il existe des tests post-hoc qui vont avec.

HTH, Eric.

Eric Wajnberg

Nombre de messages : 308
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par sunshine le Sam 9 Jan 2016 - 18:12

Bonjour,

merci pour votre réponse. J'ai corrigé l'erreur concernant l'abréviation du modèle linéaire généralisé.

Je ne suis pas sure de comprendre votre explication. Ce qui vous dites s'applique-t-il toujours dans le cas où les conditions de validité de l'anova sont vérifiées (homogénéité des variances selon les modalités de la variable qualitative) ? Vous semblez dire que le pourcentage est nécessairement binomial ?

Merci.

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par Eric Wajnberg le Lun 11 Jan 2016 - 6:41

sunshine a écrit:Bonjour,

merci pour votre réponse. J'ai corrigé l'erreur concernant l'abréviation du modèle linéaire généralisé.

Je ne suis pas sure de comprendre votre explication. Ce qui vous dites s'applique-t-il toujours dans le cas où les conditions de validité de l'anova sont vérifiées (homogénéité des variances selon les modalités de la variable qualitative) ? Vous semblez dire que le pourcentage est nécessairement binomial ?

Merci.

L'anova s'applique toujours dans le cas où conditions de validité de l'anova sont vérifiées. Oui. C'est une tautologie.

Oui, un pourcentage suit nécessairement une distribution binomiale, dans le cas général, par définition. Il se trouve que, dans certaines conditions, une loi binomiale se rapproche d'une loi normale, mais ca reste dans ce cas une loi binomiale de toute façon.

Eric Wajnberg

Nombre de messages : 308
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par sunshine le Lun 11 Jan 2016 - 7:36

Bonjour,

je pense que je commence à comprendre.
Mais peut-on argumenter du fait que la variable quantitative exprimée en pourcentage se rapproche d'une loi normale ? Par rapport à la taille de l'échantillon par exemple ?

Ou alors une anova de Kruskal Wallis qui s'affranchit de l'impératif de normalité ?

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par Ayana le Lun 11 Jan 2016 - 10:24

Bonjour,
Bonjour,

Tout depend de la variable. As-tu un pourcentage par individu ou un pourcentage par groupe? Si c'est un pourcentage par groupe, dans ce cas, Eric a raison, et il vaut mieux partir des donnees individuelles et faire une regression logistique. En revanche, si c'est un pourcentage par individu, une ANOVA peut eventuellement suffire si tes distributions de pourcentages par groupe respectent les conditions d'application. Certains pourcentages peuvent suivre une loi normale. Par exemple, si on a un groupe de 100 sujets et on leur fait passer un test de 100 questions, et qu'on regarde par individu le pourcentage de reponses correctes, il y a de fortes chances que les notes suivent une distribution normale (en supposant que le test est ni trop facile, ni infaisable). Donc peut-etre qu'une premiere chose a faire est de faire l'histogramme de ta variable et regarder si ca a l'air normal ou pas, et egalement nous en dire plus sur ce que tu regardes et mesures.

Ayana

Ayana

Nombre de messages : 388
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par sunshine le Mar 12 Jan 2016 - 10:14

Ayana a écrit:Bonjour,
Bonjour,

Tout depend de la variable. As-tu un pourcentage par individu ou un pourcentage par groupe? Si c'est un pourcentage par groupe, dans ce cas, Eric a raison, et il vaut mieux partir des donnees individuelles et faire une regression logistique.  En revanche, si c'est un pourcentage par individu, une ANOVA peut eventuellement suffire si tes distributions de pourcentages par groupe respectent les conditions d'application. Certains pourcentages peuvent suivre une loi normale. Par exemple, si on a un groupe de 100 sujets et on leur fait passer un test de 100 questions, et qu'on regarde par individu le pourcentage de reponses correctes, il y a de fortes chances que les notes suivent une distribution normale (en supposant que le test est ni trop facile, ni infaisable). Donc peut-etre qu'une premiere chose a faire est de faire l'histogramme de ta variable et regarder si ça a l'air normal ou pas, et également nous en dire plus sur ce que tu regardes et mesures.

Ayana

Bonjour,

mes données consistent en différents sites (une trentaine), pour chaque site je dispose d'une proportion d'individus (en %) et d'une variable qualitative à plusieurs modalités qui décrit l'appartenance du site à un groupe particulier. Soit:

Site 1      %site1         groupe A
Site 2      %site2         groupe B    
Site 3      %site3         groupe B
...            ....                ....

Ma proportion d'individus sur l'ensemble des sites n'est pas normale mais asymétrique. En revanche la distribution de la proportion selon chaque groupe semble se rapprocher de la normalité. Je fais tourner l'ANOVA sur les groupes et le pourcentage des sites selon leur appartenance à chaque groupe. Je veux pouvoir évaluer si la proportion d'individus (ou plus précisément la moyenne) diffère significativement ou non par groupe. Ce n'est pas correct ?

Je précise également que j'ai des échantillons relativement petits (26 sites et 4 modalités pour la variable qualitative).

sunshine

Nombre de messages : 31
Date d'inscription : 17/05/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: GLM ou anova ?

Message par Contenu sponsorisé Aujourd'hui à 0:14


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum