Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le Deal du moment : -40%
Tefal Ingenio Emotion – Batterie de cuisine 10 ...
Voir le deal
59.99 €

Anova type I, II, III

3 participants

Aller en bas

Anova - Anova type I, II, III Empty Anova type I, II, III

Message par Nik Mer 19 Sep 2018 - 10:17

Reprise ici d'une conversation issue d'un autre sujet (>>LA<<) dont je reprends les messages qui concernent le titre du présent sujet

Florent Aubry a écrit:3) Un petit rappel sur l'utilisation de la fonction anova : les termes sont testés séquentiellement (Terms added sequentially (first to last)), ce qu'on appelle la somme des carrés de type I, c'est-à-dire qu'anova donne la significativité de l'ajout du second terme à l'estimation du premier. Si les deux termes ne sont pas corrélés, ceci ne pose pas de problème. Par contre, s'ils le sont, on peut obtenir un second terme T2 non ou peu significatif dans la formule Y ~ T1 + T2 et ce même terme significatif quand on utilise la formule Y ~ T2 + T1 :
Code:
    set.seed(
    T2 <- runif( 100)
    T1 <- (T2 + 0.2 * runif( 100)) / 2
    Y <- T1 + T2 + rnorm( 100, sd=0.1)
    lm.r1 <- lm( Y ~ T1 + T2)
    anova( lm.r1)
    lm.r2 <- lm( Y ~ T2 + T1)
    anova( lm.r2)

C'est pourquoi il est toujours préférable d'utiliser la fonction Anova (avec un A majuscule) du package car.
Nik a écrit:
   
C'est pourquoi il est toujours préférable d'utiliser la fonction Anova (avec un A majuscule) du package car.

Je viens de relever cette affirmation et je ne suis pas sûr de comprendre.
il est surtout important que l'utilisateur comprenne bien ce qu'il est en train de tester. Anova reprend la programmation choisi par SAS mais je ne suis pas sûr qu'elle permette vraiment d'éviter les écueils...
Il faudrait je pense plutôt encourager les utilisateurs à comprendre ce que sont les contrasts et donc ce qu'ils supposent en termes d'hypothèse testées.

Florent Aubry a écrit:Re: Interprétation résultat glm et anova(glm)
Quand on teste la significativité de prédicteurs dans un modèle (g)lm à plusieurs prédicteurs, il y a trois approches principales connues sous le non de sommes des carrés de type I, II et III. Statistica et certains autres logiciels ont introduit des type IV, V et VI qui sont des cas particuliers des 3 précédents types. Ces trois types n'ont rien à voir avec SAS, simplement chaque logiciel a choisi un type par défaut. Par exemple, toujours pour parler de Statistica que je connais mieux que SAS, c'est le type III. R, avec sa fonction anova (a minuscule), c'est le type I.

Quelles sont les différences entre ces trois types ? Je ne vais pas entrer dans les détails mais essayer de les expliquer par un exemple. Soit le modèle linéaire  Y ~ F1 * F2 où F1 et F2 sont deux facteurs.

Type I (anova) :
 ligne F1 : Contribution de F1 interaction comprise dans l'explication de Y
 ligne F2 : Contribution de F2 dans l'explication de (Y moins la contribution de F1)
 ligne F1:F2 : Contribution de l'interaction dans l'explication de Y
Ce type de somme des carrés est donc intéressant quand on cherche à savoir si l'ajout d'un prédicteur apporte quelque chose de plus à l'explication des données (cf. la comparaison des modèles par l'appel à la fonction anova avec comme deux paramètres deux résultats sur des modèles emboités : anova( modele.1, modele.2)). Mais comme je l'ai mentionné, on peut avoir F1 et F2 significatifs avec le modèle Y ~ F1 * F2 alors que dans le modèle Y ~ F2 * F1, seul F2 est significatif. Cela peut alors suggérer une forte corrélation entre les facteurs ou des effets d'amplitude différents de plusieurs ordres de grandeur entre les facteurs.

Type II (Anova avec valeur de type par défaut, c'est-à-dire 2) :
 ligne F1 : Contribution de F1 interaction comprise dans l'explication de Y
 ligne F2 : Contribution de F2 interaction comprise dans l'explication de Y
 ligne F1:F2 : Contribution de l'interaction dans l'explication de Y
Donc la ligne F2 est exactement celle qu'on obtiendrait avec la fonction anova pour le modèle Y ~ F2 * F1

Type III (Anova avec valeur de type par défaut, c'est-à-dire 2) :
 ligne F1 : Contribution de F1 en dehors de l'interaction F1 * F2 dans l'explication de Y
 ligne F2 : Contribution de F2 en dehors de l'interaction F1 * F2  dans l'explication de Y
 ligne F1:F2 : Contribution de l'interaction dans l'explication de de Y
De plus, contrairement aux types I et II, ces contributions sont entendues au sens des moindres carrés. De ce fait :
i) les lignes F1:F2 sont identiques pour les trois types ;
ii) de nombreux auteurs recommandent le type II par défaut sauf si le modèle n'est pas équilibré ; alors ils recommandent le type III ;
iii) les trois modèles ne sont équivalents que si les deux facteurs sont indépendants.

Donc, contrairement au type I, les types II et III donnent toujourd les mêmes résultats pour les modèles Y ~ F1 * F2 et Y ~ F2 * F1.

Nik, j'espère que mes explications répondent à ton attente, sinon n'hésite pas à poser d'autres questions.

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par Nik Mer 19 Sep 2018 - 10:30

Florent,

Ce qui m'a fait relever ce que tu as écrit, c'est qu'il me semble que la question n'est pas aussi tranché que "il vaut mieux utiliser la fonction Anova".

L'hypothèse testée n'étant pas la même, il est important de le signaler à l'utilisateur. L'un des principal reproche fait par les puristes de R aux autres logiciels est que ces différents types de SS sont à priori en mesure de régler tous les problèmes de tests qu'on peut rencontrer notamment quand le design n'est pas équilibré.

Le type III, viole le principe de marginalité contrairement aux types I et II. L'interaction semble y être prise comme existante de fait et pour autant on arriverait à interpréter les effets principaux indépendamment de l'interaction...J'avoue que ça me semble assez "magique" mais peu recommandable.

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par Florent Aubry Mer 19 Sep 2018 - 11:18

Nik

Tu as raison de souligner que cela dépend de l'hypoyhèse. Si j'ai écrit qu'il fallait mieux utiliser la fonction Anova c'est que généralement, du point du point de vue de mon expérience, la question posée est de tester l'influence d'un prédicteur (facteur ou régresseur) sur la variable dépendante pris indépendamment des autres prédicteurs.

Le problème de la fonction anova (et de la SS de type I) ne vient pas d'elle-même mais de son utilisation car la majorité des utilisateurs ne connaissent pas les fondements du calcul et vont par exemple déduire que dans le modèle Y ~ F1 * F2, F1 est significatif alors que s'ils essayaient Y ~ F2 * F1, F1 ne le serait plus. Donc, au lieu d'en tirer une conclusion définitive, cela devrait conduire à une interrogation et à une discussion sur les liens entre les deux facteurs et, pourquoi pas, sur les hypothèses testées ou sur les limites de l'échantillon.

D'accord aussi pour le type III et ton sentiment reflète la principale critique de nombreux auteurs sur cette SS mais d'après la synthèse de la littérature que j'ai faite sur le sujet, il apparaît que malgré tout c'est l'approche souvent recommandée quand les groupes ne sont pas équilibrés.

En fait, le principal problème provient du fait que peu d'utilisateurs savent vraiment ce que signifie la notion de SS et font confiance quasi-aveugle aux résultats donnés par l'option par défaut de leur logiciel favori sans les discuter. par contre, ils concluront qu'un autre logiciel est faux parce qu'il ne donne pas les mêmes résultats (issu de mon expérience, réflexion faite par des utilisateurs de Statistica confrontrés aux résultats donnés par R).

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par Nik Mer 19 Sep 2018 - 11:46

C'est ce qu'il me semblait.

J'ajoute à la discussion que la commande anova de R permet d'une certaine manière d'obtenir le type II quand on prend la 2e ligne du résultat de chacunes des anovas des modèles Y~F2*F1 et Y~F1*F2.

Le type III dans R (par la fonction Anova ou autre) nécessite de changer les contrastes des facteurs non-ordonnés via par exemple :
Code:
options(contrasts=c(unordered="contr.sum", ordered="contr.poly"))
Hormis via Anova {car}, on peut reproduire le type III via la fonction drop1 (une fois les contrastes modifiés pour les facteurs).

HTH !

Nik

Nik

Nombre de messages : 1606
Date d'inscription : 23/05/2008

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par droopy Mer 19 Sep 2018 - 13:02

Bonjour,

je trouve que ceci est assez parlant aussi :
https://www.r-bloggers.com/anova-%E2%80%93-type-iiiiii-ss-explained/

cdlt
droopy
droopy

Nombre de messages : 1156
Date d'inscription : 04/09/2009

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par Florent Aubry Mer 19 Sep 2018 - 13:23


@Nik sur le type III. En effet j'ai oublié de le signaler peut-être que la raison en est que mon option par défaut pour mes sessions est contr.sum et non celle de R, contr.treatment. Là aussi, cela évite des erreurs d'interprétation des paramètres estimés (cf. fonction summary) d'autant que le niveau de référence (le premier) est souvent arbitraire puisque par défaut c'est l'ordre lexicographique qui prévaut.

@droopy : C'est en effet l'une de mes sources d'insipration

Florent Aubry

Nombre de messages : 251
Date d'inscription : 02/11/2015

Revenir en haut Aller en bas

Anova - Anova type I, II, III Empty Re: Anova type I, II, III

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum