Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
niaboc
 
c@ssoulet
 
droopy
 
vae
 
Catz
 
cicino
 
Coco
 
Jonathan COSTA
 
Anny_Nina
 


Que représente vraiment l'homoscédasticité ?

Page 1 sur 2 1, 2  Suivant

Voir le sujet précédent Voir le sujet suivant Aller en bas

Que représente vraiment l'homoscédasticité ?

Message par zezima le Mar 30 Mai 2017 - 7:02

Bonjour,

J'étais en train de me poser une question (car je vois pas mal de définitions différentes sur internet).

Lorsqu'on parle de normalité, on parle de normalité de la population globale d'une variable et non pas d'un échantillon précis d'une étude.

Pour l'homoscédasticité, peut-on dire que deux échantillons ayant des variances différentes peuvent être homoscédastiques si les populations dont ils sont issus sont homoscédastiques ?

Merci d'avance
avatar
zezima

Nombre de messages : 748
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mar 30 Mai 2017 - 7:40

Bonjour.

j'ai toujours cru que ''homoscédasticité" voulait dire "qui provient de populations de même variance". Car on ne compare pas les variances des échantillons, mais on s'intéresse à la variance de la population sous-jacente, dans une test de variance par exemple.

Cordialement.

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par niaboc le Mar 30 Mai 2017 - 8:19

Bonjour,

je trouve que la définition de gg définit bien l'homoscédasticité aussi

Niaboc
avatar
niaboc

Nombre de messages : 929
Age : 30
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par c@ssoulet le Mar 30 Mai 2017 - 9:15

On trouve aussi pour l'hypothèse d'homoscédasticité "répartition homogène de la variance".

C'est en tout cas ce que l'on regarde lorsqu'on vérifie graphiquement cette hypothèse dans le cadre des modèles de régression.

c@ssoulet

Nombre de messages : 763
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par niaboc le Mar 30 Mai 2017 - 9:32

je trouve que la définition de c@ssoulet définit bien l'homoscédasticité aussi

Niaboc
avatar
niaboc

Nombre de messages : 929
Age : 30
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Mar 30 Mai 2017 - 9:52

étymologiquement, homoscédasticité veut dire même variance. C'est tout.

Après on peut, si on veut, parler d'homoscédasticité des échantillons, ou des populations.

De même on peut bien parler de la normalité d'un échantillon, ou de la population. Il suffit juste de préciser de quoi on parle.

HTH, Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mar 30 Mai 2017 - 10:15

Heu ... Eric,

la distribution d'un échantillon est discrète, puisqu'il y a un nombre fini de valeurs. Comment pourrait-elle être gaussienne ?
Pour ma part, je ne comprends "normalité d'un échantillon" que comme le fait qu'un test de normalité n'est pas significatif.
C'est différent pour la variance, qui existe sur n'importe quelle série statistique et aussi sur les modèles probabilistes.

Cordialement.


Dernière édition par gg le Mar 30 Mai 2017 - 14:54, édité 1 fois

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Mar 30 Mai 2017 - 13:56

Si je jette un dès 10 fois et que je compte le nombre d'as. Et que je recommence ceci 100 fois. La distribution du nombre d'as (de 0 à 10) sur les 100 répétitions suit une loi de Poisson, et c'est pourtant la distribution d'un échantillon dont je parle.

Le problème n'est pas de parler de normalité ou pas, d'un échantillon ou d'une population, mais de faire un test d'hypothèse pour voir si - effectivement - on est sur une loi normale ou pas. Dans le premier cas, c'est juste descriptif. Dans le second, on se réfère à (l'estimation d') une population mère. Et c'est là que les problèmes commencent..

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mar 30 Mai 2017 - 14:59

Désolé Eric,

mais je ne comprends pas pourquoi tu parles de loi de Poisson à propos de Normalité. D'ailleurs, comme il n'y a que 11 valeurs, ce n'est pas une loi de Poisson. A moins que tu parles de la distribution d’échantillonnage, pas de la distribution de l'échantillon (ne serait-ce pas plutôt une multinomiale ?).

[Édit : je finis par me demander si j'ai compris de quoi tu parles, je ne vois aucune variable aléatoire de Poisson dans ton exemple, je vois un vecteur aléatoire dont les composantes sont discrètes finies : Sur 100 lancers, on obtiendra au plus 100 fois chacune des valeurs. ]

Pour ma part, je fais toujours très attention de distinguer l'aléatoire du réalisé, même si la réalisation provient d'un processus aléatoire.

Cordialement.

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Mar 30 Mai 2017 - 16:52

Je prenais la loi de Poisson comme un exemple, j'aurais pu prendre n'importe quelle loi, même une normale. C'était pour expliquer.

Oui, mon exemple était foireux. Je dois être crevé.

Ce que je veux dire est plus simple que tout ceci. Je veux dire que la loi est sous-jacente, et qu'un échantillon qui suit cette loi, peut être déclaré normal, ou poissonien, etc.

Par exemple, sous R:
Code:
rnorm(100)
me fourni bien un échantillon normale car tirée dans une population qui est normale. C'est tout ce que je veux dire.

La normalité, l’homoscédasticité, etc. peuvent concerner des échantillons ou des populations, il suffit de préciser.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mar 30 Mai 2017 - 18:00

Donc tu es bien d'accord avec moi, la normalité d'un échantillon concerne la variable sous-jacente, même si on teste sur l'échantillon : " un échantillon normal car tiré dans une population qui est normale". La suite de valeurs 1, 2, 3, 4 est Normale (dans ce sens) si je l'ai obtenue par hasard par tirage de 3 valeurs avec une loi de Gauss. A priori pas si j'ai énoncé les premiers entiers non nuls.

Par contre, pour l'égalité (éventuellement approximative) des variances on peut comparer les variances des deux échantillons directement (ce sont des séries statistiques), ce qui ne concerne que les échantillons, pas les populations dont on les a extraits, ou bien tester par une analyse de variance s'il peuvent provenir de populations de même variance, par un test. Si la première comparaison a donné des variances égales, le test devrait ne pas rejeter l'hypothèse d'égalité des variances.

Cordeialement.

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Mer 31 Mai 2017 - 5:46

Oui, sauf que les tests d'égalité des variances (deux ou plus) ne comparent pas les variances des échantillons pour eux mêmes, mais les estimations des variances des populations à partir des échantillons. Comme c'est le cas pour des comparaisons de moyennes.

Par ailleurs, une ANOVA ne testent pas si les variances sont égales. Ce sont les moyennes qui sont comparées.

J'espère que ma réponse éclaircie le débat..

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mer 31 Mai 2017 - 7:13

On est d'accord !

Cordialement.

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par zezima le Mer 31 Mai 2017 - 15:27

D'accord, merci à tous pour vos réponses et pour ce mini débat.

Donc au final, si on fait une simulation d'échantillons qui doivent être hétéroscédastiques, on se fiche que ce soit vraiment le cas car ce ne sont que des échantillons au final.

Au final je me prends peut être la tête car le fondement de tout test statistique est de faire une hypothèse sur des échantillons issus de populations donc ça s'applique également à l'hétéroscédasticité.
avatar
zezima

Nombre de messages : 748
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Mer 31 Mai 2017 - 20:23

Effectivement,

les hypothèses des tests statistiques portent sur les populations sous-jacentes, sauf celle qui donnent l'application d'un test pour des échantillons de taille suffisante (genre n> pour un test t)

Cordialement

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Jeu 1 Juin 2017 - 4:12

gg a écrit:sauf celle qui donnent l'application d'un test pour des échantillons de taille suffisante (genre n> pour un test t)
A mon tour, gg, de ne pas comprendre. Que signifie ce bout de phrase? Un test t est également un test de comparaison des moyennes de deux populations sous-jacentes..

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Jeu 1 Juin 2017 - 7:25

La condition classique d'utilisation d'un test t lorsqu'on ne peut assurer que la variable statistique est gaussienne est n>=30 (*), ce qui n'est pas dans la théorie du test, mais dans les habitudes des statisticiens, qui utilisent fréquemment la robustesse des tests. Cette condition porte sur l'échantillon, pas sur la population.

Je suis un peu surpris que tu aies autant de mal à me comprendre, je ne fais que reprendre des classiques. Je me demande si tu n'interprètes pas à l'envers ce que je dis depuis le début.

Cordialement.

(*) A ma grande surprise, le 30 a sauté dans mon message initial, mais c'est tellement classique ...

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par droopy le Jeu 1 Juin 2017 - 8:20

Au final je me prends peut être la tête car le fondement de tout test statistique est de faire une hypothèse sur des échantillons issus de populations donc ça s'applique également à l'hétéroscédasticité.
C'est plutôt l'inverse, tu fais des hypothèses sur les populations et tes échantillons sont là pour s'assurer ou non que ces hypothèses sont plausibles. Quand tu as deux échantillons il est logique de ne pas avoir exactement les mêmes variances, puisque ces deux variances ne sont que des estimations ponctuelles des variances des populations. La question est donc de savoir si la différence observée entre les variances des échantillons est compatible ou non avec l'hypothèse de deux populations avec des variances homogènes.

cdlt
avatar
droopy

Nombre de messages : 1073
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par zezima le Jeu 1 Juin 2017 - 9:48

Donc lors d'une expérimentation on aura vraisemblablement des différence de variances entre deux échantillons qui ne seront pas réalistes mais qui essaieront de se rapprocher de la réalité (en fonction du sample size).

Ce que tu conseilles pour évaluer l'homogénéité est alors de privilégier les données historiques pour augmenter le pool de données ?

Merci droopy,

Cdlt




avatar
zezima

Nombre de messages : 748
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par droopy le Jeu 1 Juin 2017 - 12:28

Ce n'est pas ce que sous entendait.
Prends le cas extrême ou deux échantillons sont issus de la même population, dans ces cas là il n'y a pas de doute concernant le fait qu'ils proviennent de populations de variance homogène puisqu'on parle de la même population pour les deux échantillons. Du fait de l'échantillonnage tes deux échantillons ne te donneront pas la même estimation de la variance de ta population, ils n'auront pas la même variance. Quand tu testes l'homogénéité des variances, la question est de savoir si la différence des variances de tes échantillon est compatible, est probable si tu fais l'hypothèse à priori que tes deux échantillons proviennent de deux populations dont les variances sont homogènes.

Pour te montrer ce qui se passe. On se place dans un cadre "théorique" idéal, ou on connait la population (X). Tu tires au hasard un premier échantillon de 100 valeurs et un deuxième aussi de 100 valeurs. Tu regardes ce qui se passe par rapport à leurs variances et au lieu de comparer les différences de variance tu regardes le ratio entre les variances (var1/var2) :
Code:
# notre population théorique :
set.seed(100)
X <- rnorm(1000, 4, 6)

# le premier échantillon
x1 <- sample(X, 100)
x2 <- sample(X, 100)

var(X)*(999)/1000
[1] 38.19778

var(x1)
[1] 35.39229
var(x2)
[1] 44.43272
var(x1)/var(x2)
[1] 0.7965366
Tu vois que les deux échantillons n'ont pas les mêmes variances et en plus ils n'ont pas des variances égales à celle de la population.

Si tu répètes l'opération un grand nombre de fois et si tu regardes la distribution du ratio entre les variances :
Code:
sims <- replicate(1e6, {
  x1 <- sample(X, 100)
  x2 <- sample(X, 100)
  res <- (var(x1)/99)/(var(x2)/99)
  res
  })
plot(density(sims), lwd = 2)
curve(df(x, 99, 99), col = "red", lty = 2, lwd = 2, add = T)
 
Cet exemple te montre que le ratio entre la variance de deux échantillons (en prenant en compte les effectifs relatifs) qui appartiennent à la même population suit une loi de Fischer à n1-1 et n2-1 ddl.

La logique d'un test statistique est de dire : si je fais l'hypothèse que les deux populations ont des variances homogènes alors il y a x% de chance que le ratio des variances des deux échantillons se situent entre telle et telle valeur parce qu'on sait que la distribution du ratio des variances est une loi de F.
Tu calcules le ratio entre les variances de tes échantillons, si ce ratio est entre les deux valeurs de l'intervalle à x% de niveau de confiance, alors le ratio que tu observes est compatible avec l'hypothèse de l'homogénéité des variances de la population. Et ce même si tes deux variances d'échantillons ne sont pas égales. Elles ne sont pas égales mais leur différence peut-être tout simplement du à la variabilité d'échantillonnage et non à la différence entre les variances de tes deux populations.

Bon j'espère que c'est plus clair maintenant.
avatar
droopy

Nombre de messages : 1073
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Jeu 1 Juin 2017 - 13:56

gg a écrit:La condition classique d'utilisation d'un test t lorsqu'on ne peut assurer que la variable statistique est gaussienne est n>=30 (*), ce qui n'est pas dans la théorie du test, mais dans les habitudes des statisticiens, qui utilisent fréquemment la robustesse des tests. Cette condition porte sur l'échantillon, pas sur la population..
Oui, mais ca reste bien les paramètres des populations qui sont comparés dans tous les cas, pas ceux des échantillons. Et ceci est contraire à ce que tu disais ici :
gg a écrit:les hypothèses des tests statistiques portent sur les populations sous-jacentes, sauf celle qui donnent l'application d'un test pour des échantillons de taille suffisante
C'est ce que je voulais préciser.

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par gg le Jeu 1 Juin 2017 - 18:04

Bof ... tu interprètes ma phrase à ta façon ... tu aurais pu être plus strict encore en interprétant "hypothèses" par "hypothèses statistiques".
En fait, tu enfonces des portes ouvertes, personne ne conteste depuis presque le début que les tests sur des échantillons portent sur des propriétés des populations dont ils ont été tirés. Toi seul semble lire autre chose dans nos messages.

Mais je te l'ai dit déjà, on est d'accord.

Cordialement.

gg

Nombre de messages : 1945
Date d'inscription : 10/01/2011

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Eric Wajnberg le Ven 2 Juin 2017 - 4:53

Ok !

Eric.
avatar
Eric Wajnberg

Nombre de messages : 715
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par zezima le Ven 2 Juin 2017 - 8:46

Bonjour Droopy, merci pour ton exemple.

On peut donc conclure que lorsqu'on veut "simuler" de l'homoscédasticité, on se fiche de savoir si les groupes simulés seront bien homoscédastiques car c'est représentatif des échantillonnages qu'on pourrait obtenir dans la vraie vie.

Une simulation prend alors en compte l'incertitude de l'échantillonnage en compte.

Merci
avatar
zezima

Nombre de messages : 748
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par droopy le Ven 2 Juin 2017 - 12:19

Je dirais que de toute manière l'homoscédasticité ne se regarde pas sur les groupes simulés mais sur les populations dont ils sont issus, mais que la différence de variance entre les groupes te permet d'estimer s'il est vraissemblable que les populations soient homoscédastiques.

La simulation mime l'incertitude d'échantillonnage. Le seul but de cette simulation c'était que tu vois que deux populations avec des variances identiques (ici la même population utilisée deux fois) génère aléatoirement des variances d'échantillons différentes (les variances d'échantillons ne seront jamais égales sauf a reprendre les mêmes individus). La question qui se pose est : est-ce que la différence de variance observée avec mes deux échantillons est compatible avec l'hypothèse d'homoscédasticité ?

cdlt
avatar
droopy

Nombre de messages : 1073
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Que représente vraiment l'homoscédasticité ?

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Page 1 sur 2 1, 2  Suivant

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum