T de student ou intervalle de confiance

par Qu4tre Ven 7 Avr 2017 - 9:53

Bonjour,

Je ne peux m'empêcher de commencer par m'excuser pour l'extrême naïveté dont je vais faire preuve dans ce temple numérique des statistiques.
Je m'interroge sur la comparaison de moyenne et cherche à mettre en avant une différence significative entre 2 échantillons. Je suis perplexe quant à l'outil à utiliser : le calcul des intervalles de confiance permet d'affirmer, si les IC ne se recoupent pas une différence significative entre 2 moyenne n'est-ce pas? Le test de Student permet également d'affirmer cette différence.

Mais alors quand et pourquoi utiliser un test de student ou une simple comparaison d'intervalle de confiance?

Merci d'avance de votre réponse magnanime.
Bonne journée à tous

par gg Ven 7 Avr 2017 - 10:15

Bonjour.

Et que fais-tu si les intervalles de confiance se recoupent, mais peu ? Les tests sont construits pour prendre des décisions dans des cas peu évidents (si les intervalles de confiance ne se recoupent pas, on a souvent déjà vu que les moyennes sont nettement différentes.

Cordialement.

par Qu4tre Ven 7 Avr 2017 - 10:23

J'ai tendance à considérer (en étant sans doute obtus) qu'à partir du moment où les intervalles se recoupent, même très faiblement, la différence ne peut être affirmée dans la mesure où d'autres échantillons pourraient conduire à des résultats contraires.

par zezima Ven 7 Avr 2017 - 11:23

Bonjour, la question m'intéressait donc j'ai fait un petit essai.

J'ai simulé 2 échantillons de 30 individus (groupe 1 et groupe 2) ayant une différence de moyenne de 0,5 et une variance similaire (1).

Code:: g1 [1] 9.816572 9.986391 9.433911 10.738642 10.996064 11.795079 9.182538 [8] 10.691788 11.892035 10.031320 8.923802 10.852126 10.028425 9.614729 [15] 12.447473 11.116793 9.626526 11.633421 10.701976 9.979956 9.501012 [22] 9.820433 10.083803 10.050819 9.278529 11.230093 10.419751 9.836678 [29] 10.943779 10.757774 g2 [1] 10.141827 8.958249 12.168681 13.787521 9.662228 12.446536 10.822128 [8] 11.329080 9.440091 11.155502 12.572087 11.151410 12.662031 10.792231 [15] 10.834591 10.984461 10.975014 10.893180 10.452646 11.215147 10.162314 [22] 11.953497 10.342893 10.298692 9.992591 11.912457 11.639874 11.869742 [29] 10.790892 10.343348

J'ai calculé les intervalles de confiance à 95% et réalisé un t-test pour lequel j'ai récupéré la p-valeur.

J'obtiens les résultats suivants :
Groupe 1 : IC95%=[10.07;10.69]
Groupe 2 : IC95%=[10.68;11.44]

p-valeur du test de student = 0.009 donc significatif.

Dans le cas de figure des intervalles de confiance, on ne rejetterais pas alors que le test de Student nous fait rejeter l'hypothèse d'égalité des moyennes.

Donc je ne pense pas que l'intervalle de confiance et le t-test soient équivalents.

Je n'ai jamais vu des articles où on portait des conclusions en comparant des intervalles de confiance.
Par contre on voit très souvent des tests statistiques pour prendre les décisions.
Après je suis d'accord avec toi, c'est très spécifique à la question qu'on se pose et je ne sais pas ce qui serait le plus intéressant à prendre en compte entre les deux paramètres.

par Qu4tre Ven 7 Avr 2017 - 11:35

Alors l'intervalle de confiance n'est finalement "qu'illustratif".
Je trouve étonnant d'avoir des divergences de conclusion alors que les éléments de formules sont assez proches.

J'ai également tendance à utiliser le Student, car en tant que test il est justement là pour rendre un avis sur la différence des moyennes, mais j'ai du coup de plus en plus de mal à me positionner et à communiquer sur l'intervalle de confiance

par Eric Wajnberg Ven 7 Avr 2017 - 11:53

Effectivement, le calcul d'un test-t est construit sur des calculs d'intervalle de confiance. C'est la même chose, et l'un n'est juste qu'une traduction graphique de l'autre.

Le problème est que les deux doivent donner la même chose asymptotiquement seulement, c'est à dire avec - en théorie - une quantité infinie d'individus, avec les mêmes variances, etc. L'exemple de zezima est à ce titre un beau contre-exemple lorsqu'on n'est pas dans une telle situation asymptotique.

Pour répondre à zezima, On prends je pense au contraire très fréquemment ce genre de conclusions en comparant des intervalles de confiance, notamment - par exemple - dans des comparaisons multiples. Il n'y a qu'à regarder, par exemple, ce que donne une instruction R comme:

Code:: plot(TukeyHSD(aov(..))

après une ANOVA.

HTH, Eric.

par zezima Ven 7 Avr 2017 - 12:25

Exactement, au final en refaisant la même simulation, pour 10000 individus par groupe, on a une p-valeur qui se rapproche de la non-significativité dans les rares cas de figure où les intervalles de confiance se coupent :

Groupe 1 : IC95%=[10.481;10.52]
Groupe 2 : IC95%=[10.51;10.55]

p-valeur du test de student = 0.021

Cela devient de plus en plus rare lors de cette simulation d'avoir des différences entre les conclusions des IC et de la pvaleur du test de Student.

par Eric Wajnberg Ven 7 Avr 2017 - 12:45

Et pour cause. Le calcul d'un IC et d'un test t est exactement le même (c'est même la définition de l'intervalle de confiance). Le contraire serait étonnant..

Eric.

par zezima Ven 7 Avr 2017 - 12:55

J'ai compris pourquoi, en faite c'est la valeur du z_alpha/2 qui implique qu'on n'ait pas les mêmes résultats.

La théorie dit qu'au delà d'un échantillon de 30 individus, on peut prendre un z_alpha/2=1.96 alors que sa valeur est légèrement différente lorsqu'on prend n=30 d'après la table de Student.

Pour n=30 on a z_alpha/2=2.0423.

Au final vachement important de ne pas se référer à la théorie de temps en temps.

Une comparaison d'IC entre deux groupes et un t-test entre deux groupes est donc la même chose si on prend la bonne valeur de z_alpha/2 même au delà de n>30.

(attention à bien prendre les chiffres après la virgule pour z_alpha/2, j'ai pris que 4 chiffres après la virgule et ça ne marche pas à tous les coups).

par Eric Wajnberg Ven 7 Avr 2017 - 13:12

zezima a écrit:Au final vachement important de ne pas se référer à la théorie de temps en temps.

Mais si, on est bien dans le cadre de la théorie ici aussi..

Eric.

par droopy Ven 7 Avr 2017 - 14:14

Bonjour,

en plus ce n'est pas le bon intervalle de confiance qui est établit ici. Pour pouvoir réellement comparer avec le test il faudrait construire l'intervalle de confiance de la différence des deux moyennes et non de chacune des moyennes.

Cdlt

par Ayana Ven 7 Avr 2017 - 14:50

Bonjour,

Eric a écrit:Et pour cause. Le calcul d'un IC et d'un test t est exactement le même (c'est même la définition de l'intervalle de confiance). Le contraire serait étonnant..

Non, les deux approches ne sont pas equivalentes car l'erreur standard utilisee pour l'IC de chaque moyenne est plus grande que l'erreur standard de la difference de moyenne utilisee pour le test de Student.
On peut donc tout a fait avoir deux IC qui se chevauchent et une difference de moyennes significative au meme risque alpha. Cela revient au commentaire fait par Droopy. Pour pouvoir comparer un IC et un test, il faut considerer l'IC de la quantite testee avec le test en question, ici une difference de moyennes.
Ayana

par Eric Wajnberg Ven 7 Avr 2017 - 15:06

Bon, il faut donc être plus précis.

Un test t, à la base, c'est la comparaison d'une moyenne à une valeur attendue ("théorique"). Dans ce cas, l'erreur standard est l'erreur standard de la moyenne. Et là, effectivement, c'est strictement équivalent. A noter par exemple, que c'est bien la fonction t.test() dans R qui permet de calculer un intervalle de confiance.

Comme il est justement fait remarquer ici, un test t peut aussi être utilisé pour comparer deux moyennes, issues de deux échantillons. Est c'est effectivement un intervalle de confiance de la différence des moyennes qui est construit dans ce cas. Ces deux échantillons sont supposés être indépendants. Du coup, il n'y a pas de double produits dans le calcul de la variance de la différence des moyennes, et la variance de la différence revient à une moyenne pondérée des variances des deux échantillons. Du coup, l'erreur standard de la différence peut être plus grande (et non plus petite) que l'erreur standard de chaque moyenne. Un exemple:

Code:: > x1=rnorm(10000000,1,1) > x2=rnorm(10000000,2,1) > sd(x1)/sqrt(length(x1)) [1] 0.0003161923 > sd(x2)/sqrt(length(x2)) [1] 0.000316181 > sd(x1-x2)/sqrt(length(x1-x2)) [1] 0.0004471602

Il faut être précis, effectivement. HTH, Eric.

par Contenu sponsorisé

T de student ou intervalle de confiance

T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance

Re: T de student ou intervalle de confiance