Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
T de student ou intervalle de confiance
+2
gg
Qu4tre
6 participants
Page 1 sur 1
T de student ou intervalle de confiance
Bonjour,
Je ne peux m'empêcher de commencer par m'excuser pour l'extrême naïveté dont je vais faire preuve dans ce temple numérique des statistiques.
Je m'interroge sur la comparaison de moyenne et cherche à mettre en avant une différence significative entre 2 échantillons. Je suis perplexe quant à l'outil à utiliser : le calcul des intervalles de confiance permet d'affirmer, si les IC ne se recoupent pas une différence significative entre 2 moyenne n'est-ce pas? Le test de Student permet également d'affirmer cette différence.
Mais alors quand et pourquoi utiliser un test de student ou une simple comparaison d'intervalle de confiance?
Merci d'avance de votre réponse magnanime.
Bonne journée à tous
Je ne peux m'empêcher de commencer par m'excuser pour l'extrême naïveté dont je vais faire preuve dans ce temple numérique des statistiques.
Je m'interroge sur la comparaison de moyenne et cherche à mettre en avant une différence significative entre 2 échantillons. Je suis perplexe quant à l'outil à utiliser : le calcul des intervalles de confiance permet d'affirmer, si les IC ne se recoupent pas une différence significative entre 2 moyenne n'est-ce pas? Le test de Student permet également d'affirmer cette différence.
Mais alors quand et pourquoi utiliser un test de student ou une simple comparaison d'intervalle de confiance?
Merci d'avance de votre réponse magnanime.
Bonne journée à tous
Qu4tre- Nombre de messages : 3
Date d'inscription : 07/04/2017
Re: T de student ou intervalle de confiance
Bonjour.
Et que fais-tu si les intervalles de confiance se recoupent, mais peu ? Les tests sont construits pour prendre des décisions dans des cas peu évidents (si les intervalles de confiance ne se recoupent pas, on a souvent déjà vu que les moyennes sont nettement différentes.
Cordialement.
Et que fais-tu si les intervalles de confiance se recoupent, mais peu ? Les tests sont construits pour prendre des décisions dans des cas peu évidents (si les intervalles de confiance ne se recoupent pas, on a souvent déjà vu que les moyennes sont nettement différentes.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: T de student ou intervalle de confiance
J'ai tendance à considérer (en étant sans doute obtus) qu'à partir du moment où les intervalles se recoupent, même très faiblement, la différence ne peut être affirmée dans la mesure où d'autres échantillons pourraient conduire à des résultats contraires.
Qu4tre- Nombre de messages : 3
Date d'inscription : 07/04/2017
Re: T de student ou intervalle de confiance
Bonjour, la question m'intéressait donc j'ai fait un petit essai.
J'ai simulé 2 échantillons de 30 individus (groupe 1 et groupe 2) ayant une différence de moyenne de 0,5 et une variance similaire (1).
J'ai calculé les intervalles de confiance à 95% et réalisé un t-test pour lequel j'ai récupéré la p-valeur.
J'obtiens les résultats suivants :
Groupe 1 : IC95%=[10.07;10.69]
Groupe 2 : IC95%=[10.68;11.44]
p-valeur du test de student = 0.009 donc significatif.
Dans le cas de figure des intervalles de confiance, on ne rejetterais pas alors que le test de Student nous fait rejeter l'hypothèse d'égalité des moyennes.
Donc je ne pense pas que l'intervalle de confiance et le t-test soient équivalents.
Je n'ai jamais vu des articles où on portait des conclusions en comparant des intervalles de confiance.
Par contre on voit très souvent des tests statistiques pour prendre les décisions.
Après je suis d'accord avec toi, c'est très spécifique à la question qu'on se pose et je ne sais pas ce qui serait le plus intéressant à prendre en compte entre les deux paramètres.
J'ai simulé 2 échantillons de 30 individus (groupe 1 et groupe 2) ayant une différence de moyenne de 0,5 et une variance similaire (1).
- Code:
g1
[1] 9.816572 9.986391 9.433911 10.738642 10.996064 11.795079 9.182538
[8] 10.691788 11.892035 10.031320 8.923802 10.852126 10.028425 9.614729
[15] 12.447473 11.116793 9.626526 11.633421 10.701976 9.979956 9.501012
[22] 9.820433 10.083803 10.050819 9.278529 11.230093 10.419751 9.836678
[29] 10.943779 10.757774
g2
[1] 10.141827 8.958249 12.168681 13.787521 9.662228 12.446536 10.822128
[8] 11.329080 9.440091 11.155502 12.572087 11.151410 12.662031 10.792231
[15] 10.834591 10.984461 10.975014 10.893180 10.452646 11.215147 10.162314
[22] 11.953497 10.342893 10.298692 9.992591 11.912457 11.639874 11.869742
[29] 10.790892 10.343348
J'ai calculé les intervalles de confiance à 95% et réalisé un t-test pour lequel j'ai récupéré la p-valeur.
J'obtiens les résultats suivants :
Groupe 1 : IC95%=[10.07;10.69]
Groupe 2 : IC95%=[10.68;11.44]
p-valeur du test de student = 0.009 donc significatif.
Dans le cas de figure des intervalles de confiance, on ne rejetterais pas alors que le test de Student nous fait rejeter l'hypothèse d'égalité des moyennes.
Donc je ne pense pas que l'intervalle de confiance et le t-test soient équivalents.
Je n'ai jamais vu des articles où on portait des conclusions en comparant des intervalles de confiance.
Par contre on voit très souvent des tests statistiques pour prendre les décisions.
Après je suis d'accord avec toi, c'est très spécifique à la question qu'on se pose et je ne sais pas ce qui serait le plus intéressant à prendre en compte entre les deux paramètres.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: T de student ou intervalle de confiance
Alors l'intervalle de confiance n'est finalement "qu'illustratif".
Je trouve étonnant d'avoir des divergences de conclusion alors que les éléments de formules sont assez proches.
J'ai également tendance à utiliser le Student, car en tant que test il est justement là pour rendre un avis sur la différence des moyennes, mais j'ai du coup de plus en plus de mal à me positionner et à communiquer sur l'intervalle de confiance
Je trouve étonnant d'avoir des divergences de conclusion alors que les éléments de formules sont assez proches.
J'ai également tendance à utiliser le Student, car en tant que test il est justement là pour rendre un avis sur la différence des moyennes, mais j'ai du coup de plus en plus de mal à me positionner et à communiquer sur l'intervalle de confiance
Qu4tre- Nombre de messages : 3
Date d'inscription : 07/04/2017
Re: T de student ou intervalle de confiance
Effectivement, le calcul d'un test-t est construit sur des calculs d'intervalle de confiance. C'est la même chose, et l'un n'est juste qu'une traduction graphique de l'autre.
Le problème est que les deux doivent donner la même chose asymptotiquement seulement, c'est à dire avec - en théorie - une quantité infinie d'individus, avec les mêmes variances, etc. L'exemple de zezima est à ce titre un beau contre-exemple lorsqu'on n'est pas dans une telle situation asymptotique.
Pour répondre à zezima, On prends je pense au contraire très fréquemment ce genre de conclusions en comparant des intervalles de confiance, notamment - par exemple - dans des comparaisons multiples. Il n'y a qu'à regarder, par exemple, ce que donne une instruction R comme:
après une ANOVA.
HTH, Eric.
Le problème est que les deux doivent donner la même chose asymptotiquement seulement, c'est à dire avec - en théorie - une quantité infinie d'individus, avec les mêmes variances, etc. L'exemple de zezima est à ce titre un beau contre-exemple lorsqu'on n'est pas dans une telle situation asymptotique.
Pour répondre à zezima, On prends je pense au contraire très fréquemment ce genre de conclusions en comparant des intervalles de confiance, notamment - par exemple - dans des comparaisons multiples. Il n'y a qu'à regarder, par exemple, ce que donne une instruction R comme:
- Code:
plot(TukeyHSD(aov(..))
après une ANOVA.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: T de student ou intervalle de confiance
Exactement, au final en refaisant la même simulation, pour 10000 individus par groupe, on a une p-valeur qui se rapproche de la non-significativité dans les rares cas de figure où les intervalles de confiance se coupent :
Groupe 1 : IC95%=[10.481;10.52]
Groupe 2 : IC95%=[10.51;10.55]
p-valeur du test de student = 0.021
Cela devient de plus en plus rare lors de cette simulation d'avoir des différences entre les conclusions des IC et de la pvaleur du test de Student.
Groupe 1 : IC95%=[10.481;10.52]
Groupe 2 : IC95%=[10.51;10.55]
p-valeur du test de student = 0.021
Cela devient de plus en plus rare lors de cette simulation d'avoir des différences entre les conclusions des IC et de la pvaleur du test de Student.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: T de student ou intervalle de confiance
Et pour cause. Le calcul d'un IC et d'un test t est exactement le même (c'est même la définition de l'intervalle de confiance). Le contraire serait étonnant..
Eric.
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: T de student ou intervalle de confiance
J'ai compris pourquoi, en faite c'est la valeur du z_alpha/2 qui implique qu'on n'ait pas les mêmes résultats.
La théorie dit qu'au delà d'un échantillon de 30 individus, on peut prendre un z_alpha/2=1.96 alors que sa valeur est légèrement différente lorsqu'on prend n=30 d'après la table de Student.
Pour n=30 on a z_alpha/2=2.0423.
Au final vachement important de ne pas se référer à la théorie de temps en temps.
Une comparaison d'IC entre deux groupes et un t-test entre deux groupes est donc la même chose si on prend la bonne valeur de z_alpha/2 même au delà de n>30.
(attention à bien prendre les chiffres après la virgule pour z_alpha/2, j'ai pris que 4 chiffres après la virgule et ça ne marche pas à tous les coups).
La théorie dit qu'au delà d'un échantillon de 30 individus, on peut prendre un z_alpha/2=1.96 alors que sa valeur est légèrement différente lorsqu'on prend n=30 d'après la table de Student.
Pour n=30 on a z_alpha/2=2.0423.
Au final vachement important de ne pas se référer à la théorie de temps en temps.
Une comparaison d'IC entre deux groupes et un t-test entre deux groupes est donc la même chose si on prend la bonne valeur de z_alpha/2 même au delà de n>30.
(attention à bien prendre les chiffres après la virgule pour z_alpha/2, j'ai pris que 4 chiffres après la virgule et ça ne marche pas à tous les coups).
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: T de student ou intervalle de confiance
Mais si, on est bien dans le cadre de la théorie ici aussi..zezima a écrit:Au final vachement important de ne pas se référer à la théorie de temps en temps.
Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Re: T de student ou intervalle de confiance
Bonjour,
en plus ce n'est pas le bon intervalle de confiance qui est établit ici. Pour pouvoir réellement comparer avec le test il faudrait construire l'intervalle de confiance de la différence des deux moyennes et non de chacune des moyennes.
Cdlt
en plus ce n'est pas le bon intervalle de confiance qui est établit ici. Pour pouvoir réellement comparer avec le test il faudrait construire l'intervalle de confiance de la différence des deux moyennes et non de chacune des moyennes.
Cdlt
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: T de student ou intervalle de confiance
Bonjour,
On peut donc tout a fait avoir deux IC qui se chevauchent et une difference de moyennes significative au meme risque alpha. Cela revient au commentaire fait par Droopy. Pour pouvoir comparer un IC et un test, il faut considerer l'IC de la quantite testee avec le test en question, ici une difference de moyennes.
Ayana
Non, les deux approches ne sont pas equivalentes car l'erreur standard utilisee pour l'IC de chaque moyenne est plus grande que l'erreur standard de la difference de moyenne utilisee pour le test de Student.Eric a écrit:Et pour cause. Le calcul d'un IC et d'un test t est exactement le même (c'est même la définition de l'intervalle de confiance). Le contraire serait étonnant..
On peut donc tout a fait avoir deux IC qui se chevauchent et une difference de moyennes significative au meme risque alpha. Cela revient au commentaire fait par Droopy. Pour pouvoir comparer un IC et un test, il faut considerer l'IC de la quantite testee avec le test en question, ici une difference de moyennes.
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: T de student ou intervalle de confiance
Bon, il faut donc être plus précis.
Un test t, à la base, c'est la comparaison d'une moyenne à une valeur attendue ("théorique"). Dans ce cas, l'erreur standard est l'erreur standard de la moyenne. Et là, effectivement, c'est strictement équivalent. A noter par exemple, que c'est bien la fonction t.test() dans R qui permet de calculer un intervalle de confiance.
Comme il est justement fait remarquer ici, un test t peut aussi être utilisé pour comparer deux moyennes, issues de deux échantillons. Est c'est effectivement un intervalle de confiance de la différence des moyennes qui est construit dans ce cas. Ces deux échantillons sont supposés être indépendants. Du coup, il n'y a pas de double produits dans le calcul de la variance de la différence des moyennes, et la variance de la différence revient à une moyenne pondérée des variances des deux échantillons. Du coup, l'erreur standard de la différence peut être plus grande (et non plus petite) que l'erreur standard de chaque moyenne. Un exemple:
Il faut être précis, effectivement. HTH, Eric.
Un test t, à la base, c'est la comparaison d'une moyenne à une valeur attendue ("théorique"). Dans ce cas, l'erreur standard est l'erreur standard de la moyenne. Et là, effectivement, c'est strictement équivalent. A noter par exemple, que c'est bien la fonction t.test() dans R qui permet de calculer un intervalle de confiance.
Comme il est justement fait remarquer ici, un test t peut aussi être utilisé pour comparer deux moyennes, issues de deux échantillons. Est c'est effectivement un intervalle de confiance de la différence des moyennes qui est construit dans ce cas. Ces deux échantillons sont supposés être indépendants. Du coup, il n'y a pas de double produits dans le calcul de la variance de la différence des moyennes, et la variance de la différence revient à une moyenne pondérée des variances des deux échantillons. Du coup, l'erreur standard de la différence peut être plus grande (et non plus petite) que l'erreur standard de chaque moyenne. Un exemple:
- Code:
> x1=rnorm(10000000,1,1)
> x2=rnorm(10000000,2,1)
> sd(x1)/sqrt(length(x1))
[1] 0.0003161923
> sd(x2)/sqrt(length(x2))
[1] 0.000316181
> sd(x1-x2)/sqrt(length(x1-x2))
[1] 0.0004471602
Il faut être précis, effectivement. HTH, Eric.
Eric Wajnberg- Nombre de messages : 1237
Date d'inscription : 14/09/2012
Sujets similaires
» Intervalle de tolérance vs intervalle de confiance
» t de student
» glm ou student ?
» t de student?
» test de student
» t de student
» glm ou student ?
» t de student?
» test de student
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|