Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Calcul de la p-value
2 participants
Page 1 sur 1
Calcul de la p-value
Bonjour à tous. Nous sommes actuellement en train d'étudier les tests d'hypothèses, et quelques questions me taraudent. La p-value (ou valeur p) est définie comme étant le plus petit niveau du risque de première espèce pour lequel on rejette l'hypothèse nulle.
Dans notre cours, il est écrit que, dans un test unilatéral inférieur (à gauche), "on calcule la probabilité d'être en-dessous de Z (la statistique de test)." Ensuite, on compare cette probabilité au seuil de confiance α (qui est souvent égal à 5%). Si la probabilité est inférieure ou égale à α, alors on rejette l'hypothèse nulle H0.
Ma question est la suivante : quelle est la probabilité (la p-value) qu'on devrait calculer si l'on était dans un test unilatéral supérieur (à droite) ou encore dans un test bilatéral (dans un test unilatéral inférieur, on a déterminé la probabilité d'être en-dessous de Z) ?
Merci d'avance pour votre aide.
Dans notre cours, il est écrit que, dans un test unilatéral inférieur (à gauche), "on calcule la probabilité d'être en-dessous de Z (la statistique de test)." Ensuite, on compare cette probabilité au seuil de confiance α (qui est souvent égal à 5%). Si la probabilité est inférieure ou égale à α, alors on rejette l'hypothèse nulle H0.
Ma question est la suivante : quelle est la probabilité (la p-value) qu'on devrait calculer si l'on était dans un test unilatéral supérieur (à droite) ou encore dans un test bilatéral (dans un test unilatéral inférieur, on a déterminé la probabilité d'être en-dessous de Z) ?
Merci d'avance pour votre aide.
stat01- Nombre de messages : 2
Date d'inscription : 31/03/2012
Re: Calcul de la p-value
Bonjour.
le seul avantage de la p-value est que "Ensuite, on compare cette p-value au seuil de confiance α (qui est souvent égal à 5%). Si la probabilité est inférieure ou égale à α, alors on rejette l'hypothèse nulle H0. " s'applique toujours.
Ce qu'il faut comprendre, c'est que dans tous les tests, on utilise une variable, la variable de test (dans ton cas, Z), dont on calcule la valeur sur l'échantillon (ou les échantillons) réels. Il y a une zone d'acceptation (dans ton cas, Z autour de 0 ou au dessus) et une zone de rejet de H0 (dans ton cas en dessous d'une certaine valeur pour Z). La zone de rejet est déterminée par le seuil de risque : Plus le risque est petit (un grand risque serait sans utilité), plus la zone d'acceptation est grande puisqu'on a une plus grande probabilité d'accepter H0.
cette méthode est délicate à utiliser pour les traitements automatiques (logiciels), car il faut demander à l'utilisateur quel risque il choisit. On utilise donc une autre idée, la p-value. Elle est bien définie dans ton exemple : "le plus petit niveau du risque de première espèce pour lequel on rejette l'hypothèse nulle. " Les logiciels ne donnent pas seulement la valeur de la variable (de Z pour ton exemple), mais aussi la p-value. Qui redonne la même technique dans ton cas (mais aussi dans tous les autres alors qu'avec un test supérieur, ce serait l'inverse), donc une seule façon d'interpréter dans tous les cas.
Par exemple, si le risque est 5%; tu obtiens dans ton cas une p-value de 0,02 (2%); la valeur de Z est telle qu'il faudrait accepter un risque de 2% pour accepter H0, donc étendre la zone d'acceptation au delà de ce qu'elle est pour 5%. Donc la valeur de Z est en dehors de la zone d'acceptation pour 5%, elle est dans la zone de rejet. Si par contre la p-value est 10%, on peut étendre la zone d'acceptation au delà de la valeur de Z pour atteindre celle du risque 5%, donc Z était dans la zone d'acceptation.
Un gros inconvénient est que la p-value n'est pas la probabilité d'un événement lié à la situation. Tout nombre entre 0% et 100% peut être considéré comme une probabilité, donc la p-value aussi, mais pas la probabilité d'un événement utile.
Par contre la règle est simple : p-value presque nulle : test significatif (= H0 à rejeter au risque r%); p-value supérieure au risque : pas de rejet de H0.
Cordialement.
NB : Pour ta question de l'avant dernier paragraphe, il y a des réponses dans tous les cours, il suffit de regarder la zone d'acceptation. Mais on peut y revenir si c'était le vrai sujet (j'ai traité le titre). Et il y a une réponse par test, et des centaines de tests classiques !
le seul avantage de la p-value est que "Ensuite, on compare cette p-value au seuil de confiance α (qui est souvent égal à 5%). Si la probabilité est inférieure ou égale à α, alors on rejette l'hypothèse nulle H0. " s'applique toujours.
Ce qu'il faut comprendre, c'est que dans tous les tests, on utilise une variable, la variable de test (dans ton cas, Z), dont on calcule la valeur sur l'échantillon (ou les échantillons) réels. Il y a une zone d'acceptation (dans ton cas, Z autour de 0 ou au dessus) et une zone de rejet de H0 (dans ton cas en dessous d'une certaine valeur pour Z). La zone de rejet est déterminée par le seuil de risque : Plus le risque est petit (un grand risque serait sans utilité), plus la zone d'acceptation est grande puisqu'on a une plus grande probabilité d'accepter H0.
cette méthode est délicate à utiliser pour les traitements automatiques (logiciels), car il faut demander à l'utilisateur quel risque il choisit. On utilise donc une autre idée, la p-value. Elle est bien définie dans ton exemple : "le plus petit niveau du risque de première espèce pour lequel on rejette l'hypothèse nulle. " Les logiciels ne donnent pas seulement la valeur de la variable (de Z pour ton exemple), mais aussi la p-value. Qui redonne la même technique dans ton cas (mais aussi dans tous les autres alors qu'avec un test supérieur, ce serait l'inverse), donc une seule façon d'interpréter dans tous les cas.
Par exemple, si le risque est 5%; tu obtiens dans ton cas une p-value de 0,02 (2%); la valeur de Z est telle qu'il faudrait accepter un risque de 2% pour accepter H0, donc étendre la zone d'acceptation au delà de ce qu'elle est pour 5%. Donc la valeur de Z est en dehors de la zone d'acceptation pour 5%, elle est dans la zone de rejet. Si par contre la p-value est 10%, on peut étendre la zone d'acceptation au delà de la valeur de Z pour atteindre celle du risque 5%, donc Z était dans la zone d'acceptation.
Un gros inconvénient est que la p-value n'est pas la probabilité d'un événement lié à la situation. Tout nombre entre 0% et 100% peut être considéré comme une probabilité, donc la p-value aussi, mais pas la probabilité d'un événement utile.
Par contre la règle est simple : p-value presque nulle : test significatif (= H0 à rejeter au risque r%); p-value supérieure au risque : pas de rejet de H0.
Cordialement.
NB : Pour ta question de l'avant dernier paragraphe, il y a des réponses dans tous les cours, il suffit de regarder la zone d'acceptation. Mais on peut y revenir si c'était le vrai sujet (j'ai traité le titre). Et il y a une réponse par test, et des centaines de tests classiques !
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Calcul de la p-value
Merci pour ta réponse gg. En fait, dans un exercice que nous avons fait en classe, il s'agissait d'un test unilatéral inférieur et le professeur nous a dit de calculer la probabilité d'être en-dessous de Z ( P(Z≤valeur de Z) ). Dans un test unilatéral supérieur ou dans un test bilatéral, quelle est la probabilité que nous devrions calculer ?
Merci encore.
Merci encore.
stat01- Nombre de messages : 2
Date d'inscription : 31/03/2012
Re: Calcul de la p-value
je suis un peu dubitatif : cette catégorisation de test (je l'ai déjà rencontrée) m'a toujours laissé songeur, car elle dépend de la façon de calculer, pas de l'hypothèse. Je précise donc :
* H0 : Z=0 H1 : Z<0 (unilatéral inférieur ?) La zone d'acceptation est [a, +inf[, avec naturellement a<0. La p-value est Pr(Z * H0 : Z=0 H1 : Z>0 (unilatéral inférieur ?) La zone d'acceptation est ]-inf[, a], avec naturellement a>0. La p-value est Pr(Z>Z0)
* H0 : Z=0 H1 : Z différent de 0 (bilatéral centré) La zone d'acceptation est [-a, a[, avec naturellement a>0. La p-value est 2Pr(ZZ0) si Z0>0. En effet, il faut compter les deux "queues de distribution".
Mais il faut reprendre la définition précise dans chaque cas pour bien savoir ce qu'on fait.
Rappel : La p-value se calcule à l'aide d'une probabilité, mais seulement théorique. Ce n'est pas la probabilité que H0 soit vraie, ou que le test soit efficace, ou ..
Cordialement.
* H0 : Z=0 H1 : Z<0 (unilatéral inférieur ?) La zone d'acceptation est [a, +inf[, avec naturellement a<0. La p-value est Pr(Z
* H0 : Z=0 H1 : Z différent de 0 (bilatéral centré) La zone d'acceptation est [-a, a[, avec naturellement a>0. La p-value est 2Pr(Z
Mais il faut reprendre la définition précise dans chaque cas pour bien savoir ce qu'on fait.
Rappel : La p-value se calcule à l'aide d'une probabilité, mais seulement théorique. Ce n'est pas la probabilité que H0 soit vraie, ou que le test soit efficace, ou ..
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» calcul p-value
» Calcul de distances
» Calcul de représentativité
» Calcul de la p-value
» calcul du RSQ en une dimension
» Calcul de distances
» Calcul de représentativité
» Calcul de la p-value
» calcul du RSQ en une dimension
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum