Les posteurs les plus actifs de la semaine
clemm
 
Nik
 
Florent Aubry
 


présentation des résultats de tests de Wilcoxon

Aller en bas

présentation des résultats de tests de Wilcoxon

Message par tinomulot le Jeu 2 Oct 2008 - 15:05

Bonjour,
J'ai réalisé un série de test de Wilcoxon sous R.
Je voudrais savoir si ce type de présentation est correcte
(j'en ai toute une batterie, alors avant de trop fignoler la présentation pour chaque...):


Je ne sais pas si cela est juste de mettre les effectifs mais d'omettre les valeurs des test W.
En plus, il y a le soucis des "indices de description moyens". Ne devrais-je pas plutôt mettre "les indices de description médians" étant en présence d'un test de Wilcoxon-Mann&Withney (donc non-paramétrique).
Dans ce cas, le dernier indice sur lequel porte le test "DISP_epiO" présenterait des "indices de description médians" sur et hors structure de 0 et 0.
Dois-je à votre avis dans ce cas créer un troisième groupe intitulé: "Indices indifférent à la présence de structures"?

Merci d'avance pour toute aide,
Tino

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Mer 22 Oct 2008 - 17:52

???
personne n'a une idée?
Quelqu'un n'a jamais été amené à présenter ce genre de résultats?
Dans l'article suivant: http://www.isu.edu/bios/CV_Pub/Bowyer/CV_pdfs/62.pdf, ce sont bien les moyennes qui sont présentées... mais, est-ce juste?

PS: Sinon, j'ai bien sur oublié les erreurs standards associées aux moyennes... mais si ce sont les médianes que je dois présenter, est-ce qu'il y a un équivalent? Genre:
http://archive.numdam.org/ARCHIVE/RSA/RSA_1987__35_1/RSA_1987__35_1_5_0/RSA_1987__35_1_5_0.pdf

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Nik le Mer 22 Oct 2008 - 20:36

Bonsoir c'est quoi ce que tu appelles les indices de description moyen ?

Pour présenter un test de wilcoxon, il faut les n des deux distributions comparées, la valeur de la statistiques de wilcoxon associée et une p-value. et puis c'est tout.
Par contre ton intitulé "probabilité de différence" est faux

Nik

Nombre de messages : 1582
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Jeu 23 Oct 2008 - 8:56

Bonsoir c'est quoi ce que tu appelles les indices de description moyen ?
J'ai plusieurs types d'indices, ceux affichés dans ce tableau sont les indices "de description" de la végétation.
Etant donné que je compare ces indices entre n1 et n2 relevés, j'ai mis cet intitulé "indices de description moyen".
Pour des recouvrements de plantes en %, je mets "recouvrement moyen"...sur structure...et hors structure.
Mais dois-je mettre plutôt le recouvrement médian?

Pour présenter un test de wilcoxon, il faut les n des deux
distributions comparées, la valeur de la statistiques de wilcoxon
associée et une p-value. et puis c'est tout.
ok, dans le cas d'un test unique, mais dans le cas d'un tableau final? Il faut bien mettre la valeur moyenne (ou médiane) du facteur pour chaque modalité afin de "montrer" le sens de la différence. Dans ce cas, n'est-ce pas trop alourdir de mettre en plus la valeur du test dans le dit-tableau. J'ai un autre exemple d'article pour d'autres tests (fisher-exact) présentés de la même manière où la valeur du test n'est pas écrite (dans la même bonne revue que l'exemple précédent: Ecology, qui aurait laissé passé 2 fois la même erreur?).

Par contre ton intitulé "probabilité de différence" est faux
si je comprend bien, tu mettrais p-value ou probabilité?
C'est bien la probabilité que l'écart observé entre les deux jeux de données soit du au hasard?

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Nik le Ven 24 Oct 2008 - 9:15

J'ai plusieurs types d'indices, ceux affichés dans ce tableau sont les indices "de description" de la végétation.
Etant donné que je compare ces indices entre n1 et n2 relevés, j'ai mis cet intitulé "indices de description moyen".
Pour des recouvrements de plantes en %, je mets "recouvrement moyen"...sur structure...et hors structure.
Mais dois-je mettre plutôt le recouvrement médian?
ok...tant que tu expliques bien ton tableau dans une légende associée, pas de soucis. Pour ce qui est du recouvrement médian, peu importe car de toute façon la statistique du test que tu fais est sur les rangs donc que tu mettes la moyenne ou la médiane n'a pas plus de sens par rapport au test...C'est comme tu veux.
J'ai un autre exemple d'article pour d'autres tests (fisher-exact) présentés de la même manière où la valeur du test n'est pas écrite (dans la même bonne revue que l'exemple précédent: Ecology, qui aurait laissé passé 2 fois la même erreur?)
Ce n'est pas une erreur, c'est un manque Smile. Ecology a beau être une bonne revue, ils n'en suivent pas moins la mode de la p-value. Tu as raison quand tu dis qu'il faut mettre des valeurs car il faut non pas montrer le sens de la différence mais surtout son importance. Une p-value toute seule ne veut rien dire et d'autant plus sur des tests non paramétriques. La statistique du test permet de juger les résultats du test sous un angle plus précis. Mais c'est vrai que c'est rare dans les publis.
En tant qu'écologiste, on a souvent tendance à croire que la p-value se suffit à elle même mais c'est loin d'être le cas. Dans le cas des test non paramétriques, le pb est qu'on ne peut en plus pas juger de la différence car celle qui est mesurée est celle sur les rangs. On perd en grande partie l'information quantitative qui intéresse les biologistes. Il vaut mieux se tourner vers les tests de permutations qui sont bien plus puissants permettent des interprétations biologiques plus intéressante que simplement certifier que la différence existe.

si je comprend bien, tu mettrais p-value ou probabilité?
C'est bien la probabilité que l'écart observé entre les deux jeux de données soit du au hasard?
la p-value est la proba de rejeter l'hypothèse H0 alors qu'elle est vraie.
Donc la proba de différence c'est 1 - p-value.

Nik

Nombre de messages : 1582
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Invité le Ven 24 Oct 2008 - 9:49

Bonjour,

Dans le cas du test de wilcoxon et surtout dans un cas de comparaisons multiples, je ne chargerais pas l'info avec la valeur du test qui dans le cas de tests non paramétriques sont très difficiles à interpréter. Faire attention : la statistique du test ne te donne pas le sens de la différence et l'hypothèse alternative n'est pas que la somme des rangs d'un des deux groupes est inférieure ou supérieure à la somme des rangs du second groupe.

Perso je mettrai la moyenne plutôt que la médiane dans le tableau qui est pour beaucoup de gens beaucoup plus explicite (en rajoutant l'écart type) même si elle ne veut pas dire grand chose quand ta distribution est fortement asymétrique. De plus le test de wilcoxon est considéré par beaucoup comme l'alternative non paramétrique au test de student.

Pourquoi être parti sur le test de wilcoxon ? Problème de variance non égale entre les groupes ou des distributions qui ne suivent pas une loi normale ? Comme l'a dit Nik quand on peut rester en quantitatif c'est quand même mieux.

Je simpliderai aussi la représentation des p-values avec un truc du genre : >0.05 , <0.05, <0.01 et <0.001.

micros

Invité
Invité


Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Ven 24 Oct 2008 - 12:03

Nik:
la p-value est la proba de rejeter l'hypothèse H0 alors qu'elle est vraie.
Donc la proba de différence c'est 1 - p-value.
Ok, grossière erreur de ma part!

Nik:
En tant qu'écologiste, on a souvent tendance à croire que la p-value se
suffit à elle même mais c'est loin d'être le cas. Dans le cas des test
non paramétriques, le pb est qu'on ne peut en plus pas juger de la
différence car celle qui est mesurée est celle sur les rangs. On perd
en grande partie l'information quantitative qui intéresse les
biologistes. Il vaut mieux se tourner vers les tests de permutations
qui sont bien plus puissants permettent des interprétations biologiques
plus intéressante que simplement certifier que la différence existe.
qu'entend-tu par tests de permutation: monte carlo?
je ne connais malheureusement pas toutes les ficelles des stats...

micros corpus:
Perso je mettrai la moyenne plutôt que la médiane dans le tableau qui
est pour beaucoup de gens beaucoup plus explicite (en rajoutant l'écart
type)
écart-type ou écart-type de la moyenne (erreur standard)?

micros corpus:
Pourquoi être parti sur le test de wilcoxon ? Problème de variance non
égale entre les groupes ou des distributions qui ne suivent pas une loi
normale ? Comme l'a dit Nik quand on peut rester en quantitatif c'est
quand même mieux.
en fait, problème de beaucoup de tests... avec parfois peu d'individus, des distributions non normales... donc j'ai décidé de tout faire en non paramétrique afin de pouvoir tout mettre dans des tableaux uniques... je perd en puissance, certes, mais je considère que si un test non paramétrique met en évidence des différences, un test paramétrique l'aurait aussi fait... seules les différences faibles échappent à ces tests non paramétriques

micros corpus:
Je simpliderai aussi la représentation des p-values avec un truc du genre : >0.05 , <0.05, <0.01 et <0.001.
c'est ce que j'ai représenté par des étoiles... mais c'est sur, les valeurs pourraient au moins être arrondies...

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Invité le Ven 24 Oct 2008 - 12:28

c'est ce que j'ai représenté par des étoiles... mais c'est sur, les valeurs pourraient au moins être arrondies...

alors les deux infos sont redondantes et une seule des deux est utile (les étoiles ou la valeur de p-value).

en fait, problème de beaucoup de tests... avec parfois peu d'individus,
des distributions non normales... donc j'ai décidé de tout faire en non
paramétrique afin de pouvoir tout mettre dans des tableaux uniques...
je perd en puissance, certes, mais je considère que si un test non
paramétrique met en évidence des différences, un test paramétrique
l'aurait aussi fait... seules les différences faibles échappent à ces
tests non paramétriques
Un truc m'échappe, tu dis avoir parfois peu d'individus, mais si je regarde ton tableau on voit pour une colonne 42 relevés et pour l'autre 72 relevés. Tu n'utilises pas a chaque fois ces 114 relevés dans tes analyses ? Si ce n'est pas le cas alors tu devrais spécifier les effectifs de chaque classe à chaque fois.

A près si tu as pas mal de zéro ça peut mettre le bazard dans le calcul des tests et il te faut faire attention que ton test prenne bien en compte les exaequos.

Perso je mettrais aussi l'écart type.

micros

Invité
Invité


Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Nik le Ven 24 Oct 2008 - 13:01

qu'entend-tu par tests de permutation: monte carlo?
Un test de permutation se base sur une statistique de test et on va évaluer la sgnificativité en faisant des tirages aléatoire dans les valeurs observées. Dans ton cas
- 2 distributions A et B avec respectivement nA et nB valeurs.
- tu cacules la différence entre les deux moyennes observées : nAbar - nBbar = Mobs
- ensuite tu regroupes toutes tes données. tu tires aléatoirement nA valeurs, dont tu fais la moyenne et avec les nB autres valeurs tu fais aussi une moyenne. Tu fais la différence : nAbarSim - nBbarSim = Msim.
-Tu reproduis l'étape précédente autant de fois qu'il y de combinaison possible de nA tirage parmi nA+nB (si ça dépasse 1000 en général on s'arrête Smile ) et voilà. Tu as une statistique robuste.
Pour la p-value :
- la p-value unilatérale est calculée comme la proportion des valeurs simulées (Msim) supérieure ou égale à Mobs.
- la p-value bilatérale est calculée comme la proportion des valeurs simulées dont la valeur absolue est supérieure ou égale à la valeur absolue de Mobs.

voilà.

Nik

Nombre de messages : 1582
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Ven 24 Oct 2008 - 13:51

micros corpus :
Un truc m'échappe, tu dis avoir parfois peu d'individus, mais si je
regarde ton tableau on voit pour une colonne 42 relevés et pour l'autre
72 relevés. Tu n'utilises pas a chaque fois ces 114 relevés dans tes
analyses ? Si ce n'est pas le cas alors tu devrais spécifier les
effectifs de chaque classe à chaque fois.
L'exemple de mon tableau est mal choisi: c'est mon test de base sur l'ensemble de mes relevés.
Après je découpe les 42 relevés sur structures en 2 classes (structures en creux, structures en élévation) et ainsi de suite... (élévation=mur+talus; creux=fosse+fossés)... et à chaque fois je réitère la série de test... donc à la fin il me reste peu d'individus dans chaque modalité.
Nik:
Un test de permutation se base sur une statistique de test et on va
évaluer la sgnificativité en faisant des tirages aléatoire dans les
valeurs observées. Dans ton cas
- 2 distributions A et B avec respectivement nA et nB valeurs.
- tu cacules la différence entre les deux moyennes observées : nAbar - nBbar = Mobs
-
ensuite tu regroupes toutes tes données. tu tires aléatoirement nA
valeurs, dont tu fais la moyenne et avec les nB autres valeurs tu fais
aussi une moyenne. Tu fais la différence : nAbarSim - nBbarSim = Msim.
-Tu
reproduis l'étape précédente autant de fois qu'il y de combinaison
possible de nA tirage parmi nA+nB (si ça dépasse 1000 en général on
s'arrête Smile ) et voilà. Tu as une statistique robuste.
Pour la p-value :
- la p-value unilatérale est calculée comme la proportion des valeurs simulées (Msim) supérieure ou égale à Mobs.
-
la p-value bilatérale est calculée comme la proportion des valeurs
simulées dont la valeur absolue est supérieure ou égale à la valeur
absolue de Mobs.
Je comprend bien le fonctionnement, celà me semble en effet plus adapté à mes données et mes problématiques. Mais d'un point de vue pratique, j'ai jamais essayé. Je travaille sous R, il doit bien exister un package adéquat?

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Nik le Ven 24 Oct 2008 - 15:28

Je travaille sous R, il doit bien exister un package adéquat?
bah...est il bien nécessaire de poser la question en ce sens ? Wink

regardes la fonction randtest ou as.randtest dans le package ade4...ça marche bien et il y a aussi la fonction plot.randtest qui donne le graphique à mettre dans la publi ou le rapport ... trop top Very Happy
Il y a peut être d'autres packages et fonction je n'ai jamais regardé.

Nik

Nik

Nombre de messages : 1582
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Sam 25 Oct 2008 - 12:52

regardes la fonction randtest ou as.randtest dans le package ade4...
j'ai pas trop compris le fonctionnement de cette fonction... du coup, j'ai écrit les codes suivants en fonction de ce que tu as énoncé précédemment:
p_value_unilatérale:
Code:
> table<-numeric(10000)
> for(i in 1:10000)
+ {var<-sample(indice,nrow(groix_fin_rec),replace=F)
+ temp<-data.frame(Structure,var)
+ temp1<-subset(temp,Structure=="sur_structure")
+ moy1<-mean(temp1$var)
+ temp2<-subset(temp,Structure=="hors_structure")
+ moy2<-mean(temp2$var)
+ table[i]<-moy1-moy2}
> data<-data.frame(groix_fin_rec)
> tempo1<-subset(data,Structure=="sur_structure")
> moy1<-mean(tempo1$indice)
> tempo2<-subset(data,Structure=="hors_structure")
> moy2<-mean(tempo2$indice)
> delta<-moy1-moy2
> tabletf<-drop(delta>table)
> tablet<-subset(tabletf,tabletf==TRUE)
> p_value<-ifelse(0>delta,length(tablet)/(10000+1),1-length(tablet)/(10000+1))
> p_value

p_value_bilatérale:
Code:
> table<-numeric(10000)
> for(i in 1:10000)
+ {var<-sample(indice,nrow(groix_fin_rec),replace=F)
+ temp<-data.frame(Structure,var)
+ temp1<-subset(temp,Structure=="sur_structure")
+ moy1<-mean(temp1$var)
+ temp2<-subset(temp,Structure=="hors_structure")
+ moy2<-mean(temp2$var)
+ table[i]<-abs(moy1-moy2)}
> data<-data.frame(groix_fin_rec)
> tempo1<-subset(data,Structure=="sur_structure")
> moy1<-mean(tempo1$indice)
> tempo2<-subset(data,Structure=="hors_structure")
> moy2<-mean(tempo2$indice)
> delta<-abs(moy1-moy2)
> tabletf<-drop(delta>table)
> tablet<-subset(tabletf,tabletf==TRUE)
> p_value<-length(tablet)/(10000+1)
> p_value
cela à l'air de marcher même si le code peut surement être simplifié et amélioré pour une vitesse d'exécution moindre (je débute en programmation sous R).
j'espère que c'est juste...

Effectivement on gagne en puissance, d'après les essais que j'ai réalisé un p de 0.01016 en wilcoxon passe à 0.0028 pour des permutations en unilatéral et 0.0079 en bilatéral.
Par contre je ne sais pas quand utiliser la p-value unilatérale ou la p-value bilatérale.

Au fait, as-tu des références biblio pour ce test?

Merci d'avance,
Tino

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Invité le Lun 27 Oct 2008 - 10:08

Il n'est pas évident que les tests de permutation soient plus adaptés dans le cas ou tu compares les groupes avec de très faibles effectifs. De plus ici tu ne peux pas comparer les différences de p-value que tu observes entre le test de wlicoxon et le code R, puisque dans un cas tu travailles sur la somme des rangds et dans l'autre sur la différence entre tes deux moyennes et donc en paramétrique, autrement dit les deux choses n'ont rien à voir. Si tu fais des permutations c'est pour recalculer la statistique de ton test pas pour calculer une statistique qui n'a rien à voir. Pour ce qui est d'utiliser le bilateral ou l'unilateral, ça dépend de ton hypothèse alternative : est-ce que les moyennes sont différentes (bilatérale), est-ce que la moyenne du groupe sur_structure est supérieure (ou inférieure) à la moyenne du groupe hors_structure (unilatérale).

micros

P.S: le code R pour reproduire ce qui a été fait ci dessus mais de façon un peu plus optimisée (essayer de ne pas utiliser des noms d'objets qui sont aussi des noms de fonction) :
Code:
table <- replicate(10000,{
  var<-sample(indice,nrow(groix_fin_rec),replace=F)
  abs(diff(tapply(var,Structure,mean)))
  })
# je ne pense pas que la valeur absolue soit adéquate non plus

Invité
Invité


Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Lun 27 Oct 2008 - 10:45

micros corpus a écrit:De plus ici tu ne peux pas comparer les différences de p-value que tu observes entre le test de wlicoxon et le code R, puisque dans un cas tu travailles sur la somme des rangds et dans l'autre sur la différence entre tes deux moyennes et donc en paramétrique, autrement dit les deux choses n'ont rien à voir.
Je sais, mais je voulais juste dire que d'après les p-value de mes quelques tests, il y a de grandes chances de voir apparaître des différences (de moyennes) dans des cas où wilcoxon n'avais pas vu de différences de rangs.
micros corpus a écrit:Si tu fais des permutations c'est pour recalculer la statistique de ton test pas pour calculer une statistique qui n'a rien à voir.
qu'entends-tu pas là ?
micros corpus a écrit:Pour ce qui est d'utiliser le bilateral ou l'unilateral, ça dépend de ton hypothèse alternative : est-ce que les moyennes sont différentes (bilatérale), est-ce que la moyenne du groupe sur_structure est supérieure (ou inférieure) à la moyenne du groupe hors_structure (unilatérale).
c'est bien le problème...
faire 2 tests unilatérals (supérieur et inférieur) font apparaître des p-value inférieures à un test bilatéral...???
en général quand on teste des différences de moyennes, on veut en savoir le sens, alors quel est l'intérêt du bilatéral?
micros corpus a écrit:
Code:
table <- replicate(10000,{
  var<-sample(indice,nrow(groix_fin_rec),replace=F)
  abs(diff(tapply(var,Structure,mean)))
  })
# je ne pense pas que la valeur absolue soit adéquate non plus
Grands mercis pour le code, effectivement, c'est plus rapide à l'exécution et celà donne les mêmes valeurs.
concernant la p-value finale, pense-tu qu'il faut utiliser 10000 ou 10000+1 comme j'ai fait?
Qu'entends-tu par "je ne pense pas que la valeur absolue soit adéquate non plus"?

Tino

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Invité le Lun 27 Oct 2008 - 12:22

tinomulot a écrit:
micros corpus a écrit:Si tu fais des
permutations c'est pour recalculer la statistique de ton test pas pour
calculer une statistique qui n'a rien à voir.
qu'entends-tu pas là ?

J'entends qu'ici tu compares des choses qui n'ont rien à voir. Comparer
la p-value de ton test de wilcoxon, et les p-values que tu obtiens sur les différences de moyenne ça n'a rien à voir ! Puisque tu ne fais pas la même chose, dans un cas tu regardes la somme des rangs et dans l'autre cas une différence de moyenne. De plus je trouve ça dangereux de comparer des moyennes de la sorte, dans chaque test de comparaison de moyenne paramétrique la variance est prise en compte ce qui n'est pas le cas ici. Si tu veux vraiment comparer ton test de wilcoxon avec un test sur les permutation alors tu permuttes tes données (N fois) tu récupères les statistiques de ces tests et tu compares si la statistique de ton test que tu obtiens sur les données brutes avec la distribution des statistiques obtenues par permutation.

Si je regarde plus haut, tu dis que la distribution n'est pas normale, alors dans ce cas la je pense que la moyenne n'a pas de sens.

Après l'histoire de choisir un test unlitateral ou biolateral ne dépend pas de la valeur de la p-value mais de tes hypothèses de travails ! Dans le cas d'un test bilateral tu n'as pas d'hypothèse concernant l'effet que ça pourrait avoir sur la différence de la moyenne, alors que si utilises un test unilatéral tu as une hypothèse.

Exemple : tu utilises deux type d'engrais pour produire du maïs et tu cherches a savoir si les productions sont différentes ou non selon le type d'engrais utuliser. Si tu ne connais pas les engrais tu vas juste chercher à les comparer, alors tu vas utiliser un test bilatéral.
Après si tu compares des productions de maïs dans des champs avec et sans engrais, tu as pour hypothèse que l'engrais augmente le rendement, alors ce que tu cherches à savoir c'est si la production est plus forte avec l'engrais que sans. La tu es dans le cas d'un test unliatéral.

J'espère que c'est plus clair pour toi.

moi je prendrais N=9999 permutations + 1 observation.

micros

Invité
Invité


Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Mar 28 Oct 2008 - 9:28

merci pout tout ces conseils,
voila ma fonction finale,
j'ai notamment modifié "tabletf<-drop(table>delta)" en "tabletf<-drop(table>=delta)"

Code:
permutino<-function(fichier,variable,modalite)
{attach(fichier)
table <- replicate(9999,{
tempo<-sample(variable,nrow(fichier),replace=F)
abs(diff(tapply(tempo,modalite,mean)))
})
delta<-abs(diff(tapply(variable,modalite,mean)))
tabletf<-drop(table>=delta)
tablet<-subset(tabletf,tabletf==TRUE)
p_value<-length(tablet)/(9999+1)
nb_rel<-tapply(variable,modalite,length)
moyenne<-tapply(variable,modalite,mean)
err_std<-sqrt(tapply(variable,modalite,var)/tapply(variable,modalite,length))
result<-rbind(nb_rel, moyenne,err_std)
print(result)
print(cat("\n","p-value",p_value,"\n"))
detach(fichier)
}

encore merci,
Tino

PS: dans le cas de valeurs manquantes NA pour la variable considérée (mais pas pour la modalité), pensez-vous qu'il faille éliminer les lignes correspondantes ou distribuer aléatoirement les NA? Je pense à la première solution afin d'avoir des moyennes aléatoires basées sur le même nombre d'individus que les moyennes observées, mais j'ai un doute...

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Invité le Mar 28 Oct 2008 - 9:57

Re,

J'ai trouvé un cours de biostatistique qui peut te servir comme référence pour le test de permutation que tu fais. Néanmoins, il y a une restriction très forte à l'utilisation de ce test qui est la suivante :
Il faut que les variances de tes deux échantillons soient équivalentes !
Si ce n'est pas le cas tu peux jeter à la poubelle les conclusions de tes tests.

http://homepages.ulb.ac.be/~aleveque/epitraumac/pdf-ppt/bootstrap2.pps

Je te laisse regarder la diapositive 25.

micros

Invité
Invité


Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par tinomulot le Mar 28 Oct 2008 - 15:14

Re,
Merci pour l'info,
Tino

PS: Je teste l'égalité de variances par bootstrap?

tinomulot

Nombre de messages : 17
Age : 38
Localisation : Neuvile (Correze)
Date d'inscription : 02/10/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: présentation des résultats de tests de Wilcoxon

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum