Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Besoin d'aide sur variables quantitatives.
2 participants
Page 1 sur 1
Besoin d'aide sur variables quantitatives.
Bonjour à tous.
Me revoilà face à certaines questions quant à mon analyse de données.
1) Je dispose de deux séries de données quantitatives "inventaire1" et "inventaire2", contenant chacune 6 valeurs (pour 6sites inventoriés). Mesurant la même chose à chaque fois, je pense pouvoir apparier mes données. N'ayant que peu de valeurs, j'utilise un test non paramétrique.
Pour tester la différence entre mon inventaire 1 et mon inventaire 2, je pensais donc utiliser un test de Wilcoxon.
J'ai fait ceci sous R:
eff1=c(114,128,82,45,80,24)
eff2=c(108,175,109,130,113,51)
wilcox.test(eff1,eff2,paired=T)
Wilcoxon signed rank test with continuity correction
data: eff1 and eff2
V = 1, p-value = 0.05848
alternative hypothesis: true location shift is not equal to 0
Message d'avis :
In wilcox.test.default(eff1, eff2, paired = T) :
impossible de calculer la p-value exacte avec des ex-aequos
Est-ce quelqu'un peut me confirmer que ce que j'ai fait est correct? Puis-je en conclure, en prenant un risque alpha=0.05 que mes données ne sont pas significativement différentes, mais presque?
2) Toujours dans le même projet, je tente de mettre en évidence un lien entre deux variables quantitatives: le nombre d'espèces d'insectes et le nombre d'espèces de fleurs.
Je dispose là aussi de 6 valeurs seulement pour chaque variable: je ne peux donc pas parler de normalité, la régression linéaire est-elle possible quand même?
J'avais pensé à un modèle linéaire généralisé, voilà ce que j'avais tenté, sans grande conviction:
RSflore=c(37,65,87,116,39,58)
RSfaune=c(14,28,29,33,16,19)
mod1=glm(RSfaune~RSflore)
cor(predict(mod1),RSfaune)^2
[1] 0.866053
Le R² que j'obtiens est le même que pour la régression linéaire que j'avais réalisé sous Excel...
Qu'en pensez-vous?
Merci infiniment à celui ou ceux qui pourront m'éclairer.
Me revoilà face à certaines questions quant à mon analyse de données.
1) Je dispose de deux séries de données quantitatives "inventaire1" et "inventaire2", contenant chacune 6 valeurs (pour 6sites inventoriés). Mesurant la même chose à chaque fois, je pense pouvoir apparier mes données. N'ayant que peu de valeurs, j'utilise un test non paramétrique.
Pour tester la différence entre mon inventaire 1 et mon inventaire 2, je pensais donc utiliser un test de Wilcoxon.
J'ai fait ceci sous R:
eff1=c(114,128,82,45,80,24)
eff2=c(108,175,109,130,113,51)
wilcox.test(eff1,eff2,paired=T)
Wilcoxon signed rank test with continuity correction
data: eff1 and eff2
V = 1, p-value = 0.05848
alternative hypothesis: true location shift is not equal to 0
Message d'avis :
In wilcox.test.default(eff1, eff2, paired = T) :
impossible de calculer la p-value exacte avec des ex-aequos
Est-ce quelqu'un peut me confirmer que ce que j'ai fait est correct? Puis-je en conclure, en prenant un risque alpha=0.05 que mes données ne sont pas significativement différentes, mais presque?
2) Toujours dans le même projet, je tente de mettre en évidence un lien entre deux variables quantitatives: le nombre d'espèces d'insectes et le nombre d'espèces de fleurs.
Je dispose là aussi de 6 valeurs seulement pour chaque variable: je ne peux donc pas parler de normalité, la régression linéaire est-elle possible quand même?
J'avais pensé à un modèle linéaire généralisé, voilà ce que j'avais tenté, sans grande conviction:
RSflore=c(37,65,87,116,39,58)
RSfaune=c(14,28,29,33,16,19)
mod1=glm(RSfaune~RSflore)
cor(predict(mod1),RSfaune)^2
[1] 0.866053
Le R² que j'obtiens est le même que pour la régression linéaire que j'avais réalisé sous Excel...
Qu'en pensez-vous?
Merci infiniment à celui ou ceux qui pourront m'éclairer.
Patty- Nombre de messages : 6
Date d'inscription : 02/08/2010
Re: Besoin d'aide sur variables quantitatives.
A priori l'appariement de tes données me semble être une bonne chose. Après réflexion je pense que tu devrais regarder du côté du test de friedman plutôt que du test de wilcoxon. Il me semble important de prendre en compte les sites. A toi de voir.
Concernant la conclusion de ton test, effectivement tes données ne sont pas significativement différentes, le mais presque est une interprétation de ta part. Je serai plus catégorique : soit c'est significatif, soit ça ne l'est pas.
Le GLM tel que tu l'as réalisé considère par défaut une distribution normale pour la distribution de l'erreur. Moralité tu n'as fait rien de plus qu'une régression linéaire classique. Le modèle linéaire étant un cas particulier des GLM. D'ailleurs tape les mêmes commandes avec lm à la place de glm tu verras que tu as les mêmes résultats.
La régression linéaire ne mesure pas un lien entre deux variables mais cherche à expliquer une variable par rapport à une autre. Pour tout ce qui est du lien entre deux variables il faut regarder du côté des mesures d'associations comme la corrélation (ici un rho ?).
Concernant la conclusion de ton test, effectivement tes données ne sont pas significativement différentes, le mais presque est une interprétation de ta part. Je serai plus catégorique : soit c'est significatif, soit ça ne l'est pas.
Le GLM tel que tu l'as réalisé considère par défaut une distribution normale pour la distribution de l'erreur. Moralité tu n'as fait rien de plus qu'une régression linéaire classique. Le modèle linéaire étant un cas particulier des GLM. D'ailleurs tape les mêmes commandes avec lm à la place de glm tu verras que tu as les mêmes résultats.
La régression linéaire ne mesure pas un lien entre deux variables mais cherche à expliquer une variable par rapport à une autre. Pour tout ce qui est du lien entre deux variables il faut regarder du côté des mesures d'associations comme la corrélation (ici un rho ?).
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Besoin d'aide sur variables quantitatives.
Merci Droopy!
Je comprends mieux maintenant pourquoi je trouve la même chose en faisant une régression et un GLM.
Pour ce qui est du lien entre mes deux variables, en fait je détaille.
Je m'occupe de la diversité des insectes pollinisateurs, et je cherche donc à savoir si elle dépend de la diversité des fleurs. Cette diversité des fleurs a elle même été mesurée par un collègue qui m'a transmis ces résultats.
Je me retrouve donc avec 6 valeurs de biodiversité de la faune, dont je veux savoir si elles ont un lien avec les 6 valeurs de biodiversité de la flore.
Régression? Corrélation?
J'ai essayé de faire des test de corrélation avec R, mais on me propose 3 méthodes (Spearman, Kendall ou Pearson) qui ne me donnent pas du tout les mêmes p-value....jamais je n'ai eu de cours sur ces méthodes là, comment savoir laquelle choisir?
Je comprends mieux maintenant pourquoi je trouve la même chose en faisant une régression et un GLM.
Pour ce qui est du lien entre mes deux variables, en fait je détaille.
Je m'occupe de la diversité des insectes pollinisateurs, et je cherche donc à savoir si elle dépend de la diversité des fleurs. Cette diversité des fleurs a elle même été mesurée par un collègue qui m'a transmis ces résultats.
Je me retrouve donc avec 6 valeurs de biodiversité de la faune, dont je veux savoir si elles ont un lien avec les 6 valeurs de biodiversité de la flore.
Régression? Corrélation?
J'ai essayé de faire des test de corrélation avec R, mais on me propose 3 méthodes (Spearman, Kendall ou Pearson) qui ne me donnent pas du tout les mêmes p-value....jamais je n'ai eu de cours sur ces méthodes là, comment savoir laquelle choisir?
Patty- Nombre de messages : 6
Date d'inscription : 02/08/2010
Re: Besoin d'aide sur variables quantitatives.
Bon, après épluchage intense de mes vieux cours de licence, je pense à peu près m'en sortir...
J'ai fait un test de corrélation de Pearson avec R qui me donne un r=0.93, que j'ai comparé avec le r (ddl4) de la table égal à 0.81.
Jusque là, est-ce-que c'est bon?
Reste une question quant aux alternatives: le test de corrélation sous R avec alternative="greater" ne me donne pas la même p-value qu'un test par défaut.
J'ai du mal à saisir la nuance car d'après ce que j'ai lu "greater" signifierait que ma variable X est positivement corrélée avec ma variable Y.
Or il me semblait que le signe du coefficient de corrélation suffisait à lui seul à connaître la nature positive ou négative de la corrélation.
Une explication svp?
J'ai fait un test de corrélation de Pearson avec R qui me donne un r=0.93, que j'ai comparé avec le r (ddl4) de la table égal à 0.81.
Jusque là, est-ce-que c'est bon?
Reste une question quant aux alternatives: le test de corrélation sous R avec alternative="greater" ne me donne pas la même p-value qu'un test par défaut.
J'ai du mal à saisir la nuance car d'après ce que j'ai lu "greater" signifierait que ma variable X est positivement corrélée avec ma variable Y.
Or il me semblait que le signe du coefficient de corrélation suffisait à lui seul à connaître la nature positive ou négative de la corrélation.
Une explication svp?
Patty- Nombre de messages : 6
Date d'inscription : 02/08/2010
Re: Besoin d'aide sur variables quantitatives.
En fait lorsque tu testes le coefficient de corrélation, tu test si celui-ci est égale à 0 (hypothèse nulle). Tu as plusieurs hypothèses alternatives : r différent de 0, r>0 ou r<0. Suivant ton hypothèse alternative le calcul de la p-value ne sera pas indentique.
De manière générale si tu n'as pas d'hypothèse à priori sur comment devrait varié les deux variables alors la première hypothèse alternative r différent de 0 qui s'impose alternative="two.sided".
Si par contre tu supposes que ta corrélation va être positive alors tu peux utiliser l'hypothèse alternative r>0 alternative="greater".
Si tu supposes que ta corrélation va être négative alors tu vas utiliser l'hypothèse alternative r<0, alternative="less".
Toutes ces hypothèses sont des hypothèses à priori, leur choix ne doit pas dépendre du r observer mais des hypothèses que tu as au départ.
De manière générale c'est sur surtout la première hypothèse alternative qui est utilisée.
De manière générale si tu n'as pas d'hypothèse à priori sur comment devrait varié les deux variables alors la première hypothèse alternative r différent de 0 qui s'impose alternative="two.sided".
Si par contre tu supposes que ta corrélation va être positive alors tu peux utiliser l'hypothèse alternative r>0 alternative="greater".
Si tu supposes que ta corrélation va être négative alors tu vas utiliser l'hypothèse alternative r<0, alternative="less".
Toutes ces hypothèses sont des hypothèses à priori, leur choix ne doit pas dépendre du r observer mais des hypothèses que tu as au départ.
De manière générale c'est sur surtout la première hypothèse alternative qui est utilisée.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Besoin d'aide sur variables quantitatives.
Ok, merci bien!
Un de mes enseignant vient de me répondre également, et lui me conseillerait finalement d'utiliser le test de corrélation de Spearman, vu que je traite un petit échantillon. La corrélation ne se fait donc plus sur les valeurs en elles-mêmes mais sur les rangs.
Et pour mon étude, il se trouve que si l'on transforme mes données en rangs, on obtient la même chose pour la faune et la flore...donc j'obtiens forcément un rho=1.
Je trouve cette approche là beaucoup trop "simplifiée", je ne sais plus trop quoi faire
Un de mes enseignant vient de me répondre également, et lui me conseillerait finalement d'utiliser le test de corrélation de Spearman, vu que je traite un petit échantillon. La corrélation ne se fait donc plus sur les valeurs en elles-mêmes mais sur les rangs.
Et pour mon étude, il se trouve que si l'on transforme mes données en rangs, on obtient la même chose pour la faune et la flore...donc j'obtiens forcément un rho=1.
Je trouve cette approche là beaucoup trop "simplifiée", je ne sais plus trop quoi faire
Patty- Nombre de messages : 6
Date d'inscription : 02/08/2010
Re: Besoin d'aide sur variables quantitatives.
vu le petit jeu de données dont tu disposes, j'en resterai à un graphique en disant qu'il semblerait qu'il y ait un lien entre les deux et tu peux mettre un coefficient de corrélation, pour illustrer ce lien. J'ai presque envie de dire peut importe lequel parce que 0.93 ou 1 c'est kif-kif.
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Sujets similaires
» régression sur variables qualitatives et quantitatives
» Regression logistique (codages variables quantitatives)
» lien entre deux variables quantitatives (étude psychologie)
» Variables quantitatives + qualtitatives. quel test?
» comparaison de données quantitatives par paire
» Regression logistique (codages variables quantitatives)
» lien entre deux variables quantitatives (étude psychologie)
» Variables quantitatives + qualtitatives. quel test?
» comparaison de données quantitatives par paire
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum