Analyse de données

Aller en bas

Analyse de données Empty Analyse de données

Message par boubou le Lun 5 Mai 2014 - 9:22

Bonjour,

Je suis perdue sur R...

Je suis en stage et j'ai des données à analyser sur les papillons de jour.
J'ai donc un tableau avec toutes mes espèces et leur abondance sur 3 années, j'aurais voulu savoir comment je pouvais voir et interpréter l'évolution de ces espèces sur mes 3 années?

un test de chi-deux serait il possible? ou Student ou un autre?

Help me lol

boubou

Nombre de messages : 8
Date d'inscription : 05/05/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par Nik le Lun 5 Mai 2014 - 12:03

Bonjour
un test de chi-deux serait il possible? ou Student ou un autre?
tu es donc surtout perdue en stats non ? Smile

Tu as 3 années= 3 valeurs par espèce ou tu en as plus ?
Dans le premier cas : pas de stats à réaliser (tests sans intérêt), tu peux présenter ces résultats sous forme de graphiques ce sera tout aussi scientifique. A la limite faire des groupes d'espèce selon des critères bio-écologique peut

Si tu as plus de données, il faut préciser tes questions scientifiques car pour le moment "voir et interpréter" ne relèvent ni l'un ni l'autre de la statistique. Pour le premier il faut faire les bons graphiques et le second c'est de l'écologie.

Nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par boubou le Lun 5 Mai 2014 - 12:37

euh ça se voit tant que ça? lol

et donc oui que 3 valeurs par espèce Smile
je pensais que fallait que je montre bien statistiquement l'évolution de mes espèces durant ces 3 années d'où le fait que je veuilles faire des tests ^^

mais oui au pire je dois les regrouper par habitat et voir avec les conditions météorologiques donc là je ferais des tests je pense du genre ACP

merci beaucoup en tout cas

boubou

Nombre de messages : 8
Date d'inscription : 05/05/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par Nik le Lun 5 Mai 2014 - 13:30

mais oui au pire je dois les regrouper par habitat et voir avec les conditions météorologiques donc là je ferais des tests je pense du genre ACP

oui c'est sans doute une piste à explorer qui pourra te fournir des illustrations intéressantes.

Nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par ghimli le Lun 23 Fév 2015 - 9:03

Bonjour à tous,

Je suis nouveau sur ce site (donc voilà mon premier post) ! Smile

Alors pour déterrer ce topic, j'aimerais savoir si vous n'auriez pas un schéma de sélection de test à faire après avoir vu si nos données étaient normales ou non ?

Pour mes données, j'ai des valeurs de pH pour 3 types de sols différents (5 répétitions biologiques et 2 répétitions techniques). Et à savoir que les répétitions technique sont sur 2 dates différentes.

Donc ce que j'ai fais :
- test de Shapiro-Wilk, on obtient une p-value<0.05 (même 0.001), donc pas de normalité.
- Je voulais savoir si entre les différents types de sol le pH était différents ou non : W_test=pairwise.wilcox.test(ph,soiltype) ; W_test
- J'ai fais la même chose pour la deuxième date.
- Et dernière chose, je voudrais savoir si je peux combiner les deux date pour agrandir mon jeu de donnée. J'étais partis là-dessus : cor.test(ph,ph2) ==> Mais je ne sais pas si c'est la bonne formule ou non. Car il compare uniquement le jeu de donnée dans sa globalité et non par type de sol.

Voilà, est-ce que ma méthode est correcte ou il y a des améliorations à faire ?
Est-ce je dois regarder le test de Barlett ? (et qu'est-ce que je dois faire avec ce test ?)

Merci de votre compréhension et de votre futur réponse ! :-)

Bon Lundi !
ghimli
ghimli

Nombre de messages : 7
Age : 28
Localisation : Orléans
Date d'inscription : 23/02/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par Nik le Lun 23 Fév 2015 - 9:39

Bonjour,

Tu as une vision trop schématique des stats et surtout trop limitée aux tests d'hypothèse. En gros, une vision "sortie d'école" Smile.

Donc, non il n'existe pas de schéma simple d'application des stats.

La normalité--> c'est pas si important et les tests de normalité rejettent très souvent la normalité
Il faut vérifier effectivement la variance des groupes.

Les stats non-paramétriques font perdre énormément d'info et en général on s'aperçoit en discutant que l'info perdue, c'est celle qui nous intéresse. Pour rappel, les stats non-paramétrique ne s'intéresse qu'à l'ordre des données et pour un pH c'est pas forcément l'info principale.

Pour combiner les deux dates, c'est à toi de voir si les conditions sont réellement comparable. Peux-t-on comparer les deux dates si par ex à la seconde date, le sol a été fortement lessivé par des pluies...Bref, on ne peut pas répondre à ta place à ces questions.

Faire des stats, c'est réaliser des allers-retours permanents entre connaissances du domaine et méthodes statistiques adaptées.

nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par ghimli le Lun 23 Fév 2015 - 10:01

Oui, j'ai vision sortie d'école, mais j'essaie de comprendre ce monde qui est vraiment très vaste et un peu exilé du reste de part son vocabulaire et sa technicité ! Smile

Enfin, bon, tout ça pour dire que le différents types de sols normalement peuvent être combiné parce qu'il sont en laboratoire et en pot. Du coup il n'y a pas eu "d'incident" qui pourrait modifier les valeurs de façon drastiques. Mais justement j'aimerais savoir comment le vérifier.

Comment je peux appliqué un test paramétrique si mes données ne sont pas normales ?
Comment procéderiez-vous pour savoir quel test utiliser ? Y a t'il un livre/site qui permet de nous orienter dans le(s) test(s) à utiliser ?

Car c'est assez gênant de regarder ses cours de stats et de voir qu'au final, on sait à peu près les tests de bases qui existent. Comment procéder pour faire des comparaisons de moyennes ou de variances si nos données sont normales... Mais plus rien quand ce n'est pas le cas.
Et le plus inquiétant c'est que l'on apprends qu'il faut regarder 4 points essentiels (dont la normalité, même si elle n'est pas vraiment nécessaire... au final \o/) mais sans plus ! (petit coup de gueule sans rapport avec le sujet, navré)

Bref, que faire avec :

bartlett.test(ph,soiltype)

Bartlett test of homogeneity of variances

data: ph and soiltype
Bartlett's K-squared = 27.167, df = 2, p-value = 1.261e-06

Thks

Ghim
ghimli
ghimli

Nombre de messages : 7
Age : 28
Localisation : Orléans
Date d'inscription : 23/02/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par Nik le Lun 23 Fév 2015 - 21:55

Salut,

Avant tout, ce qui guide la bonne marche de l'analyse de données c'est la question scientifique et les hypothèses de base. La forme des données n'intervient que dans un second temps quand on sait quel tiroir des stats on a ouvert.

Les tests paramétriques sont le plus souvent robustes à la non-normalité. C'est à dire que le résultat n'est pas biaisé.
Par contre, si tu as des différences de variance, c'est plus gênant notamment dans le cas d'une ANOVA. Cela veut-il dire que tu dois laisser tomber l'arsenal paramétrique : non. Mais tu plonges dans un tout autre monde d'un point de vue stat et tu te rendras d'autant plus compte à quel point les tests d'hypothèses que tu as appris constituent la pointe de la partie émergée de l'iceberg des stats.

Donc si te lancer dans autre chose que les tests d'hypothèse est trop lourd pour toi (manque de temps/de connaissances ou autre) alors tu peux faire des stats non-paramétriques et te contenter de la faible portée des conclusions qu'on peut en tirer (on conclut uniquement sur les rangs)

J'imagine que mes réponses peuvent te paraître floue voire inutile mais au moins pour le moment on ne parle pas le même langage et pourtant je suis biologiste et non statisticien de formation.

Nik

Nik

Nombre de messages : 1605
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par ghimli le Mar 24 Fév 2015 - 12:28

Donc, en gros, mes données n'ont pas la même variance ici ?
Et même si mes données ne sont pas normales statistiquement je peux utiliser des ANOVA ?
J'ai jeté un oeil sur le post du membre "Lapin-*machin*" (oui, je ne m'en souviens plus). Et pour des variable continue vs variable polychotomique, avec des données normales, le conseil c'était ==> Une ANOVA de Welch à 1 facteur.

Alors oui, effectivement c'est pas toujours simple de comprendre tout ce qui peut se faire, mais j'aimerais bien avoir des tests qui vaillent le coup ! Parce que sinon je pense que je vais avoir des question du genre : "pourquoi tu a choisit tel tests et pas un autre?" etc

Quand on conclut sur les rangs, peut-on parler de significativité ? Ou d'autres termes existent ?

Autre question : Est-ce que je peux te MP ? Car j'ai pleins de petites questions, et ça m'embêterais de créer un topic juste pour de bêtes questions du genre.

Merci pour tout !!! C'est vraiment cool de pouvoir parler des difficultés rencontrer au niveau des stats sans qu'on te rétorque :" t'as qu'à lire le livre de 1000 pages indigeste pour te renseigner, et tu me fait un rapport la dessus !" Smile
ghimli
ghimli

Nombre de messages : 7
Age : 28
Localisation : Orléans
Date d'inscription : 23/02/2015

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Analyse de données Empty Re: Analyse de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum