Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
c@ssoulet
 
cmoi
 
louiv
 
laureG
 
Glaboune
 
Nik
 


Représentation graphique blé [ggplot2]

Aller en bas

Représentation graphique blé [ggplot2]

Message par Epi2blé le Mar 20 Mar 2018 - 16:31

Bonjour,

Nous sommes un groupe d'étudiants en master biologie végétale, et nous avons au cours de notre formation à réaliser une analyse de données en autonomie sur R. Or, nous n'arrivons pas à définir par où commencer. Nous espérons trouver une âme charitable pour nous donner un coup de pouce et nous permettre d'avancer sur notre projet, car plus le temps passe plus nous démoralisons Laughing

Le contexte:

Un organisme nous a communiqué une de leurs base de donnée brute, sur laquelle nous devons sortir plusieurs graphiques et analyses. Il s'agit de données collectées sur un essai blé, visant à caractériser l'influence de l'irrigation sur le rendement.

Voici à quoi ressemble la dite base (la base de données totale présente plus de 16k entrées, chaque ligne caractérisant un grain)

DatePrelev Prelev Genotype Traitement Bloc Rep Epi MSEpi NbEpillet Epillet GrainNum MSgrain
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 4 1 33,581
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 1 44,536
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 2 42,141
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 3 48,672
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 6 1 51,441

avec DatePrelev Date de prélèvement de l’épi (dd.mm.yyyy)
Prelev=Stade phénologique du prélèvement
Genotype=Code du génotype ( 4 génotypes )
Traitement=Traitement hydrique( sec ou humide)
Bloc=Bloc expérimental ( 2 blocs)
Rep=sous bloc
Epi=Numero de l’épi
MSEpi = Matière sèche de l’épi (somme de la masse des grains)
NbEpillet=Nombre d’épillet sur l’épi
Epillet =Numéro d’épillet
GrainNum=Numéro du grain dans l’épillet
MS grain=Matière sèche du grain


Nous voulons trouver une représentation graphique via ggplot2 nous permettant de visualiser un épi, avec ses épillets et les grains dans les épillets. Voici un petit schéma qui vous permettra peut être de mieux voir ce que nous souhaitons faire.

https://i62.servimg.com/u/f62/19/88/01/38/exempl10.png

Les graphiques que nous avons plus ou moins réussis à sortir n'avaient, après réflexion, pas vraiment d'utilité et ne ressemblaient pas à grand chose (çà nous aura au moins forcé à utiliser R, c'est déjà ça) Rolling Eyes
Nous pensons peut être retravailler toute la base de donnée avant de commencer à travailler dessus. De plus, nous avons quelques points à éclaircir avec le propriétaire de la base de donnée (numérotation des épillets par exemple)
Nous espérons avoir été assez clair quant à la présentation de notre sujet.

Toute idée (type de fonction à utiliser par exemple), ou ressource pouvant nous aider à démarrer serait la bienvenue. Nous ne sommes pas très dégourdis sur R(c'est mal OUI OUI OUI Evil or Very Mad ), et nous n'avons jamais eu l'occasion de nous familiariser à l'outil ggplot2. Encore une fois nous ne demandons en aucun cas de réaliser le travail à notre place, mais juste un petit coup de pouce pour lancer le travail !

Nous sommes à la disposition des âmes charitables pour plus amples informations si nécessaire !

Merci bien !




Epi2blé

Nombre de messages : 1
Date d'inscription : 20/03/2018

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Représentation graphique blé [ggplot2]

Message par Nik le Mer 21 Mar 2018 - 20:59

Bonsoir,

Vous n'êtes pas forcément clair sur le but de l'enseignement : c'est pratiquer les stats (via R car c'est l'outil utilisé par l'école) ou c'est pratiquer R (et vous faites des stats mais vous pourriez tout aussi bien faire de la programmation pure). Je penche plutôt pour la première option comme vous êtes en master de biologie végétale.

Si vous en êtes déjà à vous demander comment faire des représentations graphiques assez particulières c'est que vous avez déjà réalisé les analyses stats et que vous savez assez précisément ce que vous voulez mettre en avant dans les données en fonction de la problématique posée.

Donc exposez d'abord la problématique scientifique que vous voulez traiter via le jeu de données à disposition. Posez vous la question de savoir si le jeu de données permet bien de répondre à cette problématique. Puis une fois la problématique bien posée vous pourrez passer à l'étape suivante qui est de savoir quel(s) outil(s) statistique employer.
Les représentations graphiques doivent dans un premier temps vous aider à y voir plus clair sur la nature des liens qui lient les différentes variables. Donc au début pas besoin de se casser la tête avec du ggplot2 (malgré tout le bien que je pense de ce package). Des simples plot(poid~rang) feront bien l'affaire.

Voilà

j'espère que cela vous aidera à vous lancer et puis à poser d'autres questions pour préciser votre démarche.

Nik

Nik

Nombre de messages : 1571
Date d'inscription : 23/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum