Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Représentation graphique blé [ggplot2]
2 participants
Page 1 sur 1
Représentation graphique blé [ggplot2]
Bonjour,
Nous sommes un groupe d'étudiants en master biologie végétale, et nous avons au cours de notre formation à réaliser une analyse de données en autonomie sur R. Or, nous n'arrivons pas à définir par où commencer. Nous espérons trouver une âme charitable pour nous donner un coup de pouce et nous permettre d'avancer sur notre projet, car plus le temps passe plus nous démoralisons
Le contexte:
Un organisme nous a communiqué une de leurs base de donnée brute, sur laquelle nous devons sortir plusieurs graphiques et analyses. Il s'agit de données collectées sur un essai blé, visant à caractériser l'influence de l'irrigation sur le rendement.
Voici à quoi ressemble la dite base (la base de données totale présente plus de 16k entrées, chaque ligne caractérisant un grain)
DatePrelev Prelev Genotype Traitement Bloc Rep Epi MSEpi NbEpillet Epillet GrainNum MSgrain
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 4 1 33,581
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 1 44,536
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 2 42,141
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 3 48,672
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 6 1 51,441
avec DatePrelev Date de prélèvement de l’épi (dd.mm.yyyy)
Prelev=Stade phénologique du prélèvement
Genotype=Code du génotype ( 4 génotypes )
Traitement=Traitement hydrique( sec ou humide)
Bloc=Bloc expérimental ( 2 blocs)
Rep=sous bloc
Epi=Numero de l’épi
MSEpi = Matière sèche de l’épi (somme de la masse des grains)
NbEpillet=Nombre d’épillet sur l’épi
Epillet =Numéro d’épillet
GrainNum=Numéro du grain dans l’épillet
MS grain=Matière sèche du grain
Nous voulons trouver une représentation graphique via ggplot2 nous permettant de visualiser un épi, avec ses épillets et les grains dans les épillets. Voici un petit schéma qui vous permettra peut être de mieux voir ce que nous souhaitons faire.
https://i.servimg.com/u/f62/19/88/01/38/exempl10.png
Les graphiques que nous avons plus ou moins réussis à sortir n'avaient, après réflexion, pas vraiment d'utilité et ne ressemblaient pas à grand chose (çà nous aura au moins forcé à utiliser R, c'est déjà ça)
Nous pensons peut être retravailler toute la base de donnée avant de commencer à travailler dessus. De plus, nous avons quelques points à éclaircir avec le propriétaire de la base de donnée (numérotation des épillets par exemple)
Nous espérons avoir été assez clair quant à la présentation de notre sujet.
Toute idée (type de fonction à utiliser par exemple), ou ressource pouvant nous aider à démarrer serait la bienvenue. Nous ne sommes pas très dégourdis sur R(c'est mal OUI OUI OUI ), et nous n'avons jamais eu l'occasion de nous familiariser à l'outil ggplot2. Encore une fois nous ne demandons en aucun cas de réaliser le travail à notre place, mais juste un petit coup de pouce pour lancer le travail !
Nous sommes à la disposition des âmes charitables pour plus amples informations si nécessaire !
Merci bien !
Nous sommes un groupe d'étudiants en master biologie végétale, et nous avons au cours de notre formation à réaliser une analyse de données en autonomie sur R. Or, nous n'arrivons pas à définir par où commencer. Nous espérons trouver une âme charitable pour nous donner un coup de pouce et nous permettre d'avancer sur notre projet, car plus le temps passe plus nous démoralisons
Le contexte:
Un organisme nous a communiqué une de leurs base de donnée brute, sur laquelle nous devons sortir plusieurs graphiques et analyses. Il s'agit de données collectées sur un essai blé, visant à caractériser l'influence de l'irrigation sur le rendement.
Voici à quoi ressemble la dite base (la base de données totale présente plus de 16k entrées, chaque ligne caractérisant un grain)
DatePrelev Prelev Genotype Traitement Bloc Rep Epi MSEpi NbEpillet Epillet GrainNum MSgrain
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 4 1 33,581
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 1 44,536
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 2 42,141
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 5 3 48,672
17.06.2016 Flo+450 225 Sec B nord 1 2,16 19 6 1 51,441
avec DatePrelev Date de prélèvement de l’épi (dd.mm.yyyy)
Prelev=Stade phénologique du prélèvement
Genotype=Code du génotype ( 4 génotypes )
Traitement=Traitement hydrique( sec ou humide)
Bloc=Bloc expérimental ( 2 blocs)
Rep=sous bloc
Epi=Numero de l’épi
MSEpi = Matière sèche de l’épi (somme de la masse des grains)
NbEpillet=Nombre d’épillet sur l’épi
Epillet =Numéro d’épillet
GrainNum=Numéro du grain dans l’épillet
MS grain=Matière sèche du grain
Nous voulons trouver une représentation graphique via ggplot2 nous permettant de visualiser un épi, avec ses épillets et les grains dans les épillets. Voici un petit schéma qui vous permettra peut être de mieux voir ce que nous souhaitons faire.
https://i.servimg.com/u/f62/19/88/01/38/exempl10.png
Les graphiques que nous avons plus ou moins réussis à sortir n'avaient, après réflexion, pas vraiment d'utilité et ne ressemblaient pas à grand chose (çà nous aura au moins forcé à utiliser R, c'est déjà ça)
Nous pensons peut être retravailler toute la base de donnée avant de commencer à travailler dessus. De plus, nous avons quelques points à éclaircir avec le propriétaire de la base de donnée (numérotation des épillets par exemple)
Nous espérons avoir été assez clair quant à la présentation de notre sujet.
Toute idée (type de fonction à utiliser par exemple), ou ressource pouvant nous aider à démarrer serait la bienvenue. Nous ne sommes pas très dégourdis sur R(c'est mal OUI OUI OUI ), et nous n'avons jamais eu l'occasion de nous familiariser à l'outil ggplot2. Encore une fois nous ne demandons en aucun cas de réaliser le travail à notre place, mais juste un petit coup de pouce pour lancer le travail !
Nous sommes à la disposition des âmes charitables pour plus amples informations si nécessaire !
Merci bien !
Epi2blé- Nombre de messages : 1
Date d'inscription : 20/03/2018
Re: Représentation graphique blé [ggplot2]
Bonsoir,
Vous n'êtes pas forcément clair sur le but de l'enseignement : c'est pratiquer les stats (via R car c'est l'outil utilisé par l'école) ou c'est pratiquer R (et vous faites des stats mais vous pourriez tout aussi bien faire de la programmation pure). Je penche plutôt pour la première option comme vous êtes en master de biologie végétale.
Si vous en êtes déjà à vous demander comment faire des représentations graphiques assez particulières c'est que vous avez déjà réalisé les analyses stats et que vous savez assez précisément ce que vous voulez mettre en avant dans les données en fonction de la problématique posée.
Donc exposez d'abord la problématique scientifique que vous voulez traiter via le jeu de données à disposition. Posez vous la question de savoir si le jeu de données permet bien de répondre à cette problématique. Puis une fois la problématique bien posée vous pourrez passer à l'étape suivante qui est de savoir quel(s) outil(s) statistique employer.
Les représentations graphiques doivent dans un premier temps vous aider à y voir plus clair sur la nature des liens qui lient les différentes variables. Donc au début pas besoin de se casser la tête avec du ggplot2 (malgré tout le bien que je pense de ce package). Des simples plot(poid~rang) feront bien l'affaire.
Voilà
j'espère que cela vous aidera à vous lancer et puis à poser d'autres questions pour préciser votre démarche.
Nik
Vous n'êtes pas forcément clair sur le but de l'enseignement : c'est pratiquer les stats (via R car c'est l'outil utilisé par l'école) ou c'est pratiquer R (et vous faites des stats mais vous pourriez tout aussi bien faire de la programmation pure). Je penche plutôt pour la première option comme vous êtes en master de biologie végétale.
Si vous en êtes déjà à vous demander comment faire des représentations graphiques assez particulières c'est que vous avez déjà réalisé les analyses stats et que vous savez assez précisément ce que vous voulez mettre en avant dans les données en fonction de la problématique posée.
Donc exposez d'abord la problématique scientifique que vous voulez traiter via le jeu de données à disposition. Posez vous la question de savoir si le jeu de données permet bien de répondre à cette problématique. Puis une fois la problématique bien posée vous pourrez passer à l'étape suivante qui est de savoir quel(s) outil(s) statistique employer.
Les représentations graphiques doivent dans un premier temps vous aider à y voir plus clair sur la nature des liens qui lient les différentes variables. Donc au début pas besoin de se casser la tête avec du ggplot2 (malgré tout le bien que je pense de ce package). Des simples plot(poid~rang) feront bien l'affaire.
Voilà
j'espère que cela vous aidera à vous lancer et puis à poser d'autres questions pour préciser votre démarche.
Nik
Nik- Nombre de messages : 1606
Date d'inscription : 23/05/2008
Sujets similaires
» Représentation graphique
» Représentation graphique de données qualitatives ?
» Représentation graphique de données héterogénes
» Mesure de la satisfaction - Représentation graphique
» Représentation graphique sur un seul axe factoriel
» Représentation graphique de données qualitatives ?
» Représentation graphique de données héterogénes
» Mesure de la satisfaction - Représentation graphique
» Représentation graphique sur un seul axe factoriel
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum