Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Traitement d'une liste de données
3 participants
Page 1 sur 1
Traitement d'une liste de données
J'ai une liste de plus de 31 000 agriculteurs, provenant de 42 communes. Ces listes contiennent les informations suivantes: Nom et Prénom, Commune, Surface Agricole Utile, Surface réservée à la céréaliculture, Année d'installation.
Il se trouve que sur chaque liste des différentes communes il y a des agriculteurs (nom & prénom) qui sont cité plusieurs fois (de deux jusqu'à huit fois). Ceci peut être dû à:
Y-a-t-il un moyen d'avoir une liste ne contenant pas de doublons?
Il se trouve que sur chaque liste des différentes communes il y a des agriculteurs (nom & prénom) qui sont cité plusieurs fois (de deux jusqu'à huit fois). Ceci peut être dû à:
- Enregistrement des données sur plusieurs années.
- Enregistrement de différentes parcelles appartenant au même agriculteur.
- Agriculteurs différent portant le même Nom et Prénom.
Y-a-t-il un moyen d'avoir une liste ne contenant pas de doublons?
Dernière édition par Ryad le Jeu 9 Jan 2020 - 22:28, édité 1 fois
Ryad- Nombre de messages : 3
Date d'inscription : 09/01/2020
Re: Traitement d'une liste de données
Bonjour.
"doublant" élève ou étudiant qui refait une année d'études
"doublon" donnée apparaissant deux fois.
S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface
Si ce sont les deux autres cas, il faut des renseignements complémentaires pour trancher. Donc faire des vérifications commune par commune.
Cordialement.
"doublant" élève ou étudiant qui refait une année d'études
"doublon" donnée apparaissant deux fois.
S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface
Si ce sont les deux autres cas, il faut des renseignements complémentaires pour trancher. Donc faire des vérifications commune par commune.
Cordialement.
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Traitement d'une liste de données
Votre question n'est pas vraiment une question de statistique.
Pour revenir à une discussion statistique sur votre problème, éliminer les doublons va vous faire perdre une quantité non négligeable d'information, et notamment la variation intra-agriculteur, ce n'est pas une bonne idée je pense.
Ca serait bien si vous nous expliquez pourquoi vous voulez faire ça.
Cordialement, Eric.
Pour revenir à une discussion statistique sur votre problème, éliminer les doublons va vous faire perdre une quantité non négligeable d'information, et notamment la variation intra-agriculteur, ce n'est pas une bonne idée je pense.
Ca serait bien si vous nous expliquez pourquoi vous voulez faire ça.
Cordialement, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Traitement d'une liste de données
Je tiens tout d'abord à vous remercier d'avoir pris le temps de me répondre.
Pour vous donner un peu plus de détails, il s'agit d'une enquête qui sera menée auprès des agriculteurs afin de confirmer l'existence d'une influence du conseil agricole sur la gestion d'une exploitation.
on a donc utilisé la liste des agriculteurs comme base de sondage pour effectuer un échantillonnage, on a pensé ensuite à diviser cette liste en sous-groupes pour former des strates en fonction de la taille de l'exploitation (Petite, Moyenne, Grande, ...etc,). et à ce moment là si on s'amuse à consolider les différentes parcelles on perdra forcement de l'information sur l'unité de référence de l'enquête, à savoir l'exploitation.
gg a écrit:
S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface
Pour vous donner un peu plus de détails, il s'agit d'une enquête qui sera menée auprès des agriculteurs afin de confirmer l'existence d'une influence du conseil agricole sur la gestion d'une exploitation.
on a donc utilisé la liste des agriculteurs comme base de sondage pour effectuer un échantillonnage, on a pensé ensuite à diviser cette liste en sous-groupes pour former des strates en fonction de la taille de l'exploitation (Petite, Moyenne, Grande, ...etc,). et à ce moment là si on s'amuse à consolider les différentes parcelles on perdra forcement de l'information sur l'unité de référence de l'enquête, à savoir l'exploitation.
Ryad- Nombre de messages : 3
Date d'inscription : 09/01/2020
Re: Traitement d'une liste de données
Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Re: Traitement d'une liste de données
gg a écrit:Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?
Sauf qu'un agriculteur peut avoir deux parcelles avec une localisation distincte sur la même commune ou sur différentes communes.
Ryad- Nombre de messages : 3
Date d'inscription : 09/01/2020
Re: Traitement d'une liste de données
Oui, justement ...
gg- Nombre de messages : 2174
Date d'inscription : 10/01/2011
Sujets similaires
» Traitement de données
» Analyse de données avant/après traitement
» Traitement données brutes - CAH
» Traitement de données par ANOVA ?
» Traitement de donnees climatiques
» Analyse de données avant/après traitement
» Traitement données brutes - CAH
» Traitement de données par ANOVA ?
» Traitement de donnees climatiques
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum