Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur

Le deal à ne pas rater :
Nike : Jusqu’à 50% sur les articles de fin de saison
Voir le deal

Traitement d'une liste de données

3 participants

Aller en bas

Traitement d'une liste de données Empty Traitement d'une liste de données

Message par Ryad Jeu 9 Jan 2020 - 13:31

J'ai une liste de plus de 31 000 agriculteurs, provenant de 42 communes. Ces listes contiennent les informations suivantes: Nom et Prénom, Commune, Surface Agricole Utile, Surface réservée à la céréaliculture, Année d'installation.

Il se trouve que sur chaque liste des différentes communes il y a des agriculteurs (nom & prénom) qui sont cité plusieurs fois (de deux jusqu'à huit fois). Ceci peut être dû à:

  • Enregistrement des données sur plusieurs années.
  • Enregistrement de différentes parcelles appartenant au même agriculteur.
  • Agriculteurs différent portant le même Nom et Prénom.

Y-a-t-il un moyen d'avoir une liste ne contenant pas de doublons?


Dernière édition par Ryad le Jeu 9 Jan 2020 - 22:28, édité 1 fois

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg Jeu 9 Jan 2020 - 19:46

Bonjour.

"doublant" élève ou étudiant qui refait une année d'études
"doublon" donnée apparaissant deux fois.

S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface

Si ce sont les deux autres cas, il faut des renseignements complémentaires pour trancher. Donc faire des vérifications commune par commune.

Cordialement.

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Eric Wajnberg Ven 10 Jan 2020 - 15:42

Votre question n'est pas vraiment une question de statistique.

Pour revenir à une discussion statistique sur votre problème, éliminer les doublons va vous faire perdre une quantité non négligeable d'information, et notamment la variation intra-agriculteur, ce n'est pas une bonne idée je pense.

Ca serait bien si vous nous expliquez pourquoi vous voulez faire ça.

Cordialement, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1237
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Ryad Mer 15 Jan 2020 - 11:01

Je tiens tout d'abord à vous remercier d'avoir pris le temps de me répondre.

gg a écrit:
S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface

Pour vous donner un peu plus de détails, il s'agit d'une enquête qui sera menée auprès des agriculteurs afin de confirmer l'existence d'une influence du conseil agricole sur la gestion d'une exploitation.
on a donc utilisé la liste des agriculteurs comme base de sondage pour effectuer un échantillonnage, on a pensé ensuite à diviser cette liste en sous-groupes pour former des strates en fonction de la taille de l'exploitation (Petite, Moyenne, Grande, ...etc,). et à ce moment là si on s'amuse à consolider les différentes parcelles on perdra forcement de l'information sur l'unité de référence de l'enquête, à savoir l'exploitation.

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg Mer 15 Jan 2020 - 11:36

Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Ryad Mer 15 Jan 2020 - 13:13

gg a écrit:Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?

Sauf qu'un agriculteur peut avoir deux parcelles avec une localisation distincte sur la même commune ou sur différentes communes.

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg Mer 15 Jan 2020 - 15:38

Oui, justement ...

gg

Nombre de messages : 2174
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum