Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Particule
données - Traitement d'une liste de données Vote_lcapdonnées - Traitement d'une liste de données Voting_bardonnées - Traitement d'une liste de données Vote_rcap 
Eric Wajnberg
données - Traitement d'une liste de données Vote_lcapdonnées - Traitement d'une liste de données Voting_bardonnées - Traitement d'une liste de données Vote_rcap 

-25%
Le deal à ne pas rater :
Microsoft Manette Xbox One sans Fil + Câble pour PC et Xbox
44.99 € 59.99 €
Voir le deal

Traitement d'une liste de données

Aller en bas

données - Traitement d'une liste de données Empty Traitement d'une liste de données

Message par Ryad le Jeu 9 Jan 2020 - 13:31

J'ai une liste de plus de 31 000 agriculteurs, provenant de 42 communes. Ces listes contiennent les informations suivantes: Nom et Prénom, Commune, Surface Agricole Utile, Surface réservée à la céréaliculture, Année d'installation.

Il se trouve que sur chaque liste des différentes communes il y a des agriculteurs (nom & prénom) qui sont cité plusieurs fois (de deux jusqu'à huit fois). Ceci peut être dû à:

  • Enregistrement des données sur plusieurs années.
  • Enregistrement de différentes parcelles appartenant au même agriculteur.
  • Agriculteurs différent portant le même Nom et Prénom.

Y-a-t-il un moyen d'avoir une liste ne contenant pas de doublons?


Dernière édition par Ryad le Jeu 9 Jan 2020 - 22:28, édité 1 fois

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg le Jeu 9 Jan 2020 - 19:46

Bonjour.

"doublant" élève ou étudiant qui refait une année d'études
"doublon" donnée apparaissant deux fois.

S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface

Si ce sont les deux autres cas, il faut des renseignements complémentaires pour trancher. Donc faire des vérifications commune par commune.

Cordialement.

gg

Nombre de messages : 2157
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Eric Wajnberg le Ven 10 Jan 2020 - 15:42

Votre question n'est pas vraiment une question de statistique.

Pour revenir à une discussion statistique sur votre problème, éliminer les doublons va vous faire perdre une quantité non négligeable d'information, et notamment la variation intra-agriculteur, ce n'est pas une bonne idée je pense.

Ca serait bien si vous nous expliquez pourquoi vous voulez faire ça.

Cordialement, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1174
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Ryad le Mer 15 Jan 2020 - 11:01

Je tiens tout d'abord à vous remercier d'avoir pris le temps de me répondre.

gg a écrit:
S'il s'agit de différentes parcelles, il faut faire une consolidation. Les tableurs ont des outils pour cela, certains logiciels statistique sans doute aussi. Il s'agit simplement de rassembler tous les doublons en une seule ligne en additionnant les surface

Pour vous donner un peu plus de détails, il s'agit d'une enquête qui sera menée auprès des agriculteurs afin de confirmer l'existence d'une influence du conseil agricole sur la gestion d'une exploitation.
on a donc utilisé la liste des agriculteurs comme base de sondage pour effectuer un échantillonnage, on a pensé ensuite à diviser cette liste en sous-groupes pour former des strates en fonction de la taille de l'exploitation (Petite, Moyenne, Grande, ...etc,). et à ce moment là si on s'amuse à consolider les différentes parcelles on perdra forcement de l'information sur l'unité de référence de l'enquête, à savoir l'exploitation.

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg le Mer 15 Jan 2020 - 11:36

Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?

gg

Nombre de messages : 2157
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Ryad le Mer 15 Jan 2020 - 13:13

gg a écrit:Heu ... si on rassemble les parcelles d'une même exploitation situées dans diverses communes, on obtient bien la vraie taille de l'exploitation, non ?

Sauf qu'un agriculteur peut avoir deux parcelles avec une localisation distincte sur la même commune ou sur différentes communes.

Ryad

Nombre de messages : 3
Date d'inscription : 09/01/2020

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par gg le Mer 15 Jan 2020 - 15:38

Oui, justement ...

gg

Nombre de messages : 2157
Date d'inscription : 10/01/2011

Revenir en haut Aller en bas

données - Traitement d'une liste de données Empty Re: Traitement d'une liste de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum