Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Les posteurs les plus actifs de la semaine
Aucun utilisateur


Importation des données

2 participants

Aller en bas

données - Importation des données Empty Importation des données

Message par FMarwen Ven 3 Aoû 2018 - 9:32

Bonjour tout le monde,

Je veux appliquer études statistique approfondie sur les fiches de paie. Alors, ma question est la suivante : vue la complexité des champs de fiche de paie, sous quelle forme de tableau de données je peux introduire les données sous R afin de faire le traitement ? Merci à vous.

Bien cordialement.

FMarwen

Nombre de messages : 226
Date d'inscription : 17/04/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par zezima Ven 3 Aoû 2018 - 9:45

Bonjour,

Quelle seront les analyses prévues ?
Comment est-ce que tu recueilles les données à partir des fiches de paie ?

Théoriquement sur un fichier Excel, une colonne par variable avec un ID par fiche de paie, un ID par individu et une variable date permettrait d'englober toutes les fiches de paie et de créer les sous-groupes qui t'intéresseront.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par FMarwen Ven 3 Aoû 2018 - 10:01

Bonjour Zezima,

Merci pour votre retour. Le but c'est de détecter les fiches de paie erronées de celles qui sont correctes et identifier le champ de l'erreur. Alors, les analyses prévues ça peut être les méthodes de Machine Learning comme réseaux de neurones et ou SVM. Que pensez-vous?
En général les fiches de paie sont stockées sous forme Excel.

BC.

FMarwen

Nombre de messages : 226
Date d'inscription : 17/04/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par zezima Ven 3 Aoû 2018 - 12:40

D'accord, vous voulez monitorer les données.

Très franchement je n'ai que des connaissances théoriques des méthodes machine learning que vous avez énoncé et je ne peux pas vous conseiller sur la structure de la base de donnée optimale pour utiliser ces méthodes.
Mais je pense que la structure de la BD doit être en accord avec les données que vous entrez dans l'analyse.

FMarwen a écrit:Que pensez-vous?
Je ne sais pas, je ne connais pas assez ces méthodes de classification, personnellement je monitore les données aberrantes avec des méthodes de "Monitoring Centralisé Statistique" et c'est peut être différent de la problématique que vous avez (quoique) donc je ne peux pas vous dire.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par FMarwen Ven 3 Aoû 2018 - 13:22

Plus clairement, je cherche une méthode de contrôle automatisée et c'est pour ça j'ai pensé aux méthodes de machine Learning.
En revanche, pouvez vous s'il vous plaît m'explique un peu plus votre méthode Monitoring Centralisé Statistique ? Merci

FMarwen

Nombre de messages : 226
Date d'inscription : 17/04/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par zezima Ven 3 Aoû 2018 - 13:37

Le CSM (monitoring centralisé statistique) regroupe plusieurs méthodes inférentielles et graphiques pour potentiellement détecter des individus ou des centres ayant des valeurs/moyennes aberrantes.
Un centre peut être n'importe quel regroupement d'individu pour lequel on suspecte un comportement aberrant (exemple: une banque qui aurait des fiches de paie plus élevées que les autres banques).

Avant d'utiliser ces méthodes de CSM, il faut établir des hypothèses (e.g. dysfonctionnement du logiciel qui fait les fiches de paie dans une banque et qui impliquerait un biais récurrent), cela permet de savoir quelle(s) méthode(s) utiliser.
Il y a plusieurs méthodes spécifiques en fonction de chaque problématique :
- fraude
- erreur humaine
- dysfonctionnement d'une machine

Mais il faut faire attention à ne pas confondre une valeur aberrante avec une valeur extrême.
Une valeur extrême peut provenir du hasard.
Si tu tapes CSM sur internet tu trouveras pas mal de méthodes (Funnel plot, grubs test, dixon test, distance de mahalanobis...)
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

données - Importation des données Empty Re: Importation des données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum