Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Importation des données
2 participants
Page 1 sur 1
Importation des données
Bonjour tout le monde,
Je veux appliquer études statistique approfondie sur les fiches de paie. Alors, ma question est la suivante : vue la complexité des champs de fiche de paie, sous quelle forme de tableau de données je peux introduire les données sous R afin de faire le traitement ? Merci à vous.
Bien cordialement.
Je veux appliquer études statistique approfondie sur les fiches de paie. Alors, ma question est la suivante : vue la complexité des champs de fiche de paie, sous quelle forme de tableau de données je peux introduire les données sous R afin de faire le traitement ? Merci à vous.
Bien cordialement.
FMarwen- Nombre de messages : 226
Date d'inscription : 17/04/2013
Re: Importation des données
Bonjour,
Quelle seront les analyses prévues ?
Comment est-ce que tu recueilles les données à partir des fiches de paie ?
Théoriquement sur un fichier Excel, une colonne par variable avec un ID par fiche de paie, un ID par individu et une variable date permettrait d'englober toutes les fiches de paie et de créer les sous-groupes qui t'intéresseront.
Quelle seront les analyses prévues ?
Comment est-ce que tu recueilles les données à partir des fiches de paie ?
Théoriquement sur un fichier Excel, une colonne par variable avec un ID par fiche de paie, un ID par individu et une variable date permettrait d'englober toutes les fiches de paie et de créer les sous-groupes qui t'intéresseront.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Importation des données
Bonjour Zezima,
Merci pour votre retour. Le but c'est de détecter les fiches de paie erronées de celles qui sont correctes et identifier le champ de l'erreur. Alors, les analyses prévues ça peut être les méthodes de Machine Learning comme réseaux de neurones et ou SVM. Que pensez-vous?
En général les fiches de paie sont stockées sous forme Excel.
BC.
Merci pour votre retour. Le but c'est de détecter les fiches de paie erronées de celles qui sont correctes et identifier le champ de l'erreur. Alors, les analyses prévues ça peut être les méthodes de Machine Learning comme réseaux de neurones et ou SVM. Que pensez-vous?
En général les fiches de paie sont stockées sous forme Excel.
BC.
FMarwen- Nombre de messages : 226
Date d'inscription : 17/04/2013
Re: Importation des données
D'accord, vous voulez monitorer les données.
Très franchement je n'ai que des connaissances théoriques des méthodes machine learning que vous avez énoncé et je ne peux pas vous conseiller sur la structure de la base de donnée optimale pour utiliser ces méthodes.
Mais je pense que la structure de la BD doit être en accord avec les données que vous entrez dans l'analyse.
Très franchement je n'ai que des connaissances théoriques des méthodes machine learning que vous avez énoncé et je ne peux pas vous conseiller sur la structure de la base de donnée optimale pour utiliser ces méthodes.
Mais je pense que la structure de la BD doit être en accord avec les données que vous entrez dans l'analyse.
Je ne sais pas, je ne connais pas assez ces méthodes de classification, personnellement je monitore les données aberrantes avec des méthodes de "Monitoring Centralisé Statistique" et c'est peut être différent de la problématique que vous avez (quoique) donc je ne peux pas vous dire.FMarwen a écrit:Que pensez-vous?
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Importation des données
Plus clairement, je cherche une méthode de contrôle automatisée et c'est pour ça j'ai pensé aux méthodes de machine Learning.
En revanche, pouvez vous s'il vous plaît m'explique un peu plus votre méthode Monitoring Centralisé Statistique ? Merci
En revanche, pouvez vous s'il vous plaît m'explique un peu plus votre méthode Monitoring Centralisé Statistique ? Merci
FMarwen- Nombre de messages : 226
Date d'inscription : 17/04/2013
Re: Importation des données
Le CSM (monitoring centralisé statistique) regroupe plusieurs méthodes inférentielles et graphiques pour potentiellement détecter des individus ou des centres ayant des valeurs/moyennes aberrantes.
Un centre peut être n'importe quel regroupement d'individu pour lequel on suspecte un comportement aberrant (exemple: une banque qui aurait des fiches de paie plus élevées que les autres banques).
Avant d'utiliser ces méthodes de CSM, il faut établir des hypothèses (e.g. dysfonctionnement du logiciel qui fait les fiches de paie dans une banque et qui impliquerait un biais récurrent), cela permet de savoir quelle(s) méthode(s) utiliser.
Il y a plusieurs méthodes spécifiques en fonction de chaque problématique :
- fraude
- erreur humaine
- dysfonctionnement d'une machine
Mais il faut faire attention à ne pas confondre une valeur aberrante avec une valeur extrême.
Une valeur extrême peut provenir du hasard.
Si tu tapes CSM sur internet tu trouveras pas mal de méthodes (Funnel plot, grubs test, dixon test, distance de mahalanobis...)
Un centre peut être n'importe quel regroupement d'individu pour lequel on suspecte un comportement aberrant (exemple: une banque qui aurait des fiches de paie plus élevées que les autres banques).
Avant d'utiliser ces méthodes de CSM, il faut établir des hypothèses (e.g. dysfonctionnement du logiciel qui fait les fiches de paie dans une banque et qui impliquerait un biais récurrent), cela permet de savoir quelle(s) méthode(s) utiliser.
Il y a plusieurs méthodes spécifiques en fonction de chaque problématique :
- fraude
- erreur humaine
- dysfonctionnement d'une machine
Mais il faut faire attention à ne pas confondre une valeur aberrante avec une valeur extrême.
Une valeur extrême peut provenir du hasard.
Si tu tapes CSM sur internet tu trouveras pas mal de méthodes (Funnel plot, grubs test, dixon test, distance de mahalanobis...)
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» Importation de données et AFC
» importation et formes des données
» Importation de données sous R
» importation bases de données dans R
» Problème d'importation des données R vers Excel
» importation et formes des données
» Importation de données sous R
» importation bases de données dans R
» Problème d'importation des données R vers Excel
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|