Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Méthodologie de simulation
3 participants
Page 1 sur 1
Méthodologie de simulation
Bonjour,
Imaginons que nous ayont un pool de centres et que nous voulions utiliser une méthode statistique permettant de détecter des valeurs aberrantes (outliers / valeurs extrêmes). Je précise que je m'intéresse à la moyenne des données de chaque centre (par exemple la moyenne de température dans chaque centre), c'est cette moyenne que je comparer à la moyenne globale.
Ces valeurs aberrantes peuvent bien sur venir de différents horizons (fraude, hasard, erreur d'inatention, erreur de calibrage de machine).
Comment effectuer une simulation avec des données créées pour tester une méthode.
Je m'explique plus en détail. Par exemple je veux utiliser un test de Student à alpha=0,01% (prise en compte de la multiplicité), les centres sortant significativement différents de la moyenne globale seront considérés comme outlier.
J'ai donc besoin de créer le pool de centres mais aussi les données à l'intérieur. Il faut que je crée des données qui soient censées être proches de la réalité mais aussi intégrer quelques erreurs pour voir si la méthode est robuste pour les détecter.
Auriez-vous des suggestions / idées sur comment faire pour se lancer dans ce projet de simulation complexe sachant qu'il faut également prendre en compte :
- La taille des centres
- Le nombre total de centres
Merci d'avance pour toutes vos suggestions.
Imaginons que nous ayont un pool de centres et que nous voulions utiliser une méthode statistique permettant de détecter des valeurs aberrantes (outliers / valeurs extrêmes). Je précise que je m'intéresse à la moyenne des données de chaque centre (par exemple la moyenne de température dans chaque centre), c'est cette moyenne que je comparer à la moyenne globale.
Ces valeurs aberrantes peuvent bien sur venir de différents horizons (fraude, hasard, erreur d'inatention, erreur de calibrage de machine).
Comment effectuer une simulation avec des données créées pour tester une méthode.
Je m'explique plus en détail. Par exemple je veux utiliser un test de Student à alpha=0,01% (prise en compte de la multiplicité), les centres sortant significativement différents de la moyenne globale seront considérés comme outlier.
J'ai donc besoin de créer le pool de centres mais aussi les données à l'intérieur. Il faut que je crée des données qui soient censées être proches de la réalité mais aussi intégrer quelques erreurs pour voir si la méthode est robuste pour les détecter.
Auriez-vous des suggestions / idées sur comment faire pour se lancer dans ce projet de simulation complexe sachant qu'il faut également prendre en compte :
- La taille des centres
- Le nombre total de centres
Merci d'avance pour toutes vos suggestions.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Méthodologie de simulation
Je ne suis pas sûr de bien comprendre la question. S'agit-il de simuler des données selon des lois théoriques ? C'est ça la question ? Si non, alors on peut toujours - et facilement - simuler des données en suivant les distributions empiriques observées, quel qu'elles soient. L'issue de tout ceci, si je comprends bien, permettra soit de pouvoir faire des tests (artéfactuellement) plus puissants, soit de faire des tests en suivant des procédures de Monte Carlo, donc en s'affranchissant des lois de Student, puisque c'est celle qui est mentionnée dans la question.
Des éclaircissements semblent nécessaires.
HTH, Eric.
Des éclaircissements semblent nécessaires.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Méthodologie de simulation
Bonjour,
Oui toute ma question repose sur la simulation et non pas sur le test à appliquer.
Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité. Dans la vraie vie, on a toujours un effet aléatoire des centres.
C'est le premier point de la simulation. Ensuite après avoir créé ces données, je me verrais bien tester les méthodes et évaluer le nombre d'outliers identifiés avec une méthode telle que Student par exemple.
(je peux rentrer plus dans les détails si je ne suis tjrs pas assez clair)
Oui toute ma question repose sur la simulation et non pas sur le test à appliquer.
Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité. Dans la vraie vie, on a toujours un effet aléatoire des centres.
C'est le premier point de la simulation. Ensuite après avoir créé ces données, je me verrais bien tester les méthodes et évaluer le nombre d'outliers identifiés avec une méthode telle que Student par exemple.
(je peux rentrer plus dans les détails si je ne suis tjrs pas assez clair)
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Re: Méthodologie de simulation
Bonjour,
Si tu as un effet centre, tu dois a priori specifier ton CCI (coefficient de correlation intraclasse) qui te permettra ensuite de generer des donnees correlees par centre. Le plus simple etant ensuite de simuler tes donnees selon un modele mixte. Pour calibrer tes simulations, utilise la valeur observee de ton CCI sur tes vraies donnees.
Ayana
Si tu as un effet centre, tu dois a priori specifier ton CCI (coefficient de correlation intraclasse) qui te permettra ensuite de generer des donnees correlees par centre. Le plus simple etant ensuite de simuler tes donnees selon un modele mixte. Pour calibrer tes simulations, utilise la valeur observee de ton CCI sur tes vraies donnees.
Ayana
Ayana- Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009
Re: Méthodologie de simulation
Ok, j'avais bien compris. Il suffit alors de simuler des données selon la distribution empirique observée. C'est assez simple à faire. La fonction sample() sous R fait ça très bien, etc.zezima a écrit:Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité.
HTH, Eric.
Eric Wajnberg- Nombre de messages : 1238
Date d'inscription : 14/09/2012
Re: Méthodologie de simulation
Merci à vous
Donc il suffit de connaître à priori la loi suivie par les données pour créer des données équivalentes sur de plus grands effectifs. Et ainsi les tester.
Je reviens vers vous si je rencontre des difficultés.
Donc il suffit de connaître à priori la loi suivie par les données pour créer des données équivalentes sur de plus grands effectifs. Et ainsi les tester.
Je reviens vers vous si je rencontre des difficultés.
zezima- Nombre de messages : 939
Date d'inscription : 26/02/2013
Sujets similaires
» Méthodologie
» Faire une méthodologie
» Méthodologie tient la route?
» Méthodologie stat sur données répétées.
» Aide choix test et méthodologie
» Faire une méthodologie
» Méthodologie tient la route?
» Méthodologie stat sur données répétées.
» Aide choix test et méthodologie
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum