Les posteurs les plus actifs de la semaine
Pchalix
 
victornitho
 
joyeux_lapin13
 
zezima
 
c@ssoulet
 


Méthodologie de simulation

Voir le sujet précédent Voir le sujet suivant Aller en bas

Méthodologie de simulation

Message par zezima le Mer 30 Mar 2016 - 8:43

Bonjour,

Imaginons que nous ayont un pool de centres et que nous voulions utiliser une méthode statistique permettant de détecter des valeurs aberrantes (outliers / valeurs extrêmes). Je précise que je m'intéresse à la moyenne des données de chaque centre (par exemple la moyenne de température dans chaque centre), c'est cette moyenne que je comparer à la moyenne globale.

Ces valeurs aberrantes peuvent bien sur venir de différents horizons (fraude, hasard, erreur d'inatention, erreur de calibrage de machine).

Comment effectuer une simulation avec des données créées pour tester une méthode.

Je m'explique plus en détail. Par exemple je veux utiliser un test de Student à alpha=0,01% (prise en compte de la multiplicité), les centres sortant significativement différents de la moyenne globale seront considérés comme outlier.

J'ai donc besoin de créer le pool de centres mais aussi les données à l'intérieur. Il faut que je crée des données qui soient censées être proches de la réalité mais aussi intégrer quelques erreurs pour voir si la méthode est robuste pour les détecter.

Auriez-vous des suggestions / idées sur comment faire pour se lancer dans ce projet de simulation complexe sachant qu'il faut également prendre en compte :
- La taille des centres
- Le nombre total de centres

Merci d'avance pour toutes vos suggestions.

zezima

Nombre de messages : 494
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par Eric Wajnberg le Mer 30 Mar 2016 - 9:08

Je ne suis pas sûr de bien comprendre la question. S'agit-il de simuler des données selon des lois théoriques ? C'est ça la question ? Si non, alors on peut toujours - et facilement - simuler des données en suivant les distributions empiriques observées, quel qu'elles soient. L'issue de tout ceci, si je comprends bien, permettra soit de pouvoir faire des tests (artéfactuellement) plus puissants, soit de faire des tests en suivant des procédures de Monte Carlo, donc en s'affranchissant des lois de Student, puisque c'est celle qui est mentionnée dans la question.

Des éclaircissements semblent nécessaires.

HTH, Eric.

Eric Wajnberg

Nombre de messages : 305
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par zezima le Mer 30 Mar 2016 - 9:15

Bonjour,

Oui toute ma question repose sur la simulation et non pas sur le test à appliquer.

Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité. Dans la vraie vie, on a toujours un effet aléatoire des centres.

C'est le premier point de la simulation. Ensuite après avoir créé ces données, je me verrais bien tester les méthodes et évaluer le nombre d'outliers identifiés avec une méthode telle que Student par exemple.

(je peux rentrer plus dans les détails si je ne suis tjrs pas assez clair)

zezima

Nombre de messages : 494
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par Ayana le Mer 30 Mar 2016 - 9:18

Bonjour,

Si tu as un effet centre, tu dois a priori specifier ton CCI (coefficient de correlation intraclasse) qui te permettra ensuite de generer des donnees correlees par centre. Le plus simple etant ensuite de simuler tes donnees selon un modele mixte. Pour calibrer tes simulations, utilise la valeur observee de ton CCI sur tes vraies donnees.

Ayana

Ayana

Nombre de messages : 388
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par Eric Wajnberg le Mer 30 Mar 2016 - 9:28

zezima a écrit:Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité.
Ok, j'avais bien compris. Il suffit alors de simuler des données selon la distribution empirique observée. C'est assez simple à faire. La fonction sample() sous R fait ça très bien, etc.

HTH, Eric.

Eric Wajnberg

Nombre de messages : 305
Date d'inscription : 14/09/2012

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par zezima le Mer 30 Mar 2016 - 9:59

Merci à vous Smile

Donc il suffit de connaître à priori la loi suivie par les données pour créer des données équivalentes sur de plus grands effectifs. Et ainsi les tester.

Je reviens vers vous si je rencontre des difficultés.

zezima

Nombre de messages : 494
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Méthodologie de simulation

Message par Contenu sponsorisé Aujourd'hui à 8:12


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum