Forum de Statistiques
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
Le Deal du moment : -29%
DYSON V8 Origin – Aspirateur balai sans fil
Voir le deal
269.99 €

Méthodologie de simulation

3 participants

Aller en bas

Méthodologie de simulation Empty Méthodologie de simulation

Message par zezima Mer 30 Mar 2016 - 8:43

Bonjour,

Imaginons que nous ayont un pool de centres et que nous voulions utiliser une méthode statistique permettant de détecter des valeurs aberrantes (outliers / valeurs extrêmes). Je précise que je m'intéresse à la moyenne des données de chaque centre (par exemple la moyenne de température dans chaque centre), c'est cette moyenne que je comparer à la moyenne globale.

Ces valeurs aberrantes peuvent bien sur venir de différents horizons (fraude, hasard, erreur d'inatention, erreur de calibrage de machine).

Comment effectuer une simulation avec des données créées pour tester une méthode.

Je m'explique plus en détail. Par exemple je veux utiliser un test de Student à alpha=0,01% (prise en compte de la multiplicité), les centres sortant significativement différents de la moyenne globale seront considérés comme outlier.

J'ai donc besoin de créer le pool de centres mais aussi les données à l'intérieur. Il faut que je crée des données qui soient censées être proches de la réalité mais aussi intégrer quelques erreurs pour voir si la méthode est robuste pour les détecter.

Auriez-vous des suggestions / idées sur comment faire pour se lancer dans ce projet de simulation complexe sachant qu'il faut également prendre en compte :
- La taille des centres
- Le nombre total de centres

Merci d'avance pour toutes vos suggestions.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par Eric Wajnberg Mer 30 Mar 2016 - 9:08

Je ne suis pas sûr de bien comprendre la question. S'agit-il de simuler des données selon des lois théoriques ? C'est ça la question ? Si non, alors on peut toujours - et facilement - simuler des données en suivant les distributions empiriques observées, quel qu'elles soient. L'issue de tout ceci, si je comprends bien, permettra soit de pouvoir faire des tests (artéfactuellement) plus puissants, soit de faire des tests en suivant des procédures de Monte Carlo, donc en s'affranchissant des lois de Student, puisque c'est celle qui est mentionnée dans la question.

Des éclaircissements semblent nécessaires.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par zezima Mer 30 Mar 2016 - 9:15

Bonjour,

Oui toute ma question repose sur la simulation et non pas sur le test à appliquer.

Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité. Dans la vraie vie, on a toujours un effet aléatoire des centres.

C'est le premier point de la simulation. Ensuite après avoir créé ces données, je me verrais bien tester les méthodes et évaluer le nombre d'outliers identifiés avec une méthode telle que Student par exemple.

(je peux rentrer plus dans les détails si je ne suis tjrs pas assez clair)
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par Ayana Mer 30 Mar 2016 - 9:18

Bonjour,

Si tu as un effet centre, tu dois a priori specifier ton CCI (coefficient de correlation intraclasse) qui te permettra ensuite de generer des donnees correlees par centre. Le plus simple etant ensuite de simuler tes donnees selon un modele mixte. Pour calibrer tes simulations, utilise la valeur observee de ton CCI sur tes vraies donnees.

Ayana
Ayana
Ayana

Nombre de messages : 550
Localisation : Londres
Date d'inscription : 18/08/2009

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par Eric Wajnberg Mer 30 Mar 2016 - 9:28

zezima a écrit:Il s'agit de simuler des données mais je ne sais pas de quelle manière car si je simule en fonction de lois théoriques, je vais avoir des choses trop éloignées de la réalité, on aura une variance forcément plus faible de la réalité.
Ok, j'avais bien compris. Il suffit alors de simuler des données selon la distribution empirique observée. C'est assez simple à faire. La fonction sample() sous R fait ça très bien, etc.

HTH, Eric.
Eric Wajnberg
Eric Wajnberg

Nombre de messages : 1238
Date d'inscription : 14/09/2012

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par zezima Mer 30 Mar 2016 - 9:59

Merci à vous Smile

Donc il suffit de connaître à priori la loi suivie par les données pour créer des données équivalentes sur de plus grands effectifs. Et ainsi les tester.

Je reviens vers vous si je rencontre des difficultés.
zezima
zezima

Nombre de messages : 939
Date d'inscription : 26/02/2013

Revenir en haut Aller en bas

Méthodologie de simulation Empty Re: Méthodologie de simulation

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum