Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
Catz
 
cicino
 
Anny_Nina
 


SAS, R et génération de données

Voir le sujet précédent Voir le sujet suivant Aller en bas

SAS, R et génération de données

Message par Ayana le Ven 15 Juin 2012 - 9:11

Bonjour à tous,

J'ai un problème étrange et aimerais avoir votre avis.

Je réalise des simulation sous SAS et sous R, et je m'interroge sur les fonctions normal() et rannor() de SAS.
Sous R, si je simule simplement 100 variables N(0,1), la moyenne est inférieure à |10^-4| dès 100 simulations. Avec SAS, il faut environ... 1000000 de valeurs pour un résultat équivalent. Il y a une énorme variabilité avec SAS. Régulièrement, avec 5000 variables, on arrive à des valeurs de 0.02 ou 0.03, certes dans l'intervalle de prédiction, mais qui entraînent au final d'énormes perturbations sur les données simulées, le plan de simulation étant complexe.

Comment expliquer ces différences entre SAS et R, et surtout quelles peuvent être les implications sur les résultats de simulations?

Ayana
avatar
Ayana

Nombre de messages : 461
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par joyeux_lapin13 le Ven 15 Juin 2012 - 9:54

La graine peut-être? (fonction seed)
avatar
joyeux_lapin13

Nombre de messages : 1912
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par Ayana le Ven 15 Juin 2012 - 10:04

je prends l'heure courante pour éviter tout problème avec le RNG...
avatar
Ayana

Nombre de messages : 461
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par joyeux_lapin13 le Ven 15 Juin 2012 - 13:24

Désolé, en fait j'ai peut-être proposé une piste alors que tu en savais 10 fois plus que moi, mais quel rapport avec l'heure courante?
avatar
joyeux_lapin13

Nombre de messages : 1912
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par Ayana le Ven 15 Juin 2012 - 13:47

Quand tu utilises -1 comme graine, SAS utilise l'heure courante comme graine et du coup ça multiplie les chances d'avoir des données vraiment indépendantes. Je fais la même chose avec R, et les résultats sont beaucoup plus stables.
Là j'avoue, je n'y comprends rien... Rolling Eyes
avatar
Ayana

Nombre de messages : 461
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par niaboc le Ven 15 Juin 2012 - 15:15

Ayana a écrit:Bonjour à tous,

J'ai un problème étrange et aimerais avoir votre avis.

Je réalise des simulation sous SAS et sous R, et je m'interroge sur les fonctions normal() et rannor() de SAS.
Sous R, si je simule simplement 100 variables N(0,1), la moyenne est inférieure à |10^-4| dès 100 simulations. Avec SAS, il faut environ... 1000000 de valeurs pour un résultat équivalent. Ayana


Et encore... avec 1000000 de valeurs on obtient une précision inférieur à 10^-4 qu'une fois sur 5.


Je ne sais pas comment l'expliquer ; l'algorithme est différent entre les deux logiciels?! mais lequel serait le plus vrai...?
avatar
niaboc

Nombre de messages : 923
Age : 30
Localisation : Paris
Date d'inscription : 05/05/2008

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par Ayana le Dim 17 Juin 2012 - 19:24

Ca me rassure de voir que je ne suis pas la seule à retrouver ça. Sur le forum "officiel" de SAS, ça ne choquait personne... Un des nombreux mystères de SAS. Je n'ai qu'une solution : tous à R!!!!
avatar
Ayana

Nombre de messages : 461
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par joyeux_lapin13 le Lun 18 Juin 2012 - 7:58

Pas compris en quoi ça impliquait un "tous à R" même si je vois Nick avec la banane rien qu'en lisant cela lol!

Bon dans le doute, aussi peu futile que ça peut sembler être, j'aurais tendance à croire SAS et non R car le premier est un logiciel professionnel où chaque code reçoit un aval contrairement au premier où on a pas cette assurance. Et c'est bien pour cela que de nombreuses boîtes investissent énormément d'argent dans ce type de logiciel alors que R est bien plus complet, accessible et surtout gratuit; car avec un logiciel payant tu restes sûr que ton résultat, combien même est-il étrange, est juste.

Mais je l'admet moi-même après pas mal de temps à travailler avec SAS et R en simultané, dés fois je me demande si je continue pas à travailler dans SAS juste parce que la compétence est très demandée sur le marché.
avatar
joyeux_lapin13

Nombre de messages : 1912
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par Ayana le Lun 18 Juin 2012 - 8:14

Je comprends ton point de vue, et c'est ce que je pensais aussi. Mais à force de travailler avec les 2 (le plus souvent pour vérifier les résultats), je trouve justement que R induit plus de confiance. Et comme R est à contribution libre, ça améliore la qualité du logiciel.
Enfin bref, sur 100 000 000 de simulations, tomber assez souvent en dehors de l'intervalle de prédiction, c'est pas très rassurant...

Mais je te rassure, mon "tous à R" était un peu provocateur ;-)
avatar
Ayana

Nombre de messages : 461
Localisation : Londres
Date d'inscription : 18/08/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par joyeux_lapin13 le Lun 18 Juin 2012 - 8:23

Et il est vrai! C'est ça le pire, pour preuve avec le module IML qui permet de faire du R avec du SAS, bref je sais qu'à ma boite ça commence à devenir un sujet sensible, rien que la parallélisation sous SAS et R c'est le jour et la nuit et si seulement ça venait du code... le pire c'est que j'ai jamais filé autant de taff à mon administrateur réseau depuis que je parallélise avec SAS... sous R il avait quasiment rien à faire, sous SAS il doit tout configurer et reconfigurer et rereconfigurer et ect ect ect bref lui-même ma posé la question pourquoi au prix de la licence on a pas tout passé sous R... ben autant te dire que l'argument il l'a trouvé moyennement pourris lol!
avatar
joyeux_lapin13

Nombre de messages : 1912
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: SAS, R et génération de données

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum