Les posteurs les plus actifs de la semaine
Eric Wajnberg
 
toussaZK
 
niaboc
 
zezima
 
gg
 
droopy
 
Ayana
 
Truella
 
Amyloide
 
Doudouman
 


SAS vs R

Voir le sujet précédent Voir le sujet suivant Aller en bas

01062016

Message 

SAS vs R




Bonjour,

J'aimerais savoir quel est l'avantage à utiliser SAS au détriment de R.

Depuis 5 ans que je travaille sur les 2 logiciels, je trouve énormément de points positifs à R que je ne retrouve pas chez SAS et je ne comprends pas pourquoi tous les labos et les CRO utilisent SAS en grande majorité.

R est gratuit, intuitif, c'est un langage orienté objet donc facile à manier pour le maniement des bases de données, il est mis à jour très souvent et ne pèse pas lourd si on veut le télécharger.
Cependant, étant donné que les packages sont développés par des universitaires (en grande partie), les commités de santé sont plus réticents quand à l'acceptation d'un papier provenant d'une étude issue de R. Les boucles sont beaucoup plus fastidieuses à exécuter que sur SAS et certaines fonctions ont du mal à tourner (fisher exact...).

SAS est agréable graphiquement et il me semble plus puissant pour manier des grosses bases de données, les erreurs sont plutôt faciles à comprendre et un code couleur est présent dans les aides et au niveau des scripts.
Cependant le langage fait appel à un second langage (SQL) pour le maniement des données, qui me semble moins efficace que R tout de même. L'interface graphique est très complexe.

Je sais que R va se développer de plus en plus dans le monde des statistiques, dans les entreprises, pour son côté gratuit mais également sa facilité d'utilisation.

En tant que statisticiens, quels avantages trouvez-vous à SAS qui ne sont pas présents chez R ?
Et pour quelqu'un qui va s'orienter dans le monde de la santé (CRO/labos), préconisez-vous de se mettre à niveau en SAS ou c'est viable de maîtriser partiellement R ?

Smile

zezima

Nombre de messages : 536
Date d'inscription : 26/02/2013

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Partager cet article sur : Excite BookmarksDiggRedditDel.icio.usGoogleLiveSlashdotNetscapeTechnoratiStumbleUponNewsvineFurlYahooSmarking

SAS vs R :: Commentaires

Message le Mer 1 Juin 2016 - 8:39 par niaboc

Bonjour,

tous ces arguments ne concernent que moi et sont surement biaisés car j'ai commencé à apprendre à coder dans SAS avant R, mais voici mon avis :

la gestion et le maniement des bases de données est beaucoup beaucoup plus agréable sur SAS. Sitôt que tu dois gérer plusieurs tables à la fois pour recouper un paquet d'informations, je trouve que SAS est bien meilleur.

La documentation de SAS est vraiment bien.

Je trouve qu'il est beaucoup plus simple et efficace de coder un programme sous SAS que sous R, notamment grâce au langage macro. Et le langage est plus intuitif.

SAS a son propre langage, mais tu peux effectivement utiliser du SQL via la "proc sql;". Et il est apparemment possible d'utiliser du language R dans SAS, via :
http://analyticstraining.com/2014/how-to-use-proc-r-in-sas/
L'inverse n'est peut-être pas possible :-).

On entend de plus en plus parler de WPS. C'est un logiciel de stat qui reprend parfaitement le code SAS et qui est beaucoup beaucoup moins cher que SAS.

Niaboc

Revenir en haut Aller en bas

Message le Jeu 2 Juin 2016 - 15:57 par zezima

Merci pour ton avis.

Alors justement je ne suis pas tout à fait d'accord pour le maniement des données étant donné qu'on peut faire en une ligne un proc sql sur R. Après je n'ai jamais manié de manière complexe les données mais c'est mon ressenti. Le merge est plus simple sur SAS mais pour mettre des proc sql dans les maccros, au final le code finit par être assez lourd je trouve sachant qu'on a l'équivalent des maccros sur R (fonctions).

Niveau doc je suis d'accord par contre, c'est plutôt bien fait.

C'est super sympa ton astuce pour utiliser R sur SAS, je vais jeter un coup d'oeil Smile

Revenir en haut Aller en bas

Message le Ven 3 Juin 2016 - 7:45 par joyeux_lapin13

Sujet très intéressant et qui pourrait s'étendre à ceux qui se servent de SPSS et STAT.

Pour ma part, je trouve que SAS et R se complètent. Quand j'étais en R&D j'avais travaillé sur un programme bashé qui faisait intervenir les deux afin de dérouler toute la chaine d'analyse statistique automatisée et parallélisée, les résultats étaient vraiment prodigieux.

Pour revenir au sujet, voici comment je définirais mon expérience:
- SAS: le passage par procédure limite fortement les erreurs de manipulation quand on prend le temps de regarder ce qui sort et ce qu'on veut exactement. De plus, une fois qu'on a compris l'idée qui se casse derrière le machin on peut vraiment générer des séries de feuillets de résultats très agréable à lire (ods rtf fait des choses exeptionnelles). De plus, le logiciel permet également de générer des rapports d'analyse tout fait et ça R ne le fait pas. Faut dire que le reporting avec SAS rend énormément de service quand on empile les bases de données et qu'on doit tout traiter rapidement pour ramener un max de thune à sa boîte. Après, en effet, tout ce qui vient de SAS est certifié donc plus rassurant pour un chef de projet par exemple.
- R: pas le même délire, plus axé algorithmique et donc plus sujet à créer une erreur dans son code difficilement identifiable. Je pourrais en lister un sacré nombres de fonction douteuses sous R comme la fonction pour le test de kruskal wallis ou encore les méthodes de validation insérée dans la fonction pour les svm. De plus on peut quand même reprocher un certain nombre de lacunes dans les sorties des fonctions sous R, alors on peut recoder le machin c'est vrai mais c'est pas toujours le but de réinventer la poudre. Je rajouterais que le reporting avec R est absolument naze voir d'une complexité aberrante sans parler de ces putains de format de variables ou de bases qui obligent à reconsidérer plus exception pour que son code tourne quelque soit la configuration de la base de données et ça moi ça me gonfle sévèrement.

Globalement, je passe par R si je n'ai pas le choix. Donc tout ce qui est analyse multivariée prédictive plus poussée que l'analyse discriminante de Fisher ou la régression logistique (et linéaire) je me sers des fonctions R que j'ai toute recodée quasiment car légèrement obsolète pour l'application que je veux en faire ou même qu'un pro devrait en faire (sauf s'il s'agit d'analyse de faisabilité à la rigueur). Tu cites le test de Fisher exact, mais sous SAS il tourne infiniment plus rapidement, SAS reste plus rapide globalement. Outre son manque d'exhaustivité, pour moi le seul souci avec SAS c'est que passé un certain nombre d'actions il se met à ramer voir planter sans raison, ex: j'avais programmé la modélisation par régression logistique avec sortie des résultats dans un tableau de synthèse sur toutes les combinaisons de variables possibles et passé environ 20 à 30 000 combinaisons explorées, le programme plantait un coups sur trois, triste quand on voit le temps de calcul qui peut dépasser facilement la journée de traitement... Bon par contre la parallélisation de calcul avec R est d'une simplicité sans nom et c'est très agréable, contrairement à SAS qui demande que l'administrateur réseau t'ouvre les droits, le code est également très compliqué à mettre en place, je peux garantir que la maquette que j'ai pu faire je la conserve à vie dans un coffre fort lol tant elle vaut de l'or. Je parlerais volontaire du prix, mais au final c'est pas moi qui paie la facture alors ça serait obsolète.

Revenir en haut Aller en bas

Message le Mer 11 Jan 2017 - 9:05 par zezima

Merci beaucoup pour ton avis joyeux lapin, je suis globalement du même avis que toi.
Bon j'avais horreur de SAS au départ mais j'ai finalement changé d'avis en me forçant un peu.

Pour résumer, après 9 mois de programmation SAS, je dois admettre qu'il y a un sacré nombre de points positifs:
- Les sorties sont beaucoup plus lisibles, simples, rapides à générer
- Les fonctions sont plus acceptées par les agences (et à juste titre)
- Les graphiques sont très facilement créés à partir de certaines procédures
- Le code est très intuitif, le squelette des procédures est assez homogène
- Une puissance du logiciel qui peut gérer de grosses bases de données plus aisément que R

Cependant des points non-négligeables en faveur de R:
- Tout ce qui est recherche fondamentale est fait sur R et du coup les universitaires l'utilisent pour développer des nouvelles méthodes / packages, ce qui fait que si on veut utiliser des choses assez récentes, R est plutôt à privilégier
- Egalement, pour la création de graphiques à la main, SAS est assez complexe contrairement à R
- Le plus de R est surtout l'aspect des objets qui ne nécessitent pas de macros variables, on a tendance à ne pas créer des macros variables pour les calculs sous SAS contrairement à R qui peut contenir très simplement des vecteurs, des listes etc...
- Je trouve également que la partie data-management est énormément plus simple sous R (même si on peut manier assez bien les tables avec du SQL sous SAS)
- Les simulations sont plus simples à réaliser sous R, tout comme les méthodes bayésiennes qui sont bien plus développées sous R
- R est gratuit alors que les versions et packages de SAS sont payants et assez chers, tout comme les versions de SAS qui sont à mettre à jour, c'est assez complexe de le faire dans un laboratoire et on peut se heurter à certaines options/méthodes qui ne fonctionnent pas (RIP 9.3)
- Enfin, l'aide de SAS est... très laborieuse, les exemples pas très bien expliqués, les forums parlent beaucoup moins de SAS, ce qui fait que c'est plus complexe de trouver son code et ça se comprend car c'est un logiciel payant et le savoir se partage moins facilement

Il y a un point dont je ne connais pas l'aspect, celui de la parallelisation (lancer un code issu d'une session R sous plusieurs ordinateurs pour le faire tourner plus vite) qui est possible sous R, je ne sais pas si c'est le cas sous SAS.

Je dirais que les deux logiciels sont utiles pour des utilisations différentes en fonction des problématiques de l'entreprise/l'institut.

Revenir en haut Aller en bas

Message le Jeu 26 Jan 2017 - 13:22 par A.D.

Bonjour,

Personnellement je suis une grande fan et utilisatrice de R depuis des années et je n'ai que très peu utilisé SAS donc je ne pourrais pas apporter d'avis direct sur la comparaison entre les deux...

Par contre, pour rebondir un peu sur ce qui a été dit, je ne suis pas d'accord avec l'affirmation "le reporting avec R est absolument naze", car amha il y a eu beaucoup de progrès de ce point de vue là ces derniers temps.
Quelques exemples :

  • R Markdown : permet la génération de rapports automatiques dans divers formats : Word, ODT, PDF, HTML, présentation (beamer, slidy, ioslides...), et également la génération de Notebooks.
  • ReporteRs : permet la génération de rapports Word et PowerPoint de manière automatisée.
  • Shiny (et toutes ses déclinaisons comme par exemple shinydashboard) : permet la génération de pages web / tableaux de bord web dynamiques, sans avoir besoin de s'y connaitre en HTML / CSS / JavaScript (hyper puissant amha !).

Après je pense que c'est comme pour tout outil, il est bien adapté pour certains cas/problématiques/configuration et moins pour d'autres, il n'y a pas d'outil parfait pour tout Wink

Intéressant en tout cas d'avoir des retours d'expériences concrets sur ce sujet, merci !

Revenir en haut Aller en bas

Message  par Contenu sponsorisé

Revenir en haut Aller en bas

Voir le sujet précédent Voir le sujet suivant Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum