Les posteurs les plus actifs de la semaine
Stanlgn
 
zezima
 


logiciels de stats

Aller en bas

30012014

Message 

logiciels de stats




Bonjour à tous,

dans le but d'une étude des outils de stats, comparaison, limites ... de chaque outils et comme étant informaticien et non statisticien , je voulais une aide, donc si vous pouvez me suggérer des outils que vous juger les plus performants et meilleurs pour que je commence l'études à partir de ceux la

merci pour votre aide

lewan

Nombre de messages : 1
Date d'inscription : 30/01/2014

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

- Sujets similaires
Partager cet article sur : diggdeliciousredditstumbleuponslashdotyahoogooglelive

logiciels de stats :: Commentaires

avatar

Message le Ven 31 Jan 2014 - 15:38 par zezima

Gratuit, tu as le logiciel R qui assez accessible.
Payant tu as le logiciel SAS qui est très bien aussi.

Il y a aussi stata et SPAD mais je ne sais pas s'ils sont gratuits.

Revenir en haut Aller en bas

avatar

Message le Sam 1 Fév 2014 - 8:19 par joyeux_lapin13

Je me permet de mettre ici ma réponse à ton mp, histoire que ça puisse profiter de tout le monde voir apporter quelques rectifications des autres actifs du forum.

Bonjour,

Personnellement je ne connais que R et SAS et globalement MATLAB. Le premier a l'avantage d'être gratuit, mais c'est également son défaut puisqu'on a aucune garantie sur la qualité du code même si jusqu'à aujourd'hui je n'ai jamais entendu parler d'un package qui soit officiel et faux. Après R pêche dans les grandes bases de données, une matrice d'une 30aine de colonne et de 50 000 observations prend un certain temps à être traitée en fonction de l'algorithme utilisé. SAS, quand à lui, est particulièrement cher mais c'est également son avantage, sortir un résultat avec SAS est mieux considéré qu'avec R d'une certaine manière. Pour les grandes bases de données il gère très bien même si je trouve qu'il est assez lent contrairement à ce que tout le monde avance. Ensuite, R est beaucoup plus complet niveau outil contrairement à SAS qui demande d'acheter des modules supplémentaires et qui fait pas grand chose sur le module de base, même le fait de sortir de "beaux" graphe demande d'acheter un module de plus... incroyable...

Niveau code, R c'est de l'algorithmique pur et dur qui est parfois agaçant sur le fait qu'il se complique la vie sur la gestion des formats numériques et caractères, on va d'un coup se trouver avec un format de table qui met tout en caractère uniquement et c'est franchement le bordel... alors que SAS fait vraiment les choses simplement sur ce point. De même pour les cas où on se retrouve avec un tableau d'une colonne, il faut alors prévoir tout plein de cas particulier pour pouvoir gérer cette exception lorsque le programme est une fonction supposée marcher aussi bien pour un tableau d'une colonne qu'un de plusieurs colonnes. SAS est plus un langage de type automate qui s'articule autour d'étapes d'édition de tables/résultats, utilisation de procédures spécifiques pour tirer des informations de la table puis récupération de ces sorties pour repartir sur le début de la boucle. Il présente un avantage vraiment agréable en terme de flexibilité, c'est qu'il permet d'écrire un programme dans le programme, c'est à dire que vous pouvez coder des macros qui vont s'adapter à la tête des données et des résultats associés pour faire un code vraiment neutre et totalement automatisé.

Pour Matlab, qui est un langage de type algorithmique payant et très complet, il reste un peu plus pénible pour traiter les données qualitatives car il faut les coder en numérique (du moins dans mes souvenirs). Il est également assez rapide même si je ne l'ai jamais tester sur de grandes bases de données.

Dernier point, essentiel de nos jours, les 3 permettent de faire du calcul parallèle, SAS est le plus complexe sur ce point car il faut définir parfaitement la structure du code et c'est pas toujours intuitif, R et Matlab sont plus directes.

Revenir en haut Aller en bas

Message le Sam 1 Fév 2014 - 10:07 par gg

Bonjour.

Il est facile de trouver les noms de la plupart des logiciels de statistiques payant. Pourquoi ne pas utiliser ton moteur de recherche préféré ?

Quelques noms courants : Statistica, SPSS, Minitab. Mais il en existe d'autres, généralistes, et quelques dizaines de spécialisés.

Cordialement.

NB : En deux secondes j'ai eu cette page Wikipédia qui donne 70 noms  Smile 

Revenir en haut Aller en bas

avatar

Message le Sam 1 Fév 2014 - 10:51 par joyeux_lapin13

De plus, le livre de S. Tufféry cité dans la section lien utile (cf mon post-it) donne une note descriptive des logiciels R, SAS et SPSS.

Revenir en haut Aller en bas

Message le Lun 3 Fév 2014 - 9:42 par c@ssoulet

stata est payant mais il existe une version d'evaluation gratuite.

Pour les perfs, les logiciels pros ne sont pas limites en nombre d'enregistrement (la limite est physique: RAM). Pour les enormes fichiers depassant la taille de la RAM, je pense que SAS gère un peu mieux le disque virtuel que les autres et garde une certaine avance. Mais c'est une situation tres rare avec les machines actuelles. La limite en nombre de variables va de quelques milliers à au delà des capacites raisonnables du cerveau humain lambda.
Les caracteristiques plus mathematiques (taille maxi des matrices ..etc..) sont dispos sur les sites des editeurs.
Les "formules mathématiques des tests" sont globalement les memes: tous ces programmes sont certifies et il n'y a pas 50 façons de faire un chi2. Il n'y a que pour des analyses un peu moins lambda qu'il peut y avoir des différences, lorsqu'il n'y a pas encore un consensus fort sur la meilleure "stratégie" pour aborder un problème. Tout ca est décrit dans la notice utilisateur, avec les formules et les references bibliographiques.

Globalement, pour avoir une idée à la louche SAS reste la référence, surtout parce qu'il a été le premier et qu'ils proposent depuis la nuit des temps des développements de logiciels specifiques autour de leur noyau. Beaucoup de boites ont investi des fortunes la dedans, par exemple pour creer des tableaux de bord d'entreprise ou pour l'exploitation des "entrepots de données". SPSS est plus orienté analyses de populations (epidemio, banques, assurances.. etc..) Stata est a peu pres equivalent a SAS sans les options developpement de modules et un peu moins performent en fonctions avancées de data management. R est tres oriente programmation, avec les possibilites certainement les plus ouvertes mais les avantages et inconvenients du monde libre et du developpement communautaire.

Revenir en haut Aller en bas

Message  par Contenu sponsorisé

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum