Les posteurs les plus actifs de la semaine
c@ssoulet
 
maplej0e
 
Eric Wajnberg
 
Florent Aubry
 
Mlbc
 


Logiciel de Data-Mining WEKA

Aller en bas

Logiciel de Data-Mining WEKA

Message par A.D. le Lun 31 Mai 2010 - 10:47

Bonjour,

Je suis amenée à travailler avec le logiciel Weka, et je souhaite l'utiliser sans effectuer simplement du "clique-bouton", c'est-à-dire en entrant directement des lignes de commandes. J'ai vu que cela était possible à l'aide de ce qui est appelé "Simple CLI", seulement je ne trouve pas de documentation assez fournie sur les différentes possibilités (notamment la réalisation de graphiques). J'ai bien sûr consulté le(s) site(s) "officiel(s)" et chercher via google. Donc si quelqu'un connaît ce logiciel et peut m'éclairer, je le remercie par avance

Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 30
Localisation : Nantes
Date d'inscription : 02/12/2009

Voir le profil de l'utilisateur http://www.dacta.fr

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par joyeux_lapin13 le Lun 31 Mai 2010 - 11:44

Bonjour, travaillant également avec WEKA mais en restant sur du click-action, il me semble que si tu lances une application et que tu cliques sur la touche log en bas à droite de l'interface il t'affiche les commandes qu'il a fait.

Ca pourra toujours te servir de didactitiel en attendant de trouver un site bien expliqué.
avatar
joyeux_lapin13

Nombre de messages : 1920
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par A.D. le Lun 31 Mai 2010 - 12:40

Merci pour votre réponse.

En effet, le bouton log permet d'obtenir certaines lignes de commandes, mais malheureusement pas toutes (certaines actions ne sont pas notées par exemple le choix de la variable à prédire entre autres).

J'ai une autre question sinon, si l'on effectue une régression linéaire, j'obtiens le modèle en sortie (output), comment tracer alors le nuage de points et la droite de régression ainsi obtenue ?

Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 30
Localisation : Nantes
Date d'inscription : 02/12/2009

Voir le profil de l'utilisateur http://www.dacta.fr

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par joyeux_lapin13 le Lun 31 Mai 2010 - 13:04

Je suis pas sur car pour le moment je fais que du boosting et de l'arbre de décision, mais sur le peu que j'ai lu, je crois qu'il faut enregistré ton étude et lancer avec un logiciel tel que gnuplot. Désolé j'en sais pas plus.

J'ai pas vraiment eu le temps d'aller au bout, mais dés que j'ai trouvé je poste sur ton topic.

Tant qu'on y est j'avais une question que j'ai laissé sur un autre post, sais-tu ce que fais exactement WEKA quand on lui indique "training set" ou encore "% split" en guise d'apprentissage? En cas si tu as le temps de vite consulter ce que j'ai écris pour voir exactement l'info que je cherchais étant donné que sur le fond je sais ce qu'il va faire, mais sur la forme pas du tout.

http://statistiques.forumpro.fr/questions-generales-f9/apprentissage-statistique-t1535.htm
avatar
joyeux_lapin13

Nombre de messages : 1920
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par A.D. le Lun 31 Mai 2010 - 13:21

Merci encore pour votre réponse rapide.
Je trouve ça dommage qu'il n'y ait pas plus de possibilités graphiques directement incluses dans Weka alors que dans R tout se fait "simplement".

Pour ce qui est de votre question, je n'en ai malheureusement aucune idée, désolée.
En effet, je ne connais que très peu de choses aux arbres de décisions et au boosting, et je viens juste de découvrir le logiciel Weka. Je suis actuellement en stage, on m'a donné un jeu de données sur lequel je dois effectuer une régression linéaire et tracer la droite de régression et le nuage de points, avec le logiciel R (ce que je sais faire sans problème) et avec le logiciel Weka (dont je dois apprendre à me servir par moi même). Pour le moment je ne vois pas en quoi le logiciel Weka serait plus "sympa" que R
Mais si d'aventures je venais à en apprendre un peu plus à propos de ce que vous recherchez, je ne manquerais pas de vous le faire savoir.

Bonne continuation,
Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 30
Localisation : Nantes
Date d'inscription : 02/12/2009

Voir le profil de l'utilisateur http://www.dacta.fr

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par joyeux_lapin13 le Lun 31 Mai 2010 - 13:26

Je connais pas R, en fait je vais devoir m'y mettre dés la semaine prochaine pour je sais plus quel package pratique qui y est implémenté.

L'avantage de WEKA est qu'il est programmé en JAVA et donc relativement rapide. De plus il est extrêment fiable bien que son interface ne soit pas des plus agréables.

Il possède tous les algorithmes et fonctions de classifications et en fouillant il possède une panoplie de graphe sur les performances qu'il construit.

Aprés c'est vrai que ça manque de doc, là je n'ai pas le temps mais dés demain je te posterais ce que j'avais trouvé.

Bonne continuation.

EDIT: voilà de quoi te satisfaire pour la nuit à venir http://weka.wikispaces.com/Frequently+Asked+Questions
avatar
joyeux_lapin13

Nombre de messages : 1920
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par droopy le Lun 31 Mai 2010 - 13:36

je ne peux pas répondre concernant weka, par contre concernant training set et %split oui. Regarde ici pour commencer: http://www.pitt.edu/~super7/7011-8001/7071.ppt
Tout est dans le livre de Franck Harrel, que je n'ai pas moi même.

Ce sont deux méthodes de validation interne, training set est basée sur du bootstrap, tu réechantillonnes ton jeu de données tu refais le modèle et tu calcule la statistique (ex: RMSE) qui t'interesse sur ton jeu de de données obtenu par bootsrap et sur le jeu de données intial. Tu fais ça n fois tu as 2 vecteurs de valeurs et la différence entre les deux te donne "l'optimisme".

Le %split et ben tu sépares ton jeu de données en 2 sous jeux de données: 1) training et 2)test qui contiennent x% des données de départ. Ca peut-être 50-50 ou 2/3-1/3. Tu recalcules ton modèle sur le jeu de données training et tu calcules la valeur de la statistique qui t'intérresse sur le jeu test.

voir ici :
http://books.google.com/books?id=kfHrF-bVcvQC&dq=egression+modeling+strategies&printsec=frontcover&source=bn&hl=fr&ei=sLsDTO2dIcaB4Qa7sYzMDg&sa=X&oi=book_result&ct=result&resnum=5&ved=0CDUQ6AEwBA#v=onepage&q&f=false
avatar
droopy

Nombre de messages : 1097
Date d'inscription : 04/09/2009

Voir le profil de l'utilisateur

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par A.D. le Lun 31 Mai 2010 - 13:46

joyeux_lapin13 a écrit:
EDIT: voilà de quoi te satisfaire pour la nuit à venir http://weka.wikispaces.com/Frequently+Asked+Questions
Merci mais j'ai déjà parcouru de long en large cette page ^^

Cela dit, c'est vrai que R est assez lent (surtout avec des jeux de données importants), mais je le trouve plus intuitif. Après, je viens seulement de "découvrir" Weka donc bon, je verrais bien...

Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 30
Localisation : Nantes
Date d'inscription : 02/12/2009

Voir le profil de l'utilisateur http://www.dacta.fr

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par joyeux_lapin13 le Lun 31 Mai 2010 - 14:54

En ce qui concerne les graphes apperemment il faut passer par l'interface Gui http://www.lri.fr/~antoine/Courses/Master-ISI/TD-TP/TP-Weka.pdf, même si c'est expliquer pour le cas du perceptron je pense que c'est bon pour toutes les autre méthodes.

Sinon tu peux aussi regarder les TP de plusieurs profs qui sont assez détaillés (même si au final pas assez...) comme ceux de Yann Esposito ou encore Christophe Magnan.

Et merci Droopy au fait! ça faisait un bail que je cherchais une explication sur ces deux méthodes d'apprentissage.
avatar
joyeux_lapin13

Nombre de messages : 1920
Age : 34
Localisation : Mayotte
Date d'inscription : 21/04/2010

Voir le profil de l'utilisateur https://lemakistatheux.wordpress.com/

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par A.D. le Lun 31 Mai 2010 - 15:13

Merci encore une fois pour votre réponse

Je vais regarder tout ça en espérant trouver mon bonheur !

Cordialement,

A.D.

A.D.

Nombre de messages : 305
Age : 30
Localisation : Nantes
Date d'inscription : 02/12/2009

Voir le profil de l'utilisateur http://www.dacta.fr

Revenir en haut Aller en bas

Re: Logiciel de Data-Mining WEKA

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum