Les posteurs les plus actifs de la semaine
Aucun utilisateur |
Sujets les plus vus
Logiciel de Data-Mining WEKA
3 participants
Page 1 sur 1
Logiciel de Data-Mining WEKA
Bonjour,
Je suis amenée à travailler avec le logiciel Weka, et je souhaite l'utiliser sans effectuer simplement du "clique-bouton", c'est-à-dire en entrant directement des lignes de commandes. J'ai vu que cela était possible à l'aide de ce qui est appelé "Simple CLI", seulement je ne trouve pas de documentation assez fournie sur les différentes possibilités (notamment la réalisation de graphiques). J'ai bien sûr consulté le(s) site(s) "officiel(s)" et chercher via google. Donc si quelqu'un connaît ce logiciel et peut m'éclairer, je le remercie par avance
Cordialement,
A.D.
Je suis amenée à travailler avec le logiciel Weka, et je souhaite l'utiliser sans effectuer simplement du "clique-bouton", c'est-à-dire en entrant directement des lignes de commandes. J'ai vu que cela était possible à l'aide de ce qui est appelé "Simple CLI", seulement je ne trouve pas de documentation assez fournie sur les différentes possibilités (notamment la réalisation de graphiques). J'ai bien sûr consulté le(s) site(s) "officiel(s)" et chercher via google. Donc si quelqu'un connaît ce logiciel et peut m'éclairer, je le remercie par avance
Cordialement,
A.D.
Re: Logiciel de Data-Mining WEKA
Bonjour, travaillant également avec WEKA mais en restant sur du click-action, il me semble que si tu lances une application et que tu cliques sur la touche log en bas à droite de l'interface il t'affiche les commandes qu'il a fait.
Ca pourra toujours te servir de didactitiel en attendant de trouver un site bien expliqué.
Ca pourra toujours te servir de didactitiel en attendant de trouver un site bien expliqué.
Re: Logiciel de Data-Mining WEKA
Merci pour votre réponse.
En effet, le bouton log permet d'obtenir certaines lignes de commandes, mais malheureusement pas toutes (certaines actions ne sont pas notées par exemple le choix de la variable à prédire entre autres).
J'ai une autre question sinon, si l'on effectue une régression linéaire, j'obtiens le modèle en sortie (output), comment tracer alors le nuage de points et la droite de régression ainsi obtenue ?
Cordialement,
A.D.
En effet, le bouton log permet d'obtenir certaines lignes de commandes, mais malheureusement pas toutes (certaines actions ne sont pas notées par exemple le choix de la variable à prédire entre autres).
J'ai une autre question sinon, si l'on effectue une régression linéaire, j'obtiens le modèle en sortie (output), comment tracer alors le nuage de points et la droite de régression ainsi obtenue ?
Cordialement,
A.D.
Re: Logiciel de Data-Mining WEKA
Je suis pas sur car pour le moment je fais que du boosting et de l'arbre de décision, mais sur le peu que j'ai lu, je crois qu'il faut enregistré ton étude et lancer avec un logiciel tel que gnuplot. Désolé j'en sais pas plus.
J'ai pas vraiment eu le temps d'aller au bout, mais dés que j'ai trouvé je poste sur ton topic.
Tant qu'on y est j'avais une question que j'ai laissé sur un autre post, sais-tu ce que fais exactement WEKA quand on lui indique "training set" ou encore "% split" en guise d'apprentissage? En cas si tu as le temps de vite consulter ce que j'ai écris pour voir exactement l'info que je cherchais étant donné que sur le fond je sais ce qu'il va faire, mais sur la forme pas du tout.
https://statistiques.forumpro.fr/questions-generales-f9/apprentissage-statistique-t1535.htm
J'ai pas vraiment eu le temps d'aller au bout, mais dés que j'ai trouvé je poste sur ton topic.
Tant qu'on y est j'avais une question que j'ai laissé sur un autre post, sais-tu ce que fais exactement WEKA quand on lui indique "training set" ou encore "% split" en guise d'apprentissage? En cas si tu as le temps de vite consulter ce que j'ai écris pour voir exactement l'info que je cherchais étant donné que sur le fond je sais ce qu'il va faire, mais sur la forme pas du tout.
https://statistiques.forumpro.fr/questions-generales-f9/apprentissage-statistique-t1535.htm
Re: Logiciel de Data-Mining WEKA
Merci encore pour votre réponse rapide.
Je trouve ça dommage qu'il n'y ait pas plus de possibilités graphiques directement incluses dans Weka alors que dans R tout se fait "simplement".
Pour ce qui est de votre question, je n'en ai malheureusement aucune idée, désolée.
En effet, je ne connais que très peu de choses aux arbres de décisions et au boosting, et je viens juste de découvrir le logiciel Weka. Je suis actuellement en stage, on m'a donné un jeu de données sur lequel je dois effectuer une régression linéaire et tracer la droite de régression et le nuage de points, avec le logiciel R (ce que je sais faire sans problème) et avec le logiciel Weka (dont je dois apprendre à me servir par moi même). Pour le moment je ne vois pas en quoi le logiciel Weka serait plus "sympa" que R
Mais si d'aventures je venais à en apprendre un peu plus à propos de ce que vous recherchez, je ne manquerais pas de vous le faire savoir.
Bonne continuation,
Cordialement,
A.D.
Je trouve ça dommage qu'il n'y ait pas plus de possibilités graphiques directement incluses dans Weka alors que dans R tout se fait "simplement".
Pour ce qui est de votre question, je n'en ai malheureusement aucune idée, désolée.
En effet, je ne connais que très peu de choses aux arbres de décisions et au boosting, et je viens juste de découvrir le logiciel Weka. Je suis actuellement en stage, on m'a donné un jeu de données sur lequel je dois effectuer une régression linéaire et tracer la droite de régression et le nuage de points, avec le logiciel R (ce que je sais faire sans problème) et avec le logiciel Weka (dont je dois apprendre à me servir par moi même). Pour le moment je ne vois pas en quoi le logiciel Weka serait plus "sympa" que R
Mais si d'aventures je venais à en apprendre un peu plus à propos de ce que vous recherchez, je ne manquerais pas de vous le faire savoir.
Bonne continuation,
Cordialement,
A.D.
Re: Logiciel de Data-Mining WEKA
Je connais pas R, en fait je vais devoir m'y mettre dés la semaine prochaine pour je sais plus quel package pratique qui y est implémenté.
L'avantage de WEKA est qu'il est programmé en JAVA et donc relativement rapide. De plus il est extrêment fiable bien que son interface ne soit pas des plus agréables.
Il possède tous les algorithmes et fonctions de classifications et en fouillant il possède une panoplie de graphe sur les performances qu'il construit.
Aprés c'est vrai que ça manque de doc, là je n'ai pas le temps mais dés demain je te posterais ce que j'avais trouvé.
Bonne continuation.
EDIT: voilà de quoi te satisfaire pour la nuit à venir http://weka.wikispaces.com/Frequently+Asked+Questions
L'avantage de WEKA est qu'il est programmé en JAVA et donc relativement rapide. De plus il est extrêment fiable bien que son interface ne soit pas des plus agréables.
Il possède tous les algorithmes et fonctions de classifications et en fouillant il possède une panoplie de graphe sur les performances qu'il construit.
Aprés c'est vrai que ça manque de doc, là je n'ai pas le temps mais dés demain je te posterais ce que j'avais trouvé.
Bonne continuation.
EDIT: voilà de quoi te satisfaire pour la nuit à venir http://weka.wikispaces.com/Frequently+Asked+Questions
Re: Logiciel de Data-Mining WEKA
je ne peux pas répondre concernant weka, par contre concernant training set et %split oui. Regarde ici pour commencer: http://www.pitt.edu/~super7/7011-8001/7071.ppt
Tout est dans le livre de Franck Harrel, que je n'ai pas moi même.
Ce sont deux méthodes de validation interne, training set est basée sur du bootstrap, tu réechantillonnes ton jeu de données tu refais le modèle et tu calcule la statistique (ex: RMSE) qui t'interesse sur ton jeu de de données obtenu par bootsrap et sur le jeu de données intial. Tu fais ça n fois tu as 2 vecteurs de valeurs et la différence entre les deux te donne "l'optimisme".
Le %split et ben tu sépares ton jeu de données en 2 sous jeux de données: 1) training et 2)test qui contiennent x% des données de départ. Ca peut-être 50-50 ou 2/3-1/3. Tu recalcules ton modèle sur le jeu de données training et tu calcules la valeur de la statistique qui t'intérresse sur le jeu test.
voir ici :
http://books.google.com/books?id=kfHrF-bVcvQC&dq=egression+modeling+strategies&printsec=frontcover&source=bn&hl=fr&ei=sLsDTO2dIcaB4Qa7sYzMDg&sa=X&oi=book_result&ct=result&resnum=5&ved=0CDUQ6AEwBA#v=onepage&q&f=false
Tout est dans le livre de Franck Harrel, que je n'ai pas moi même.
Ce sont deux méthodes de validation interne, training set est basée sur du bootstrap, tu réechantillonnes ton jeu de données tu refais le modèle et tu calcule la statistique (ex: RMSE) qui t'interesse sur ton jeu de de données obtenu par bootsrap et sur le jeu de données intial. Tu fais ça n fois tu as 2 vecteurs de valeurs et la différence entre les deux te donne "l'optimisme".
Le %split et ben tu sépares ton jeu de données en 2 sous jeux de données: 1) training et 2)test qui contiennent x% des données de départ. Ca peut-être 50-50 ou 2/3-1/3. Tu recalcules ton modèle sur le jeu de données training et tu calcules la valeur de la statistique qui t'intérresse sur le jeu test.
voir ici :
http://books.google.com/books?id=kfHrF-bVcvQC&dq=egression+modeling+strategies&printsec=frontcover&source=bn&hl=fr&ei=sLsDTO2dIcaB4Qa7sYzMDg&sa=X&oi=book_result&ct=result&resnum=5&ved=0CDUQ6AEwBA#v=onepage&q&f=false
droopy- Nombre de messages : 1156
Date d'inscription : 04/09/2009
Re: Logiciel de Data-Mining WEKA
Merci mais j'ai déjà parcouru de long en large cette page ^^joyeux_lapin13 a écrit:
EDIT: voilà de quoi te satisfaire pour la nuit à venir http://weka.wikispaces.com/Frequently+Asked+Questions
Cela dit, c'est vrai que R est assez lent (surtout avec des jeux de données importants), mais je le trouve plus intuitif. Après, je viens seulement de "découvrir" Weka donc bon, je verrais bien...
Cordialement,
A.D.
Re: Logiciel de Data-Mining WEKA
En ce qui concerne les graphes apperemment il faut passer par l'interface Gui http://www.lri.fr/~antoine/Courses/Master-ISI/TD-TP/TP-Weka.pdf, même si c'est expliquer pour le cas du perceptron je pense que c'est bon pour toutes les autre méthodes.
Sinon tu peux aussi regarder les TP de plusieurs profs qui sont assez détaillés (même si au final pas assez...) comme ceux de Yann Esposito ou encore Christophe Magnan.
Et merci Droopy au fait! ça faisait un bail que je cherchais une explication sur ces deux méthodes d'apprentissage.
Sinon tu peux aussi regarder les TP de plusieurs profs qui sont assez détaillés (même si au final pas assez...) comme ceux de Yann Esposito ou encore Christophe Magnan.
Et merci Droopy au fait! ça faisait un bail que je cherchais une explication sur ces deux méthodes d'apprentissage.
Re: Logiciel de Data-Mining WEKA
Merci encore une fois pour votre réponse
Je vais regarder tout ça en espérant trouver mon bonheur !
Cordialement,
A.D.
Je vais regarder tout ça en espérant trouver mon bonheur !
Cordialement,
A.D.
Page 1 sur 1
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum