LoginSignup
7
12

More than 5 years have passed since last update.

文系のためのweka 入門(クラスタリング編)

Posted at

こんにちは、数学が出来なかったから文系というダメな文系の典型な私です。

機械学習はずっとやりたくてウズウズしているけど、プログラミングはサッパリだしGUIでサクッとなんか出来ないの?という方向けの wekaを使ったクラスタリングのやり方。

*あくまで今回はwekaをざっくり触ろうというテーマです!

wekaについてはwikipediaなんかで見ていただいて、サクッとやり方だけ行きます。
https://ja.wikipedia.org/wiki/Weka

今回はMacを想定してGUI自体のキャプチャもMacでのものとなります。
以下URLからwekaをダウンロードして段取り。
http://www.cs.waikato.ac.nz/ml/weka/downloading.html

起動するとこんな感じ。

スクリーンショット 2016-03-31 10.46.47.png

今回はもっともシンプルにwekaで遊ぼうということなので、クラスタリングをやります。
元にしたデータはCSVファイルでこんな感じになっています。

スクリーンショット 2016-03-31 10.52.56.png

物凄くシンプルですね。
CSVを作るときの注意事項としては項目を "" とかでくくらないこと、UTF-8で保存しておくことくらいでしょうか。データがちゃんとできていない場合はエラーが出ますので修正しましょう。

さて、wekaのメニューから「ナレッジフロー」をクリックして起動させます。

スクリーンショット 2016-03-31 10.46.53.png

すでに色々配置していますが、クラスタリングをする場合はこの3つだけ配置すればそれなりに「あ、出来たかも」が実感できるので良いと思います。より細かく分析したい場合はなんとか勉強してください。

フローレイアウトの説明ですが、CSVを読み込むので「CSV Loader」を配置します。クラスタリングをしたいわけなので、読み込んだデータを処理するために「Add Cluster」を配置。可視化しないといけないのでビューワーを最後に配置する、という流れ。

各モジュール(?といっていいのか)を右クリックすると 「dataset」とか出てきますのでこれを選択し、各モジュールをつなげていきます。

スクリーンショット 2016-03-31 10.58.08.png

あとは読み込み開始でスタート。

スクリーンショット 2016-03-31 10.58.45.png

処理が完了したらビュワーの「Show plot」をクリックします。

スクリーンショット 2016-03-31 10.59.46.png

出来上がりました! まぁこれでどうするんだという話なんですが、今回は触りですしこの辺で・・・。

7
12
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
12