機械学習
weka
クラスタリング

文系のためのweka 入門(クラスタリング編)

More than 1 year has passed since last update.

こんにちは、数学が出来なかったから文系というダメな文系の典型な私です。

機械学習はずっとやりたくてウズウズしているけど、プログラミングはサッパリだしGUIでサクッとなんか出来ないの?という方向けの wekaを使ったクラスタリングのやり方。

*あくまで今回はwekaをざっくり触ろうというテーマです!

wekaについてはwikipediaなんかで見ていただいて、サクッとやり方だけ行きます。
https://ja.wikipedia.org/wiki/Weka

今回はMacを想定してGUI自体のキャプチャもMacでのものとなります。
以下URLからwekaをダウンロードして段取り。
http://www.cs.waikato.ac.nz/ml/weka/downloading.html

起動するとこんな感じ。

スクリーンショット 2016-03-31 10.46.47.png

今回はもっともシンプルにwekaで遊ぼうということなので、クラスタリングをやります。
元にしたデータはCSVファイルでこんな感じになっています。

スクリーンショット 2016-03-31 10.52.56.png

物凄くシンプルですね。
CSVを作るときの注意事項としては項目を "" とかでくくらないこと、UTF-8で保存しておくことくらいでしょうか。データがちゃんとできていない場合はエラーが出ますので修正しましょう。

さて、wekaのメニューから「ナレッジフロー」をクリックして起動させます。

スクリーンショット 2016-03-31 10.46.53.png

すでに色々配置していますが、クラスタリングをする場合はこの3つだけ配置すればそれなりに「あ、出来たかも」が実感できるので良いと思います。より細かく分析したい場合はなんとか勉強してください。

フローレイアウトの説明ですが、CSVを読み込むので「CSV Loader」を配置します。クラスタリングをしたいわけなので、読み込んだデータを処理するために「Add Cluster」を配置。可視化しないといけないのでビューワーを最後に配置する、という流れ。

各モジュール(?といっていいのか)を右クリックすると 「dataset」とか出てきますのでこれを選択し、各モジュールをつなげていきます。

スクリーンショット 2016-03-31 10.58.08.png

あとは読み込み開始でスタート。

スクリーンショット 2016-03-31 10.58.45.png

処理が完了したらビュワーの「Show plot」をクリックします。

スクリーンショット 2016-03-31 10.59.46.png

出来上がりました! まぁこれでどうするんだという話なんですが、今回は触りですしこの辺で・・・。