はじめに
無料、会員登録不要、データをアップせずオフラインでも使えるブラウザベースの機械学習ツールを作りました。
空飛ぶニューラルネット
https://soratobu-nn.net/
目次
なにこれ
主にReact.jsとTensorflow.jsで構成された簡易的な機械学習ツールです。
世の中には多機能・高性能な機械学習プラットフォームがゴマンとありますが、利用料が高額、利用開始まで時間がかかる、使い方が難しい、データをサーバーにアップロードする必要があるなど意外とハードルが高いものです。
- ちょっと手元のデータでAI使えるか試したい、PoCしたい
- 趣味や業務で統計・機械学習モデル作ったけど普通どのぐらいの精度が出るか見てみたい
- 外注とかする前に自分でもデータ見てみたい
- クラウドにデータをアップロードしたくない
- 自分で自由にいじるので、いますぐ簡単に使えるツールが欲しい
このようなニーズを満たすべく作っています。
特徴
機械学習サービスといえば、通常はバックエンドにPythonベースのAPIサーバを置くなどしてサーバサイドで学習などの処理を行います。
空飛ぶニューラルネットでは、前処理・学習・推論などすべての処理をJavascript、クライアントサイドで行うためデータをサーバーにアップロードする必要がありません。なんとなくクラウドにデータをアップロードするのに抵抗がある方でも気軽にお使いいただけます。
オフラインでも使えるので、心配な方はページの読み込み完了後、インターネット接続を切ってお使いください。
データの読み込みや前処理、学習・推論と結果のダウンロードの他、学習したモデルの書き出しや読み込みにも対応しています。
基本的な使い方
データ読み込みから予測結果取得までの7ステップをKaggle Titanicの生存者予測を例に紹介します。
1.教師データの読込
2.予測したい変数を選択
データに含まれる列から、予測したい変数を選択します。
また、テーブルの変数名の下にある"削除"というボタンを押せば学習から外すことも可能です。
3.学習を実行
データに前処理を施した上で、機械学習モデルに学習させます。early stoppingによりニューラルネットワークの学習が止まった段階で学習完了となります。
4.学習状況を確認
学習の進捗とあらかじめ分けておいた検証用データに対する精度を確認することができます。
5.予測したいデータの読込
6.予測を実行
実行すると5で読み込ませたデータに前処理および推論が行われます。
7.結果をファイルに出力
予測結果をダウンロードすることができます。入力変数は前処理がかかっていますが、行の順番は変わっていないので元のデータにコピペして結合することができます。
基本的な使い方は以上です。
使っていて何かうまくいかなかった場合はページを更新すればリセットされるのでやり直しが可能です。
ちょっと高度な使い方
学習済モデルを保存・適用したい
あえて状態を保存せず、更新したらリセットしてやり直せるというインスタント性を持たせていますが、いいモデルが作れたら保存していつでも適用できるようにしたいこともあるはずです。
まず、以下のようにモデルを保存すると、pp.txt、model.json、model.weights.binの3つのファイルが保存されます。これが適用の際必要になるので、大事に保管してあげてください。
保存できたら、あとは任意のタイミングで高度な設定>モデルの読み込みから、3つのファイルを読み込ませてあげると学習させたモデルが復元できるので、お好きなデータに適用していただけます。
ニューラルネットワークの編集(4/18アプデ)
空飛ぶニューラルネットでは1層および3層のニューラルネットワークが利用可能でしたが、詳細設定はプリセットのみでした。
4/18のアプデから、高度な設定画面内でニューラルネットワークの隠れ層のニューロン数及びDropoutの割合を設定することができるようになりました。
いまいち意味がわからない場合は特に編集する必要はありませんが、予測精度上げたいなーというときは少し数字をいじってみてください。
今後について
バグフィックスやUI改善を除いた機能として、以下が近々の実装予定となります。
回帰問題(売上金額などの連続値を予測する)への対応- 精度評価指標の充実(ROC-AUC、PR-AUCやROC曲線など)
- CSV以外の形式受付
ニューラルネットワークのトポロジー編集
4/18追記: ニューラルネットワークの編集に対応しました。
前処理の選択・高機能化や勾配ブースティングなどニューラルネットワーク以外の機械学習アルゴリズムの実装も考えていますが、ツールの立ち位置を考えると操作の複雑さとのトレードオフになるのでしばらくは様子見の予定です。
そのようなことができる方はそもそも自前でPythonなりDataRobotなどのツールなり使いこなせると思いますし。
今後はケーススタディを通してどう使っていけるかといった活用法、前処理・モデルの詳細や実装について記事を書いていきたいと思います。
4/21追記: リセットボタンができました。
オンラインで作業している場合はサイトを更新すれば全てのデータが初期化されてやり直せるのですが、
オフラインで作業する場合更新ができないので一度ネットに繋ぐ->更新->再度オフラインにするというステップが必要でした。
今回追加したリセットボタンを押すだけで状態がリセットされるので、オフラインのままやり直しができるようになりました。
4/23追記: デザインをリニューアルしました。
見た目を少しモダンに変更しましたので、併せて本記事の紹介画像をアップデートしています。
ボタンの位置が移動しましたが操作方法は従来と同じです。
5/9追記: 回帰問題に対応しました。
別途記事を書きました。
空飛ぶニューラルネット
ということで、ぜひ触ってみてあげてください。
全てクライアントサイドで処理しており何かエラーが起きてもこちらでは確認できないため、
もし何かあればサイト内「このサイトについて」に記載のアドレス宛にメールを送っていただけると嬉しいです。
サイトへの改善要望や相談事など何かありましたらご連絡ください。
尚、すでに色々フィードバック頂きました方々、ありがとうございました。早速反映していきます。