#H2Oとは
H2Oとは機械学習の為のオープンソースのプラットフォーム。
Auto-mlという機能があり、まともな機械学習の経験が無くても簡単に実装できる模様。
似たようなライブラリにはauto-sklearnやTPOTがある。
(参考:https://towardsdatascience.com/whats-auto-ml-b457d2710f9d)
Githubのページによると、動作する環境としては以下の様になっている。
"H2O uses familiar interfaces like R, Python, Scala, Java, JSON and the Flow notebook/web interface, and works seamlessly with big data technologies like Hadoop and Spark"
#Google Colabatoryとは
無料でJupyter Notebookの様なものをGoogleが提供するVirtual Machine上で走らせる事ができるサービス。
ハイエンドなGPU(Tesla K80 GPU)が積まれており、機械学習のコミュニティから期待されている。
#環境構築
A.クイックスタート(おすすめ!)
- githubにipynbを保存したので'Open in Colab'を選べばShift + Enterを押すだけでスタート出来るはず。
https://github.com/Cactice/h2o-experiments/blob/master/h2o_quickStart.ipynb
B.ステップバイステップ(上記のクイックスタートの場合不要です。説明として読んでください。)
-
Google Colabのページを開く
https://colab.research.google.com/ -
左上からNew Python 3 Notebookを選ぶ
-
Javaをインストール
!apt-get install openjdk-8-jdk
*「!」はBashであることを提示するので、忘れない様に
Javaのバージョンが最新だとエラーが出たのでここではJava8をインストールしよう(2018年現在は対応していないようだ)
!java -version
でバージョン確認が出来るが、もしここで新しいバージョン(openjdk version "10.0.2")などが表示されるのであれば、
!update-alternatives --config java
で古いバージョン(openjdk version "1.8.0_181")に変える必要がある。 -
H2Oインストール
!pip install H2O
-
PythonでImport/Initする(bashでは無いので!は付けない)
import h2o
h2o.init()
これで成功すれば
checking whether there is an H2O instance running at ...
などのメッセージが表示されるはず。
続きは以下のリンクで学んで下さい。
(参考:https://medium.com/@naeemasvat.na/how-to-use-h2o-in-google-colab-b69ba539ab1a)
#おまけ
Google Colabはjupyter notebookとはホットキーが違うらしい。
以下にホットキー一覧があります。
https://qiita.com/Intel0tw5727/items/7cc68734edd568357a9e