#機械学習の自動化とは
機械学習ってバズワードにもなり,様々なデータ分析を行うのにとても有効らしいけど,
実装しようとするとライブラリを使ったとしても,「色々な調整」を行う必要が出てくるため,とても敷居が高いです.
そこで,その「色々な調整」も機械にやってもらってしまおう,というのが機械学習の自動化です.
#auto-sklearnとは
機械学習のモデル選択などを自動で行ってくれる便利なライブラリ.
ここで用いられる機械学習のモデルはscikit-learnの実装物となる.
論文としては以下のものに該当する.
#auto-sklearnのインストール
実際にcentos7へのインストールを行う.
基本的な手順は本家(英語)のHPに載っており,以下の通り.
curl https://raw.githubusercontent.com/automl/auto-sklearn/master/requirements.txt | xargs -n 1 -L 1 pip install
pip install auto-sklearn
ただし,上記を成城に動作させるためには,いくつか環境の準備が必要となるので,それを以下にまとめる.
また,現状では(少なくともmasterブランチからのインストールでは)依存関係にあるライブラリの都合でputhon 2には対応していない模様なので,python 3環境を同時に整える.
作業内容の概要
- python 2とpython 3を共存させるためにpythonバージョン管理ツールpyenvをインストール
- python 3をインストール
- python 3環境を整備
- auto-sklearnに必要なライブラリをインストール
- auto-sklearnをインストール
yum -y install git zlib-devel bzip2 bzip2-devel openssl openssl-devel readline readline-devel sqlite sqlite-devel
git clone https://github.com/yyuu/pyenv.git ~/.pyenv
vi ~/.bash_profile
# export PYENV_ROOT="$HOME/.pyenv"(.bash_profileに追加)
# export PATH="$PYENV_ROOT/bin:$PATH"(.bash_profileに追加)
# eval "$(pyenv init -)"(.bash_profileに追加)
source .bash_profile
pyenv install 3.6.0
yum -y install atlas-sse3 atlas-sse2 atlas-devel atlas lapack-devel lapack-static lapack
pip3 install numpy six cython scipy matplotlib
pip install -r https://raw.githubusercontent.com/automl/autosklearn/master/requirements.txt
pip3 install auto-sklearn
#動作確認
本家(英語)のHPのExampleのプログラムをそのまま実行してみる.
計算にはそこそこ時間がかかる模様.
それでもインストールは完了し,動作することは確認できました!
#今後
auto-sklearnがどのくらい使えるかについては未知数なので,実際に動かして体感してみようと思います.