背景
仕事で機械学習をやることになったので、セットアップ方法をメモ。
環境
- Ubuntu 16.04 LTS
事前準備
pythonのインストールに必要なモジュールを先にインストールします。
sudo aptitude install gcc g++ make openssl libssl-dev libbz2-dev libreadline-dev libsqlite3-dev
pyenv, pyenv-virtualenvのインストール
バージョンやライブラリをディレクトリごとに切り替えられるようにpyenvとpyenv-virtualenvを利用します。
git clone https://github.com/yyuu/pyenv.git ~/.pyenv
git clone https://github.com/yyuu/pyenv-virtualenv.git ~/.pyenv/plugins/pyenv-virtualenv
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
echo 'eval "$(pyenv init -)"' >> ~/.bashrc
echo 'eval "$(pyenv virtualenv-init -)"' >> ~/.bashrc
source ~/.bashrc
pyenv install 3.5.1
pyenv rehash
pyenv global 3.5.1
作業するフォルダに機械学習のライブラリをインストールします。
mkdir work
cd work
pyenv virtualenv 3.5.1 3.5.1_work
pyenv local 3.5.1_work
pip install numpy
pip install scipy
pip install scikit-learn
pip install gensim
pip freeze
で確認するとworkフォルダの中でだけ、インストールしたライブラリ一覧が表示されます。
pip freeze
boto==2.40.0
bz2file==0.98
gensim==0.12.4
...
mecab
テキスト系をやるのでついでにmecabもインストールしておきます。
sudo aptitude install libmecab-dev
sudo aptitude install mecab mecab-ipadic-utf8
mecab --version
pip install mecab-python3