Edited at

MacOSXにPythonを用いた機械学習を行うための環境を構築する

More than 1 year has passed since last update.

下記の書籍を読み進めるための開発環境の構築メモです。

書籍:Pythonによるスクレイピング&機械学習 開発テクニック

http://www.socym.co.jp/book/1079


Homebrewのインストール

まず最初に、MacOSX用のパッケージマネージャー「Homebrew」をインストールします。

http://brew.sh/index_ja.html

$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

途中、sudoのパスワードを入力します。


pyenv

次に、Pythonのバージョンマネージャー「pyenv」をインストールします。

Pythonのバージョンごとに環境(インストールしているパッケージ)を変えることができます。

$ brew install pyenv

環境変数をセットします。

$ echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.profile

$ echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.profile
$ echo 'eval "$(pyenv init -)"' >> ~/.profile
$ . ~/.profile

pyenvを用いてインストールできるバージョンやパッケージを確認します。

$ pyenv install --list

最新のPython3.6.0とanaconda3-4.2.0をインストールします。

$ pyenv install 3.6.0

$ pyenv install anaconda3-4.2.0

インストールされているバージョンを確認します。

$ pyenv versions

バージョンの切り替えは以下のように行います。(特定のディレクトリのみに適用する場合はglobalをlocalに変更します)

(python3.6.0への切り替え)

$ pyenv global 3.6.0
$ pyenv rehash
$ python --version
Python 3.6.0
$ pyenv versions
system
* 3.6.0 (set by /Users/hisashi/.pyenv/version)
anaconda3-4.2.0

(anaconda3-4.2.0への切り替え)
$ pyenv global anaconda3-4.2.0
$ pyenv rehash
$ python --version
Python 3.5.2 :: Anaconda 4.2.0 (x86_64)
$ pyenv versions
system
3.6.0
* anaconda3-4.2.0 (set by /Users/hisashi/.pyenv/version)


パッケージ管理

Pythonのパッケージ管理は「pip」で行います。

また、Anacondaのパッケージ管理は「conda」と「pip」で行います。


エディタ

エディタはAtomが良いと思います。

https://atom.io


PhantomJSとSelenium

ブラウザを経由したスクレイピングの設定です(2章2節)。

機械学習でよく利用される「anaconda3-4.2.0」を利用します。

$ pyenv global anaconda3-4.2.0

$ pyenv rehash

書籍ではUbuntu + dockerでの環境構築が紹介されていますが、MacOSXでは下記のようにして環境構築が行えます。

$ brew install phantomjs

$ pip install selenium
$ pip install beautifulsoup4


TensorFlowのインストール

引き続き「anaconda3-4.2.0」を利用します。

書籍では、以下のコマンドが記載されていますが、エラーが出て途中で止まります。

$ pip install --upgrade https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-0.12.1-py3-none-any.whl

エラーを回避するため「-I setuptools」オプションを付与する必要があります。

http://datalove.hatenadiary.jp/entry/python/anaconda/install-tensorflow-into-anaconda-environment

$ pip install --upgrade -I setuptools https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-0.12.1-py3-none-any.whl