下記の書籍を読み進めるための開発環境の構築メモです。
書籍:Pythonによるスクレイピング&機械学習 開発テクニック
http://www.socym.co.jp/book/1079
##Homebrewのインストール
まず最初に、MacOSX用のパッケージマネージャー「Homebrew」をインストールします。
http://brew.sh/index_ja.html
$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
途中、sudoのパスワードを入力します。
##pyenv
次に、Pythonのバージョンマネージャー「pyenv」をインストールします。
Pythonのバージョンごとに環境(インストールしているパッケージ)を変えることができます。
$ brew install pyenv
環境変数をセットします。
$ echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.profile
$ echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.profile
$ echo 'eval "$(pyenv init -)"' >> ~/.profile
$ . ~/.profile
pyenvを用いてインストールできるバージョンやパッケージを確認します。
$ pyenv install --list
最新のPython3.6.0とanaconda3-4.2.0をインストールします。
$ pyenv install 3.6.0
$ pyenv install anaconda3-4.2.0
インストールされているバージョンを確認します。
$ pyenv versions
バージョンの切り替えは以下のように行います。(特定のディレクトリのみに適用する場合はglobalをlocalに変更します)
(python3.6.0への切り替え)
$ pyenv global 3.6.0
$ pyenv rehash
$ python --version
Python 3.6.0
$ pyenv versions
system
* 3.6.0 (set by /Users/hisashi/.pyenv/version)
anaconda3-4.2.0
(anaconda3-4.2.0への切り替え)
$ pyenv global anaconda3-4.2.0
$ pyenv rehash
$ python --version
Python 3.5.2 :: Anaconda 4.2.0 (x86_64)
$ pyenv versions
system
3.6.0
* anaconda3-4.2.0 (set by /Users/hisashi/.pyenv/version)
##パッケージ管理
Pythonのパッケージ管理は「pip」で行います。
また、Anacondaのパッケージ管理は「conda」と「pip」で行います。
##エディタ
エディタはAtomが良いと思います。
https://atom.io
##PhantomJSとSelenium
ブラウザを経由したスクレイピングの設定です(2章2節)。
機械学習でよく利用される「anaconda3-4.2.0」を利用します。
$ pyenv global anaconda3-4.2.0
$ pyenv rehash
書籍ではUbuntu + dockerでの環境構築が紹介されていますが、MacOSXでは下記のようにして環境構築が行えます。
$ brew install phantomjs
$ pip install selenium
$ pip install beautifulsoup4
##TensorFlowのインストール
引き続き「anaconda3-4.2.0」を利用します。
書籍では、以下のコマンドが記載されていますが、エラーが出て途中で止まります。
$ pip install --upgrade https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-0.12.1-py3-none-any.whl
エラーを回避するため「-I setuptools」オプションを付与する必要があります。
http://datalove.hatenadiary.jp/entry/python/anaconda/install-tensorflow-into-anaconda-environment
$ pip install --upgrade -I setuptools https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-0.12.1-py3-none-any.whl