やってみよう分析!第8章:PythonとEclipse(PyDev)で作る分析環境 for Windows

  • 50
    Like
  • 0
    Comment
More than 1 year has passed since last update.

はじめに

今回も始まりました。やってみよう分析!シリーズ

本章からやってみよう分析次リーズの実践編に突入しました。これからの記事ではPythonやScalaを活用した分析技術を紹介していこうと思います。

本章では以後の章の準備として、まず Pythonを使った分析のための簡易的な環境構築を紹介したいと思います。フォーカスするのは WindowsのEclipse上(PyDev利用)で作業するための環境構築です。Linuxではyum等の便利コマンドが用意されているので比較的簡単に環境を作ることができます。一方でWindowsではライブラリ(本章で紹介するのは numpy, scipy, matplotlib)のインストール方法などで多少手間取る点があるので、個人的につまづきどころかなと感じた箇所を中心に解説していきたいと思います。

本章で紹介する環境構築は

  • Windows 7 Professional

で進めます。

※次章では Scala + Eclipse + R で作る簡易的な分析環境構築を紹介する予定です。

Pythonのインストール

最初はPython本体をインストールします。インストール方法は簡単でPythonのサイトのダウンロードページに行って、ダウンロードファイルを取得し、それを実行するだけです(現時点で最新のPython3.4.1をインストールします)。

fig01.png

コマンドプロンプトを立ち上げてPythonがうまく起動するか確認します。コマンドプロンプト上でpython -Vと打ち込み、バージョン情報が取得すれば大丈夫です。もしうまく表示されない場合にはパスが通っていないことが考えられます。windows7のパスの設定は コンピュータ➞システムのプロパティ➞システムの詳細設定➞環境変数➞システム環境変数➞Path➞編集ボタンで可能です。編集画面でpython実行ファイル(python.exe)のあるフォルダの場所を追加します(例えばC:\Python34;)。

numpy、scipy、matplotlibのインストール

numpyなどのライブラリをインストールした準備として環境変数に pipのあるフォルダのアドレスを追加しておきます(例えば C:\Python34\Scripts;)。

numpyのインストール

windowsのpython34にnumpyをインストールするためにはNumerical Pythonからファイル名に cp34とついているファイルをダウンロードして実行します。

fig02.png

インストールが完了したらうまくインストールされたか確認します。コマンドプロロンプトでpythonと入力してpythonを起動させ、import numpyと打ち込んでエラーが出なければOKです。

scipyのインストール

scipyもnumpyと同様な手続きでインストールできます。SciPy: Scientific Library for Pythonから python3.4の文字列が含まれるインストールファイルをダウンロードして実行します。

fig03.png

コマンドプロロンプトでpythonと入力してpythonを起動させ、import scipyと打ち込んでエラーが出なければOKです。

matplotlibのインストール

matplotlibのインストールは上記のものより簡単です。コマンドプロンプトよりpip3.4 install matplotlibと入力すればOKです(Scriptsフォルダにパスが通っていることが前提)。

コマンドプロンプトでpythonと入力してpythonを起動させ、import matplotlibと打ち込んでエラーが出なければOKです。

EclipseにPyDevをインストール

準備としてEclipseをインストールしておきます。eclipseのページからWindows用のインストールファイルをダウンロードして実行します。

Eclipseを起動してHelp➞Install new Software (初回起動時はworkspaceを作りますかと聞かれたらYES(OK)を選択)。

fig04.png

http://pydev.org/updatesを入力してPyDevを選択し、Nextを押して先に進んでいけば作業終了です。

fig05.png

open perspectiveを押します。

fig06.png

PyDevを選択してOKします。

fig07.png

Eclipseの windows➞Preferencesより PyDev➞Interpreters➞Python Interpreterを選択。Newボタンからpython3.4のexeファイルのあるフォルダを指定します。

fig08.png

PyDevでHello World

Eclipse上部右側のPyDevをアクティブにします。次に File➞New➞PyDev Projectでプロジェクトを作成します。project nameはここでは適当にtestとします。Grammer Versionは 3.0を選択します。生成されたtest projectのアイコンの上で右クリックし、 New➞PyDev Moduleを作ります(ここでは簡単のためにパッケージ無しにします)。package nameは空欄にして、moduleの名前をつけます。最後に Module:Mainを選択すると完了です。

print("hello world")と入力し、実行するとコンソール画面にhello worldと出力されるはずです。

fig09.png

この先は必要に応じてnumpy, scipy, matplotlibをimportして作業することになります。

===========================================

こちらもよろしくおねがいいたします。

入門編

第1部イントロダクション

第2部エクセルで学ぶ分析入門

第3部 データ可視化(ビッグデータに限らない)

Appendix

==================

お知らせ:Fringe81エンジニアチームでは仲間を募集しています!

 

 チームの雰囲気や採用情報については下記ページをご覧下さい。