この記事は、社内勉強会の際に利用したPython実行環境準備用の記事を公開用に編集したものです。
100番煎じですが、もったいないので共有。
windows環境を前提にしています。
前提
Anacondaをインストールするのが一番単純で簡単だと思います。
ITに疎い方は迷わずAnacondaにしましょう。
500Mぐらいの超大容量インストーラーです。
・時間かかるので注意。
・bit数間違えないように注意。
・Python3.6系推奨
補足
勉強会として実施する場合は、Dockerのような仮想環境化で実行環境を提供できるのが理想的だと思います。
また、少しクセはあるものの、Google colaboratoryが非常に手軽で勉強会向けかもしれません。
Environmens(実行環境)をつくる
AnacondaNavigatorを起動。
適当に環境の名前を入れて、Python3.6であることを確認して「Create」!
これも時間かかるかも。
必要なライブラリのインストール
データ分析にあたって必要となる以下の主要ライブラリをインストール
- numpy(多次元配列等の数値計算を行うライブラリ)
- pandas(データフレーム操作等のライブラリ)
- matplotlib(numpyのためのグラフ描写ライブラリ)
- seaborn(これもグラフ描写ライブラリ。綺麗。)
- scikit-learn(機械学習ライブラリ。やる場合は必須といって言い)
さきほどのEnvironmensから作成した環境名を選択
Not installedを選択して、上記ライブラリを検索。
チェックしてそれぞれインストールする。
これも結構時間かかる。
JupyterNotebookをインストール
ブラウザ上でPython書ける優れもの。
初心者はこれがやりやすいので、推奨です。
Applications on でさっき作成した環境名を選択
※余談ですが、「jupyterlab」も高性能IDEでおすすめです。
Pythonが動くか検証!
ここまで順調にいけばあとはJupyterNotebookが動けば問題なし。
先ほどインストールしたJupyterNotebookのLaunchをクリック。
「New」から、作業用フォルダを作りたければ作る。
Pythonを動かすNotebookを作る場合は「Python3」を選択。
プログラムを書いてみよう!
まずは恒例のHello Worldを書いてみよう。
以下をコピペして、shift + Enter
print('Hello, World!')
グラフも描けるかやってみよう!
※上記工程のnumpy、 matplotlibがインストールされてないとエラーになりますので注意。
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
x = np.arange(50)
y = np.random.randn(50)
plt.plot(x,y)
こんなグラフが描写されれば成功(数値はランダムなので、同じ形にはなりません)
裏技
実はローカルに環境構築しなくてもPythonがかけちゃう方法もある。
Kaggle
https://www.kaggle.com/
言わずと知れたデータサイエンスのコンペサイトであるが、利用登録のうえKernelを作成すると、
ブラウザ上でPythonを実行できる。マシンスペックにも影響されないため、
コンペ出たりしなくても、練習としてはかなり使いやすい。
Colaboratory
https://colab.research.google.com
クラウド上でJupyterNotebookベースのエディタを動かせる優れもの。
GoogleDriveとの連携。
GPUの割り当て。
リアルタイム共有。
ちょっと試したい。勉強会したい。みたいな場合はこれで十分なのではないだろうか?
環境構築も、高性能なPCも不要。
ちなみにcolaboratoryで利用できるGPU Tesla K80は、購入したらだいたい70万~80万です。
Googleすごすぎ。