Edited at

【Pythonメモ】データ分析初めての人のためのPython環境構築

More than 1 year has passed since last update.

この記事は、社内勉強会の際に利用したPython実行環境準備用の記事を公開用に編集したものです。

100番煎じですが、もったいないので共有。

windows環境を前提にしています。


前提

Anacondaをインストールするのが一番単純で簡単だと思います。

ITに疎い方は迷わずAnacondaにしましょう。

500Mぐらいの超大容量インストーラーです。

・時間かかるので注意。

・bit数間違えないように注意。

・Python3.6系推奨

ダウンロードはこちら

参考ブログはこちら


補足

勉強会として実施する場合は、Dockerのような仮想環境化で実行環境を提供できるのが理想的だと思います。

また、少しクセはあるものの、Google colaboratoryが非常に手軽で勉強会向けかもしれません。


Environmens(実行環境)をつくる

AnacondaNavigatorを起動。

「Environments」をクリック。

図2.png

「Create」をクリック

図3.png

適当に環境の名前を入れて、Python3.6であることを確認して「Create」!

これも時間かかるかも。

図4.png


必要なライブラリのインストール

データ分析にあたって必要となる以下の主要ライブラリをインストール


  • numpy(多次元配列等の数値計算を行うライブラリ)

  • pandas(データフレーム操作等のライブラリ)

  • matplotlib(numpyのためのグラフ描写ライブラリ)

  • seaborn(これもグラフ描写ライブラリ。綺麗。)

  • scikit-learn(機械学習ライブラリ。やる場合は必須といって言い)

さきほどのEnvironmensから作成した環境名を選択

Not installedを選択して、上記ライブラリを検索。

チェックしてそれぞれインストールする。

これも結構時間かかる。

図8.png


JupyterNotebookをインストール

ブラウザ上でPython書ける優れもの。

初心者はこれがやりやすいので、推奨です。

Homeを選択。

図5.png

Applications on でさっき作成した環境名を選択

図6.png

JupyterNotebookのインストールをクリック

図7.png

※余談ですが、「jupyterlab」も高性能IDEでおすすめです。


Pythonが動くか検証!

ここまで順調にいけばあとはJupyterNotebookが動けば問題なし。

先ほどインストールしたJupyterNotebookのLaunchをクリック。

図9.png

ブラウザが立ち上がって以下のような画面が出てくる。

図10.png

「New」から、作業用フォルダを作りたければ作る。

Pythonを動かすNotebookを作る場合は「Python3」を選択。

図11.png

この画面になったら成功。

図12.png


プログラムを書いてみよう!

まずは恒例のHello Worldを書いてみよう。

以下をコピペして、shift + Enter


test1

print('Hello, World!')


こうなったら成功

図13.png


グラフも描けるかやってみよう!

※上記工程のnumpy、 matplotlibがインストールされてないとエラーになりますので注意。


test2


import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

x = np.arange(50)
y = np.random.randn(50)

plt.plot(x,y)


こんなグラフが描写されれば成功(数値はランダムなので、同じ形にはなりません)

ダウンロード.png


裏技

実はローカルに環境構築しなくてもPythonがかけちゃう方法もある。


Kaggle

https://www.kaggle.com/

thumbnail

言わずと知れたデータサイエンスのコンペサイトであるが、利用登録のうえKernelを作成すると、

ブラウザ上でPythonを実行できる。マシンスペックにも影響されないため、

コンペ出たりしなくても、練習としてはかなり使いやすい。


Colaboratory

https://colab.research.google.com

クラウド上でJupyterNotebookベースのエディタを動かせる優れもの。

GoogleDriveとの連携。

GPUの割り当て。

リアルタイム共有。

ちょっと試したい。勉強会したい。みたいな場合はこれで十分なのではないだろうか?

環境構築も、高性能なPCも不要。

ちなみにcolaboratoryで利用できるGPU Tesla K80は、購入したらだいたい70万~80万です。

Googleすごすぎ。

図1.png

図2.png