Python
CentOS
データ分析
Jupyter
Anaconda

Jupyterでデータ分析を全力で楽しむ!(1)環境準備

 お疲れ様です。
 今回より新シリーズ、「Jupyterでデータ分析を全力で楽しむ!」を執筆していきたいと思います。
 とはいえ、当方はまだまだPythonもデータ分析も初心者で勉強中の身。この初心者がどのようにデータ分析を身に着けていくかを解説しながら楽しんでいく過程を記述していきたいと思います。

開発環境

  • CentOS 7.4

Anacondaインストーラをダウンロードしよう

 以下のサイトからWindows、MacOS、Linuxの各々のOSに合わせて、インストーラをダウンロードします。
 https://www.anaconda.com/download/

 Python3.6版とPython2,7版の2つがありますが、Python2.7の方はパッケージの更新などが終了しているものもあるため、どうしてもという理由がない場合はPython3.6をおススメします。
 Linuxの場合なら、下記のコマンドで取得するのもありです。

wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh

Anacondaインストール

 
 それでは、インストールしてみましょう。
 実行権限をつけて、シェルを実行します。

chmod +x Anaconda3-5.0.1-Linux-x86_64.sh
./Anaconda3-5.0.1-Linux-x86_64.sh

 利用規約等を読んで、yesとタイプすると、自動でパッケージ等をインストールします。
 無事、インストールが完了すると、下記コマンドにてPython3.6がインストールされていることがわかります。

python --version

Python 3.6.3 :: Anaconda, Inc.

Jupyter Notebookを起動しよう

 さて、これでPythonやデータ分析に使うパッケージをインストールできました。
 このまま、CLIモードでPython言語を使ってスクリプトを書くのもいいですが、ブラウザ上でインタラクティブにPythonコードでデータ分析を行えるツールがあります。

 それがご存知、Jupyter Notebookです。
 AnacondaにはJupyter Notebookを標準で備えているので、下記のコマンドを打つだけで起動することができます。

jupyter notebook &

 これで起動します。&がないと、現状のセッションでCLI操作ができなくなるので、&をつけておきます。
 ここで上記のコマンドだけだと、127.0.0.1:8888のアクセスしかできないので、全員がサーバにアクセスできるようにするためには、次のようなオプションをつけます。

jupyter notebook --ip=xx.xx.xx.xx &

 これで、ブラウザでxx.xx.xx.xx:8888にアクセスすれば全員で利用することができます。ただ、デフォルトだとトークンによる認証になってしまうので、パスワード認証に変えておいたほうが良いかもしれません。
 下記の記事に大変お世話になりましたので、下記を参考にしてパスワードを設定してください。

 【Jupyter notebookのパスワード】
 https://qiita.com/SaitoTsutomu/items/aee41edf1a990cad5be6

Jupyter Notebookにアクセスしよう

 さて、これでJupyter Notebookへアクセスできるようになりました。
 早速、Webブラウザでアクセスしてみましょう。

jupyter001.png

 パスワードを設定していれば、このようなログイン画面が出てくるはずです。
 パスワードを入れて認証が通ると、次の画面が表れます。

jupyter002.png

Notebookを作って動かしてみよう

 さっそく動かしてみちゃいましょう。
 [NEW]を押下して、[Python3]を選択します。

jupyter003.png

 すると、下のような画面が現れます。
 そこにPythonコードの"Hello,World!"を入れて動くか確認してみましょう。

jupyter004.png

 きちんと動いたでしょうか。
 今回はここまで、次回はAnacondaに入っているパッケージで簡単なデータ分析を紹介します。

 次→Jupyterでデータ分析を全力で楽しむ!(2)最小二乗法