Jupyter Notebookの利用(基礎)
Jupyter Notebookをはじめて利用する方向けの、基礎的な説明です。
Jupyter Notebook画面の概要
###Jupyter Notebook画面 1
Jupyter Notebook起動・ログイン直後の画面
- Filesタブ 保存されているフォルダやファイルを表示します
- Runningタブ 実行中のプロセス等を表示します
- Clustersタブ 本資料では利用しませんので説明を割愛します
- Quit (権限がある場合のみ表示される)Jupyter Notebookを停止します
- Logout Jupyter Notebookをログアウトします
- Upload 分析データやノートブック(ファイル拡張子 .ipynb)をアップロードします
- New フォルダやノートブックを新規作成します
- 更新 リスト表示を更新します
- (全体) リスト全体を選択状態にします
- ファイルやフォルダ作成後は個別に選択できます
Jupyter Notebook画面 2
リストからファイルを選択したときの画面
選択した対象により、表示されるボタンは変わります
- Duplicate 選択したフォルダやファイルを複製(コピー)します
- View 選択したフォルダやファイルを開く、もしくはダウンロードします
- Edit 選択したフォルダやファイルを編集します
- ゴミ箱 選択したフォルダやファイルを削除します
Newボタンを押したときのメニュー
・Notebook(ノートブック:プログラムを実行し、結果を保存可能なファイル)
5. Python3 Python3で実行するノートブックを新規に作成します
・Other
6.Text File テキストファイルを新規に作成します
Folder フォルダを新規に作成します
Terminal ターミナル(端末)画面を開きます
ノートブックの作成
ノートブックの新規作成
- カレントディレクトリ(今居る場所)を移動
ノートブックを作成したいディレクトリ・フォルダへ移動します - 新しいノートブックを作成
右上のNewボタンをクリックし、Python 3(またはPython 2)を選択してください。
新しいノートブックがWebブラウザの新しい画面として作成され、開きます。
ノートブックのファイル拡張子は .ipynb で作成されます。
ノートブックのファイル名(タイトル)を変更
画面上部のUntitledをクリックすると、変更画面が表示されます。
変更後にRenameボタンを押して下さい。
名前が変更されました。
コードセル
表示されているIn[ ]:の入力欄はコードセルと呼ばれます。
ノートブックでのプログラム実行
プログラムの記載と実行
コードセルに Python3 のプログラムを記載し、実行します。
print ("test")
実行するには以下の方法があります。
- Runボタンを押す
- Ctr + Enterを押す
ノートブックの保存(チェックポイント作成)
ノートブックは、通常は自動保存される設定となっていますが、作業の状態を任意のタイミングで保存するため、チェックポイントを作成することができます。
Checkpointを選択すると、そのCheckpointを作成した時点の状態にノートブックを戻すことができます。
ノートブックのツールバー
- save and Checkpoint 保存とチェックポイントを作成します
- incert cell below (12)で選択した種類のセルを下に追加します
- cut selected cells 選択したコードセルを切り取ります
- copy selected cells 選択したコードセルをコピーします
- pasete cells below 選択したコードセルの下に貼り付けます
- move selected cells up 選択したコードセルを上に移動します。
- move selected cells down 選択したコードセルを下に移動します。
- Run 選択したコードセルを実行します
- Stop コードセルの実行を停止します
- interrupt the kernel 実行に割り込み(中断、再実行)します
- restart the kernel 再実行します(全てのコードセルを実行したいときに利用)
ノートブックを閉じる
ノートブックを閉じるにはWebブラウザのタブやウインドウを終了させると保存されず強制終了してしまいますので、FileメニューのClose and Haltを選択して下さい。
ノートブックが保存された後に、正しく閉じられます。
グラフを作成する
Pythonでグラフを描画するときなどに使われる標準的なライブラリであるmatplotlibを使って、グラフを作成することができます。
matplotlib
また、以下の例では配列に使われる標準的なライブラリであるnumpyを使っています。
numpy
コードセルに以下を入力し、Runボタンで実行して下さい。
import numpy as np
import matplotlib.pyplot as plt
bar = np.array([1, 2, 3, 4, 5])
height = np.array([10, 20, 30, 40, 50])
plt.bar(bar, height)
乱数(正規分布)をグラフで可視化
乱数を作成する関数randn()は正規分布に従います。
グラフで確認してみます。
コードセルに以下を入力し、Runボタンで実行して下さい。
import matplotlib.pyplot as plt
plt.hist(np.random.randn(100))
実行結果は以下になります。
何回かRunボタンで実行したり、random()の()の中の値を変えてみて試してみて下さい。
毎回違う結果(乱数なので毎回違う値になるため)や、乱数が正規分布の形のグラフになることを確認できると思います。
散布図の作成
matplotlibでは散布図を作成することもできます。
コードセルに以下を入力し、Runボタンで実行して下さい。
sin(x)はsin xの値です。
最後の行の"."は半角のピリオドですので注意してください。
import numpy as np
import matplotlib.pyplot as plt
x = np.random.randn(10)
y = np.sin(x) + np.random.randn(10)
plt.plot(x, y, ".")
Markdown記法でレポートを作成
Jupyter NotebookはMarkdown記法に対応しているため、プログラムの実行結果やプログラムを実行できる形で組み込んだレポートを作成することができます。
Markdownは、プレーンテキストに書式設定要素を追加するための軽量なマークアップ言語(単なるテキストに書式を加えて見やすい文書にできる)です。
- 新しいコードセルを追加した後、コードセルを選択状態にし、Markdown用に変更します。
- 変更後は以下のようになり、コードセル左端のIn[ ]:が消えたことを確認してください。
コードセル(Markdown用)に以下を入力し、Runボタンで実行して下さい。
# My report
By [my name](mailto:my.name@xxx.com)<br>
[Qiita](https://qiita.com/)
## test
Markdownのテストです1
### test
Markdownのテストです2
Markdownの編集中にも、自動的に文字に色がついたり太字になります。
編集中は以下のようになります。
Runボタンを押すことで、Markdown記法に基づき表示されます。
実行結果は以下になります。
再度編集したいときは、表示中のものをダブルクリックすれば、編集状態のコードセルになります。
Markdownの詳しい書式については、ドキュメントを参照してください。
Markdown Guide
数式を入力する
Markdown用のセルには数式を入力することもできます。
コードセル(Markdown用に変更を忘れないこと)に以下を入力し、Runボタンで実行して下さい。
# Maxwell’s Equations
\begin{align}
\nabla \times \vec{\mathbf{B}} -\, \frac1c\, \frac{\partial\vec{\mathbf{E}}}{\partial t} & =
\frac{4\pi}{c}\vec{\mathbf{j}} \\ \nabla \cdot \vec{\mathbf{E}} & = 4 \pi \rho \\
\nabla \times \vec{\mathbf{E}}\, +\, \frac1c\, \frac{\partial\vec{\mathbf{B}}}{\partial t} & =
\vec{\mathbf{0}} \\
\nabla \cdot \vec{\mathbf{B}} & = 0
\end{align}
実行結果は以下になります。
Motivating Examples — Jupyter Notebook stable documentationより引用
Jupyter Notebook上でコードの処理時間を計測
コードセルの先頭行に %%timeit を記載し、その後にプログラムを記述すれば、そのコードセルの処理時間が表示されます。
コードセルに以下を入力し、Runボタンで実行して下さい。
%%time
import matplotlib.pyplot as plt
plt.hist(np.random.randn(1000))
- CPU times:の表示(処理時間)が追加されました。