0. 概要
以前、クルマの燃費を計測して走行ごとのばらつきを調べるのにヒストグラムを作りたく、Node.js、Express、MySQLとChart.jsを駆使して作る記事を書きました。やりたいことは出来ていたのですが、Pythonを使うともっと簡単にできるらしいということで試してみたら、大幅に簡単でした。Pythonにもいろいろやり方がありそうですが、ローカルにある多くのファイルから作成する使い方で、コードとグラフを並べて見栄えを調整するなら、Pycharm、GoogleColaboratory より、Jupyter Notebook を VS Code で操作する使い方が使いやすいと感じました。以下、詳細です。
1. Python 動作環境
Pythonの動作環境にもいろいろあるようで迷いましたが、まずは手軽にできそうなPycharmを使ってみました。
- PyCharm 2024.1.4 (Community Edition)
- Python 3.12.4
- matplotlib 3.9.1
2. ヒストグラムを書くコード
なんと、Pythonのグラフ作成パッケージ Matplotlib を使うと、例えば正規分布に従う乱数をヒストグラムにするには、
import numpy as np
import matplotlib.pyplot as plt
# 平均 50, 標準偏差 10 の正規乱数を1,000件生成
x = np.random.normal(50, 10, 1000)
# ヒストグラムを出力
plt.hist(x)
plt.show()
を実行するだけ1らしい! 以前の、MySQLを使って集計し、MySQLはバックグラウンドじゃないと動かないというのでNode.js、Expressを駆使して2、とやっていたのに比べるとはるかに簡単!hist()の中に区切りの数を変更したりカスタマイズが出来るという...
さっそく、Pycharm で新プロジェクトを作って実行してみました。確かにこの数行のコマンドでヒストグラムが生成できている!
3. Pythonコンソールで実行してみる
今、このコードを実行するのに、メニューバーの実行ボタンを押すか、ファイル名のあたりを右クリックして出てくるメニューから"実行"を選択しました。これでもいいのですが、Pythonは対話形式で実行結果を見ながらコマンドを順番に入力して実行することもできるはずですよね。グラフを作るときのように、毎回ライブラリーをインポートしなくても、hist()内の区切りやオプションの選択を試したりもしたいですね。”Python コンソール”での実行を試しました。すると、上で試したコードだけではエラーが出ます。
Backend tkagg is interactive backend. Turning interactive mode on.
と表示されたら
import matplotlib
matplotlib.use('TkAgg',force=True)
などと入力してからplt.hist()
を実行する必要があるそうです。入力画面とは別に、グラフ化のプログラムの作動する"バックエンド"があって、そのバックエンドが起動できないとエラーになるそうです3
結果、Python コンソールにコードを入力しても無事にヒストグラムを作ることができました。ちなみに、バックエンドにはMacOSX, QtAgg, GTK4Agg, Gtk3Agg, TkAgg, WxAgg, Agg
がある4そうです。詳細もこのMatplotlibのドキュメントに記載ありました。
4. Jupyter Notebookを使ってみる
4.1. Google Colabを使ってみる
ヒストグラムが別のウィンドウに出てくるよりは、同じ画面上(同じページ?)で見たいなぁ、と思っていたら、"Jupyter Notebook" が目につきました。これなら同じ画面上(同じページ?)で見やすいのでは、と思います。では早速、と思ったら、"Jupyter Notebook" にもいろいろ、やり方があり、Google Colab がお手軽で良さそうに思えました。
Google Colabでノートブックを新規で作成し、「実行」ボタンを押します。うん、これならコードのすぐ下にヒストグラムが表示されてるので、思っていたイメージに近いと思います。
ただ、ここで一つ問題が発生しました。もともと、多くのクルマの走行データ(時系列データ)から走行ごとの燃費を出して、それを月間や年間の燃費のヒストグラム出したかったのですが、その時系列のデータから集計する部分も同時に処理しようとすると、多くの時系列データをGoogle Colab にアップロードするか、Google ドライブを使ったりする必要がありそうです。データ自体はローカルにあるからな...
4.2. VS Codeで使う
ローカルで使う方法を探そうと、.ipynbファイルをダウンロードし、何気にダブルクリックしたところ、VS Codeが立ち上がりました。あれ、VS Code 使える?ということで調べてみると、使えるらしい。
これだったら、ローカルのファイルも気軽に読み込めるし、当面これが一番気楽と感じました。
- Visual Studio Code
- バージョン: 1.92.0 (user setup)
ちなみに、では、Pycharmではできないの?と思って調べてみると、PyCharm Professional が必要らしい...残念。
5. まとめ
ローカルにある多くのファイルから作成する使い方で、コードとグラフを並べて見栄えを調整するなら、Jupyter Notebook を VS Code で操作する使い方が使いやすいと感じました。