背景
実験結果からヒストグラムを書きたいときがよくある。大体エクセルで散布図や平均値・標準偏差などを描いている流れで、ところで一応ヒストグラム見ておきたいという事が多々ある。そんな時に、エクセルではヒストグラムを作るのがいちいち面倒である。また、対象のデータがそこまでない場合、ヒストグラムのためだけにCSVファイルを作っているのは面倒だと思う。
目的
エクセルで閲覧しているデータを簡単にpandasのデータフレームとして扱って、ざっくり全体のカラム毎の分布を確認するときに必要な方法をまとめる。
概要
- エクセルで対象のテーブルを作っておく
- 全体を選択してコピーする
- pythonで受け取る
- ヒストグラムを書く
コード
hist.py
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
#クリップボードから読込
df = pd.read_clipboard()
#データを確認
df.head()
#ヒストグラムを書く
from pylab import rcParams
#サイズを調整(これ無いとかなり小さくなってしまう)
rcParams["figure.figsize"]= 10, 10
df.hist()
plt.tight_layout()
plt.show()
まとめ
- エクセルで小規模のデータを分析しているとき、全体の分布をざっくり把握したいときに便利そう
- 細かなパラメータの変更とかはおいおい理解していきたい