Pythonのhist(bins=int)
とRのhist(breaks=integer)
。いずれも、区間数を指定すると区間幅の設定が自動で行われる機能である。しかし、 区間の上限下限の設定が異なる。
R
breaksが数値の場合(hist(VEC,breaks=BREAKS)
)、集計範囲は
pretty(range(VEC), n=BREAKS)
によって(おおよそ100やら1000やらの単位になるよう)算出される1。
Python (matplotlib)
binsが数値の場合(plt.hist(VEC,bins=BINS)
)、集計範囲は
(min(VEC), max(VEC))
によって算出される2。上限下限を切りの良い数値にしたい場合、たとえば
plt.hist(VEC,bins=BINS,range=(-1000,1000))
のように明示的にrange=を指定する必要がある。
終わりに
特に拡大比率を変えて複数のヒストグラムを描く場合は、分布が変化してしまいうるのでご注意下さい…