0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

Python matplotlibのhist(bins=int)とRのhist(breaks=integer)の違い

Last updated at Posted at 2021-09-30

Pythonのhist(bins=int)とRのhist(breaks=integer)。いずれも、区間数を指定すると区間幅の設定が自動で行われる機能である。しかし、 区間の上限下限の設定が異なる。

R

breaksが数値の場合(hist(VEC,breaks=BREAKS))、集計範囲は

pretty(range(VEC), n=BREAKS)

によって(おおよそ100やら1000やらの単位になるよう)算出される1

Python (matplotlib)

binsが数値の場合(plt.hist(VEC,bins=BINS))、集計範囲は

(min(VEC), max(VEC))

によって算出される2。上限下限を切りの良い数値にしたい場合、たとえば

plt.hist(VEC,bins=BINS,range=(-1000,1000))

のように明示的にrange=を指定する必要がある。

終わりに

特に拡大比率を変えて複数のヒストグラムを描く場合は、分布が変化してしまいうるのでご注意下さい…

  1. https://svn.r-project.org/R/trunk/src/library/graphics/R/hist.R

  2. https://github.com/matplotlib/matplotlib/blob/master/lib/matplotlib/axes/_axes.py

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?