スタージェスの公式(Sturges' rule)
度数分布やヒストグラム作成時の階級数の目安を得られる公式。
nをサンプル数、kを階級数として下記の式で求めることができる。
k = 1 + log_2N
例
サンプル数40(N=40)のデータがあったとし、それよりヒストグラムを作成する場合の階級の数を求める。
1 + log_240 = 6.3219280948874 ≒ 6
これより階級数6を設定する。
注意
スタージェスの公式を用いて得られる階級数はあくまでも目安でしかない。
(度数分布表・ヒストグラムの作成にあたっての階級数設定について絶対的な答えは存在しない)
Pythonでのメソッド化
sturges.py
import math
def sturges_rule(n):
u"""
スタージェスの公式
"""
return round(1 + math.log2(n))
※math.log2はPython3 >= 3.3
(それ以前のバージョンであれば、math.log(n, 2)を利用)
https://docs.python.jp/3/library/math.html#math.log2
前述の「例」で確認。
>>> from sturges import sturges_rule
>>> sturges_rule(40)
6
#参考