はじめに
1回の試行において、コインの表と裏が出る確率はちょうどどちらも$1/2$である。そのような試行を100回や1000回、10000回と繰り返し行った場合、表が1回の試行で平均何回でるかを調査したとする。おそらく、1回の試行での平均値は。0.5回程度に落ち着き、その分布は正規分布になると考えられる。これは、中心極限定理と呼ばれ、あらゆるものの確率分布に正規分布が現れる所以である。そこで、今回はコイントスと等価な試行をプログラム上で繰り返した場合、それらの標本平均の確率分布はどのようになるのかを調査する。
前提
PythonのRandomモジュールを用いて、0から1までの一様乱数を生成するという試行を繰り返し行う。
一回の試行において確率変数$X$は$0\le X \le 1$とする。
この試行を$N$回行ったときの平均を以下のように定義する。
\bar{X}=\frac{1}{N} \sum_{k=1}^{N}X_k
プログラム
以下のようなプログラムを書いた。
import numpy as np
import matplotlib.pyplot as plt
import japanize_matplotlib
import math
import random
#試行の繰り返し回数N
N=30000
X_m=[]
#標本数m
m=1000
for p in range(m):
x=0
for i in range(N):
x=x+random.random()/N
X_m.append(x)
#ヒストグラムの描画
plt.hist(X_m,bins=50)
plt.savefig("正規分布と標本調査"+str(N)+"_"+str(m)+".png")
plt.show()
結果
標本数が多い場合は極めて正規分布に漸近することが分かった。
ただし、$N=3000$とした。
m=10
正規分布の傾向はみれない
m=100
すこし、正規分布ぽくなってきた。
m=1000
かなり、正規分布に似かよってきた。
m=10000
かなり、正規分布ぽくなってきた。
まとめ
今回は、中心極限定理の性質について一様乱数の試行を繰り返し行うことによって図示するという試みを行った。全く傾向が正規分布に似ていない分布でもそれらの試行が積み重なれば必ず正規分布が現れるというのは面白いと感じた。
参考文献