正規分布(normal distribution)
・正規分布は最もよく使われる分布で、統計学の理論でもよく出てくる分布になります。
・平均$\mu$と分散$\sigma^2$で形状が決まります。
正規分布が平均$\mu$と分散$\sigma^2$に従うことを省略して、$N(\mu, \sigma^2)$に従うと表記します。
下記の図のように、分散が大きくなると、山は低くなり左右に広がって平らになります。分散が小さくなると、山は高くなり、より尖った形になります。
確率変数$X$が$N(\mu, \sigma^2)$に従うとき、確率密度関数は次の式で表されます。
f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
Pythonで実践
正規分布
・ stats.norm
引数
・loc : 平均
・scale : 標準偏差
from scipy import stats
# 平均10, 標準偏差3の正規分布からランダムに1つとってくる
stats.norm(loc=10, scale=3).rvs()
結果
6.562147535575372
上記を実行すると、10に近い値をとってくる確率が高いです。
では、正規分布を描画してみましょう。
from scipy import stats
import numpy as np
import matplotlib.pyplot as plt
# x軸を設定
x = np.linspace(-5, 20, 100)
# y軸を設定
# N(10,3)に従う確率密度関数
y = stats.norm(loc=10, scale=3).pdf(x)
# N(8,3)に従う確率密度関数
y2 = stats.norm(loc=8, scale=3).pdf(x)
# N(8,1)に従う確率密度関数
y3 = stats.norm(loc=8, scale=1).pdf(x)
# 描画する
plt.plot(x, y)
plt.plot(x, y2)
plt.plot(x, y3)