1
0

More than 3 years have passed since last update.

雰囲気で中心極限定理

Posted at

あまり数学によらず、なんとなく(自分が)納得できるような中心極限定理の説明をしてみたいと思います。
そもそも中心極限定理とは、、、
有限の期待値と分散を持つ、互いに独立で同一な分布に従う確率$X_1,X_2,\cdots,X_n$があるとします。この相加平均
$$\bar{X}=\frac{1}{n}\sum_{j=1}^{n}X_j$$
の分布は、$n$が十分大きなところで正規分布に近づくことを主張するものです。つよつよですね。

準備

説明に入る前にいくつか準備することがあるので、そちらを先に行いたいと思います。
まず考える系について整理します。
互いに独立で同一な分布に従う確率変数$X_1,X_2,\cdots,X_n$があり、それぞれの期待値と分散は$\mu\ ,\ \sigma^2$であるとします。また、
$$\bar{X}=(X_1+X_2+\cdots+X_n)/n$$
として$\bar{X}$の期待値、分散を$\bar{\mu}\ ,\ \bar{\sigma}^2$とします。

期待値

$\bar{X}$の期待値を求めます。

\begin{align}
\bar{\mu}=E[\bar{X}]=E[(X_1+X_2+\cdots+X_n)/n]=\frac{1}{n}\bigl(E[X_1]+E[X_2]+\cdots+E[X_n]\bigr)=\mu
\end{align}

です。

分散

$\bar{X}$の分散を求めます。

\begin{align}
\bar{\sigma}^2&=V[\bar{X}]=E[\bar{X}^2]-E[\bar{X}]^2\\
&=E[\frac{1}{n^2}\sum_{m=0}^n\sum_{l=0}^nX_mX_l]-\bar{\mu}^2\\
&=\frac{1}{n^2}\Bigl[\sum_{m=0}^nE[X_m^2]+\sum_{m=0}^n\sum_{l(\neq m)=0}^nE[X_mX_l]\Bigr]-\mu^2
\end{align}

ここで$\sum_{m=0}^n\sum_{l(\neq m)=0}^n$は$\sum_{m=0}^n\sum_{l=0}^n$のうち、$m=l$となるものを抜いたものの足し合わせという意味で用いています。$X_1,X_2,\cdots,X_n$は互いに独立であり同じ分布に従うため

\begin{align}
\bar{\sigma}^2&=\frac{1}{n^2}\Bigl[\sum_{m=0}^nE[X_m^2]+\sum_{m=0}^n\sum_{l(\neq m)=0}^nE[X_mX_l]\Bigr]-\mu^2\\
&=\frac{1}{n^2}\Bigl[\sum_{m=0}^nE[X_1^2]+\sum_{m=0}^n\sum_{l(\neq m)=0}^nE[X_1]E[X_1]\Bigr]-\mu^2\\
&=\frac{1}{n^2}\Bigl[nE[X_1^2]+(n^2-n)\mu^2\Bigr]-\mu^2\\
&=\frac{1}{n}\bigl[E[X_1^2]-\mu^2\bigr]=\frac{1}{n}V[X_1]=\frac{1}{n}\sigma^2
\end{align}

です。

正規分布の特性関数

期待値$\mu$、分散$\sigma^2$の正規分布の特性関数$\Phi(t)$は、

\begin{align}
\Phi(t)&=\int^{+\infty}_{-\infty} dxf(x)e^{itx}=\int^{+\infty}_{-\infty} dx\frac{1}{\sqrt{2\pi}\sigma}\exp\bigr[-\frac{(x-\mu)^2}{2\sigma^2}+itx\bigr]\\
&=\frac{1}{\sqrt{2\pi}\sigma}\int^{+\infty}_{-\infty} dx\exp\bigr[-\frac{(x-\mu+i\sigma^2t)^2}{2\sigma^2}+it\mu-\frac{t^2}{2}\sigma^2\bigr]\\
&=\frac{1}{\sqrt{2\pi}\sigma}\exp\bigr[it\mu-\frac{t^2}{2}\sigma^2\bigr]\int^{+\infty}_{-\infty} dx\exp\bigr[-\frac{(x-\mu+i\sigma^2t)^2}{2\sigma^2}\bigr]\\
&=\frac{1}{\sqrt{2\pi}\sigma}\exp\bigr[it\mu-\frac{t^2}{2}\sigma^2\bigr]\int^{+\infty}_{-\infty} dx\exp\bigr[-\frac{x^2}{2\sigma^2}\bigr]\\
&=\frac{1}{\sqrt{2\pi}\sigma}\exp\bigr[it\mu-\frac{t^2}{2}\sigma^2\bigr]\sqrt{2}\sigma\int^{+\infty}_{-\infty} dxe^{-x^2}\\
&=\frac{1}{\sqrt{2\pi}\sigma}\exp\bigr[it\mu-\frac{t^2}{2}\sigma^2\bigr]\sqrt{2}\sigma\sqrt{\pi}\\
&=\exp\bigr[it\mu-\frac{t^2}{2}\sigma^2\bigr]
\end{align}

です。

説明

互いに独立で同一な分布に従う確率変数$X_1,X_2,\cdots,X_n$があり、それぞれの期待値と分散は$\mu\ ,\ \sigma^2$であるとします。
$\bar{X}$の特性関数は、$X_1,X_2,\cdots,X_n$が互いに独立なため
$$\Phi_{\bar{X}}(t)=E[e^{it\bar{X}}]=E[e^{itX_1/n}]E[e^{itX_2/n}]\cdots E[e^{itX_n/n}]$$
です。また、同一な分布に従うため
$$\Phi_{\bar{X}}(t)=\bigl(E[e^{itX_1/n}]\bigr)^n=\bigl(\Phi_{X_1}(t/n)\bigr)^n$$
となります。計算の簡略化のために特性関数の対数を取ったものを$H_{\bar{X}}(t)$と表します。$H_{\bar{X}}(t)$は
$$H_{\bar{X}}(t)=n\log\Phi_{X_1}(t/n)$$
です。これを$it/n=0$まわり$it/n$で展開すれば、

\begin{align}
&H_{\bar{X}}(t)=n\sum_{m=0}^\infty\kappa_m\frac{(it/n)^m}{m!}\\
&\kappa_m=\frac{\partial^m}{\partial(it/n)^m}\log\Phi_{X_1}(t/n)\bigr|_{t=0}
\end{align}

です。ここで

\begin{align}
&\kappa_0=\log\Phi_{X_1}(t/n)\bigr|_{t=0}=\log E[e^{itX_1/n}]\bigr|_{t=0}=\log 1=0\\
&\kappa_1=\frac{\partial}{\partial(it/n)}\log\Phi_{X_1}(t/n)\bigr|_{t=0}=\frac{1}{\Phi_{X_1}(t/n)}\frac{\partial\Phi_{X_1}(t/n)}{\partial(it/n)}\Bigr|_{t=0}=1\cdot E[X_1]=\mu\\
&\kappa_2=\frac{\partial^2}{\partial(it/n)^2}\log\Phi_{X_1}(t/n)\bigr|_{t=0}\\
&\quad=\biggr[-\frac{1}{\Phi_{X_1}(t/n)^2}\Bigr(\frac{\partial \Phi_{X_1}(t/n)}{\partial(it/n)}\Bigr)^2+\frac{1}{\Phi_{X_1}(t/n)}\frac{\partial^2\Phi_{X_1}(t/n)}{\partial(it/n)^2}\biggr]\biggr|_{t=0}\\
&\quad=-E[X_1]^2+E[X_1^2]=\sigma^2
\end{align}

です。これを代入して

\begin{align}
H_{\bar{X}}(t)&=n\bigr[0+\mu(it/n)+\sigma^2\frac{(it/n)}{2!}+\mathcal O(n^{-3})\bigr]\\
&=it\bar{\mu}-\frac{t^2}{2}\bar{\sigma}^2+\mathcal O(n^{-2})
\end{align}

となります。特性関数は$H_{\bar{X}}(t)$を用いて
$$\Phi_{\bar{X}}(t)=\exp[H_{\bar{X}}(t)]$$
と表せることから
$$\Phi_{\bar{X}}(t)=\exp[it\bar{\mu}-\frac{t^2}{2}\bar{\sigma}^2+\mathcal O(n^{-2})]$$
です。従って$n$が十分大きなところでは
$$\Phi_{\bar{X}}(t)\simeq\exp[it\bar{\mu}-\frac{t^2}{2}\bar{\sigma}^2]$$
であることがわかります。この右辺は期待値$\mu$と分散$\bar{\sigma}^2$を持つ正規分布の特性関数と一致するため、$n$が十分大きいところでは$\bar{X}$の分布は正規分布に近似することができます。

以上です。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0