1. 記事の目的
二次元正規分布における条件付き確率密度関数の求め方を確認します.
大学の基礎的な統計学の講義や統計検定(準一級程度)で見かけることがありました.
2. 正規分布
1次元の場合
確率変数 $X$ が平均 $\mu$, 分散 $\sigma^2$ の正規分布に従うとき,その確率密度関数は
$$
f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left({-\frac{1}{2}\frac{(x-\mu)^2 }{\sigma^2}}\right)
$$
と表されます.
多次元の場合
上記を$k$次元の場合に一般化します.多変量正規分布に従う $k$ 次元の確率変数ベクトル ${\boldsymbol X}=\left[X_1,X_2,\cdots,X_k\right]^T$ の同時確率密度関数は
$$
f({\boldsymbol x})=\frac{1}{\sqrt{(2\pi)^k|\Sigma|}}\exp\left({-\frac{1}{2}({\boldsymbol x}-{\boldsymbol \mu})^T\Sigma^{-1}({\boldsymbol x}-{\boldsymbol \mu}) }\right)
$$
と表されます.ここで $\boldsymbol\mu$,$\Sigma$ はそれぞれ平均ベクトルと共分散行列です.
#3. 条件付き確率密度関数
さて本題の条件付き確率密度関数を求めます.ここでは簡単に二次元の例を考えます.すなわち
$$
{\boldsymbol X}=
\begin{bmatrix}
X_1\
X_2
\end{bmatrix},\
{\boldsymbol\mu}=
\begin{bmatrix}
\mu_1\
\mu_2
\end{bmatrix},\
{\boldsymbol\Sigma}=
\begin{bmatrix}
\sigma_{11} & \sigma_{12}\
\sigma_{21} & \sigma_{22}
\end{bmatrix}
$$
です.共分散行列の $(i,j)$ 成分は $X_i$ と $X_j$ の共分散($i=j$ならただの分散)ですので
$$
{\boldsymbol\Sigma}=
\begin{bmatrix}
\sigma_{11} & \sigma_{12}\
\sigma_{21} & \sigma_{22}
\end{bmatrix}
=\begin{bmatrix}
\sigma_{1}^2 & {\rm Cov}(X_1,X_2)\
{\rm Cov}(X_1,X_2) & \sigma_{2}^2
\end{bmatrix}
$$
であり,$X_1$ と $X_2$ の相関係数 $\rho$ が
$$
\rho=\frac{{\rm Cov}(X_1,X_2)}{\sigma_1\sigma_2}
$$
であることを利用して
$$
{\boldsymbol\Sigma}
=\begin{bmatrix}
\sigma_{1}^2 & \rho\sigma_{1}\sigma_{2}\
\rho\sigma_{1}\sigma_{2} & \sigma_{2}^2
\end{bmatrix}
$$
と表現できます.以上を多変量正規分布の式に代入すれば
$$
\begin{eqnarray}
f({\boldsymbol x})&=&\frac{1}{{2\pi\sqrt{\sigma_1^2\sigma_2^2-\rho^2\sigma_1^2\sigma_2^2}}}\exp\left({-\frac{1}{2(\sigma_1^2\sigma_2^2-\rho^2\sigma_1^2\sigma_2^2)}({\boldsymbol x}-{\boldsymbol \mu})^T\begin{bmatrix}
\sigma_{2}^2 & -\rho\sigma_{1}\sigma_{2}\
-\rho\sigma_{1}\sigma_{2} & \sigma_{1}^2
\end{bmatrix}({\boldsymbol x}-{\boldsymbol \mu}) }\right)\
&=&\frac{1}{{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}}
\exp\left(
{-\frac{1}{2(1-\rho^2)}
\left(
\frac{(x_1-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x_1-\mu_1)(x_2-\mu_2)}{\sigma_1\sigma_2}+\frac{(x_2-\mu_2)^2}{\sigma_2^2}
\right)}
\right) \
&=&\frac{1}{{\sqrt{2\pi}\sqrt{1-\rho^2}}\sigma_1}\frac{1}{\sqrt{2\pi}\sigma_2}
\exp\left(
{-\frac{1}{2(1-\rho^2)}
\left(
\frac{x_1-\mu_1}{\sigma_1}-\rho\frac{x_2-\mu_2}{\sigma_2}\right)^2+(1-\rho^2)\frac{x_2-\mu_2}{\sigma_2}}
\right)
\
\
&=&\frac{1}{{\sqrt{2\pi}\sqrt{1-\rho^2}}\sigma_1}
\exp\left(
{-\frac{1}{2(1-\rho^2){\sigma_1}^2}
\left({x_1-\mu_1}-\rho\sigma_1\frac{x_2-\mu_2}{\sigma_2}
\right)^2}
\right)
\frac{1}{\sqrt{2\pi}\sigma_2}\exp\left({-\frac{1}{2}\frac{(x_2-\mu_2)^2 }{\sigma_2^2}}\right) \
&=&\frac{1}{{\sqrt{2\pi}\sqrt{1-\rho^2}}\sigma_1}
\exp\left(
{-\frac{1}{2(1-\rho^2){\sigma_1}^2}
\left({x_1-\mu_1}-\rho\sigma_1\frac{x_2-\mu_2}{\sigma_2}
\right)^2}
\right)\ f(x_2)
\end{eqnarray}
$$
が得られます.ここでポイントとなるのは $X_2$ の従う一次元正規分布の確率密度関数の式を抜き出すことです.同時確率密度関数 $f(x_1,x_2) $と条件付きの確率密度関数 $f(x_1|x_2)$ には
$$
f(x_1,x_2)=f(x_1|\ x_2)\ f(x_2)
$$
という関係が成り立つので,先ほどの式と比較すれば,
$$
f(x_1|\ x_2)=\frac{1}{{\sqrt{2\pi}\sqrt{1-\rho^2}}\sigma_1}
\exp\left(
{-\frac{1}{2(1-\rho^2){\sigma_1}^2}
\left({x_1-\mu_1}-\rho\sigma_1\frac{x_2-\mu_2}{\sigma_2}
\right)^2}
\right)
$$
が得られます.
またこの条件付き確率密度関数も正規分布の形をしていることがわかります.すなわち $X_2=x_2$ が得られたとき,$X_1$は平均 $\mu_1+\rho\sigma_1\frac{x_2-\mu_2}{\sigma_2}$,分散 $(1-\rho^2){\sigma_1}^2$の正規分布に従います.
参考文献
稲垣宣生,「数理統計学」(数学シリーズ) 裳華房,2003.