記事の目的
この記事では、t-分布の確率密度関数の求め方を数理統計学として解説します。
しかも、数式の展開をめっちゃ丁寧に追います!!
そして、t-分布という重要な概念の求め方を通して、
・同時密度関数
・周辺密度関数
・変数変換(ヤコビアン)
など、数理統計学の基礎を復習することも狙いです。
数理統計学の基礎を勉強中の皆さんにとって、とても役立つ内容になっています。
ぜひ読んでみてください。
t分布の密度関数導出
変数変換(ヤコビアン)によって、求めます。
開始のための用語整理
・$Z \sim \mathcal{N}(0, 1) $(標準正規分布)
・$U \sim \chi^2_m $(自由度 m のカイ二乗分布)
・$Z$ と $U$ は独立
・$T$の定義:
$T = \dfrac{Z}{\sqrt{U/m}}$
このとき、確率変数 T の確率密度関数 $f_T(t)$を求めることがゴールです。
解法の流れ
- Z と U の同時密度関数を求める
- 変数変換 $ (Z, U) \rightarrow (T, V) $
- ヤコビアンの計算
- 変換後の同時密度関数 $ f_{T,V}(t, v) $
- 周辺密度 $ f_T(t) $ の導出
ステップ 1:同時密度関数
独立性より:
f_{Z,U}(z, u) = f_Z(z) \cdot f_U(u)
標準正規分布の密度関数:
f_Z(z) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right)
カイ二乗分布の密度関数(自由度 m):
f_U(u) = \frac{1}{2^{m/2} \Gamma(m/2)} u^{m/2 - 1} \exp\left(-\frac{u}{2} \right), \quad u > 0
ステップ 2:変数変換
T = \frac{Z}{\sqrt{U/m}} \quad \Rightarrow \quad Z = T \cdot \sqrt{U/m}
V = U
よって逆変換:
\begin{cases}
z = t \sqrt{v/m} \\
u = v
\end{cases}
ステップ 3:ヤコビアン
ヤコビアン行列:
J =
\begin{bmatrix}
\frac{\partial z}{\partial t} & \frac{\partial z}{\partial v} \\
\frac{\partial u}{\partial t} & \frac{\partial u}{\partial v}
\end{bmatrix}
=
\begin{bmatrix}
\sqrt{\frac{v}{m}} & \frac{t}{2\sqrt{vm}} \\
0 & 1
\end{bmatrix}
行列式の絶対値:
|J| = \sqrt{\frac{v}{m}}
ステップ 4:変換後の同時密度関数
f_{T,V}(t, v) = f_{Z,U}(z(t,v), u(t,v)) \cdot |J|
各項の代入:
z = t \sqrt{v/m}
u = v
を代入すると、
f_{Z}(z) = \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{t^2 v}{2m} \right)
f_U(v) = \frac{1}{2^{m/2} \Gamma(m/2)} v^{m/2 - 1} \exp\left( -\frac{v}{2} \right)
ヤコビアン:
\sqrt{v/m}
まとめると:
f_{T,V}(t, v) = \frac{1}{\sqrt{2\pi}} \exp\left( -\frac{t^2 v}{2m} \right)
\cdot \frac{1}{2^{m/2} \Gamma(m/2)} v^{m/2 - 1} \exp\left( -\frac{v}{2} \right)
\cdot \sqrt{\frac{v}{m}}
指数項をまとめて:
\exp\left( -\frac{v}{2} \left( 1 + \frac{t^2}{m} \right) \right)
冪乗項:
v^{(m+1)/2 - 1}
定数部分を C とすると:
f_{T,V}(t, v) = C \cdot v^{(m+1)/2 - 1} \cdot \exp\left( -\frac{v}{2} \left( 1 + \frac{t^2}{m} \right) \right)
ステップ 5:Tの周辺密度
f_T(t) = \int_0^{\infty} f_{T,V}(t, v) \, dv
= C \int_0^{\infty} v^{(m+1)/2 - 1} \cdot \exp\left( -\frac{v}{2} \left(1 + \frac{t^2}{m} \right) \right) dv
ガンマ関数を利用する
\int_0^\infty x^{a - 1} e^{-b x} dx = \frac{\Gamma(a)}{b^a}
この公式を使う。
ガンマ関数の定義
\Gamma(a) = \int_0^\infty x^{a-1} e^{-x} dx
係数付きガンマ積分の公式を使う理由
次のように、指数関数の中に定数 $ b > 0 $があるとき:
\int_0^\infty x^{a - 1} e^{-b x} dx = \frac{\Gamma(a)}{b^a}
この公式が使えます。
なぜこの形で計算できるのか?(変数変換)
変数変換:$ y = b x $
すると:
$x = \frac{y}{b} $
$dx = \frac{dy}{b} $
積分は次のように変形できます:
\int_0^\infty x^{a-1} e^{-b x} dx
= \int_0^\infty \left( \frac{y}{b} \right)^{a-1} e^{-y} \cdot \frac{dy}{b}
= \frac{1}{b^a} \int_0^\infty y^{a-1} e^{-y} dy
= \frac{\Gamma(a)}{b^a}
a, bの見立て
a = \frac{m+1}{2}
b = \frac{1}{2} \left(1 + \frac{t^2}{m} \right)
結論
f_T(t) = C \cdot \frac{\Gamma\left( \frac{m+1}{2} \right)}{\left( \frac{1}{2} (1 + \frac{t^2}{m}) \right)^{(m+1)/2}}
最終的な密度関数(t分布)
定数 C を含めて整理すると:
\boxed{
f_T(t) = \frac{\Gamma\left( \frac{m+1}{2} \right)}{\sqrt{m\pi} \, \Gamma\left( \frac{m}{2} \right)} \cdot \left(1 + \frac{t^2}{m} \right)^{-\frac{m+1}{2}}
}
まとめ
かなり丁寧に数式を変形したつもりです!
数理統計学の基礎として、参考になれば幸いです。
関連記事