統計検定準1級の勉強のための解説記事となります。下記にご了承いただける方のみ、お読みください。
以下の動画でも解説していますので、見やすいほうでご覧ください。
学習のポイント
・生存関数:S(t) = P(T > t) = \int_t^\infty f(x|θ) \, dx ・・・①
・確率変数Tの累積分布関数:F(t)= P(T ≤ t) = \int_{-\infty}^{t} f(x|θ) \, dx ・・・②
・生存関数と累積分布関数の関係:S(t)=1-F(t) ・・・③
解法ノート
生存関数問題の確率密度関数
今回の問題において、確率変数 $T$は、患者が登録された時点から死亡までの時間に関する確率変数です。また、生存関数 $S(t)$ は、「患者が登録されてから、時間 $t$を過ぎても生存している確率」です。
生存関数は、時間点 $t≥0$ を固定した上で、確率変数 $T$ がその $t$ より大きな値を取る確率なので、式①から
$$
S(t) = \int_t^\infty f(x) \ dx = \exp(-\lambda t) (ただし、λ>0)
$$
です。
ここで、微積分学の第一基本定理を用いて$f(x)$を求めるために、$\int_t^\infty f(x) \ dx$の積分区間を変更する必要があります。
時間 $t$ までに死亡する確率を累積分布関数 $F(t)$ とすると、$F(t)$は、確率密度関数 $f(x)$ の$x=0からx=t$までの積分となるため、式②から
$$
F(t) = P(T \leq t) = \int_0^t f(x) dx
$$
です。また、式③から、
$$
F(t)=1-S(t)=1-\exp(-\lambda t)
$$
となります。よって、
$$
1-\exp(-\lambda t)= \int_0^t f(x) dx
$$
が成り立ちます。両辺を $t$ で微分すると、
$$
\frac{d}{dt}(1-\exp(-\lambda t)) = \frac{d}{dt} \int_0^t f(x)dx
$$
左辺の微分は、
$$
\frac{d}{dt}(1-\exp(-\lambda t)) = -\exp(-\lambda t) \cdot (-\lambda) = \lambda \exp(-\lambda t)
$$
となります。
右辺は微積分学の第一基本定理より、
$$
\frac{d}{dt}\int_0^t f(x)dx = f(t)
$$
となります。
よって、
$$
f(t)=\lambda \exp(-\lambda t)
$$
です。
指数分布に従う確率変数の平均
確率密度関数 $f(t) (t ≥ 0)$ で表される確率分布に従う、確率変数$T$の期待値を求めます。期待値の定義より、以下の式で計算できます。
$$
E[T] = \int_0^\infty t \cdot f(t) dt= \int_0^\infty t \lambda e^{-\lambda t} dt
$$
部分積分法を用いて、$u = t, dv = \lambda e^{-\lambda t} dt$ とおくと、$du = dt, v = -e^{-\lambda t}$ となります。よって、期待値は、
$$
\begin{aligned}
E[T] &= \left[-t e^{-\lambda t}\right]_0^\infty - \int_0^\infty -e^{-\lambda t} dt = \left[-\frac{1}{\lambda}e^{-\lambda t}\right]_0^\infty = \frac{1}{\lambda}
\end{aligned}
$$
と求まります。
指数分布における上側25%点
分布における上側25%点とは、$P(T > t) = 0.25$ となる $t$ の値です。これは生存関数を用いて表すと、$S(t) =exp(-λt)= 0.25$ となる $t$ を求めることに相当します。
よって、
$$
exp(-λt) = 0.25
$$
となる $t$ を求めます。両辺の自然対数をとると、
$$
-λt = log(0.25)
$$
よって、
$$
t = -\frac{\log(0.25)}{\lambda} = \frac{\log(4)}{\lambda}
$$
となります。
指数分布における上側25%点の推定値
確率変数$T$の期待値$E[T]$は $ \frac{1}{\lambda}$ であり、標本平均は母平均の不偏推定量であるため、標本平均を用いて母平均を推定します。標本平均が $3.0$ 年であることから、$\frac{1}{\lambda} ≈ 3$ となります。
よって、パラメータ$λ$ の推定値$\hat{\lambda}$は、
$$
\hat{\lambda} = \frac{1}{3}
$$
となります。分布の上側$25$%点は$\frac{\log(4)}{\lambda}$ で表されるため、これに$\lambda$の推定値$\hat{\lambda} = \frac{1}{3}$を代入すると、
$$
上側25パーセント点の推定値 =\frac{\log(4)}{\hat{\lambda}} = \frac{\log(4)}{\frac{1}{3} }≈ 4.2
$$
よって、$S(t)$が$25$%($0.25$)となる時間$t$は、約$4.2$年と推定されます。
参考:高校数学
$$
部分積分法:∫ u dv = uv - ∫ v du
$$