問19.1
(1) 観測できる積雪量が0以下になることはないから、左打ち切りであり、$L=0$である。
これと、$x_i^\top\beta = \beta_0+\beta_1x_{i1} + \beta_2x_{i2}$を潜在変数の式に代入する。
(2) 推定するパラメータの数は、例えば「日照時間+平均気温+最低気温+最高気温」のモデルの場合、$\beta_0$(切片項)、$\beta_1$(日照時間の係数)、$\beta_2$(平均気温)、$\beta_3$(最低気温)、$\beta_4$(最高気温)、$\sigma$の6つ
p288のAICの式に従ってAICを算出すると、「日照時間+平均気温」のモデルが最もAICが小さく、良いモデルといえる。
問19.2
ハザード関数$h(x)$は以下の式で導出される(p7を参照)
$h(x) =\frac{f(x)}{S(x)}= (-\log{S(x))'}$
回答のとおり
問19.3
$h(t|x) = (-\log{S(t|x)})'$
$-\log{S(t|x)}) = \int_{0}^{t} h(u|x) du$
(19.3)より、基準ハザード$h_0(x)$を用いて
$-\log{S(t|x)} = \int_{0}^{t} h_0(u)e^{x^\top\beta} du = e^{x^\top\beta}\int_{0}^{t} h_0(u) = e^{x^\top\beta}H_0(t)$
両辺の対数をとって
$\log(-\log{S(t|x)}) = x^\top\beta + \log{H_0(x)}$
カプラン・マイヤー推定量
問19.4
(1)治療する(治療群、太線)/治療しない(対象群、細線)を共変量として考える。比例ハザード性を表す式$\log(-\log{S(t|x)}) = x^\top\beta + \log{H_0(x)}$
を満たしているかどうかを確認する。
x=0は治療しない場合なので、x=0のとき
$\log{H_0(t)} = \log(\int_{0}^{t} h(u|0) du) = \log(\int_{0}^{t} (-\log{S(u|0)})' du) = \log(-\log{S(t|0)})$
x=1を治療すると仮定した場合、以下の式が成り立つがどうかを確認すればよい。
$\log(-\log{S(t|1)}) = \beta + \log(-\log{S(t|0)})$
今回の問題では、$\log(-\log{S(t|1)})$が細線、$\log(-\log{S(t|0)})$が太線であるが、これは平行になっており$\beta$をその間隔と考えれば上式は成り立つ。
(2)回答のとおり