カルマンゲイン
本日は、前回のブログで登場したカルマンゲインについて、解説する。
改めて、前回の2変量正規分布の式を再掲する。2つの変数$Z,Y$のうち、$Y=y$が得られた時のZは次のように表すことができた。
$E(Z|Y=y)=\mu_{z|Y=y}=\mu_z + K (y-\mu_y) \tag{11}$
$K = \frac{Cov(Z,Y)}{Var(Y)} \tag{12}$
そして、この2変量正規分布の過程を観測変数$Y_t$と状態変数$\tilde \beta_t$に当てはめたのが次の式であった。
$\hat \beta_{t|t}= \hat \beta_{t|t-1}+ K_t (Y_t - \hat Y_{t|t-1}) \tag{13}$
式(13)の$K_t$も式(12)に倣い、同様に求めてみると次のようになる。
$$K_t = \frac{Cov(\tilde \beta_t, Y_t|\Omega_{t-1})}{Var(Y_t|\Omega_{t-1})} = \frac{Cov(\tilde \beta_t, c + X_t \tilde \beta_t + \tilde e_t |\Omega_{t-1})}{Var(c + X_t \tilde \beta_t + \tilde e_t |\Omega_{t-1})}$$
右辺への展開には、2回目ブログの式(1)を用いた。
まず、上記の式の右辺の分子は、次のようになる。
$$Cov(\tilde \beta_t, c + X_t \tilde \beta_t + \tilde e_t |\Omega_{t-1})=Cov(\tilde \beta_t, X_t \tilde \beta_t|\Omega_{t-1})+Cov(\tilde \beta_t, \tilde e_t|\Omega_{t-1})$$
右辺の2項目の$\tilde \beta_t$と$\tilde e_t$は互いに独立であるので、0となる。よって、
$$= X_t Cov(\tilde \beta_t,\tilde \beta_t|\Omega_{t-1})+0=X_t \Sigma_{t|t-1}$$
となる。
また分母は次のようになる。
$$Var(c + X_t \tilde \beta_t + \tilde e_t |\Omega_{t-1})=0+X_t^2 Var(\tilde \beta_t|\Omega_{t-1})+Var(\tilde e_t|\Omega_{t-1})$$
これは左辺のVarの()の中はいずれも無相関の関係であり、また定数の分散は0となることを利用している。そして、次の式は、残った2つの項に対して、各々の定義から導き出せる。
$$=X_t^2 \Sigma_{t|t-1}+\sigma_e^2$$
最後に$K_t$の式に戻す。
$$K_t=\frac{X_t \Sigma_{t|t-1}}{X_t^2 \Sigma_{t|t-1}+\sigma_e^2} \tag{15}$$
これがカルマンゲイン$K_t$である。右辺の分母は元々、$Var(Y_t|\Omega_{t-1})$であるから、観測変数の1期先の分散の予測値であり、分子は式展開した結果、状態変数の1期先の分散の予測値となっている。この比がカルマンゲインであり、式(13)で観測値$Y_t$とその期待値$Y_{t|t-1}$との差に、観測変数の分散の予測値と状態変数の分散の予測値の比を重みとしてかけている。
では、なぜ(15)のような式展開をしたのか、これは$K_t$に$X_t$をかけてみるとわかる
$$X_t K_t = \frac{X_t^2 \Sigma_{t|t-1}}{X_t^2 \Sigma_{t|t-1}+\sigma_e^2} $$
この式の右辺から明らかになるのは、$0 < X_t K_t \leqq 1$となることである。
前回示した状態変数のフィルタリング値の分散の式(14)に当てはめてみると、1期前の情報から予測した分散$\hat \Sigma_{t|t-1}$よりもフィルタリング値は小さくなることが明らかである。
$$\hat \Sigma_{t|t}= (1 - X_t K_t) \hat \Sigma_{t|t-1}\tag{14}$$
このようにフィルタリングを行うことで、予測の精度を高めていることになる。
次回はスムージングの解説に入る予定である。