記載ルール
このブログではカルマンフィルターを解説していく。具体的な解説の前に状態空間モデルを記述する際のルールを述べる。なお、このブログでは線形カルマンフィルターを扱う。
状態空間モデル
まず、前回のブログでも提示した状態空間モデルを少しだけ改良した方程式を以下に記述する。
$$Y_t = c + \tilde \beta_t X_t + \tilde e_t \tag{1}$$
$$ \tilde \beta_t = d + \tilde \phi\tilde \beta_{t-1} + \tilde v_t \tag{2}$$
(1)が観測方程式、(2)が状態方程式という。前回と異なるのは、(1)に説明変数$X_t$が追加されたことと、(2)に係数$\tilde \phi$が追加されたことである。変数の$_t$は時変変数であることを示しており、また~がついている変数は確率変数である。すなわち、上記(1),(2)において観測できる変数は$Y_t, X_t$のみである。尚、$\tilde e_t ~ N(0, \sigma^2_e),\tilde v_t ~ N(0, \sigma^2_v)$に従うものとし、$c$と$d$は定数である。
次に、期待値と分散の記載ルールを述べる。各々の数式の意味は次回以降で解説し、ここではあくまで記載ルールのみの説明に留める。
期待値
$\hat \beta$ (チルダではなく、ハットがついている)は$\beta$の推定値を意味する。$\Omega$は情報集合である。
1期先の予測値
下記は1期前の情報を使って、今期の$\beta$を推定したことを意味する。
$$\hat \beta_{t|t-1} \equiv E_{t-1}[\tilde \beta_t|\Omega_{t-1}] \tag{3}$$
フィルタリング値
下記は今期の情報を使って、今期の$\beta$を推定したことを意味する。
$$\hat \beta_{t|t} \equiv E_{t}[\tilde \beta_t|\Omega_{t}] \tag{4}$$
スムージング値
下記はN期までの情報を使って、今期の$\beta$を推定したことを意味する。このN期は今期以降の未来の情報も含まれている点に留意する。
$$\hat \beta_{N} \equiv E_{N}[\tilde \beta_t|\Omega_{1:N}] \tag{5}$$
分散
1期先の分散の予測値
下記は1期前の情報を使って、今期の$\beta$の分散を推定したことを意味する。
$$\hat \Sigma_{t|t-1} \equiv Var_{t-1}[\tilde \beta_t|\Omega_{t-1}] \tag{6}$$
分散のフィルタリング値
下記は今期の情報を使って、今期の$\beta$の分散を推定したことを意味する。
$$\hat \Sigma_{t|t} \equiv Var_{t}[\tilde \beta_t|\Omega_{t}] \tag{7}$$
分散のスムージング値
下記はN期までの情報を使って、今期の$\beta$の分散を推定したことを意味する。
$$\hat \Sigma_{t|N} \equiv Var_{t}[\tilde \beta_t|\Omega_{1:N}] \tag{8}$$
MCMCをなぜ使うのか
ところで、話は(1),(2)の方程式に戻るが、なぜMCMCを使うのか、という点について触れておく。通常、$c, d$, そして、誤差項を時変変数とせず、$e ~ N(0, \sigma^2_e),v ~ N(0, \sigma^2_v) $とし、各々を最尤法で推定し、そのあと求めたい$\tilde \beta_t$をカルマンフィルターで推定する2段階の手法を用いられることがある。これは誤差項が常に一定の確率分布に従うという仮定が成立する場合においては、特に問題は発生しない。しかし、現実の世界において、誤差項の分散が常に一定であるという仮定は、2020年3月のCovid19による為替市場や株式市場の変動をみても明らかであるように、必ずしも成立しない。Covid19が極めて特別な事例であったとしても、その他にも中央銀行の金融政策の変更によるサプライズや、予期できない災害等によるショックが常に一定の範囲に収まるという仮定は、現実をうまく表せない時もあることに留意すべきことである。
以上のことを勘案し、本ブログでは誤差項も時変変数として扱う。この場合の状態方程式を推定する方法として、MCMC(Markov chain Monte Carlo methods)を用いた推定手法も併せて解説する。但し、それらの解説は恐らく随分と先の話になるかと思う。