『続・わかりやすいパターン認識―教師なし学習入門―』 (石井健一郎・上田 修功オーム社,2014)から、第8章の隠れマルコフモデルの部分を勉強します。最近、同書の読書会に参加させていだだいています。
記述法が分かりにくいと思った箇所については、ところどころ変更します。
4つの記事に分けます。
モデル
状態 $s_t$ と 出力 $x_t$ からなる時系列データがあります。$s_t, x_t$ は、それぞれ$c$個, $m$個の離散的な値を取ることとします:
s_t \in \{\omega_1, ..., \omega_c\}\\
x_t \in \{v_1, ..., v_m\}
記述の便宜上、1~$t$期までの列を上添字で書くことにします:
s^t \equiv (s_1, s_2, ..., s_t)\\
x^t \equiv (x_1, x_2, ..., x_t)
$x_t$ の確率分布は $s_t$ により決まり、他の過去の情報には直接の影響を受けません。正確には、次の式を仮定しています。
\mathbb{P} (x_{t} | s^{t}, x^{t-1}) = \mathbb{P} (x_{t} | s_{t}) = b(s_t, x_t)
$s_t$ はマルコフ連鎖に従っているとします。下の式の1つ目の等式は、(1)過去のすべての情報がわかっているとしても、前期の状態 $s_t$ 以外の情報は余分であるということで、$s_{t+1}$ は $s_{t}$ が与えられているという条件下において、過去の他の情報と独立であるとも言い換えられます。
\mathbb{P} (s_{t+1} | s^{t}, x^t) = \mathbb{P} (s_{t+1} = | s_{t}) = a(s_t, s_{t+1})
$a, b$ は確率を示すパラメータですが、具体的な値を明示するときには、次のような書き方も使用します。
a(s_t = \omega_i | s_{t+1} = \omega_j) = a_{ij}\\
b(x_t = v_k | s_t = \omega_i) = b_{ik}
第1期の状態確率は パラメータ$\rho$ で与られ、$a, b$ と同様に場合によって2つの記法を使い分けます。
\mathbb{P} (s_1) = \rho(s_1)\\
\mathbb{P} (s_1 = \omega_i) = \rho_i
変数の依存関係を図にすると以下のようになります。$x$から他の$x$や$s$への矢印がない(直接に影響しない)ことと、$s$ は次期の$s$にのみ影響している点がポイントです。
注意点
次の式は一般には成立しません。
\mathbb{P}(x_{t} | x_{t-1}) = \mathbb{P}(x_{t}) \\
\mathbb{P}(x_{t} | x_{t-1}, x_{t-2}) = \mathbb{P}(x_{t} | x_{t-1}) \\
\mathbb{P}(s_{t} | s_{t-1}, s_{t+1}) = \mathbb{P}(s_{t} | s_{t-1})
いずれも、「影響しない」ということと「独立である」ということの関係に関する誤りです。
1つ目の式についてですが、$x$ 自体はマルコフ過程に従っていないのですが、その時系列は状態変数$s$を通じて関係しているため、過去の情報は今期の値の予測に影響します。例えば、状態変数が景気の良し悪しを表し、出力変数が株価の高低だとして、好景気のとき株価が高くなりやすく、不景気のときは株価が低くなりやすいとします。さらに、景気は硬直的(好景気・不景気が連続しやすい)なものとします。前期の株価が高かかった時、今期の株価の予測はどう変わるでしょうか。・・・予測は上方修正されるはずです。というのも、「前期の株価が高かった→前期は好景気だった可能性が高い→今期も好景気になりやすい→今期も株価が高くなりやすい」というように考えられるからです。したがって、1つ目の式は誤りです。
2つ目の式は、$x$もマルコフ過程であることを意味していますが、これも誤りです。理由は、$x_{t-1}$ の情報が、$s_{t}$ に関する不完全な情報でしかないためで、$x_{t-2}$ などの過去の情報は予測の精度を高めるのに役立つからです。上の例では、前期の株価が高いということだけでなく、過去10年間ずっと株価が高いことが分かっていたほうが、今が好景気であるという確信が得やすいということです。逆に、前期の株価が高かったが前々期は振るわなかったことがわかれば、前期の株価はたまたまにすぎないのではと予測を改めることになります。
3つ目の式は、マルコフ過程における未来の情報の価値についてです。未来の情報は、今期の状態へと逆算する形で、予測に影響します。上の例では、第1期の景気が良かったことがわかっているとします。すると第2期が好景気になる確率が高くなります。ここへさらに追加の情報で、第3期は不景気だったと分かったとしたらどうでしょうか。「第3期が不景気になった→これが起こりやすいのは第2期が不景気だった場合→第2期も不景気だったのでは」という予測が成り立ち、景気予測が下がります。したがって、3つ目の式も誤りです。