での知識を用いて確率過程について紹介したいと思います。
確率過程
$T \subset \mathbb{R}$に対して(非可算集合でもよい)
確率空間$(\Omega,\mathcal{F},p)$上の確率変数の集合
\{X_t\}_{t \in T}
を確率過程と言います。
マルコフ過程
離散的な時系列$T \subset \mathbb{R}$に対して、$E \in \mathcal{B}(\mathbb{R})$の条件付き確率が
\begin{align}
p & (\{X_{n+1} \in E \} \mid X_{n-1},X_{n-2},\cdots,X_{1}) \\
&= p(\{X_{n+1} \in E \} \mid X_{n-1},X_{n-2},\cdots,X_{n-m}) \quad (m < n-1)
\end{align}
と表されるとき、$X_t$を$m$次マルコフ過程といいます。
ここで、
\{ X_i \in E \} = X_i^{-1}(E)
なのでこれは可測です。特に$m=1$のときは単にマルコフ過程と言います。
加法過程
任意の$t_0=0 < t_1 < t_2 < \cdots < t_n$に対して$Z_i = X_{t_{i}} - X_{t_{i-1}}$
としたとき、$Z_1,Z_2,\cdots,Z_n$が互いに独立であるとき、$X_t$を加法過程と言います。
このとき$X_0=0$ならば、
X_{t_m} = \sum_{i=1}^m Z_i
と表すことができます。加法過程はマルコフ過程になります。
マルチンゲール
増大情報系(フィルトレーション)
$\mathcal{F}$の部分σ加法族の集合$(\mathcal{F}_t)_{t \in T}$が 増大情報系であるとは
\forall s,t \in T: s<t \Rightarrow \mathcal{F}_s \subset \mathcal{F}_t
となることです。またフィルトレーションに対して
\mathcal{F}_\infty = \sigma\left( \bigcup_{t \in T} \mathcal{F}_t \right)
と定義します。
増大情報系を定めた確率空間
\left( \Omega,\mathcal{F},p;\{\mathcal{F}_t\}_{t \in T} \right)
をフィルター付き確率空間と言います。
フィルトレーションとの適合
確率過程$(X_t)$がフィルトレーション$(\mathcal{F}_t)$と適合しているとは
\forall t \in T: X_t \in \mathcal{F}_t|\mathcal{B}(\mathbb{R})
であることです。
確率過程が生成する増大情報系
確率過程から
\mathcal{F}_t = \sigma\left( \bigcup_{\substack{s \in T \\ s\leq t }} \sigma(X_s) \right)
として適合する増大情報系を生成することができます。
マルチンゲール
確率過程$(X_t)_{t\in T}$がフィルトレーション$(\mathcal{F}_t)_{t \in T}$のマルチンゲールであるとは$\forall t \in T$に対して以下の3つを満たすことです。
- $X_t \in \mathcal{F}_t|\mathcal{B}(\mathbb{R})$ (つまり、$(X_t)$が$(\mathcal{F}_t)$に適合している)
- $E(|X_t|)<\infty$ ($\Leftrightarrow X_t \in L_1(\Omega,\mathcal{F},p)$)
- $s<t \Rightarrow E(X_t \mid \mathcal{F}_s) = X_s$ (a.e.)
優(劣)マルチンゲール
3つ目の条件が
s<t \Rightarrow E(X_t \mid \mathcal{F}_s) \leq X_s \quad (a.e.)
ならば、優マルチンゲール、
s<t \Rightarrow E(X_t \mid \mathcal{F}_s) \geq X_s \quad (a.e.)
ならば、劣マルチンゲールと言います。優マルチンゲールかつ劣マルチンゲールであることをマルチンゲールであると言うこともできます。
マルチンゲールの収束
\sup_n E(X_n) < \infty
ならば、ある確率変数$X_\infty \in \mathcal{F}_\infty|\mathcal{B}(\mathbb{R})$が存在して
X_n \rightsquigarrow X_\infty
と概収束します。
イメージ
例えば、コインを投げて表が出れば1万円もらえて、裏が出たら1万円払うとします。これを$3$回まで繰り返す試行で、これまでの総額を$S_n$とするとこれは確率過程になります。
状態空間は
\begin{align}
\Omega &= \{-1,1\}^3 \\
= &\{ (1,1,1), \\
&(1,1,-1), (1,-1,1), (-1,1,1), \\
&(1,-1,-1), (-1,1,-1), (1,-1,-1), \\
&(-1,-1,-1) \}
\end{align}
で、σ加法族$\mathcal{F}$は$\Omega$のすべての部分集合で、確率測度は
\forall \omega=(x_1,x_2,x_3) \in \Omega: p(\{\omega\}) = \frac{1}{8}
確率変数$S_n$は
S_n(\omega=(x_1,x_2,x_3)) = \sum_{i=1}^n x_i
つまり、
\begin{align}
S_1(\omega=(x_1,x_2,x_3)) &= x_1 \\
S_2(\omega=(x_1,x_2,x_3)) &= x_1 + x_2 \\
S_3(\omega=(x_1,x_2,x_3)) &= x_1 + x_2 + x_3
\end{align}
です。
このとき、増大情報系は
\begin{align}
\mathcal{F}_1 &= \{ \varnothing, \\
&\{ (1,1,1), (1,1,-1), (1,-1,1), (1,-1,-1) \}, \\
&\{ (-1,1,1), (-1,1,-1), (-1,-1,1), (-1,-1,-1) \}, \\
&\Omega \} \\
\mathcal{F}_2 &= \{ \varnothing, \\
&\{ (1,1,1), (1,1,-1), \}, \\
&\{(1,-1,1), (1,-1,-1) \}, \\
&\{ (1,1,1), (1,1,-1), (1,-1,1), (1,-1,-1) \}, \\
&\{ (-1,1,1), (-1,1,-1)\}, \\
&\{ (-1,-1,1), (-1,-1,-1) \}, \\
&\{ (-1,1,1), (-1,1,-1), (-1,-1,1), (-1,-1,-1) \}, \\
&\Omega \} \\
\mathcal{F}_3 &= \mathcal{F}
\end{align}
です。条件付き期待値$E[S_3 \mid \mathcal{F}_n]$を計算すると、どの事象にも$m>n$の出た面は$\pm 1$が同じ確率で含まれているのでその部分は相殺されて0になります。よって
E[S_3 \mid \mathcal{F}_n] = S_n
となります。
したがって、$n$回目の試行の時点では$m>n$回目の結果が異なる状態はすべて同じ事象に含まれているので$n$回目の時点ではそれ以降の展開がどうなるかが分からなくなっています。また、増大情報系は$n$とともにどんどん細分化されています。(下図を参照)
より一般化して$N$回この試行ををやるとしたら
\begin{align}
\Omega &= \{\pm 1\}^N \\
\mathcal{F}_n &= \{ \{ (x_1,x_2,\cdots,x_n,x_{n+1},\cdots,x_N) \mid x_j &= \pm 1 \quad j=1,2,\cdots,n\} \mid x_i = \pm 1 \quad i=n+1,n+2,\cdots,N \} \\
p(\{\omega\}) &= \frac{1}{2^N}
\end{align}
のように書けます。
これは$N$回目までで区切っているので最終的に得するかどうかは途中でわかってしまいますが、$N \rightarrow \infty$として気の済むまで何回でもやっていいとなると、最終的にこのまま続けて儲かるかどうかは常にわかりません。
ざっくり言うとゲームの途中で詰んでしまったことや勝ったことが分からない確率過程になっているのがマルチンゲールです。(同じ事象に含まれる状態=どっちが起こったか分からない、というイメージです。)
逆に、例えば麻雀は1局の中で捨て牌を見れば自分がその局で作ることのできる役が途中で制限されますし、遊戯王のようなカードゲームも残りの山札次第ではもう勝ち筋がなくなってしまう状況がゲームの途中で発生しますよね。
停止時
フィルター付き確率空間において、
可測関数$\tau:\Omega \rightarrow T$が停止時であるとは、
\forall t \in T: \tau^{-1}(t) \in \mathcal{F}_t
となることです。
停止時全体の集合を
\mathfrak{T}(\Omega,\mathcal{F},p;\{\mathcal{F}_t\}_{t \in T})
と表すことにします。
停止時つきの確率過程
マルチンゲール$(X_t)_{t \in T}$に対して
X_t^{\tau}(\omega) = X_{\min(t,\tau(\omega))} = \begin{cases}
X_t(\omega) \quad (t<\tau(\omega)) \\
X_\tau(\omega) \quad(t \geq \tau(\omega))
\end{cases}
と定義します。すると、$X_t^\tau$は確率変数であり、確率過程$(X_t^\tau)_{t \in T}$を停止時で止めた確率過程と言います。
対応するσ加法族(停止時までに得られる情報)は
\mathcal{F}_\tau = \sigma\left( \bigcup_{\substack{t \in T }} \sigma(X_t^\tau) \right)
と構成できます。これは$X_t^\tau$の$\mathcal{F}_\infty$に対応しています。
イメージ
停止時はある決まった時刻というより、起こった事象に応じてやめる条件を定めたものです。$F_\tau$は条件に応じて途中でやめるということを付け加えた確率過程の増大情報系になります。いつやめるかをケースバイケースで決められるのが停止時を導入した強みです。先ほどのコインの$N=3$の例で
C(\omega) = \left\{ k \in \{1,2,3\} \mid \sum_{i=1}^k x_i <= 0 \right\} \\
\tau(\omega) = \begin{cases}
\min_{k \in C(\omega)}(k) \quad (C(\omega) \neq \varnothing) \\
\infty \quad (C(\omega) = \varnothing)
\end{cases}
つまり、初めて得た金額の合計が0以下になった時刻を停止時とします。このとき$S^\tau_i$を考えれば、停止時までに得られる情報は
\begin{align}
\mathcal{F}_\tau &= \{ \varnothing, \\
&\{(1,1,1)\}, \\
&\{(1,1,-1)\}, \\
&\{ (1,1,1), (1,1,-1), \}, \\
&\{(1,-1,1), (1,-1,-1) \}, \\
&\{ (1,1,1), (1,1,-1), (1,-1,1), (1,-1,-1) \}, \\
&\{ (-1,1,1), (-1,1,-1), (-1,-1,1), (-1,-1,-1)\}, \\
&\Omega \}
\end{align}
となります。
$\mathcal{F}_3$ ではすべての集合が均一に分裂していましたが、$\mathcal{F}_\tau$は一部の集合の分裂が途中でストップしています。これが停止時の効果です。
局所化
フィルター付き確率空間$(\Omega,\mathcal{F},p;(\mathcal{F}_t)_{t \in [0,\infty]})$上の適合する確率過程の族$\mathcal{C}$に対して局所化された確率過程の族$\mathcal{C}_{loc} \subset \mathcal{C}$を停止時の列を用いて以下のように定義します。
\begin{align}
&\{X_t\}_{t \in [0,\infty)} \in \mathcal{C}_{loc} \\
&\overset{def}{\Leftrightarrow}
\exists \{\tau_n\}_{n=1}^\infty \subset \mathfrak{T}(\Omega,\mathcal{F},p;\{\mathcal{F}_t\}_{t \in [0,\infty)}): \tau_n \xrightarrow{a.s.} \infty,
\{X_t^{\tau_n}\}_{t \in [0,\infty)} \subset \mathcal{C}
\end{align}
可積分なマルチンゲール
一様可積分性
マルチンゲール$(X_t)_{t \in [0,\infty)}$が
\lim_{K \rightarrow \infty}\sup_{t \in [0,\infty)} E[|X_t(\omega)| 1_{|X_t|>K}(\omega)] = 0
を満たすとき一様可積分であると言います。一様可積分なマルチンゲールの集合を$\mathcal{M}$と表します。
ここで定義関数は
1_{|X_t|>K}(\omega)] = \begin{cases}
1 \quad if \ |X_t|(\omega)>K \\
0 \quad otherwise
\end{cases}
です。
局所マルチンゲール
$\mathcal{M}_{loc}$を局所マルチンゲールと言います。
2乗可積分
マルチンゲール$(X_t)_{t \in [0,\infty)}$が
\sup_{t \in [0,\infty)} E[|X_t(\omega)|^2] = 0
のとき2乗可積分であると言い、2乗可積分なマルチンゲールの集合を$\mathcal{M}^2$と表します。
エルゴート性
σ加法族が定まった空間$(\Omega,\mathcal{F})$上の$\Omega$上の値をとる確率過程$(X_t:\Omega \rightarrow \Omega)_{t \in [0,\infty)}$がエルゴートであるとは、
ある$(\Omega,\mathcal{F})$上の確率測度$p$が存在して
\forall f \in \mathcal{I}(\mu): \underset{T \rightarrow \infty}{\mathrm{l.i.p.}} \frac{1}{T} \int_0^T f(X_t(\omega)) dt = \int_\Omega f(\omega) dp(\omega)
を満たすことです。このときの確率測度$p$を不変分布と言います。
参考資料
- 伊藤清「確率論」岩波書店
- 西山陽一「マルチンゲール理論による統計解析」近代科学社