Stratonovich積分はWeiner過程を使った確率過程の定義で使われる。一般的な伊藤積分による定義とは満たす性質が異なり、解や周辺分布など結果が異なる。
定義
通常の確率微分方程式(拡散過程)の記法
dX_t = b(X_t, t) dt + \sigma(X_t, t) dW_t
は、定義としては確率積分
X_t = X_0 + \int_{0}^{t} b(X_s, s) ds + \int_{0}^{t} \sigma(X_s, s) dW_s
を意味している。このWeiner過程の微小差分$dW_t$を使った積分が伊藤積分の意味で定義される場合、
\int_{0}^{t} \sigma(X_t, t) dW_t = \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \sigma(X_{t_k}, t_k) (W_{t_{k+1}} - W_{t_k})
と定義される。ただし、$\Delta = \sup_{k} (t_{k+1} - t_{k})$。
重要なのは被積分関数の$\sigma(X_{t_k}, t_k)$が各区間$[t_k, t_{k+1}]$の範囲の左端で評価されている点である。
確率積分がStratonovich積分の場合、
\begin{eqnarray}
dX_t &=& b(X_t, t) dt + \sigma(X_t, t) \circ dW_t \\
X_t &=& X_0 + \int_{0}^{t} b(X_s, s) ds + \int_{0}^{t} \sigma(X_s, s) \circ dW_s
\end{eqnarray}
と表記され、
\int_{0}^{t} \sigma(X_t, t) \circ dW_t = \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \sigma \left( X_{\frac{t_k + t_{k+1}}{2}}, \frac{t_k + t_{k+1}}{2}\right) (W_{t_{k+1}} - W_{t_k})
と定義される。
Stratonovich積分ではWeiner過程の微小差分$dW_t$を使った積分は、被積分関数は時刻各区間$[t_k, t_{k+1}]$の範囲の中点で評価される。
確率的でない通常の変数の積分では、非積分関数がリーマン可積分なら左端評価と中点評価は同じ値になる。つまり、例えばドリフト項$b(X_t, t)$の積分は、
\lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} b(X_{t_k}, t_k) (t_{k+1} - t_k) = \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} b \left( X_{\frac{t_k + t_{k+1}}{2}}, \frac{t_k + t_{k+1}}{2}\right) (t_{k+1} - t_k)
であり、伊藤積分(左端評価)とStratonovich積分(中点評価)との間で定義による違いはない。
Weiner過程の微小差分$dW_t$を使った積分では、左端評価と中点評価の収束先は異なる場合がある。そのため、確率積分をどう定義するか注意を払う必要がある。
伊藤積分とStratonovich積分の収束先が異なる例
$W_t$は時刻$t=0$では確率$1$で$0$、つまり$W_0=0$とする。
\begin{eqnarray}
\int_{0}^{t} W_s d W_s &=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} W_{t_k} (W_{t_{k+1}} - W_{t_k}) \\
&=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \frac{W_{t_{k+1}}^2 - W_{t_k}^2 - (W_{t_{k+1}} - W_{t_k})^2}{2}\\
&=& \frac{1}{2} W_t^2 - \frac{1}{2} W_0^2 - \frac{1}{2} \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} (W_{t_{k+1}} - W_{t_k})^2 \\
&=& \frac{1}{2} W_t^2 - \frac{t}{2} \\
\int_{0}^{t} W_s \circ d W_s &=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} W_{\frac{t_k + t_{k+1}}{2}} (W_{t_{k+1}} - W_{t_k}) \\
&=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} W_{\frac{t_k + t_{k+1}}{2}} \left\{(W_{t_{k+1}} - W_{\frac{t_k + t_{k+1}}{2}}) - (W_{t_{k}} - W_{\frac{t_k + t_{k+1}}{2}})\right\} \\
&=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \frac{W_{t_{k+1}}^2 - W_{\frac{t_k + t_{k+1}}{2}}^2 - (W_{t_{k+1}} - W_{\frac{t_k + t_{k+1}}{2}})^2}{2} \\
&& - \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \frac{W_{t_{k}}^2 - W_{\frac{t_k + t_{k+1}}{2}}^2 - (W_{t_{k}} - W_{\frac{t_k + t_{k+1}}{2}})^2}{2} \\
&=& \frac{1}{2} W_t^2 - \frac{1}{2} W_0 \\
&& - \frac{1}{2} \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1}\left\{(W_{t_{k+1}} - W_{\frac{t_k + t_{k+1}}{2}})^2 - (W_{t_{k}} - W_{\frac{t_k + t_{k+1}}{2}})^2\right\} \\
&=& \frac{1}{2} W_t^2
\end{eqnarray}
となり、$W_t$を被積分関数とする確率積分で伊藤積分とStratonovich積分では$\frac{t}{2}$の違いがある。Stratonovich積分は通常の非確率的な変数の積分$\int_0^t s ds=\frac{1}{2} t^2$と同じ形式になるが、伊藤積分ではそれを補正する項$-\frac{t}{2}$が生じている。
伊藤積分とStratonovich積分の離散化の違い
伊藤積分は時刻$t_k$から時刻$t_{k+1}$へのノイズ項が時刻$t_k$における$X_{t_k}$と、時刻$t_k$以前とは独立な正規分布$W_{t_{k+1}} - W_{t_k}$で決まるという単純なモデルであり、時刻$t$における状態で条件づけた時刻$t$より後の分布が時刻$t$より前と独立になるというマルコフ性が成立する。それゆえに、自然に一次の離散化シミュレーションのEular-Maruyamaスキームが使用できる。
X_{t_{k+1}} = X_{t_k} + b(X_{t_k}, t) (t_{k+1} - t_k) + \sigma(X_{t_k}, t) \sqrt{t_{k+1} - t_k} \varepsilon_{t_k}, \; \varepsilon_{t_k} \sim N(0, 1)
Stratonovich積分では、時刻$t_k$から時刻$t_{k+1}$を求める際に時刻$\frac{t_k + t_{k+1}}{2}$の値が必要になる。この値は時刻$t_k$では本来得られないので、単純にシミュレーションすることはできない。伊藤積分に変換してからシミュレーションすることになる。
変数変換
伊藤積分で定義された確率微分方程式では、変数変換で通常の微分のchain ruleは成り立たない。
Y_t = g(X_t, t)
となる滑らかな関数$g$で変数変換する場合、$Y_t$が満たす確率微分方程式は、
d Y_t = \partial_t g(X_t, t) dt + \partial_x g(X_t, t) dX_t + \frac{1}{2} \partial_{xx} g(X_t, t) (dX_t)^2
となる。ここでは、$g(\cdot, \cdot)$の$X_t$依存の表現に用いている第一引数の偏微分を$\partial_x$、$t$依存の表現に用いている第二引数の偏微分を$\partial_t$で記述している。$\partial_{xx}$は$X_t$依存の表現に用いている第一引数の二階の偏微分である。$\partial_x g(X_t, t)$で$g$を第一引数に関して偏微分した偏導関数の$(X_t, t)$における値を表現している。
最後の$dX_t$の二次の項が残る。この二次の項は$dX_t$の確率微分方程式の二乗を展開して伊藤ルール
dt^2=0, \; dt dW_t = 0, \; (dW_t)^2 = dt
で整理することで、$dt, dW_t$の項に整理できる。確率微分方程式を整理すると、
\begin{eqnarray}
dY_t &=& \left(\partial_t g(X_t, t) + \partial_x g(X_t, t) b(X_t, t) + \frac{1}{2} \partial_{xx} g(X_t, t) (\sigma(X_t, t))^2\right) dt \\
&& + \partial_x g(X_t, t)\sigma(X_t, t) dW_t
\end{eqnarray}
となる。
Stratonovich積分ではこの二次の項は現れず、
d Y_t = \partial_t g(X_t, t) dt + \partial_x g(X_t, t) \circ dX_t
になる。通常のchain ruleが成り立つことになり、変数変換において非常に扱いやすい。変数変換、つまり座標変換で同じ形式が保存されるので多様体上の確率過程、確立分布のダイナミクスを考える際はStratonovich積分で定義するのが便利である。
導出は後述。
Stratonovich積分と伊藤積分との間の変換
Stratonovich積分と伊藤積分の確率微分方程式は一意に対応し、相互に変換できる。変換公式を導出する。
$t_k$と$t_{k+1}$の中点を$t_k^*$、$\Delta t_k=t_{k+1} - t_k, \Delta W_k = W_{t_{k+1}} - W_{t_k}$とする。$t_k^{*} = t_k + \Delta t_k / 2$である。
Stratonovich積分は
\int_{0}^{t} \sigma(X_t, t) \circ dW_t = \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \sigma \left( X_{t_k^*}, t_k^*\right) \Delta W_k
である。$\sigma ( X_{t_k^{*}}, t_k^{*} )$を$(X_{t_k}, t_k)$を中心にTaylor展開する。
\begin{eqnarray}
\sigma \left( X_{t_k^*}, t_k^* \right) &=& \sigma \left( X_{t_k}, t_k \right) + \partial_t \sigma \left( X_{t_k}, t_k \right) \frac{\Delta t_k}{2} + \partial_x \sigma \left( X_{t_k}, t_k \right) \left( X_{t_k^*} - X_{t_k} \right) \\
&& + o\left(\Delta t_k^2 + (X_{t_k^*} - X_{t_k})^2\right)
\end{eqnarray}
ここで、$X_{t_k^*} - X_{t_k}$を伊藤積分で評価すると、
X_{t_k^*} - X_{t_k} = \int_{t_k}^{t_k^*} b(X_s, s) ds + \int_{t_k}^{t_k^*} \sigma(X_s, s) dW_s
であり、オーダーとしては第一項は$\Delta t_k$、第二項が$\Delta W_k$である。
分割$\Delta \rightarrow 0$の極限でオーダーとして$(\Delta W)^2 \rightarrow \Delta t$となる。Stratonovich積分の評価で$\Delta W_k$をかけて和をとる過程で、$\Delta t_k$よりも高次の微小量は$0$に収束するため、残るのは、
\begin{eqnarray}
\lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \sigma \left( X_{t_k^*}, t_k^*\right) \Delta W_k &=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \sigma \left( X_{t_k}, t_k \right) \Delta W_k \\
&& + \frac{1}{2} \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \partial_x \sigma \left( X_{t_k}, t_k \right)\sigma(X_t, t) (\Delta W_t)^2
\end{eqnarray}
となる。
第一項は左端評価で定義された伊藤積分そのものであり、第二項は$(\Delta W_t)^2$が極限で$\Delta t_k$となるので、非確率的な$t$に関しての通常の積分として扱うことができ、
\int_{0}^{t} \sigma(X_s, s) \circ dW_s = \int_{0}^{t} \sigma(X_s, s) dW_s + \frac{1}{2} \int_{0}^{t} \partial_x \sigma \left( X_{s}, s \right) \sigma \left( X_{s}, s \right)ds
となる。
第二項についてここでは
\int_{t_k}^{t_k^*} \sigma(X_t, t) dW_t = \frac{1}{2} \sigma\left( X_{t_k}, t_k \right) \Delta W_t
として左端評価で近似しているが、この部分は最終的に非確立的な$t$での積分になるので、区間$[t_k, t_{k+1}]$のどこで評価しても同じ値に収束する。
したがって、Stratonovich積分の意味で定義された確率微分方程式
dX_t = b(X_t, t) dt + \sigma(X_t, t) \circ dW_t
は、伊藤積分で定義された確率微分方程式
dX_t = \left( b(X_t, t) + \frac{1}{2} \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) \right) dt + \sigma(X_t, t) dW_t
と等しい。
Stratonivich積分の変数変換導出
Stratonivich積分で定義された確率微分方程式
dX_t = b(X_t, t) dt + \sigma(X_t, t) \circ dW_t
と
Y_t = g(X_t, t)
にしたがって$dY_t$を求める。
まず、Stratonivich積分で定義された確率微分方程式は伊藤積分で
dX_t = \left( b(X_t, t) + \frac{1}{2} \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) \right) dt + \sigma(X_t, t) dW_t
と表せるので、伊藤積分の変数変換から、
\begin{eqnarray}
dY_t &=& \partial_t g(X_t, t)dt + \partial_x g(X_t, t) \left( b(X_t, t) + \frac{1}{2} \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) \right) dt \\
&& + \frac{1}{2} \partial_x^2 g(X_t, t) (\sigma(X_t, t))^2 dt + \partial_x g(X_t, t)\sigma(X_t, t) dW_t \\
&=& \partial_t g(X_t, t)dt + \partial_x g(X_t, t) b(X_t, t) dt \\
&& + \frac{1}{2}\left(\partial_x g(X_t, t) \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) + \partial_{xx} g(X_t, t) (\sigma(X_t, t))^2 \right) dt\\
&& + \partial_x g(X_t, t)\sigma(X_t, t) dW_t
\end{eqnarray}
となる。
一方、$X_t$についてのStratonovich積分が上述のTaylor展開から$\Delta t_k$より高次の項を削除する操作と同様の操作により、
\begin{eqnarray}
\int_{0}^{t} \partial_x g(X_s, s) \circ d X_s &=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \partial_x g \left( X_{t_k^*}, t_k^*\right) \Delta X_k \\
&=& \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \partial_x g \left( X_{t_k}, t_k\right) \Delta X_k \\
&& + \frac{1}{2} \lim_{\Delta \rightarrow 0} \sum_{k=0}^{N-1} \partial_{xx} g(X_{t_k}, t_k) (\Delta X_k)^2 \\
&=& \int_{0}^{t} \partial_x g(X_s, s) d X_s + \frac{1}{2} \int_{0}^{t} \partial_{xx} g(X_s, s) (\sigma \left( X_{s}, s \right))^2 ds
\end{eqnarray}
であるから、
\begin{eqnarray}
&& \partial_x g(X_t, t) \circ d X_t \\
&=& \partial_x g(X_t, t) d X_t + \frac{1}{2} \partial_{xx} g(X_t, t) (\sigma \left( X_{t}, t \right))^2 dt \\
&=& \partial_x g(X_t, t) \left(\left( b(X_t, t) + \frac{1}{2} \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) \right) dt + \sigma(X_t, t) dW_t\right) \\
&& + \frac{1}{2} \partial_{xx} g(X_t, t) (\sigma \left( X_{t}, t \right))^2 dt \\
&=& \partial_x g(X_t, t) b(X_t, t) dt \\
&& + \frac{1}{2}\left(\partial_x g(X_t, t) \partial_x \sigma \left( X_{t}, t \right) \sigma \left( X_{t}, t \right) + \partial_{xx} g(X_t, t) (\sigma(X_t, t))^2 \right) dt\\
&& + \partial_x g(X_t, t)\sigma(X_t, t) dW_t
\end{eqnarray}
となる。
したがって、
dY_t = \partial_t g(X_t, t)dt + \partial_x g(X_t, t) \circ d X_t
が成り立つ。Stratonovich積分で定義される確率微分方程式の解$X_t, Y_t$について、通常の変数と同様のchain ruleと同じ形式の変数変換ルールが成立している。