はじめに
今回は、時系列データ分析の第二回ということで、時系列を解析するにあたり重要な概念となる、『定常性』についてまとめていきます。
前回の投稿で、時系列データに対する期待値や分散、自己共分散などの基本統計量の求め方を紹介しました。
しかし、一度しか観測されない時系列データに対してどのように統計量を計算するのでしょうか。
そこで活躍するのが、今回紹介する定常性という仮定になります。
定常性とは
定常性とは、期待値や分散などの基本統計量が時間によって変化しない、という性質のことである。
正確には同時分布や基本統計量の時間不変性に関する性質であり、時間に対して『何が不変なのか』によって、弱定常性と強定常性に分類される。
弱定常性
任意の$t$と$k$に対して、$$E[y_t]=\mu$$ $$Cov[y_t,y_{t-k}]=E[(y_t-\mu)(y_{t-k}-\mu)]=\gamma_k$$が成り立つ場合、その過程は弱定常(weak stationary)という。
つまり、弱定常性とは、期待値と共分散が、時点$t$には依存せず、さらには自己共分散に関しては時間差のみに依存する、ということである。
また自己相関は、$$Corr[y_t,y_{t-k}]=\frac{\gamma_{kt}}{\sqrt{\gamma_{0t}\gamma_{0,t-k}}}=\frac{\gamma_k}{\gamma_0}=\rho_k$$となり、自己相関も時点$t$に依存しない。分母に関しては、弱定常性の定義(自己共分散は時点$t$に依らず時間差のみに依存する)より、$\gamma_{0t}=\gamma_{0,t-k}=\gamma_0$となり、分子も同様。
強定常性
任意の$t$と$k$に対して、$(y_t,y_{t+1},...,y_{t+k})'$の同時分布が同一となる場合、その過程は強定常(strict stationary)という。
強定常性は弱定常性より強い概念である。
一般に、分散が有限であれば強定常性は弱定常性である。
弱定常性が強定常性であるとは限らないが、正規過程(Gaussian process) では、弱定常性を持つならば強定常性も持つとされる。これは、正規過程が期待値と分散によって完全に決定されるためである。
※正規過程:任意の$t$と$k$に対して、$(y_t,y_{t+1},...,y_{t+k})'$ の同時分布が多変量正規分布となる過程。
ホワイトノイズ
すべての時点$t$において、$$E[\epsilon_t]=0$$
$$\gamma_k=E[\epsilon_t,\epsilon_{t-k}]=
\begin{cases}
\sigma^2,&&k=0 \ 0,&&k\neq0\end{cases}$$
が成立するとき、$\epsilon_t$はホワイトノイズと呼ばれる。
定義から、明らかに弱定常性をもつことが確認できる。
時系列モデルにおいて、ホワイトノイズは 攪乱項 と呼ばれ、確率的変動という重要な役割を果たす。
シミュレート
ホワイトノイズ$\epsilon_t$を用いて、最も基礎的な弱定常過程を作成し、その動きをシミュレーションしてみる。
作成する式は以下のようなとても単純なものである。
$$y_t=\mu+\epsilon_t,\ \epsilon_t\sim W.N(\sigma^2) $$
すべての場合において、特に何の傾向もなく値が変動しているのが確認できる。(自己相関を持たない)
ホワイトノイズが時系列モデルにおいて確率的変動を表現する役割を持つことが確認できた。
また、全ての場合において、平均まわりに値をとり、分散が大きくなれば変動の幅も大きいことが見て取れる。
まとめ
今回は、時系列分析を行う上で大切な概念となる、定常性とホワイトノイズについて確認してみました。
定常性とは、時系列データが時点によらず期待値や共分散が一定であること、ホワイトノイズは時系列データの確率的変動を表せること、を今回のまとめとします。
もちろん、全ての時系列データについて定常性が確認できる訳ではありません。またホワイトノイズのみの時系列モデルで表現できる時系列データも滅多に存在しません。
今後の投稿では、定常性をどのように確認するのか、定常性が確認できなかったパターンについて、
そしてホワイトノイズを含んだ単純な時系列モデルを基にした、さらに複雑な時系列モデルについて触れていけたら、と思います。
参考文献
沖本竜義(2010) -経済・ファイナンスデータの計量時系列分析
日本統計学会 -統計学実践ワークブック(統計検定準1級対応)