LoginSignup
3
1

More than 3 years have passed since last update.

ARIMAモデルを導出したい

Last updated at Posted at 2021-05-01

はじめに

ARIMAモデルは,メジャーな時系列モデルであるにも関わらず,モデル式を数式で説明している日本語の文献は少ない.
多くの文献では,ARモデルやMAモデル,ARMAモデルまでの説明はあるが,ARIMAモデルになると途端に説明が少なくなる.
SARIMAモデルになるとさらに少なくなる.Wikipediaですら,ARMAモデルまでは詳しく書いてあるが,ARIMAモデルから説明が少なくなる.
詳しい導出はどこかの本に書いているのかしれないが,インターネットで検索する範囲では簡単には見つからなかった.
インターネットで公開されているブログ記事では誤った情報も散見された.
英語の論文や海外の大学の講義資料などに断片的な情報はあるが,「これだけ見れば良い」という文献はあまりなかった.
そこで,この分野は全くの素人ではあるが,自分で導出してみることにした.(私も間違えた情報を書いているかもしれない.)
もし有用な本や記事があれば頂きたく思います.また,記事の査読や誤植などに対するコメントを頂ければ幸いです.

続編(SARIMAモデルを導出したい)を書きました.

結論

たくさん予防線を張ったところで,結論を書く.
この記事のゴールは,ある時刻$t$の時系列データ$y_t$を,過去の時系列データ$y_{t-1}, y_{t-2}, \cdots, y_{t-N}$を用いて書くことである.
結論として,ARIMA$(p,d,q)$モデルは以下の式で書ける.(自分で導出したので,あっている確証はない.)

\begin{eqnarray}
    y_{t} = \sum_{i=1}^p \phi_i y_{t-i} - \sum_{k=1}^d (-1)^{k} \binom dk y_{t-k} + \sum_{i=1}^p \sum_{k=1}^d (-1)^{k} \binom dk \phi_i y_{t-i-k} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}

【追記】以下のようにシンプルにできるとコメントを頂きました(ありがとうございます)

\begin{eqnarray}
    y_{t} = \sum_{i=1}^p \sum_{k=0}^d (-1)^{k} \binom dk \phi_i y_{t-i-k} - \sum_{k=1}^d (-1)^{k} \binom dk y_{t-k} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t} 
\end{eqnarray}

この記事では一貫して,ベースライン$c=0$とする.
導出してみて分かったが,なぜARIMAモデルの説明が少ないか考えてみると,説明が面倒だからだと思われる.
あとで記載するオペレータを用いた形式であれば,教科書などの紙面を抑えることができるので,わざわざ$y_t = ...$の形式で書く必要もないのだろう.
この式の説明をするためには,ARモデルから順に説明する必要がある.

ARモデル

  • AR$(p)$の式を以下に示す.
\begin{eqnarray}
y_{t} = \sum_{i=1}^{p} \phi_{i} y_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • ここで,$p$はorder,$\phi_i$はARモデルを決めるパラメータ,$\varepsilon_{t}$は$y_{t}$に依存しないノイズとする.例えば,平均0,分散1の正規分布を用いる.

MAモデル

  • MA$(q)$の式を以下に示す.
\begin{eqnarray}
y_{t} = \varepsilon_{t} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i}
\end{eqnarray}
  • ここで,$q$はorder,$\theta_i$はMAモデルを決めるパラメータとする.
  • この記事では,$\theta_i > 0$とするため,$(-\theta_{i})$で記載しているが,$\theta_i < 0$とするならば,$(\theta_{i})$で書ける.

ARMAモデル

  • ARMA$(p,q)$の式を以下に示す.
\begin{eqnarray}
    y_{t} = \sum_{i=1}^{p} \phi_{i} y_{t-i} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}

ARIMAモデル

  • ARIMA$(p,d,q)$モデルの式は,ARMA$(p,q)$と$y_{t}$の差分を用いて定義できる.
\begin{eqnarray}
    y^{(d)}_{t} = \sum_{i=1}^{p} \phi_{i} y^{(d)}_{t-i} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • ここで,$d$次の$y_{t}$の差分を以下で定義する.
\begin{eqnarray}
    y^{(d)}_{t} := y^{(d-1)}_{t} - y^{(d-1)}_{t-1}
\end{eqnarray}
  • 1次と2次の差分を以下で定義する.
\begin{eqnarray}
    y^{(1)}_{t} &:=& y_{t} - y_{t-1} \\
    y^{(2)}_{t} &:=& y^{(1)}_{t} - y^{(1)}_{t-1} = (y_{t} - y_{t-1}) - (y_{t-1} - y_{t-2}) = y_{t} - 2y_{t-1} + y_{t-2}
\end{eqnarray}
  • ここで$d$次の差分が以下で書けることに瞬時に気づけば,ARIMAモデルの導出は問題ない(無理)
\begin{eqnarray}
    y^{(d)}_{t} = \sum_{k=0}^d \binom dk (-1)^k y_{t-k} 
\end{eqnarray}
  • これを用いれば,代入して整理すればよい.
\begin{eqnarray}
    \sum_{k=0}^d \binom dk (-1)^k y_{t-k} = \sum_{i=1}^{p} \phi_{i} \sum_{k=0}^d \binom dk (-1)^k y_{t-i-k} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • ただし,問題は両辺に$y_{t-k}$に関する項が出てくるので,式変形が大変.
  • 便利な略式記号(作用素・オペレータなどと呼ばれる)を定義することで,式変形を簡単にできる(ただし簡単とは言っていない)

後退オペレータ (Backshift operator)

  • Backward shift operator $B$を定義する(別名 Lag operator $L$)
\begin{eqnarray}
    B y_{t} &:=& y_{t-1} \\
    B^k y_{t} &:=& y_{t-k}
\end{eqnarray}
  • このオペレータを使用すると,差分を以下のように書ける.
\begin{eqnarray}
    y^{(1)}_{t} &=& y_{t} - y_{t-1} = y_{t} - B y_{t} = (1-B) y_{t} \\
    y^{(2)}_{t} &=& y_{t} - 2y_{t-1} + y_{t-2} = (1 - 2B + B^2) y_{t} = (1 - B)^2 y_{t}
\end{eqnarray}
  • $n$次の差分が以下で書ける(証明略)
\begin{eqnarray}
    y^{(n)}_{t} = (1 - B)^n y_{t}
\end{eqnarray}
  • 以下のような書き方ができる.
\begin{eqnarray}
    (1 - B)(1 - B^m) y_{t} &=& (1 - B - B^m + B^{m+1}) y_{t} \\
         &=& y_{t} - y_{t-1} - y_{t-m} + y_{t-m-1}
\end{eqnarray}

差分作用素 (Difference operator)

  • もう一つオペレータを定義する.
  • 差分作用素$\nabla$を以下のように定義する.
\begin{eqnarray}
    \nabla y_t &:=& y_t - y_{t-1} \\
    \nabla^n y_t &:=& y^{(n)}_{t} = y^{(n-1)}_{t} - y^{(n-1)}_{t-1}
\end{eqnarray}
  • 差分作用素$\nabla$は後退オペレータ$B$で書ける.
\begin{eqnarray}
    \nabla y_t &=& y_t - y_{t-1} = (1 - B) y_t
\end{eqnarray}
  • 二項定理の展開式を示す.
\begin{eqnarray}
    (x+y)^n = \sum_{k=0}^n \binom nk x^{n-k}y^k \\
    (1-B)^n = \sum_{k=0}^n \binom nk (-B)^k
\end{eqnarray}
  • 展開式を用いて,差分作用素を式変形する.
\begin{eqnarray}
    \nabla^n y_t = (1 - B)^n y_{t} = \left\{ \sum_{k=0}^n \binom nk (-B)^k \right\} y_t = \sum_{k=0}^n \binom nk (-1)^k y_{t-k}
\end{eqnarray}

オペレータ形式のARMAモデル

  • オペレータでARMAモデルを書き直してみる.
  • オペレータを用いるとモデル式が簡単に書けることを示す.

ARモデル

  • AR$(p)$の式を再掲する.
\begin{eqnarray}
    y_{t} = \sum_{i=1}^{p} \phi_{i} y_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • AR$(p)$ operator を以下で定義する.
\begin{eqnarray}
    \phi_p (B) := 1 - \phi_1 B - \phi_2 B^2 - \cdots - \phi_p B^p 
\end{eqnarray}
  • オペレータに$y_t$を作用させる.
\begin{eqnarray}
    \phi_p (B) y_{t} &=& y_{t} - \phi_1 y_{t-1} - \phi_2 y_{t-2} - \cdots - \phi_p y_{t-p} \\
    &=& y_{t} - \sum_{i=1}^{p} \phi_{i} y_{t-i} \\
    &=& \varepsilon_{t}
\end{eqnarray}
  • ARモデルはAR$(p)$ operator を用いて以下の式で書ける.
\begin{eqnarray}
    \phi_p (B) y_{t} = \varepsilon_{t}
\end{eqnarray}

MAモデル

  • MA$(q)$の式を再掲する.
\begin{eqnarray}
    y_{t} = \varepsilon_{t} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i}
\end{eqnarray}
  • MA$(q)$ operator を以下で定義する.
\begin{eqnarray}
    \theta_q (B) := 1 - \theta_1 B - \theta_2 B^2 - \cdots - \theta_q B^q
\end{eqnarray}
  • オペレータに$\varepsilon_t$を作用させる.
\begin{eqnarray}
    \theta_q (B) \varepsilon_{t} &=& \varepsilon_{t} - \theta_1 \varepsilon_{t-1} - \theta_2 \varepsilon_{t-2} - \cdots - \theta_p \varepsilon_{t-p} \\
    &=& \varepsilon_{t} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} \\
    &=& y_{t}
\end{eqnarray}
  • MAモデルはMA$(q)$ operator を用いて以下の式で書ける.
\begin{eqnarray}
    y_{t} = \theta_q (B) \varepsilon_{t}
\end{eqnarray}

ARMAモデル

  • ARMA$(p,q)$の式を再掲する.
\begin{eqnarray}
    y_{t} = \sum_{i=1}^{p} \phi_{i} y_{t-i} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • ARMAモデルは operator を用いて以下の式で書ける.
\begin{eqnarray}
    y_{t} = \left\{ y_{t} - \phi_p (B) y_{t} \right\} + \theta_q (B) \varepsilon_{t} \; \Leftrightarrow \; \phi_p (B) y_{t} = \theta_q (B) \varepsilon_{t}
\end{eqnarray}

準備

  • 後で使う式変形を一般的な形式で書く.
  • 2つのオペレータを定義する.
\begin{eqnarray}
    a_N (B) &=& 1 - a_1 B - a_2 B^2 - \cdots - a_N B^N \\
    b_M (B) &=& 1 - b_1 B - b_2 B^2 - \cdots - b_M B^M
\end{eqnarray}
  • ここで,$a_0 = -1$,$b_0 = -1$とすると,以下のように書ける.
\begin{eqnarray}
    a_N (B) &=& 1 - \sum_{i=1}^N a_i B^i = \sum_{i=0}^N (-a_i) B^i \\
    b_M (B) &=& 1 - \sum_{j=1}^M b_j B^j = \sum_{j=0}^M (-b_j) B^j 
\end{eqnarray}
  • 2つのオペレータの積は以下のように書ける.
\begin{eqnarray}
    a_N (B) b_M (B) = \sum_{i=0}^N \sum_{j=0}^M (-a_i) (-b_j) B^{i+j} = \sum_{i=0}^N \sum_{j=0}^M a_i b_j B^{i+j} 
\end{eqnarray}
  • 和のスタートを変える式変更を示す(後で使う)
\begin{eqnarray}
    a_N (B) b_M (B) &=& \sum_{i=0}^N \sum_{j=0}^M (-a_i) (-b_j) B^{i+j} \\
    &=& (-a_0) (-b_0) + \sum_{i=1}^N (-a_i) (-b_0) B^{i} + \sum_{j=1}^M (-a_0) (-b_j) B^{j} \\
    &+& \sum_{i=1}^N \sum_{j=1}^M (-a_i) (-b_j) B^{i+j} \\
    &=& 1 + \sum_{i=1}^N (-a_i) B^{i} + \sum_{j=1}^M (-b_j) B^{j} + \sum_{i=1}^N \sum_{j=1}^M (-a_i) (-b_j) B^{i+j} 
\end{eqnarray}
  • $(-a_i)$のまま計算した理由は,係数の関係を分かりやすくするためである.
  • オペレータ$\alpha_N (B)$,$\beta_M (B)$と関数$f(\cdot)$,$g(\cdot)$に対して,オペレータの積が以下のように書ける.(予想)
\begin{eqnarray}
    \alpha_N (B) &=& \sum_{i=0}^N f(\alpha_i) B^i \\
    \beta_M (B) &=& \sum_{j=0}^M g(\beta_j) B^j \\
    \alpha_N (B) \beta_M (B) &=& \sum_{i=0}^N \sum_{j=0}^M f(\alpha_i) g(\beta_j) B^{i+j}
\end{eqnarray}

ARIMAモデルの式を導出する

  • ARIMA$(p,d,q)$モデルの途中式を再掲する.
\begin{eqnarray}
    y^{(d)}_{t} = \sum_{i=1}^{p} \phi_{i} y^{(d)}_{t-i} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • 上記の式は,ARMA$(p,q)$に$y_t$に差分作用素を作用させていることになるので,以下の式と同値である.
\begin{eqnarray}
    \phi_p (B) (1 - B)^d y_{t} = \theta_q (B) \varepsilon_{t}
\end{eqnarray}
  • 左辺を計算する.
\begin{eqnarray}
    \phi_p (B) (1 - B)^d y_{t} &=& \left\{ \sum_{i=0}^p (-\phi_i) B^{i} \right\} \left\{ \sum_{k=0}^d \binom dk (-B)^{k} \right\} y_{t} \\
    &=& \sum_{i=0}^p \sum_{k=0}^d \left\{ (-1)^{k} \binom dk (-\phi_i) \right\} y_{t-i-k}  \\
    &=& y_t + \sum_{i=1}^p (-\phi_i) y_{t-i} + \sum_{k=1}^d (-1)^{k} \binom dk y_{t-k} + \sum_{i=1}^p \sum_{k=1}^d \left\{ (-1)^{k} \binom dk (-\phi_i) \right\} y_{t-i-k} \\
    &=& y_t - \sum_{i=1}^p \phi_i y_{t-i} + \sum_{k=1}^d (-1)^{k} \binom dk y_{t-k} - \sum_{i=1}^p \sum_{k=1}^d \left\{ (-1)^{k} \binom dk \phi_i \right\} y_{t-i-k} 
\end{eqnarray}
  • 上式の3行目では,和のスタートを変えた.
  • スタートを変える理由は式から$y_t$の項を独立させるためである.
  • 右辺を計算し,$y_t$以外を移行して整理すると,結論で述べた式が導ける.
\begin{eqnarray}
    y_{t} = \sum_{i=1}^p \phi_i y_{t-i} - \sum_{k=1}^d (-1)^{k} \binom dk y_{t-k} + \sum_{i=1}^p \sum_{k=1}^d \left\{ (-1)^{k} \binom dk \phi_i \right\} y_{t-i-k} + \sum_{i=1}^{q} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}

具体例で検算する

  • 2通りの方法でARIMA$(2,1,1)$を導出し,式が一致することを確かめる.
\begin{eqnarray}
    \phi_2 (B) (1 - B) y_{t} = \theta_1 (B) \varepsilon_{t}
\end{eqnarray}
\begin{eqnarray}
    y_{t} = \sum_{i=1}^2 \phi_i y_{t-i} - \sum_{k=1}^1 (-1)^{k} \binom 1k y_{t-k} + \sum_{i=1}^2 \sum_{k=1}^1 \left\{ (-1)^{k} \binom 1k \phi_i \right\} y_{t-i-k} + \sum_{i=1}^{1} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t}
\end{eqnarray}
  • まずは,オペレータ形式から求める.
\begin{eqnarray}
    && \phi_2 (B) (1 - B) y_{t} = \theta_1 (B) \varepsilon_{t} \\
    & \Leftrightarrow & (1 - \phi_1 B - \phi_2 B^2) (1 - B) y_{t} = (1 - \theta_1 B) \varepsilon_{t} \\
    & \Leftrightarrow &(1 - \phi_1 B - \phi_2 B^2 - B + \phi_1 B^2 + \phi_2 B^3) y_{t} = (1 - \theta_1 B) \varepsilon_{t} \\
    & \Leftrightarrow &\left\{ 1 - (1 + \phi_1) B + (\phi_1 - \phi_2) B^2 + \phi_2 B^3 \right\} y_{t} = (1 - \theta_1 B) \varepsilon_{t} \\
    & \Leftrightarrow &y_{t} = (1 + \phi_1) y_{t-1} - (\phi_1 - \phi_2) y_{t-2} - \phi_2 y_{t-3} + \varepsilon_{t} - \theta_1 \varepsilon_{t-1}
\end{eqnarray}
  • 次に,導出した式から求める.
\begin{eqnarray}
    && y_{t} = \sum_{i=1}^2 \phi_i y_{t-i} - \sum_{k=1}^1 (-1)^{k} \binom 1k y_{t-k} + \sum_{i=1}^2 \sum_{k=1}^1 \left\{ (-1)^{k} \binom 1k \phi_i \right\} y_{t-i-k} + \sum_{i=1}^{1} (-\theta_{i}) \varepsilon_{t-i} + \varepsilon_{t} \\
    & \Leftrightarrow & y_{t} = \phi_1 y_{t-1} + \phi_2 y_{t-2} - (-1) y_{t-1} + \sum_{i=1}^2 (-1) \phi_i y_{t-i-1} - \theta_{i} \varepsilon_{t-1} + \varepsilon_{t} \\
    & \Leftrightarrow & y_{t} = \phi_1 y_{t-1} + \phi_2 y_{t-2} + y_{t-1} - \phi_1 y_{t-2} - \phi_2 y_{t-3} - \theta_{i} \varepsilon_{t-1} + \varepsilon_{t} \\
    & \Leftrightarrow & y_{t} = (1 + \phi_1) y_{t-1} - (\phi_1 - \phi_2) y_{t-2} - \phi_2 y_{t-3} + \varepsilon_{t} - \theta_{i} \varepsilon_{t-1} 
\end{eqnarray}
  • 2つの式は一致した.

次回

  • SARIMAモデル編でお会いしましょう
3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1