はじめに
時系列データを扱う際に重要なのが「データが定常か非定常か」を判断することです。データが定常でないと、回帰分析や予測の結果が信頼できなくなります。定常性を確認するための代表的な検定が DF検定 と ADF検定 です。本記事では、この2つの違いと、ADF検定の導出手順をステップバイステップで解説します。
※この記事は、ChatGPTの出力を基に作成しています。
1. ADF検定とDF検定の違い
まず、DF検定とADF検定の共通点と違いを整理します。
共通点
どちらも「データが単位根を持つかどうか」を検定し、定常か非定常かを確認します。
- 定常:データの平均やばらつきが時間とともに変わらない状態。
- 非定常:データの平均やばらつきが時間とともに変わる状態(例:インフレによる物価の上昇)。
DF検定(ディッキー・フラー検定)
- シンプルなデータ向け。
- 自己相関(データが前の値に影響されること)を考慮しない。
ADF検定(拡張ディッキー・フラー検定)
- DF検定を拡張したもの。
- 自己相関を考慮し、より複雑なデータにも対応。
- 過去のデータ(遅れ項)を追加して、自己相関の影響を除去する。
2. ADF検定の導出手順
ADF検定は次のステップで実施します。
ステップ 1:仮説の設定
- 帰無仮説 $\ H_0 $:データは単位根を持ち、非定常である。
- 対立仮説 $\ H_1 $:データは単位根を持たず、定常である。
ステップ 2:モデルの設定
ADF検定では、次の回帰モデルを使用します。
$
\Delta y_t = \alpha + \beta t + \gamma y_{t-1} + \sum_{i=1}^p \delta_i \Delta y_{t-i} + \epsilon_t
$
- $\ \Delta y_t $:データの差分$( y_t - y_{t-1} )$
- $\ \alpha $:定数項
- $\ \beta t $:時間トレンド
- $\ \gamma y_{t-1} $:単位根の有無を調べる部分
- $ \sum_{i=1}^p \delta_i \Delta y_{t-i} $:遅れ項(自己相関を除去)
- $ \epsilon_t $:誤差項
ステップ 3:単位根検定の考え方
- 単位根がある場合:$\gamma = 0$ に近い(非定常)。
- 単位根がない場合:$\gamma < 0$(定常)。
ADF検定では、$\gamma$ が統計的に0でない(負の値)かを検定します。
ステップ 4:回帰分析の実施
-
差分を計算:元のデータから1次差分 $ \Delta y_t $ を取る。
-
遅れ項を設定:適切な遅れの数 $ p $ を選ぶ(AICやBICなどを用いる)。
-
OLS回帰:上記モデルを最小二乗法(OLS)で推定し、係数 $\gamma$ を求める。
-
t統計量を計算:$\gamma$ のt統計量を以下の式で計算します。
$
t_{\gamma} = \frac{\hat{\gamma}}{\text{標準誤差}(\hat{\gamma})}
$
ステップ 5:臨界値と比較
- t統計量の算出:ステップ4で計算した $ t_{\gamma} $ を使います。
- 臨界値表を参照:ADF検定には専用の臨界値表があり、有意水準(1%, 5%, 10%)ごとに異なります。
-
判定:
- $ t_{\gamma} $ が臨界値より小さい → 帰無仮説を棄却 → 定常。
- $ t_{\gamma} $ が臨界値より大きい → 帰無仮説を棄却できない → 非定常。
ステップ 6:結果の解釈
- 帰無仮説を棄却:データは単位根を持たず、定常である。
- 帰無仮説を棄却できない:データは単位根を持ち、非定常である。
3. まとめ:ADF検定はDF検定のパワーアップ版!
ADF検定はDF検定の拡張版であり、自己相関を考慮して複雑なデータに対応できる点が大きな違いです。導出手順では、データの差分を取って回帰分析を行い、t統計量を臨界値と比較することで定常性を検定します。
おわりに
ADF検定は時系列分析において必須の手法です。単位根の有無を正確に判定することで、データの特性を理解し、適切なモデルを構築できます。定常性の確認が必要な場合は、ぜひADF検定を使ってみてください!