1. はじめに
この記事は Market API Advent Calendar 2025 のシリーズ2の23日目の記事です。
はじめまして。
マケデコのアドカレ初参加ということでお手柔らかにお願いします。
今回はスコア駆動モデルという時系列モデルについて、その概要を覗いてみようというのが趣旨です。スコア駆動モデルと聞いて、ほとんどの人が「そんなモデル知らん」と思ったのではないでしょうか。実際、時系列分析の中では若干マイナー寄りで、現状は市民権を得ているとは言い難く、2025年12月時点では日本語解説は皆無でした。(私のリサーチ不足の可能性もあります。)
なぜそのようなモデルを取り上げるかというと、ボラティリティの時系列モデリングと親和性が高く、実際に計量ファイナンス分野ではそれなりに論文が生産されているという実績もあり、日本語記事が無いならこの機会にと思ったからです。
この記事では代表的なボラティリティの時系列モデルであるGARCHモデルと確率的ボラティリティモデル(以下、SVモデル)に触れながら、スコア駆動モデルの概要を解説します。
2. 時変パラメータモデルの分類
まずはGARCHモデルとSVモデルについて眺めていこうと思います。
両モデルはボラティリティの時間変動をモデリングしたものになりますが、その違いはCox(1981)による時変パラメータモデルの分類で整理できます。
■Observation-driven(観測駆動モデル)
時点$t$のパラメータは 過去の観測値の決定関数で更新され、「(過去のデータが与えられれば)完全に予測可能」なモデル。
例:GARCHモデル
長所:尤度が解析的に評価しやすく、最尤推定で軽量に推定できることが多い。また、予測にかかる計算コストはほぼ無視できる範囲。
短所:予測の精度は決定関数の設計に依存し、恣意的なモデリングになることが多く、データによっては予測値が暴れるケースも。また、時変パラメータ自体の不確実性を評価できない。
■Parameter-driven(パラメータ駆動モデル)
時変パラメータ自身に固有のイノベーション(潜在変数の誤差)が入るモデル。状態空間モデルがこれに相当。
例:SVモデル
長所:柔軟なモデリングが可能で、時変パラメータの不確実性が評価できる。欠損データがあっても対処できたり、モデル運用上の柔軟性もある。
短所:線形ガウス状態空間モデルを除き、パラメータ(固定、時変)の推定が難しくなりがち。バッチ推定ならMCMC、オンラインでの時変パラメータ推定なら粒子フィルタと、乱数シミュレーションが必要になることが多く、運用コストは高くつく傾向がある。
一長一短があってどちらを使えばよいのか迷いますよね。
GARCH、SVモデルに焦点を当てると、SVモデルのほうが性能が良いことがほとんどです。ただ、SVモデルは推定・運用コストが高く、例えばTOPIX 500の全銘柄のボラティリティやVaR/ESを日次で監視するといったことには不向きです。現代の計算資源を使えば可能ではありますが、オンライン(日次)でのボラティリティ推定に不可欠な粒子フィルタは縮退と呼ばれる性能劣化を起こすことがあり、メンテナンスコストは無視できないでしょう。(ESSと呼ばれる指標をモニタリングすることになります。)これを個人で運用するとなると、なかなか骨が折れると思います。
一方でGARCHモデルは軽量で、一度パラメータを推定してしまえばExcelでも運用可能ですが、性能面ではSVモデルにほぼ勝てません。また、ボラティリティ決定関数の設計を変えた派生モデルがいくつもに存在することによってモデル選択もほぼ必須ですし、外れ値(大きな変動)がデータとして入ってきた場合にボラティリティの予測値が吹き飛ぶということもありえます。
結局は自分の運用スタイルや計算資源の制約内で決めることにはなるのですが、両者の良いとこどりした「ちょうど良いモデル」があると嬉しいですよね、ということで生み出されたのがScore-driven(スコア駆動モデル)という枠組みです。次節で詳しく見て行きましょう。
3. Score-driven(スコア駆動モデル)とは
スコア駆動モデルはCreal, Koopman, Lucas (2013) と Harvey (2013)がそれぞれ(独立に)提唱したモデルです。ほぼ同じモデルなのですが、前者がGeneralized Autoregressive Score(GAS)、後者がDynamic Conditional Score(DCS)と名付けたことによって呼称がややこしいことになっています。(DCSはHarvey and Chakravarty (2008)で使われた手法を再定義したものになっています。)
KoopmanとHarveyは時系列分析、特に状態空間モデルの大御所で、HarveyはSVモデルの専門家でもあります。(念のため書いておくと、Koopman作用素のKoopmanではありません。)
両者が状態空間モデルを経てスコア駆動モデルを提案したというのは非常に示唆的で、開発動機は状態空間モデル(特にSVモデル)の推定の重さにあることは論文を読めば明白です。(Harvey (2013)はボラティリティモデリングに関するものですし。)
被引用数は2025年12月時点でそれぞれ1239と789で、この分野ではかなり多いほうです。
では実際にその中身を見て行きましょう。本記事ではGASモデルで使われる式をベースとし、以下はGASモデルの呼称で統一します。
時刻 $t$ における観測ベクトルを $y_t$、これまでの情報集合を $\mathcal{F}_{t-1}$ とします。観測値は、時変パラメータベクトル $f_t$ に依存する条件付き確率密度関数 $p$ に従うと仮定します。
$$y_t \sim p(y_t | f_t, \mathcal{F}_{t-1}; \theta)$$
ここで $\theta$ は静的なパラメータです。
GASモデルにおける時変パラメータベクトル $f_t$ は以下の自己回帰的な構造に従って更新されます。
$$f_{t+1} = \omega + A s_{t} + B f_{t}$$
$\omega$は定数項ベクトル、$A, B$は係数行列です。
ここで最も重要なのが、イノベーション項(ショック項)である $s_t$ です。これがスコア駆動と呼ばれる所以なのですが、GASモデルではこれを以下のように定義します。
$$s_t = S_t \cdot \nabla_t$$
ここで、
$\nabla_t$(スコアベクトル): 時刻 $t$ の対数尤度 $\ell_t = \ln p(y_t | f_t, \mathcal{F}_{t-1}; \theta)$ の $f_t$ に関する勾配。
$$\nabla_t = \frac{\partial \ln p(y_t | f_t, \mathcal{F}_{t-1}; \theta)}{\partial f_t}$$
$S_t$(スケーリング行列): スコアのスケールを調整する行列で、通常はフィッシャー情報行列$\mathcal{I}_{t|t-1}$ の逆行列、またはその平方根の逆行列。
$$S_t = \mathcal{I}_{t|t-1}^{-1}$$
$$ \mathcal{I}_{t|t-1} =E \left[ \nabla_t \nabla_t^{\top} \right] $$
ここで重要なポイントが2つ出てきました。
①スコア
②スケーリング
まず①のスコアについてです。
GASモデルは時変パラメータを対数尤度の$f_t$に対する勾配を利用して更新するモデルとなっています。まさにこれこそがGASモデルの強さの源泉であり、後述する数理的特性が導かれるためのキーとなっています。
感覚的な話で言うと、GASモデのダイナミクスはMCMCの一種であるランジュバン・モンテカルロ法におけるダイナミクスと瓜二つになっています。(対数尤度の勾配で更新すると聞いてピンときた方もいたのではないでしょうか。)ランジュバン・モンテカルロ法が尤度の高い領域を効率的に探索するアルゴリズムになっていることを考えると、何となくGASモデルの妥当性が分かるのではないでしょうか。
次に②のスケーリングについてです。
これはニュートン法におけるヘッセ行列の逆行列と同じ役割と考えても差し支えなく、GASモデルは1ステップ最適化っぽいことをしていると言っても良いでしょう。
ここで重要なのはFisher情報量でスケーリングするということです。詳しい証明は省きますが、パラメータの変数変換に対する不変性を担保するという極めて重要な役割を担っています。例えばボラティリティ(分散)をパラメータ化する場合、
$$f_{t} = \sigma^2_t$$
$$f_{t} = \log \sigma^2_t$$の2通りの候補が考えられます。
このままスケーリングが無いとスコア(勾配)の形状が変わってしまい、同じボラティリティを対象にしていても更新の挙動が全く異なることになります。(実際に計算してみると分かると思います。)
これをFisher情報量でスケーリングすると、変数変換しても本質的に同じ更新が行われることになるのです。(最急降下法は座標変換に対して不変だけど、自然勾配法は座標変換に対して不変であるというのと同じイメージで問題ないでしょう。)
次節ではGASモデルの数理的特性について述べていきます。
4. 理論的性質
4.1. 情報理論的最適性
Blasques et al. (2015) はGASモデルの情報理論的最適性を示しており、これはBiometrikaに採択されるほどの望ましい結果となっています。
数式を用いた詳細はここでは割愛しますが、簡単に言うと、
『"真の条件付き密度"と"モデルの密度"の間のカルバックライブラー距離を測った時、1つのデータが観測された後にその距離を期待値の意味で減らすのは、更新方向がスコアと同じ向きであるものに限られる』
という局所最適性を示しています。もちろんそれが成り立つための条件があるのですが、実用的にはほぼ問題の無いものと言っても良いでしょう。
さらに、これはModel misspecificationの有無にかかわらないという強い結果になっています。
近年の研究では大域的最適性についても結果が示されており、より強固な理論的バックグランドが築かれつつあるようです。本記事ではその詳細まで掘り下げませんが、気になる方はGorgi et al. (2024) やBeutner et al. (2023) を参照してみると良いでしょう。
4.2. MLEの漸近的性質
GASモデルはその形から観測駆動モデルであることは明らかで、GARCHモデルと同様に最尤法にって軽量に推定できることが強みです。その妥当性、つまりMLEの漸近的性質についても強い結果が得られており、Blasques et al. (2022) は
・一致性
・漸近正規性
について、Model misspecificationの場合も含めて詳細に述べています。
もちろん、ある程度の仮定が必要で、例えば$f_t$ がInvertibility(反転可能性)という性質を満たす必要があったりするのですが、それらについても示されています。
5. 性能について
SVモデルと比べてスコア駆動モデルはどの程度優秀なのか、Koopman et al.(2016) ではシミュレーションによる実証を行っています。
・データ生成過程をSVモデルにしてデータを生成する
・生成したデータをもとにSVモデルとGASモデルのパラメータを推定し、予測精度を比較
というSVモデルにかなり有利な条件(データ生成過程とモデルが一致)なのですが、この条件においてもGASモデルのMSE損失は多くの場合1%未満、最大でも2.5%を超えないとされ、予測・追随精度においてはSVモデルに十分肉薄すると結論付けられています。
ただし、ボラティリティの予測・追随精度が良くてもVaR/ESの精度が良くなければ実用上あまり意味が無いこともあり、SVモデルとの比較で分析している論文はあまり見かけませんでした。(私のリサーチ不足の可能性が大きそうですが...)
一方でGARCH系モデルとのVaRを比較をしているものはいくつもあり、基本的にはGARCH系より優れている結果になっています。
6. 終わりに
所感としては、基本的にはGASモデルはGARHモデルの上位互換であり、ボラティリティ推定でSVモデルはちょっと重いなと感じる人向けの選択肢になり得るといったところでしょう。大量の銘柄のボラティリティやVaR/ESを日々監視するといった大規模な運用を考えるのであれば、スコア駆動モデルの軽量さはかなりの強みです。
ただし、上述したようにVaR/ESの精度についてはSVモデルとの比較が十分になされていないようなので、その点は注意が必要でしょう。
一般的な話をするなら、スコア駆動モデルが状態空間モデルに取って代わるかというと正直微妙なところで、使いどころによるでしょう。状態空間モデルを使う場合は未知の状態変数がどのような分布をしているか、例えば分布の幅(信用区間)はどのくらいかといった推論がメインなことも多く、このような場合はスコア駆動モデルは適していません。
例えば回帰係数が時変するようなモデルを考えたとき、スコア駆動モデルでは時変パラメータの不確実性が評価できない(回帰係数の時点毎の分布が導出できない)ので、"0を跨ぐか否か"のような検証が難しいでしょう。また、例えばDynamic Shrinkage Processesを使った動的縮小推定のようなことも実現するのが困難と思われます。
近年は確率的プログラミング言語が普及し、状態空間モデルの推定ハードルが一気に下がりました。(推定精度が十分かは議論の余地がありますが。)これによって、分析目的においてはスコア駆動モデルを使う強い動機は無くなったのではないかと思います。
と、ここまでネガティブ寄りのコメントになりましたが、それでもスコア駆動モデルの持つ軽量さや情報理論的最適性、漸近的性質は魅力でしょう。近年でも論文が生産されていることを考えると、更なる応用が期待できるのではないでしょうか。
参考文献
- Beutner, E. A., Lin, Y., & Lucas, A. (2023). Consistency, distributional convergence, and optimality of score-driven filters. Tinbergen Institute Discussion Paper, TI 2023-051/III.
- Blasques, F., van Brummelen, J., Koopman, S. J., & Lucas, A. (2022). Maximum likelihood estimation for score-driven models. Journal of Econometrics, 227(2), 325–346.
- Cox, D.R. (1981) Statistical Analysis of Time Series: Some Recent Developments. Scandinavian Journal of Statistics, 8, 110-111.
- Creal, D., Koopman, S. J., & Lucas, A. (2013). Generalized autoregressive score models with applications. Journal of Applied Econometrics.
- Gorgi, P., Lauria, C. S. A., & Luati, A. (2024). On the optimality of score-driven models. Biometrika, 111(3), 865–880.
- Harvey, A. C. (2013). Dynamic models for volatility and heavy tails: With applications to financial and economic time series. Cambridge University Press.
- Harvey, A., & Chakravarty, T. (2008). Beta-t-(E)GARCH. Cambridge Working Papers in Economics, 0840.
- Koopman, S. J., Lucas, A., & Scharth, M. (2016). Predicting time-varying parameters with parameter-driven and observation-driven models. Review of Economics and Statistics.