MaxDDは「過去最大損失」で終わらない。クオンツが見るべき戦略の生存性
バックテストで勝っても、MaxDDを甘く見る戦略は実運用で止まる
はじめに
クオンツ運用の評価指標というと、CAGR や Sharpe Ratio が真っ先に挙げられることが多い。しかし、実運用で戦略を止める原因になりやすいのは、これらの指標ではなく MaxDD(Maximum Drawdown) である。
MaxDD は定義上、過去のピークからボトムまでの最大下落であり、その意味では「過去最大損失」の一種である。しかし、MaxDD の役割はそこで終わらない。資金管理、レバレッジ、投資家心理、戦略継続性を同時に制約する、いわば 戦略の生存性指標 として機能する。
本稿では、MaxDD を成績指標としてではなく、戦略の生存性・レバレッジ上限・運用停止ルールを決める実務指標 として掘り下げていく。
記事全体の核となるメッセージは以下である。
- MaxDD は「過去にどれだけ負けたか」だけを見る指標ではない
- MaxDD は「その戦略を実運用で継続できるか」を測る指標である
- クオンツにとって重要なのは、CAGR や Sharpe を最大化することではなく、許容可能な MaxDD の範囲内で、どれだけ安定してリターンを積み上げられるか である
1. MaxDD は単なる損失指標ではない
MaxDD は、エクイティカーブの過去最高値(High Water Mark)からの最大下落幅として定義される。時刻 $t$ までのエクイティを $E(t)$ として、
$$
\mathrm{MaxDD}(T) = \max_{t \in [0, T]} \left( 1 - \frac{E(t)}{\max_{s \in [0, t]} E(s)} \right)
$$
定義としてはシンプルだが、実運用で MaxDD が果たす役割はそれだけではない。
- 資金管理: 必要な証拠金や運用余力を決める
- レバレッジ: 許容可能なレバレッジ上限を決める
- 心理面: 戦略を継続できるかどうかの心理的閾値になる
- 運用停止ルール: 想定外の DD 進行を検知して、戦略の見直し判断を起動する
つまり MaxDD は、戦略を運用し続けられるかどうかの境界条件 だと言ってよい。CAGR や Sharpe がどれだけ高くても、許容できる MaxDD を超えれば、その戦略は退場させられる。
2. DD の回復は非対称である
MaxDD を評価するうえで、最初に押さえておきたい性質が 回復の非対称性 である。
ドローダウン $d$ から元の水準に戻すために必要なリターン $r$ は、
$$
r = \frac{d}{1 - d}
$$
具体的にどのくらい非対称かを示すと、以下のようになる。
- DD 10% → 回復に必要なリターン 約 11.1%
- DD 20% → 回復に必要なリターン 25.0%
- DD 30% → 回復に必要なリターン 約 42.9%
- DD 50% → 回復に必要なリターン 100.0%
- DD 70% → 回復に必要なリターン 約 233.3%
この関係は指数関数ではなく双曲線型であり、$d \to 1$ で発散する。線形ではなく非線形に膨張する点がポイントで、特に DD が 50% を超えたあたりから、回復に必要なリターンが急激に重くなる。
これは戦略の期待リターンが線形に積み上がるのに対し、ドローダウンからの回復が非線形に重くなることを意味する。
前回までの記事で WFO や予測非依存戦略について書いてきたが、回復の非対称性を踏まえると、「大きく勝つこと」より「大きく負けないこと」のほうが、複利成長への貢献度が高い と言える。Sharpe を上げる前に、まず MaxDD の裾を切ることのほうが優先順位が高いことが多い。
3. バックテスト MaxDD は「観測値」であって「保証値」ではない
実運用に乗せた瞬間、バックテスト MaxDD は将来 MaxDD の上限ではないと痛感することが多い。これには構造的な理由がある。
- サンプル期間の偏り: バックテスト期間に含まれていないレジームが将来発生する
- オーバーフィット: 最悪期を避けるようにパラメータが選ばれている
- 生存バイアス: 退場した戦略のデータが残っていない
- スリッページ・約定遅延の過小評価: 大きな DD が発生する局面ほど流動性が落ち、滑りが拡大する
- 相関構造の崩壊: 平時は分散効いていたポートフォリオが、危機時に相関 1 に近づく
バックテスト MaxDD は、限られたサンプルパス上で観測された 一点推定 にすぎない。しかも、戦略選択・パラメータ探索・データマイニングによって楽観化されやすい。Bailey、Borwein、López de Prado らも、通常の hold-out 手法だけではバックテスト過学習を十分に防げない場合があることを指摘しており、PBO(Probability of Backtest Overfitting)のような枠組みが提案されている。
したがって実務では、バックテスト MaxDD を「過去の事実」としてではなく、「将来 MaxDD 分布の不完全な点推定」 として扱う必要がある。問うべきなのは、観測された MaxDD がいくらかではなく、運用期間 $H$ において MaxDD が許容値を超える確率がどれくらいか、である。
実務ヒューリスティックとして、バックテスト MaxDD に 1.5〜2 倍程度の安全率を掛けて運用を設計することが多い。ただしこれは普遍的な係数ではなく、戦略の頻度・流動性・自己相関・集中度に依存する。本来は、ブロックブートストラップ、レジーム別ストレステスト、約定コスト悪化シナリオ、相関崩壊シナリオを使って、運用想定期間における MaxDD の 予測分布 を推定すべきである。
4. MaxDD は推定値であり、ノイズが大きい
これは前章と関連して、独立に強調しておきたい論点である。
MaxDD は重要だが、MaxDD 自体もかなりノイズの大きい統計量である。1 本のバックテストパスで観測された極値であり、サンプル期間・開始時点・終了時点・レジーム・偶然のクラッシュ有無に強く依存する。
したがって、観測された MaxDD という 1 つの数字に最適化する のは危ない。実務では、観測 MaxDD だけでなく、以下を併用するのが安全である。
- Expected MaxDD: モンテカルロやブロックブートストラップで推定する MaxDD の期待値
- MaxDD の予測分位点: 運用期間 $H$ における $q_{0.95}(\mathrm{MaxDD}_H)$ など
- Conditional Drawdown(CDaR): 最悪側ドローダウンの平均(Chekhlov らによる定式化)
- TUW 分布: 後述する Time Under Water の分布
MaxDD は観測された極値という意味で生々しいが、点推定として過信せず、分布として扱う発想がクオンツ的には自然だと考えている。
5. MaxDD は期間依存する
MaxDD は観測期間に強く依存する。期間が長くなるほど、定義上 MaxDD は単調非減少である。
つまり、
- 1 年バックテストの MaxDD と
- 10 年バックテストの MaxDD
を同じスケールで比較してはいけない。10 年回せば、1 年では現れなかったレジームに当たる確率が上がる。
実務でよく使うのは以下のアプローチである。
- ローリング MaxDD: 一定の窓(例: 252 日)で MaxDD を再計算し、時系列で見る
- 期間別の最大値分布: ブロックブートストラップで年次 MaxDD の分布を推定する
- モンテカルロ MaxDD: リターン分布を仮定して、運用想定期間における MaxDD の分位点を推定する
「期待される MaxDD はいくらか」ではなく、「運用期間 $H$ において、$q_{0.95}(\mathrm{MaxDD}_H)$ はいくらか」という問いに置き換えるのが、クオンツ的には自然だと考えている。
6. MaxDD だけでなく Time Under Water を見る
MaxDD と並んで、実運用で重要なのが Time Under Water (TUW) である。
TUW は、エクイティカーブが High Water Mark を更新してから、再び更新するまでにかかった期間を指す。MaxDD が「下落幅の最悪値」だとすれば、TUW は「水面下にいた時間の最悪値」である。
実運用で問題になるのはむしろこちらのことが多い。
- DD 10% で 6 ヶ月以内に回復する戦略
- DD 10% で 3 年水面下にいる戦略
両者は MaxDD は同じだが、運用継続性はまったく違う。後者は、投資家心理、報酬体系、機会費用のすべてを蝕む。
実務的には、
- Max TUW: 観測期間中の最長水没期間
- Average TUW: 平均的な回復にかかる時間
の両方を見る。Sharpe が高くても TUW が長い戦略は、レバレッジを下げるか、別戦略との分散で水没期間を短縮する設計が必要になる。
7. MaxDD はレバレッジ上限を決める
MaxDD は、戦略にかけられるレバレッジの上限を決める実務指標でもある。
ざっくりとした目安として、無レバレッジ時の戦略 MaxDD を $\mathrm{MaxDD}_0$、レバレッジを $L$ 倍とすると、レバレッジ後の MaxDD は近似的に、
$$
\mathrm{MaxDD}_L \approx L \cdot \mathrm{MaxDD}_0
$$
ただしこの線形近似が成り立つのは、DD が小さく、レバレッジが低〜中程度で、複利・証拠金制約・資金調達コスト・スリッページ・強制ロスカットの影響が無視できる範囲 に限られる。
特に $L \cdot \mathrm{MaxDD}_0$ が 1 に近づく領域では、もはや MaxDD の近似ではなく、破綻確率 として評価すべきである。連続複利の枠組みで $\delta = -\log(1-d)$ と log drawdown を定義すると、レバレッジ後 DD は $d_L \approx 1 - \exp(-L\delta)$ となり、線形近似は崩れる。
許容可能な MaxDD を $\mathrm{MaxDD}_{\mathrm{tol}}$ とすると、許容レバレッジは線形領域では、
$$
L_{\max} \approx \frac{\mathrm{MaxDD}_{\mathrm{tol}}}{\mathrm{MaxDD}_0}
$$
例えば、
- 戦略の(実運用想定) MaxDD: 20%
- 許容できる MaxDD: 30%
であれば、許容レバレッジは 1.5 倍程度に収まる。Kelly 基準で得られたレバレッジが 3 倍だったとしても、MaxDD 制約により 1.5 倍に切り下げる、という判断になる。
ここで重要なのは、Sharpe が高いからといって、そのままレバレッジを上げてよいわけではない という発想である。実運用上のレバレッジ上限は、最終的には MaxDD、TUW、証拠金、流動性、資金調達コスト、投資家の損失許容度によって制約される。レバレッジ設計は、CAGR を最大化する問題ではなく、これらの制約を満たす範囲で CAGR を最大化する 制約付き最適化問題 として捉えるのが実務的である。
ついでに Calmar Ratio にも触れておく。
$$
\mathrm{Calmar} = \frac{\mathrm{CAGR}}{\mathrm{MaxDD}}
$$
Calmar は「許容 MaxDD あたり、何%の CAGR を稼げるか」を直接示す指標である。Sharpe はリターンの標準偏差をリスクとして扱うため、上方変動と下方変動を同じように罰する。また、歪度・尖度・テールリスク・経路依存リスクを十分に表現できない。ファットテールやクラッシュリスクを持つ戦略では、Sharpe だけでなく MaxDD、TUW、Expected Shortfall、Conditional Drawdown を併用すべきで、その入口として Calmar は実用的だと考えている。
8. MaxDD を運用停止ルールに落とす
MaxDD は、評価指標から 運用停止ルール に落とし込んではじめて、実務で機能する。
ただしここで注意したいのは、DD 超過は「戦略が壊れた」ことの証明ではない という点である。DD が深くなったからといって、必ずしも alpha が消えたとは限らない。単に想定分布の左側イベントが発生しただけかもしれない。逆に、DD が浅くても、約定品質や市場構造の変化で alpha が劣化していることもある。
したがって停止ルールは、目的別に分けて設計するのが実務的である。
- DD ルール: 資金保全・投資家保護
- TUW ルール: 機会費用・心理的継続性の管理
- Live vs Backtest 乖離: 実装不良・市場構造変化の検知
- コスト悪化ルール: スリッページ・流動性劣化の検知
- シグナル劣化テスト: alpha decay の検知(IC の経時変化など)
そして対応も、即時停止だけではなく 段階的に設計する のが現実的である。例えば、
- DD が予測 95% 分位を超過 → レバレッジ縮小、新規エントリー停止
- DD が予測 99% 分位を超過、または TUW が上限超過 → 完全停止、再検証
- 約定不能・流動性消失・モデル前提崩壊 → 即時停止
という段階を事前に決めておく。
ここで意識したいのは、運用停止は「失敗」ではなく 設計の一部 だということである。事前に止める条件を決めておけば、戦略が壊れたときに迷わず止められる。逆に、止める条件を決めていない戦略は、損失が許容範囲を超えても惰性で運用が続き、結果として致命的な損失につながる。
「いつ、どの段階で止めるか」を事前に決めておくことが、戦略を長期で運用するための前提条件だと考えている。
結論: MaxDD は戦略の生存性指標である
ここまでの内容をまとめると、MaxDD を見るときに押さえるべきポイントは次のとおりである。
- DD 回復は非対称(50% の DD には 100% の回復が必要、$d \to 1$ で発散)
- バックテスト MaxDD は将来 MaxDD の保証値ではなく、ノイズの大きい点推定である
- MaxDD 自体が極値統計量であり、Expected MaxDD や CDaR、予測分位点と併用すべき
- MaxDD は観測期間に依存する
- MaxDD だけでなく Time Under Water を見る
- MaxDD はレバレッジ上限を決めるが、線形近似は限定的領域でのみ有効
- Calmar Ratio で CAGR と MaxDD の関係を見る
- MaxDD を段階的な運用停止ルールに落とし込む
最後に、本稿の核となる考え方を改めて書いておく。
良い戦略とは、最も儲かる戦略ではない。悪い局面でも退場せず、運用を継続できる戦略である。
クオンツにとって重要なのは、期待リターンの最大化ではなく、破綻確率を抑えたうえで期待リターンを積み上げること である。MaxDD は、その「破綻確率を抑える」側を司る、戦略の生存性指標として捉えるのが実務的には正しい使い方だと考えている。
CAGR や Sharpe を最大化する前に、まず自分の戦略の MaxDD と Time Under Water、そしてそれに対する段階的な運用停止ルールが言語化されているか、もう一度確認してみてほしい。