2025-11-16T22:37:12.905987

Learning the Exact SABR Model

Rensi, Rossi, Bianchetti
The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions. We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality. Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.
academic

正確なSABRモデルの学習

基本情報

  • 論文ID: 2510.10343
  • タイトル: Learning the Exact SABR Model
  • 著者: Giorgia Rensi, Pietro Rossi, Marco Bianchetti
  • 分類: q-fin.CP(計算ファイナンス)、q-fin.PR(証券評価)、q-fin.RM(リスク管理)
  • 発表日: 2025年10月14日
  • 論文リンク: https://arxiv.org/abs/2510.10343

要約

SABRモデルは金利ボラティリティモデリングの基礎となるものですが、その実務的応用は大きくHaganらによる解析近似公式に依存しており、高ボラティリティ、長期限、アウト・オブ・ザ・マネー・オプションの場合に精度が著しく低下し、アービトラージ機会さえ生じます。機械学習手法によってこれらの制限を克服しようとする試みがありますが、しばしば簡略化されたSABRダイナミクスに限定されるか、全市場条件に対する体系的な検証が欠けています。本研究は、2億個以上のデータポイントからなる大規模訓練データセットを用いて、正確なSABRの確率的ダイナミクスを学習する新規なSABR DNN アーキテクチャを開発しました。このデータセットは30年までの期限と極端な行使価格をカバーしています。本手法は、アービトラージフリーな市場ボラティリティ曲面キャリブレーションを提供し、計算効率が極めて高く、再訓練の必要がありません。

研究背景と動機

問題背景

  1. SABRモデルの重要性: SABR(Stochastic Alpha Beta Rho)モデルは、世界の金融市場で最も広く使用されている金利ボラティリティモデルであり、特に金利オプション評価において支配的な地位を占めています。BISのデータによると、金利オプションは市場で最も取引量の多いオプション種別です(2024年下半期の取引量6,000億ドル)。
  2. Hagan近似の限界:
    • 高ボラティリティ、長期限、アウト・オブ・ザ・マネー・オプションの場合に精度が著しく低下
    • 負の確率密度を生じさせ、アービトラージ機会をもたらす可能性
    • ボラティリティ・スマイルのウィングに依存する複雑な商品の正確な評価ができない
  3. 既存の機械学習手法の不足:
    • ほとんどの研究は簡略化された対数正規SABR(β=1)のみを考慮
    • 訓練データセットの規模が限定的で、市場条件の網羅性が不十分
    • 実際の市場データに対する体系的な検証が欠ける
    • 完全なshifted-SABRダイナミクスを十分に活用していない

研究動機

「正確な」SABRモデルを学習できる深層ニューラルネットワークフレームワークを構築し、解析近似の限界を克服し、日常的な取引とリスク管理に対して高精度で高効率の評価ツールを提供することです。

核心的貢献

  1. 超大規模訓練データセットの構築: 30年の期限と極端な行使価格(-1.5%~10%)をカバーする2億個以上のデータポイントからなる金利ボラティリティ曲面を生成
  2. 専用SABR DNNアーキテクチャの開発: 短期、中期、長期の3つの深層ニューラルネットワークを設計し、完全なshifted-SABRの確率的ダイナミクスを学習
  3. 次元削減の実現: スケーリングされたshifted-SABRモデルを通じてパラメータ空間の次元削減を実現し、汎用性を損なわずに訓練効率を向上
  4. アービトラージフリー評価の提供: 実際の市場ボラティリティ曲面に対するアービトラージフリーなキャリブレーションを実現し、異なる取引日に対して再訓練が不要
  5. 体系的なベンチマークテスト: Haganらの最新版近似公式に対する包括的な精度評価を初めて実施し、異なる市場領域での誤差を定量化

方法の詳細

タスク定義

入力: SABRモデルパラメータ θ_SABR = {α̂, β, ρ, ν} と契約パラメータ θ_CF = {T, K̂} 出力: shifted-Black隐含ボラティリティ σ_DNN 目標: マッピング関係 (θ_SABR, θ_CF) → σ_MC を学習し、DNN出力がモンテカルロシミュレーションの正確な結果に近づくようにする

モデルアーキテクチャ

1. スケーリングされたShifted-SABRダイナミクス

パラメータ次元を削減するため、以下の標準化プロセスを導入:

X(t) = F̄(t)/F̄₀
dX(t) = σ̂(t)X^β(t)dW(t), X(0) = 1
dσ̂(t) = νσ̂(t)dZ(t), σ̂(0) = αF̂₀^(β-1)

2. 3層DNNアーキテクチャ

  • 入力層: 6個のノードが {α̂, β, ρ, ν, T, K̂} を受け取る
  • 隠れ層: 5層、各層64個のノード、ELU活性化関数を使用
  • 出力層: 1個のノードが隐含ボラティリティを出力、線形活性化関数
  • 最適化器: ADAM、最大500エポック、早期停止機構

3. 階層的訓練戦略

期限領域を3つのサブセットに分割:

  • DNN 1: 短期 [0.25, 4年)
  • DNN 2: 中期 [4, 10.5年)
  • DNN 3: 長期 10.5, 30年

技術的革新点

  1. 完全なSABRダイナミクス: βパラメータを固定せず、モデルの完全な柔軟性を保持
  2. 高精度モンテカルロ: 不偏モンテカルロシミュレーションを使用してベンチマークデータを生成し、解析近似の誤差を回避
  3. インテリジェントなデータサンプリング: ラテン超立方体サンプリングを採用してパラメータ空間を十分にカバー
  4. 誤差フィルタリング機構: DNNがフィルタとして機能し、真の情報を抽出しながらモンテカルロノイズを除去

実験設定

データセット

  • 訓練セット: 1,572,864個のランダムグリッド曲面、合計約2.39億個のボラティリティポイント
  • 検証セット: 訓練セットの20%(約4,770万個のポイント)
  • テストセット: 独立に生成された40,960個のサンプルポイント
  • パラメータ範囲:
    • F₀: 0.25%, 5%
    • α: 0.001, 0.2
    • β: 0.05, 0.9
    • ρ: -0.8, 0.6
    • ν: 0.05, 1.6

評価指標

  • RMSE: 二乗平均平方根誤差
  • 相対誤差: |Δσ| = |σ_DNN - σ_MC|
  • RMSD: 相対二乗平均平方根距離
  • ARD: 絶対相対差異

比較手法

  • SABR Hagan: Haganらの最新版解析近似を使用
  • MC SABR: ベンチマークとしての高精度モンテカルロシミュレーション

実装の詳細

  • 計算リソース: 25,000~30,000 CPU時間、256個のCPU並列処理
  • 訓練時間: 各DNN約5 GPU時間(ハイパーパラメータ調整を含む)
  • モンテカルロ設定: 2^18個のパス、時間ステップ0.5~3日

実験結果

主要な結果

1. DNN訓練性能

指標訓練セットテストセット
RMSE0.28%0.25%
|Δσ| > 1%1%-
|Δσ| > 5%0.26%-

2. 市場キャリブレーション精度の比較

2024年8月30日のEUR Cap/Floor市場データを例として:

短期(1.5年):

  • SABR DNNとMC SABR DNNはほぼ完全に一致
  • SABR HaganとMC SABR Haganにはわずかな差異

長期(30年):

  • SABR DNNは高精度を維持、RMSD < 1%
  • SABR Haganの誤差は著しく増加、最低行使価格でRMSD > 5%

3. 精度低下の分析

Hagan近似の相対誤差の期限と行使価格への依存性:

  • 期限効果: 30年オプションは1.5年オプションより約10倍の誤差が高い
  • 行使価格効果: 最低行使価格(-1.5%)で誤差が最大、10%に達する
  • SABR DNN: すべての領域で < 2%の安定した誤差を維持

アブレーション実験

  1. ネットワーク深度の影響: 隠れ層の数を減らすと性能が低下し、層数を増やすと収益が逓減
  2. データセット規模: より大きなデータセットはノイズデータに対するフィルタリング能力を向上
  3. パラメータ範囲: 反復的に最適化されたパラメータ範囲はキャリブレーション結果の安定性を確保

計算性能

  • オフライン段階: データ生成と訓練には大量の計算リソースが必要(一度限り)
  • オンライン段階: 単一のスマイルキャリブレーション < 1秒、計算効率が極めて高い
  • 再訓練不要: 同一のDNNは異なる取引日の市場データを処理可能

関連研究

従来的なSABR手法

  • Hagan et al. (2002): 元のSABRモデルと解析近似
  • Hagan et al. (2016): shifted-SABR拡張、負金利に対応

機械学習によるSABR手法

  • McGhee (2021): ニューラルネットワークをSABRに初めて適用、ただしβ=1の場合に限定
  • Jeon et al. (2022): GPU加速モンテカルロでデータセット生成
  • Funahashi (2023): 制御変量法で訓練を改善
  • Hoshisashi et al. (2024): 導関数制約ニューラルネットワークでアービトラージフリーを確保

本論文の優位性

  1. 完全性: 完全なshifted-SABRダイナミクスを考慮、βパラメータを簡略化しない
  2. 規模: 訓練データセット規模が従来の研究を数桁上回る
  3. 実用性: 実際の市場データと取引実務に直接対応
  4. 体系性: 完全なエンド・ツー・エンドソリューションを提供

結論と考察

主要な結論

  1. 技術的実現可能性: 深層ニューラルネットワークは複雑なSABRの確率的ダイナミクスを成功裏に学習可能
  2. 精度上の優位性: 長期限と極端な行使価格領域で解析近似を大幅に上回る
  3. 実用的価値: 日常的な取引とリスク管理の精度と効率要件を満たす
  4. 堅牢性: 単一訓練のモデルは異なる市場環境に適応可能

限界

  1. 計算コスト: 初期データ生成と訓練に大量の計算リソースが必要
  2. 市場カバレッジ: 現在はEUR Cap/Floor市場のみ対象、他の商品への拡張が必要
  3. 市場制度: 重大な市場制度変化は再訓練を必要とする可能性
  4. モデルリスク: ニューラルネットワークの「ブラックボックス」特性はモデルリスクをもたらす可能性

今後の方向性

  1. 商品拡張: Swaption立方体と隔夜金利商品への拡張
  2. 多通貨: USD、GBPなど他の主要通貨市場をカバー
  3. ネットワーク最適化: より先進的なネットワークアーキテクチャと訓練戦略の探索
  4. リスク応用: 歴史的VaRとストレステストへの応用

深い評価

長所

  1. 革新性が強い: 完全なSABRモデルの大規模機械学習を初めて実現、技術ルートが新規
  2. 実用的価値が高い: 金融実務の核心的な痛点を直接解決し、明確な商業応用前景がある
  3. 実験が充分: 超大規模データセットと包括的なベンチマークテストが結果の信頼性を確保
  4. 執筆が明確: 技術詳細が詳実で、再現可能性が強い

不足

  1. 汎化能力: EUR市場のみで検証、他市場への適用可能性は未検証
  2. 理論分析: ニューラルネットワーク近似誤差の理論分析が欠ける
  3. 極端ケース: 市場極端変動下での堅牢性分析が不十分
  4. 計算敷居: 高い計算コストは中小機関の応用を制限する可能性

影響力

  1. 学術貢献: 計算ファイナンスと機械学習の交差領域に重要な範例を提供
  2. 業界への影響: 金利デリバティブ評価の業界標準実務を変える可能性
  3. 方法論: 他の複雑な金融モデルの機械学習化に思想を提供

適用シーン

  1. 大型投資銀行: 十分な計算リソースを有する機関は直接応用可能
  2. リスク管理: 高精度評価が必要なリスク計量シーン
  3. アルゴリズム取引: 計算効率が極めて重要な高頻度取引環境
  4. 学術研究: ベンチマークモデルとしてさらなる方法論研究を実施

参考文献

  1. Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
  2. Hagan, P. et al. (2016). Universal Smiles. Wilmott.
  3. McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
  4. Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.

総合評価: これは計算ファイナンス領域において重要な実用的価値を有する高品質な研究です。著者はSABRモデル応用における重要な技術的課題を体系的に解決し、完全なエンド・ツー・エンドソリューションを提供しています。計算コストが高く汎化能力が検証待ちなどの限界がありますが、その技術的革新と実用的価値により、本領域における重要な貢献となっています。