2025-11-16T22:37:12.905987

Learning the Exact SABR Model

Rensi, Rossi, Bianchetti
The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions. We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality. Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.
academic

정확한 SABR 모델 학습

기본 정보

  • 논문ID: 2510.10343
  • 제목: Learning the Exact SABR Model
  • 저자: Giorgia Rensi, Pietro Rossi, Marco Bianchetti
  • 분류: q-fin.CP (전산금융), q-fin.PR (증권 가격결정), q-fin.RM (위험관리)
  • 발표일: 2025년 10월 14일
  • 논문 링크: https://arxiv.org/abs/2510.10343

초록

SABR 모델은 금리 변동성 모델링의 핵심이지만, 실제 응용은 Hagan 등의 해석적 근사 공식에 크게 의존하고 있습니다. 이 공식은 높은 변동성, 장기 만기, 외가격 옵션의 경우 정확도가 악화되며 차익거래 기회까지 발생합니다. 기계학습 방법들이 이러한 한계를 극복하려 시도했지만, 종종 단순화된 SABR 동역학이나 전체 시장 조건에 대한 체계적 검증 부족으로 제한됩니다. 본 연구는 2억 개 이상의 데이터 포인트로 구성된 대규모 훈련 데이터셋을 통해 정확한 SABR 확률 동역학을 학습하는 새로운 SABR DNN 아키텍처를 개발했습니다. 이는 30년까지의 만기와 극단적 행사가격을 포함하며, 무차익 시장 변동성 곡면 보정을 제공하고 계산 효율이 매우 높으며 재훈련이 필요 없습니다.

연구 배경 및 동기

문제 배경

  1. SABR 모델의 중요성: SABR(확률적 알파 베타 로우) 모델은 전 세계 금융시장에서 가장 광범위하게 사용되는 금리 변동성 모델이며, 특히 금리 옵션 가격결정에서 지배적입니다. BIS 데이터에 따르면, 금리 옵션은 시장에서 거래량이 가장 많은 옵션 유형입니다(2024년 하반기 거래량 6,000억 달러).
  2. Hagan 근사의 한계:
    • 높은 변동성, 장기 만기, 외가격 옵션의 경우 정확도가 심각하게 악화됨
    • 음의 확률밀도를 생성할 수 있어 차익거래 기회 발생
    • 변동성 스마일 윙 부분에 의존하는 복잡한 상품의 정확한 가격결정 불가능
  3. 기존 기계학습 방법의 부족:
    • 대부분의 연구는 단순화된 로그정규 SABR(β=1)만 고려
    • 훈련 데이터셋 규모가 제한적이고 시장 조건 커버리지 불완전
    • 실제 시장 데이터에 대한 체계적 검증 부족
    • 완전한 shifted-SABR 동역학의 미활용

연구 동기

"정확한" SABR 모델을 학습할 수 있는 심층신경망 프레임워크를 구축하여 해석적 근사의 한계를 극복하고, 일상적 거래 및 위험관리를 위한 고정확도, 고효율의 가격결정 도구를 제공합니다.

핵심 기여

  1. 초대규모 훈련 데이터셋 구축: 30년 만기와 극단적 행사가격(-1.5%~10%)을 포함하는 2억 개 이상의 데이터 포인트로 구성된 금리 변동성 곡면 생성
  2. 전용 SABR DNN 아키텍처 개발: 단기, 중기, 장기를 위한 세 개의 심층신경망을 설계하여 완전한 shifted-SABR 확률 동역학 학습
  3. 차원 축소 구현: 스케일된 shifted-SABR 모델을 통해 매개변수 공간 차원 축소, 일반성 손실 없이 훈련 효율성 향상
  4. 무차익 가격결정 제공: 실제 시장 변동성 곡면의 무차익 보정 구현, 재훈련 없이 다양한 거래일 적응
  5. 체계적 벤치마크 테스트: Hagan 등의 최신 버전 근사 공식에 대한 포괄적 정확도 평가 수행, 다양한 시장 영역의 오차 정량화

방법론 상세 설명

작업 정의

입력: SABR 모델 매개변수 θ_SABR = {α̂, β, ρ, ν} 및 계약 매개변수 θ_CF = {T, K̂} 출력: shifted-Black 내재 변동성 σ_DNN 목표: 매핑 관계 (θ_SABR, θ_CF) → σ_MC 학습, DNN 출력이 몬테카를로 시뮬레이션의 정확한 결과에 수렴

모델 아키텍처

1. 스케일된 Shifted-SABR 동역학

매개변수 차원 축소를 위해 정규화 프로세스 도입:

X(t) = F̄(t)/F̄₀
dX(t) = σ̂(t)X^β(t)dW(t), X(0) = 1
dσ̂(t) = νσ̂(t)dZ(t), σ̂(0) = αF̂₀^(β-1)

2. 3층 DNN 아키텍처

  • 입력층: 6개 노드가 {α̂, β, ρ, ν, T, K̂} 수신
  • 은닉층: 5층, 각 층 64개 노드, ELU 활성화 함수 사용
  • 출력층: 1개 노드가 내재 변동성 출력, 선형 활성화 함수
  • 최적화기: ADAM, 최대 500 에포크, 조기 종료 메커니즘

3. 계층적 훈련 전략

만기 영역을 세 개의 부분집합으로 분할:

  • DNN 1: 단기 [0.25, 4년)
  • DNN 2: 중기 [4, 10.5년)
  • DNN 3: 장기 10.5, 30년

기술 혁신점

  1. 완전한 SABR 동역학: β 매개변수 고정 없이 모델의 완전한 유연성 유지
  2. 고정확도 몬테카를로: 편향 없는 몬테카를로 시뮬레이션을 사용하여 기준 데이터 생성, 해석적 근사 오차 회피
  3. 지능형 데이터 샘플링: 라틴 초입방체 샘플링을 사용하여 매개변수 공간의 충분한 커버리지 확보
  4. 오차 필터링 메커니즘: DNN이 필터로 작용하여 실제 정보 추출 및 몬테카를로 노이즈 제거

실험 설정

데이터셋

  • 훈련셋: 1,572,864개의 무작위 그리드 곡면, 총 약 2.39억 개의 변동성 포인트
  • 검증셋: 훈련셋의 20%(약 4,770만 개 포인트)
  • 테스트셋: 독립적으로 생성된 40,960개 샘플
  • 매개변수 범위:
    • F₀: 0.25%, 5%
    • α: 0.001, 0.2
    • β: 0.05, 0.9
    • ρ: -0.8, 0.6
    • ν: 0.05, 1.6

평가 지표

  • RMSE: 평균제곱근 오차
  • 상대 오차: |Δσ| = |σ_DNN - σ_MC|
  • RMSD: 상대 평균제곱근 거리
  • ARD: 절대 상대 차이

비교 방법

  • SABR Hagan: Hagan 등의 최신 버전 해석적 근사 사용
  • MC SABR: 기준으로 사용되는 고정확도 몬테카를로 시뮬레이션

구현 세부사항

  • 계산 자원: 25,000~30,000 CPU 시간, 256개 CPU 병렬 처리
  • 훈련 시간: 각 DNN 약 5 GPU 시간(하이퍼매개변수 조정 포함)
  • 몬테카를로 설정: 2^18개 경로, 시간 스텝 0.5~3일

실험 결과

주요 결과

1. DNN 훈련 성능

지표훈련셋테스트셋
RMSE0.28%0.25%
|Δσ| > 1%1%-
|Δσ| > 5%0.26%-

2. 시장 보정 정확도 비교

2024년 8월 30일 EUR Cap/Floor 시장 데이터 예시:

단기(1.5년):

  • SABR DNN과 MC SABR DNN이 거의 완전히 일치
  • SABR Hagan과 MC SABR Hagan에 경미한 차이 존재

장기(30년):

  • SABR DNN이 높은 정확도 유지, RMSD < 1%
  • SABR Hagan 오차 현저히 증가, 최저 행사가격에서 RMSD > 5%

3. 정확도 악화 분석

Hagan 근사의 상대 오차가 만기 및 행사가격에 따라 변함:

  • 만기 효과: 30년 옵션이 1.5년 옵션보다 약 10배 높은 오차
  • 행사가격 효과: 최저 행사가격(-1.5%)에서 오차 최대, 10%에 도달
  • SABR DNN: 모든 영역에서 < 2%의 안정적 오차 유지

제거 실험

  1. 네트워크 깊이 영향: 은닉층 수 감소로 성능 저하, 층 수 증가는 수익 체감
  2. 데이터셋 규모: 더 큰 데이터셋이 노이즈 데이터에 대한 필터링 능력 향상
  3. 매개변수 범위: 반복적으로 최적화된 매개변수 범위가 보정 결과의 안정성 확보

계산 성능

  • 오프라인 단계: 데이터 생성 및 훈련에 대량의 계산 자원 필요(일회성)
  • 온라인 단계: 단일 스마일 보정 < 1초, 계산 효율 극히 높음
  • 재훈련 불필요: 동일 DNN이 다양한 거래일의 시장 데이터 처리 가능

관련 연구

전통적 SABR 방법

  • Hagan et al. (2002): 원본 SABR 모델 및 해석적 근사
  • Hagan et al. (2016): shifted-SABR 확장, 음의 금리 처리

기계학습 SABR 방법

  • McGhee (2021): 신경망을 SABR에 처음 적용, 단 β=1 경우만
  • Jeon et al. (2022): GPU 가속 몬테카를로로 데이터셋 생성
  • Funahashi (2023): 제어 변수 방법으로 훈련 개선
  • Hoshisashi et al. (2024): 도함수 제약 신경망으로 무차익 보장

본 논문의 장점

  1. 완전성: 완전한 shifted-SABR 동역학 고려, β 매개변수 단순화 없음
  2. 규모: 훈련 데이터셋 규모가 이전 연구를 수 배 초과
  3. 실용성: 실제 시장 데이터 및 거래 실무에 직접 대응
  4. 체계성: 완전한 엔드-투-엔드 솔루션 제공

결론 및 논의

주요 결론

  1. 기술 가능성: 심층신경망이 복잡한 SABR 확률 동역학을 성공적으로 학습 가능
  2. 정확도 우위: 장기 만기 및 극단적 행사가격 영역에서 해석적 근사를 현저히 능가
  3. 실용적 가치: 일상적 거래 및 위험관리의 정확도 및 효율성 요구사항 충족
  4. 견고성: 단일 훈련 모델이 다양한 시장 환경에 적응 가능

한계

  1. 계산 비용: 초기 데이터 생성 및 훈련에 대량의 계산 자원 필요
  2. 시장 커버리지: 현재 EUR Cap/Floor 시장만 대상, 다른 상품으로의 확장 필요
  3. 시장 제도: 주요 시장 제도 변화 시 재훈련 필요 가능
  4. 모델 위험: 신경망의 "블랙박스" 특성이 모델 위험 초래 가능

향후 방향

  1. 상품 확장: Swaption 큐브 및 야간 금리 상품으로 확장
  2. 다중 통화: USD, GBP 등 다른 주요 통화 시장 커버리지
  3. 네트워크 최적화: 더 고급 네트워크 아키텍처 및 훈련 전략 탐색
  4. 위험 응용: 역사적 VaR 및 스트레스 테스트에서의 응용

심층 평가

장점

  1. 높은 혁신성: 완전한 SABR 모델의 대규모 기계학습을 처음 구현, 기술 경로 참신
  2. 높은 실용적 가치: 금융 실무의 핵심 문제를 직접 해결, 명확한 상업적 응용 전망
  3. 충분한 실험: 초대규모 데이터셋 및 포괄적 벤치마크 테스트로 결과 신뢰성 확보
  4. 명확한 작성: 기술 세부사항 상세, 재현 가능성 높음

부족점

  1. 일반화 능력: EUR 시장에서만 검증, 다른 시장의 적용 가능성 미검증
  2. 이론적 분석: 신경망 근사 오차에 대한 이론적 분석 부족
  3. 극단 상황: 시장 극단적 변동 상황에서의 견고성 분석 부족
  4. 계산 진입장벽: 높은 계산 비용이 중소 기관의 응용 제한 가능

영향력

  1. 학술 기여: 전산금융과 기계학습 교차 분야에 중요한 사례 제공
  2. 산업 영향: 금리 파생상품 가격결정의 산업 표준 관행 변화 가능
  3. 방법론: 다른 복잡한 금융 모델의 기계학습화에 사상 제공

적용 시나리오

  1. 대형 투행: 충분한 계산 자원을 보유한 기관의 직접 응용 가능
  2. 위험관리: 고정확도 가격결정이 필요한 위험 계량 시나리오
  3. 알고리즘 거래: 계산 효율성을 극도로 요구하는 고빈도 거래 환경
  4. 학술 연구: 기준 모델로서 추가 방법론 연구 진행

참고문헌

  1. Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
  2. Hagan, P. et al. (2016). Universal Smiles. Wilmott.
  3. McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
  4. Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.

종합 평가: 이는 전산금융 분야에서 중요한 실용적 가치를 지닌 고품질 연구입니다. 저자들은 SABR 모델 응용의 핵심 기술 문제를 체계적으로 해결하여 완전한 엔드-투-엔드 솔루션을 제공합니다. 높은 계산 비용과 일반화 능력 검증 필요 등의 한계가 있지만, 기술 혁신성과 실용적 가치로 인해 해당 분야의 중요한 기여가 됩니다.