2025-11-16T22:37:12.905987

Learning the Exact SABR Model

Rensi, Rossi, Bianchetti

The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions. We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality. Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.

academic

Aprendizaje del Modelo SABR Exacto

Información Básica

ID del Artículo: 2510.10343
Título: Learning the Exact SABR Model
Autores: Giorgia Rensi, Pietro Rossi, Marco Bianchetti
Clasificación: q-fin.CP (Finanzas Computacionales), q-fin.PR (Valoración de Valores), q-fin.RM (Gestión de Riesgos)
Fecha de Publicación: 14 de octubre de 2025
Enlace del Artículo: https://arxiv.org/abs/2510.10343

Resumen

El modelo SABR es la piedra angular de la modelización de la volatilidad de tasas de interés, pero su aplicación práctica depende críticamente de la fórmula de aproximación analítica de Hagan et al., cuya precisión se deteriora significativamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero, generando incluso oportunidades de arbitraje. Aunque existen métodos de aprendizaje automático que intentan superar estas limitaciones, frecuentemente están restringidos a dinámicas SABR simplificadas o carecen de validación sistemática en condiciones de mercado completas. Esta investigación desarrolla una arquitectura SABR DNN novedosa que aprende la dinámica estocástica SABR verdadera mediante un conjunto de datos de entrenamiento a gran escala de más de 200 millones de puntos de datos, cubriendo plazos de hasta 30 años y precios de ejercicio extremos. El método proporciona calibración de superficies de volatilidad de mercado libre de arbitraje, con eficiencia computacional extrema y sin necesidad de reentrenamiento.

Antecedentes y Motivación de la Investigación

Contexto del Problema

Importancia del Modelo SABR: El modelo SABR (Stochastic Alpha Beta Rho) es el modelo de volatilidad de tasas de interés más ampliamente utilizado en los mercados financieros globales, siendo dominante particularmente en la valoración de opciones sobre tasas de interés. Según datos del BIS, las opciones sobre tasas de interés son el tipo de opción más negociado en el mercado (volumen de transacciones de 600 mil millones de dólares en la segunda mitad de 2024).
Limitaciones de la Aproximación de Hagan:
- La precisión se deteriora severamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero
- Puede producir densidades de probabilidad negativas, generando oportunidades de arbitraje
- No puede valorar con precisión productos complejos que dependen de las alas de la sonrisa de volatilidad
Insuficiencias de los Métodos Existentes de Aprendizaje Automático:
- La mayoría de investigaciones consideran únicamente SABR lognormal simplificado (β=1)
- Conjuntos de datos de entrenamiento de tamaño limitado con cobertura incompleta de condiciones de mercado
- Falta de validación sistemática con datos de mercado reales
- Aprovechamiento insuficiente de la dinámica completa shifted-SABR

Motivación de la Investigación

Establecer un marco de red neuronal profunda capaz de aprender el modelo SABR "exacto", superando las limitaciones de la aproximación analítica, para proporcionar herramientas de valoración de alta precisión y eficiencia para operaciones diarias y gestión de riesgos.

Contribuciones Principales

Construcción de Conjunto de Datos a Escala Masiva: Generación de más de 200 millones de puntos de datos de superficies de volatilidad de tasas de interés, cubriendo plazos de 30 años y precios de ejercicio extremos (-1.5% a 10%)
Desarrollo de Arquitectura SABR DNN Especializada: Diseño de tres redes neuronales profundas dirigidas a plazos cortos, medianos y largos, capaces de aprender la dinámica estocástica shifted-SABR completa
Implementación de Reducción de Dimensionalidad: Logro de reducción dimensional del espacio de parámetros mediante el modelo scaled shifted-SABR, mejorando la eficiencia del entrenamiento sin pérdida de generalidad
Provisión de Valoración Libre de Arbitraje: Implementación de calibración libre de arbitraje de superficies de volatilidad de mercado reales, adaptable a diferentes días de negociación sin reentrenamiento
Evaluación Comparativa Sistemática: Primera evaluación integral de precisión de la fórmula de aproximación más reciente de Hagan et al., cuantificando errores en diferentes regiones de mercado

Explicación Detallada de la Metodología

Definición de la Tarea

Entrada: Parámetros del modelo SABR θ_SABR = {α̂, β, ρ, ν} y parámetros del contrato θ_CF = {T, K̂} Salida: Volatilidad implícita shifted-Black σ_DNN Objetivo: Aprender la relación de mapeo (θ_SABR, θ_CF) → σ_MC, haciendo que la salida DNN se aproxime a los resultados precisos de la simulación Monte Carlo

Arquitectura del Modelo

1. Dinámica Scaled Shifted-SABR

Para reducir la dimensionalidad de parámetros, se introduce el siguiente proceso estandarizado:

X(t) = F̄(t)/F̄₀
dX(t) = σ̂(t)X^β(t)dW(t), X(0) = 1
dσ̂(t) = νσ̂(t)dZ(t), σ̂(0) = αF̂₀^(β-1)

2. Arquitectura DNN de Tres Capas

Capa de Entrada: 6 nodos reciben {α̂, β, ρ, ν, T, K̂}
Capas Ocultas: 5 capas, 64 nodos por capa, función de activación ELU
Capa de Salida: 1 nodo que produce volatilidad implícita, función de activación lineal
Optimizador: ADAM, máximo 500 épocas, mecanismo de parada temprana

3. Estrategia de Entrenamiento Estratificado

División del dominio de plazos en tres subconjuntos:

DNN 1: Corto plazo [0.25, 4 años)
DNN 2: Plazo medio [4, 10.5 años)
DNN 3: Largo plazo 10.5, 30 años

Puntos de Innovación Técnica

Dinámica SABR Completa: No fija el parámetro β, manteniendo flexibilidad y completitud del modelo
Monte Carlo de Alta Precisión: Utiliza simulación Monte Carlo insesgada para generar datos de referencia, evitando errores de aproximación analítica
Muestreo Inteligente de Datos: Emplea muestreo de hipercubo latino para asegurar cobertura suficiente del espacio de parámetros
Mecanismo de Filtrado de Errores: DNN actúa como filtro, extrayendo información verdadera mientras descarta ruido Monte Carlo

Configuración Experimental

Conjunto de Datos

Conjunto de Entrenamiento: 1,572,864 superficies de cuadrícula aleatoria, totalizando aproximadamente 2.39 mil millones de puntos de volatilidad
Conjunto de Validación: 20% del conjunto de entrenamiento (aproximadamente 47.7 millones de puntos)
Conjunto de Prueba: 40,960 puntos de muestra generados independientemente
Rango de Parámetros:
- F₀: 0.25%, 5%
- α: 0.001, 0.2
- β: 0.05, 0.9
- ρ: -0.8, 0.6
- ν: 0.05, 1.6

Métricas de Evaluación

RMSE: Error cuadrático medio raíz
Error Relativo: |Δσ| = |σ_DNN - σ_MC|
RMSD: Distancia cuadrática media relativa
ARD: Diferencia relativa absoluta

Métodos de Comparación

SABR Hagan: Aproximación analítica versión más reciente de Hagan et al.
MC SABR: Simulación Monte Carlo de alta precisión como referencia

Detalles de Implementación

Recursos Computacionales: 25,000-30,000 horas CPU, 256 CPUs en paralelo
Tiempo de Entrenamiento: Aproximadamente 5 horas GPU por DNN (incluyendo ajuste de hiperparámetros)
Configuración Monte Carlo: 2^18 trayectorias, paso de tiempo 0.5-3 días

Resultados Experimentales

Resultados Principales

1. Rendimiento del Entrenamiento DNN

Métrica	Conjunto de Entrenamiento	Conjunto de Prueba
RMSE	0.28%	0.25%
\|Δσ\| > 1%	1%	-
\|Δσ\| > 5%	0.26%	-

2. Precisión de Calibración de Mercado

Tomando como ejemplo datos de mercado EUR Cap/Floor del 30 de agosto de 2024:

Corto Plazo (1.5 años):

SABR DNN y MC SABR DNN prácticamente coinciden completamente
SABR Hagan y MC SABR Hagan presentan ligeras diferencias

Largo Plazo (30 años):

SABR DNN mantiene alta precisión, RMSD < 1%
SABR Hagan muestra error significativamente aumentado, RMSD > 5% en precios de ejercicio más bajos

3. Análisis del Deterioro de Precisión

Error relativo de la aproximación de Hagan según plazo y precio de ejercicio:

Efecto de Plazo: Opciones a 30 años presentan error aproximadamente 10 veces mayor que opciones a 1.5 años
Efecto de Precio de Ejercicio: Error máximo en precio de ejercicio más bajo (-1.5%), alcanzando 10%
SABR DNN: Mantiene error estable < 2% en todas las regiones

Experimentos de Ablación

Impacto de Profundidad de Red: Reducción de capas ocultas causa deterioro de rendimiento, aumento de capas muestra rendimientos decrecientes
Escala de Conjunto de Datos: Conjuntos de datos más grandes mejoran la capacidad de filtrado de datos ruidosos
Rango de Parámetros: Rango de parámetros optimizado iterativamente asegura estabilidad de resultados de calibración

Rendimiento Computacional

Fase Offline: Generación de datos y entrenamiento requieren recursos computacionales significativos (una sola vez)
Fase Online: Calibración de sonrisa individual < 1 segundo, eficiencia computacional extrema
Sin Reentrenamiento: Un mismo DNN puede procesar datos de mercado de diferentes días de negociación

Trabajo Relacionado

Métodos SABR Tradicionales

Hagan et al. (2002): Modelo SABR original y aproximación analítica
Hagan et al. (2016): Extensión shifted-SABR, manejo de tasas de interés negativas

Métodos SABR de Aprendizaje Automático

McGhee (2021): Primera aplicación de redes neuronales a SABR, limitado al caso β=1
Jeon et al. (2022): Generación de conjuntos de datos acelerada por GPU Monte Carlo
Funahashi (2023): Método de variables de control para mejorar entrenamiento
Hoshisashi et al. (2024): Red neuronal con restricciones derivadas para asegurar ausencia de arbitraje

Ventajas de Este Artículo

Completitud: Considera dinámica shifted-SABR completa, sin simplificación del parámetro β
Escala: Conjunto de datos de entrenamiento que supera investigaciones previas por varios órdenes de magnitud
Practicidad: Dirigido directamente a datos de mercado reales y práctica comercial
Sistematicidad: Proporciona solución completa de extremo a extremo

Conclusiones y Discusión

Conclusiones Principales

Viabilidad Técnica: Las redes neuronales profundas pueden aprender exitosamente la dinámica estocástica SABR compleja
Ventaja de Precisión: Significativamente superior a aproximación analítica en regiones de plazo largo y precios de ejercicio extremos
Valor Práctico: Satisface requisitos de precisión y eficiencia para operaciones diarias y gestión de riesgos
Robustez: Modelo de entrenamiento único capaz de adaptarse a diferentes entornos de mercado

Limitaciones

Costo Computacional: Generación de datos inicial y entrenamiento requieren recursos computacionales significativos
Cobertura de Mercado: Actualmente dirigido únicamente a mercado EUR Cap/Floor, requiere extensión a otros productos
Instituciones de Mercado: Cambios importantes en instituciones de mercado pueden requerir reentrenamiento
Riesgo de Modelo: Naturaleza de "caja negra" de redes neuronales puede introducir riesgo de modelo

Direcciones Futuras

Extensión de Productos: Extensión a cubos de Swaption y productos de tasas nocturnas
Múltiples Monedas: Cobertura de mercados de otras monedas principales como USD, GBP
Optimización de Red: Exploración de arquitecturas de red más avanzadas y estrategias de entrenamiento
Aplicaciones de Riesgo: Aplicaciones en VaR histórico y pruebas de estrés

Evaluación Profunda

Fortalezas

Innovación Fuerte: Primera implementación de aprendizaje automático a gran escala del modelo SABR completo, ruta técnica novedosa
Alto Valor Práctico: Resuelve directamente puntos críticos en la práctica financiera, con perspectivas claras de aplicación comercial
Experimentación Exhaustiva: Conjunto de datos a escala masiva y evaluación comparativa integral aseguran confiabilidad de resultados
Escritura Clara: Detalles técnicos exhaustivos, fuerte reproducibilidad

Deficiencias

Capacidad de Generalización: Validación únicamente en mercado EUR, aplicabilidad en otros mercados pendiente de verificación
Análisis Teórico: Falta análisis teórico del error de aproximación de red neuronal
Casos Extremos: Análisis insuficiente de robustez bajo volatilidad extrema de mercado
Barrera Computacional: Costo computacional elevado puede limitar aplicación en instituciones medianas y pequeñas

Impacto

Contribución Académica: Proporciona ejemplo importante para campo de intersección de finanzas computacionales y aprendizaje automático
Impacto Industrial: Puede cambiar prácticas estándar de la industria en valoración de derivados de tasas de interés
Metodología: Proporciona ideas para aprendizaje automático de otros modelos financieros complejos

Escenarios de Aplicación

Grandes Bancos de Inversión: Instituciones con recursos computacionales suficientes pueden aplicar directamente
Gestión de Riesgos: Escenarios de medición de riesgos que requieren valoración de alta precisión
Operaciones Algorítmicas: Entornos de operaciones de alta frecuencia con requisitos extremos de eficiencia computacional
Investigación Académica: Como modelo de referencia para investigación metodológica adicional

Referencias

Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
Hagan, P. et al. (2016). Universal Smiles. Wilmott.
McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.

Evaluación General: Este es un artículo de investigación de alta calidad con importante valor práctico en el campo de las finanzas computacionales. Los autores resuelven sistemáticamente problemas técnicos clave en la aplicación del modelo SABR, proporcionando una solución completa de extremo a extremo. A pesar de limitaciones como alto costo computacional y capacidad de generalización pendiente de verificación, su innovación técnica y valor práctico lo convierten en una contribución importante en este campo.