2025-11-16T22:37:12.905987

Learning the Exact SABR Model

Rensi, Rossi, Bianchetti
The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions. We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality. Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.
academic

Aprendizaje del Modelo SABR Exacto

Información Básica

  • ID del Artículo: 2510.10343
  • Título: Learning the Exact SABR Model
  • Autores: Giorgia Rensi, Pietro Rossi, Marco Bianchetti
  • Clasificación: q-fin.CP (Finanzas Computacionales), q-fin.PR (Valoración de Valores), q-fin.RM (Gestión de Riesgos)
  • Fecha de Publicación: 14 de octubre de 2025
  • Enlace del Artículo: https://arxiv.org/abs/2510.10343

Resumen

El modelo SABR es la piedra angular de la modelización de la volatilidad de tasas de interés, pero su aplicación práctica depende críticamente de la fórmula de aproximación analítica de Hagan et al., cuya precisión se deteriora significativamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero, generando incluso oportunidades de arbitraje. Aunque existen métodos de aprendizaje automático que intentan superar estas limitaciones, frecuentemente están restringidos a dinámicas SABR simplificadas o carecen de validación sistemática en condiciones de mercado completas. Esta investigación desarrolla una arquitectura SABR DNN novedosa que aprende la dinámica estocástica SABR verdadera mediante un conjunto de datos de entrenamiento a gran escala de más de 200 millones de puntos de datos, cubriendo plazos de hasta 30 años y precios de ejercicio extremos. El método proporciona calibración de superficies de volatilidad de mercado libre de arbitraje, con eficiencia computacional extrema y sin necesidad de reentrenamiento.

Antecedentes y Motivación de la Investigación

Contexto del Problema

  1. Importancia del Modelo SABR: El modelo SABR (Stochastic Alpha Beta Rho) es el modelo de volatilidad de tasas de interés más ampliamente utilizado en los mercados financieros globales, siendo dominante particularmente en la valoración de opciones sobre tasas de interés. Según datos del BIS, las opciones sobre tasas de interés son el tipo de opción más negociado en el mercado (volumen de transacciones de 600 mil millones de dólares en la segunda mitad de 2024).
  2. Limitaciones de la Aproximación de Hagan:
    • La precisión se deteriora severamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero
    • Puede producir densidades de probabilidad negativas, generando oportunidades de arbitraje
    • No puede valorar con precisión productos complejos que dependen de las alas de la sonrisa de volatilidad
  3. Insuficiencias de los Métodos Existentes de Aprendizaje Automático:
    • La mayoría de investigaciones consideran únicamente SABR lognormal simplificado (β=1)
    • Conjuntos de datos de entrenamiento de tamaño limitado con cobertura incompleta de condiciones de mercado
    • Falta de validación sistemática con datos de mercado reales
    • Aprovechamiento insuficiente de la dinámica completa shifted-SABR

Motivación de la Investigación

Establecer un marco de red neuronal profunda capaz de aprender el modelo SABR "exacto", superando las limitaciones de la aproximación analítica, para proporcionar herramientas de valoración de alta precisión y eficiencia para operaciones diarias y gestión de riesgos.

Contribuciones Principales

  1. Construcción de Conjunto de Datos a Escala Masiva: Generación de más de 200 millones de puntos de datos de superficies de volatilidad de tasas de interés, cubriendo plazos de 30 años y precios de ejercicio extremos (-1.5% a 10%)
  2. Desarrollo de Arquitectura SABR DNN Especializada: Diseño de tres redes neuronales profundas dirigidas a plazos cortos, medianos y largos, capaces de aprender la dinámica estocástica shifted-SABR completa
  3. Implementación de Reducción de Dimensionalidad: Logro de reducción dimensional del espacio de parámetros mediante el modelo scaled shifted-SABR, mejorando la eficiencia del entrenamiento sin pérdida de generalidad
  4. Provisión de Valoración Libre de Arbitraje: Implementación de calibración libre de arbitraje de superficies de volatilidad de mercado reales, adaptable a diferentes días de negociación sin reentrenamiento
  5. Evaluación Comparativa Sistemática: Primera evaluación integral de precisión de la fórmula de aproximación más reciente de Hagan et al., cuantificando errores en diferentes regiones de mercado

Explicación Detallada de la Metodología

Definición de la Tarea

Entrada: Parámetros del modelo SABR θ_SABR = {α̂, β, ρ, ν} y parámetros del contrato θ_CF = {T, K̂} Salida: Volatilidad implícita shifted-Black σ_DNN Objetivo: Aprender la relación de mapeo (θ_SABR, θ_CF) → σ_MC, haciendo que la salida DNN se aproxime a los resultados precisos de la simulación Monte Carlo

Arquitectura del Modelo

1. Dinámica Scaled Shifted-SABR

Para reducir la dimensionalidad de parámetros, se introduce el siguiente proceso estandarizado:

X(t) = F̄(t)/F̄₀
dX(t) = σ̂(t)X^β(t)dW(t), X(0) = 1
dσ̂(t) = νσ̂(t)dZ(t), σ̂(0) = αF̂₀^(β-1)

2. Arquitectura DNN de Tres Capas

  • Capa de Entrada: 6 nodos reciben {α̂, β, ρ, ν, T, K̂}
  • Capas Ocultas: 5 capas, 64 nodos por capa, función de activación ELU
  • Capa de Salida: 1 nodo que produce volatilidad implícita, función de activación lineal
  • Optimizador: ADAM, máximo 500 épocas, mecanismo de parada temprana

3. Estrategia de Entrenamiento Estratificado

División del dominio de plazos en tres subconjuntos:

  • DNN 1: Corto plazo [0.25, 4 años)
  • DNN 2: Plazo medio [4, 10.5 años)
  • DNN 3: Largo plazo 10.5, 30 años

Puntos de Innovación Técnica

  1. Dinámica SABR Completa: No fija el parámetro β, manteniendo flexibilidad y completitud del modelo
  2. Monte Carlo de Alta Precisión: Utiliza simulación Monte Carlo insesgada para generar datos de referencia, evitando errores de aproximación analítica
  3. Muestreo Inteligente de Datos: Emplea muestreo de hipercubo latino para asegurar cobertura suficiente del espacio de parámetros
  4. Mecanismo de Filtrado de Errores: DNN actúa como filtro, extrayendo información verdadera mientras descarta ruido Monte Carlo

Configuración Experimental

Conjunto de Datos

  • Conjunto de Entrenamiento: 1,572,864 superficies de cuadrícula aleatoria, totalizando aproximadamente 2.39 mil millones de puntos de volatilidad
  • Conjunto de Validación: 20% del conjunto de entrenamiento (aproximadamente 47.7 millones de puntos)
  • Conjunto de Prueba: 40,960 puntos de muestra generados independientemente
  • Rango de Parámetros:
    • F₀: 0.25%, 5%
    • α: 0.001, 0.2
    • β: 0.05, 0.9
    • ρ: -0.8, 0.6
    • ν: 0.05, 1.6

Métricas de Evaluación

  • RMSE: Error cuadrático medio raíz
  • Error Relativo: |Δσ| = |σ_DNN - σ_MC|
  • RMSD: Distancia cuadrática media relativa
  • ARD: Diferencia relativa absoluta

Métodos de Comparación

  • SABR Hagan: Aproximación analítica versión más reciente de Hagan et al.
  • MC SABR: Simulación Monte Carlo de alta precisión como referencia

Detalles de Implementación

  • Recursos Computacionales: 25,000-30,000 horas CPU, 256 CPUs en paralelo
  • Tiempo de Entrenamiento: Aproximadamente 5 horas GPU por DNN (incluyendo ajuste de hiperparámetros)
  • Configuración Monte Carlo: 2^18 trayectorias, paso de tiempo 0.5-3 días

Resultados Experimentales

Resultados Principales

1. Rendimiento del Entrenamiento DNN

MétricaConjunto de EntrenamientoConjunto de Prueba
RMSE0.28%0.25%
|Δσ| > 1%1%-
|Δσ| > 5%0.26%-

2. Precisión de Calibración de Mercado

Tomando como ejemplo datos de mercado EUR Cap/Floor del 30 de agosto de 2024:

Corto Plazo (1.5 años):

  • SABR DNN y MC SABR DNN prácticamente coinciden completamente
  • SABR Hagan y MC SABR Hagan presentan ligeras diferencias

Largo Plazo (30 años):

  • SABR DNN mantiene alta precisión, RMSD < 1%
  • SABR Hagan muestra error significativamente aumentado, RMSD > 5% en precios de ejercicio más bajos

3. Análisis del Deterioro de Precisión

Error relativo de la aproximación de Hagan según plazo y precio de ejercicio:

  • Efecto de Plazo: Opciones a 30 años presentan error aproximadamente 10 veces mayor que opciones a 1.5 años
  • Efecto de Precio de Ejercicio: Error máximo en precio de ejercicio más bajo (-1.5%), alcanzando 10%
  • SABR DNN: Mantiene error estable < 2% en todas las regiones

Experimentos de Ablación

  1. Impacto de Profundidad de Red: Reducción de capas ocultas causa deterioro de rendimiento, aumento de capas muestra rendimientos decrecientes
  2. Escala de Conjunto de Datos: Conjuntos de datos más grandes mejoran la capacidad de filtrado de datos ruidosos
  3. Rango de Parámetros: Rango de parámetros optimizado iterativamente asegura estabilidad de resultados de calibración

Rendimiento Computacional

  • Fase Offline: Generación de datos y entrenamiento requieren recursos computacionales significativos (una sola vez)
  • Fase Online: Calibración de sonrisa individual < 1 segundo, eficiencia computacional extrema
  • Sin Reentrenamiento: Un mismo DNN puede procesar datos de mercado de diferentes días de negociación

Trabajo Relacionado

Métodos SABR Tradicionales

  • Hagan et al. (2002): Modelo SABR original y aproximación analítica
  • Hagan et al. (2016): Extensión shifted-SABR, manejo de tasas de interés negativas

Métodos SABR de Aprendizaje Automático

  • McGhee (2021): Primera aplicación de redes neuronales a SABR, limitado al caso β=1
  • Jeon et al. (2022): Generación de conjuntos de datos acelerada por GPU Monte Carlo
  • Funahashi (2023): Método de variables de control para mejorar entrenamiento
  • Hoshisashi et al. (2024): Red neuronal con restricciones derivadas para asegurar ausencia de arbitraje

Ventajas de Este Artículo

  1. Completitud: Considera dinámica shifted-SABR completa, sin simplificación del parámetro β
  2. Escala: Conjunto de datos de entrenamiento que supera investigaciones previas por varios órdenes de magnitud
  3. Practicidad: Dirigido directamente a datos de mercado reales y práctica comercial
  4. Sistematicidad: Proporciona solución completa de extremo a extremo

Conclusiones y Discusión

Conclusiones Principales

  1. Viabilidad Técnica: Las redes neuronales profundas pueden aprender exitosamente la dinámica estocástica SABR compleja
  2. Ventaja de Precisión: Significativamente superior a aproximación analítica en regiones de plazo largo y precios de ejercicio extremos
  3. Valor Práctico: Satisface requisitos de precisión y eficiencia para operaciones diarias y gestión de riesgos
  4. Robustez: Modelo de entrenamiento único capaz de adaptarse a diferentes entornos de mercado

Limitaciones

  1. Costo Computacional: Generación de datos inicial y entrenamiento requieren recursos computacionales significativos
  2. Cobertura de Mercado: Actualmente dirigido únicamente a mercado EUR Cap/Floor, requiere extensión a otros productos
  3. Instituciones de Mercado: Cambios importantes en instituciones de mercado pueden requerir reentrenamiento
  4. Riesgo de Modelo: Naturaleza de "caja negra" de redes neuronales puede introducir riesgo de modelo

Direcciones Futuras

  1. Extensión de Productos: Extensión a cubos de Swaption y productos de tasas nocturnas
  2. Múltiples Monedas: Cobertura de mercados de otras monedas principales como USD, GBP
  3. Optimización de Red: Exploración de arquitecturas de red más avanzadas y estrategias de entrenamiento
  4. Aplicaciones de Riesgo: Aplicaciones en VaR histórico y pruebas de estrés

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primera implementación de aprendizaje automático a gran escala del modelo SABR completo, ruta técnica novedosa
  2. Alto Valor Práctico: Resuelve directamente puntos críticos en la práctica financiera, con perspectivas claras de aplicación comercial
  3. Experimentación Exhaustiva: Conjunto de datos a escala masiva y evaluación comparativa integral aseguran confiabilidad de resultados
  4. Escritura Clara: Detalles técnicos exhaustivos, fuerte reproducibilidad

Deficiencias

  1. Capacidad de Generalización: Validación únicamente en mercado EUR, aplicabilidad en otros mercados pendiente de verificación
  2. Análisis Teórico: Falta análisis teórico del error de aproximación de red neuronal
  3. Casos Extremos: Análisis insuficiente de robustez bajo volatilidad extrema de mercado
  4. Barrera Computacional: Costo computacional elevado puede limitar aplicación en instituciones medianas y pequeñas

Impacto

  1. Contribución Académica: Proporciona ejemplo importante para campo de intersección de finanzas computacionales y aprendizaje automático
  2. Impacto Industrial: Puede cambiar prácticas estándar de la industria en valoración de derivados de tasas de interés
  3. Metodología: Proporciona ideas para aprendizaje automático de otros modelos financieros complejos

Escenarios de Aplicación

  1. Grandes Bancos de Inversión: Instituciones con recursos computacionales suficientes pueden aplicar directamente
  2. Gestión de Riesgos: Escenarios de medición de riesgos que requieren valoración de alta precisión
  3. Operaciones Algorítmicas: Entornos de operaciones de alta frecuencia con requisitos extremos de eficiencia computacional
  4. Investigación Académica: Como modelo de referencia para investigación metodológica adicional

Referencias

  1. Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
  2. Hagan, P. et al. (2016). Universal Smiles. Wilmott.
  3. McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
  4. Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.

Evaluación General: Este es un artículo de investigación de alta calidad con importante valor práctico en el campo de las finanzas computacionales. Los autores resuelven sistemáticamente problemas técnicos clave en la aplicación del modelo SABR, proporcionando una solución completa de extremo a extremo. A pesar de limitaciones como alto costo computacional y capacidad de generalización pendiente de verificación, su innovación técnica y valor práctico lo convierten en una contribución importante en este campo.