The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions.
We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality.
Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.
El modelo SABR es la piedra angular de la modelización de la volatilidad de tasas de interés, pero su aplicación práctica depende críticamente de la fórmula de aproximación analítica de Hagan et al., cuya precisión se deteriora significativamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero, generando incluso oportunidades de arbitraje. Aunque existen métodos de aprendizaje automático que intentan superar estas limitaciones, frecuentemente están restringidos a dinámicas SABR simplificadas o carecen de validación sistemática en condiciones de mercado completas. Esta investigación desarrolla una arquitectura SABR DNN novedosa que aprende la dinámica estocástica SABR verdadera mediante un conjunto de datos de entrenamiento a gran escala de más de 200 millones de puntos de datos, cubriendo plazos de hasta 30 años y precios de ejercicio extremos. El método proporciona calibración de superficies de volatilidad de mercado libre de arbitraje, con eficiencia computacional extrema y sin necesidad de reentrenamiento.
Importancia del Modelo SABR: El modelo SABR (Stochastic Alpha Beta Rho) es el modelo de volatilidad de tasas de interés más ampliamente utilizado en los mercados financieros globales, siendo dominante particularmente en la valoración de opciones sobre tasas de interés. Según datos del BIS, las opciones sobre tasas de interés son el tipo de opción más negociado en el mercado (volumen de transacciones de 600 mil millones de dólares en la segunda mitad de 2024).
Limitaciones de la Aproximación de Hagan:
La precisión se deteriora severamente en casos de alta volatilidad, plazos largos y opciones fuera del dinero
Puede producir densidades de probabilidad negativas, generando oportunidades de arbitraje
No puede valorar con precisión productos complejos que dependen de las alas de la sonrisa de volatilidad
Insuficiencias de los Métodos Existentes de Aprendizaje Automático:
La mayoría de investigaciones consideran únicamente SABR lognormal simplificado (β=1)
Conjuntos de datos de entrenamiento de tamaño limitado con cobertura incompleta de condiciones de mercado
Falta de validación sistemática con datos de mercado reales
Aprovechamiento insuficiente de la dinámica completa shifted-SABR
Establecer un marco de red neuronal profunda capaz de aprender el modelo SABR "exacto", superando las limitaciones de la aproximación analítica, para proporcionar herramientas de valoración de alta precisión y eficiencia para operaciones diarias y gestión de riesgos.
Construcción de Conjunto de Datos a Escala Masiva: Generación de más de 200 millones de puntos de datos de superficies de volatilidad de tasas de interés, cubriendo plazos de 30 años y precios de ejercicio extremos (-1.5% a 10%)
Desarrollo de Arquitectura SABR DNN Especializada: Diseño de tres redes neuronales profundas dirigidas a plazos cortos, medianos y largos, capaces de aprender la dinámica estocástica shifted-SABR completa
Implementación de Reducción de Dimensionalidad: Logro de reducción dimensional del espacio de parámetros mediante el modelo scaled shifted-SABR, mejorando la eficiencia del entrenamiento sin pérdida de generalidad
Provisión de Valoración Libre de Arbitraje: Implementación de calibración libre de arbitraje de superficies de volatilidad de mercado reales, adaptable a diferentes días de negociación sin reentrenamiento
Evaluación Comparativa Sistemática: Primera evaluación integral de precisión de la fórmula de aproximación más reciente de Hagan et al., cuantificando errores en diferentes regiones de mercado
Entrada: Parámetros del modelo SABR θ_SABR = {α̂, β, ρ, ν} y parámetros del contrato θ_CF = {T, K̂}
Salida: Volatilidad implícita shifted-Black σ_DNN
Objetivo: Aprender la relación de mapeo (θ_SABR, θ_CF) → σ_MC, haciendo que la salida DNN se aproxime a los resultados precisos de la simulación Monte Carlo
Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
Hagan, P. et al. (2016). Universal Smiles. Wilmott.
McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.
Evaluación General: Este es un artículo de investigación de alta calidad con importante valor práctico en el campo de las finanzas computacionales. Los autores resuelven sistemáticamente problemas técnicos clave en la aplicación del modelo SABR, proporcionando una solución completa de extremo a extremo. A pesar de limitaciones como alto costo computacional y capacidad de generalización pendiente de verificación, su innovación técnica y valor práctico lo convierten en una contribución importante en este campo.