2025-11-16T22:37:12.905987

Learning the Exact SABR Model

Rensi, Rossi, Bianchetti

The SABR model is a cornerstone of interest rate volatility modeling, but its practical application relies heavily on the analytical approximation by Hagan et al., whose accuracy deteriorates for high volatility, long maturities, and out-of-the-money options, admitting arbitrage. While machine learning approaches have been proposed to overcome these limitations, they have often been limited by simplified SABR dynamics or a lack of systematic validation against the full spectrum of market conditions. We develop a novel SABR DNN, a specialized Artificial Deep Neural Network (DNN) architecture that learns the true SABR stochastic dynamics using an unprecedented large training dataset (more than 200 million points) of interest rate Cap/Floor volatility surfaces, including very long maturities (30Y) and extreme strikes consistently with market quotations. Our dataset is obtained via high-precision unbiased Monte Carlo simulation of a special scaled shifted-SABR stochastic dynamics, which allows dimensional reduction without any loss of generality. Our SABR DNN provides arbitrage-free calibration of real market volatility surfaces and Caps/Floors prices for any maturity and strike with negligible computational effort and without retraining across business dates. Our results fully address the gaps in the previous machine learning SABR literature in a systematic and self-consistent way, and can be extended to cover any interest rate European options in different rate tenors and currencies, thus establishing a comprehensive functional SABR framework that can be adopted for daily trading and risk management activities.

academic

Обучение точной модели SABR

Основная информация

ID статьи: 2510.10343
Название: Learning the Exact SABR Model
Авторы: Giorgia Rensi, Pietro Rossi, Marco Bianchetti
Классификация: q-fin.CP (Вычислительные финансы), q-fin.PR (Ценообразование ценных бумаг), q-fin.RM (Управление рисками)
Дата публикации: 14 октября 2025 г.
Ссылка на статью: https://arxiv.org/abs/2510.10343

Аннотация

Модель SABR является краеугольным камнем моделирования волатильности процентных ставок, однако её практическое применение в значительной степени зависит от аналитического приближения Hagana и соавторов, точность которого ухудшается при высокой волатильности, длительных сроках и опционах вне денег, вплоть до появления арбитражных возможностей. Хотя существуют методы машинного обучения, направленные на преодоление этих ограничений, они часто ограничены упрощённой динамикой SABR или отсутствием систематической проверки на полном спектре рыночных условий. В данном исследовании разработана новая архитектура DNN для SABR, которая обучается на основе истинной стохастической динамики SABR с использованием большого набора данных из более чем 200 миллионов точек данных, охватывающего сроки до 30 лет и экстремальные цены исполнения. Этот метод обеспечивает безарбитражную калибровку кривой волатильности рынка с чрезвычайно высокой вычислительной эффективностью и без необходимости переобучения.

Исследовательский контекст и мотивация

Проблемный фон

Значимость модели SABR: Модель SABR (Stochastic Alpha Beta Rho) является наиболее широко используемой моделью волатильности процентных ставок на глобальных финансовых рынках, особенно доминирует в ценообразовании опционов на процентные ставки. По данным BIS, опционы на процентные ставки являются наиболее торгуемым типом опционов на рынке (объём торговли в размере 600 млрд долларов США во второй половине 2024 года).
Ограничения приближения Hagana:
- Точность значительно ухудшается при высокой волатильности, длительных сроках и опционах вне денег
- Может привести к отрицательной плотности вероятности, создавая арбитражные возможности
- Не может точно оценить сложные продукты, зависящие от крыльев улыбки волатильности
Недостатки существующих методов машинного обучения:
- Большинство исследований рассматривают только упрощённую логнормальную SABR (β=1)
- Ограниченный размер наборов обучающих данных с неполным охватом рыночных условий
- Отсутствие систематической проверки на реальных рыночных данных
- Недостаточное использование полной динамики shifted-SABR

Исследовательская мотивация

Создание глубокой нейронной сети, способной обучаться «точной» модели SABR, преодолевая ограничения аналитических приближений и обеспечивая высокоточный и эффективный инструмент ценообразования для ежедневной торговли и управления рисками.

Основные вклады

Построение сверхбольшого набора обучающих данных: Генерация более 200 миллионов точек данных кривой волатильности процентных ставок, охватывающих 30-летние сроки и экстремальные цены исполнения (-1,5% до 10%)
Разработка специализированной архитектуры SABR DNN: Проектирование трёх глубоких нейронных сетей для краткосрочного, среднесрочного и долгосрочного периодов, способных обучаться полной стохастической динамике shifted-SABR
Реализация снижения размерности: Достижение снижения размерности пространства параметров через масштабированную модель shifted-SABR, повышение эффективности обучения без потери универсальности
Обеспечение безарбитражного ценообразования: Реализация безарбитражной калибровки реальной кривой волатильности рынка, адаптируемой к различным торговым дням без необходимости переобучения
Систематическое тестирование: Первая комплексная оценка точности последней версии приближения Hagana и соавторов, количественная оценка ошибок в различных рыночных регионах

Подробное описание методологии

Определение задачи

Входные данные: Параметры модели SABR θ_SABR = {α̂, β, ρ, ν} и параметры контракта θ_CF = {T, K̂} Выходные данные: Подразумеваемая волатильность shifted-Black σ_DNN Цель: Обучение отображению (θ_SABR, θ_CF) → σ_MC, чтобы выход DNN приближался к результатам точного моделирования методом Монте-Карло

Архитектура модели

1. Масштабированная динамика Shifted-SABR

Для снижения размерности параметров вводится нормализованный процесс:

X(t) = F̄(t)/F̄₀
dX(t) = σ̂(t)X^β(t)dW(t), X(0) = 1
dσ̂(t) = νσ̂(t)dZ(t), σ̂(0) = αF̂₀^(β-1)

2. Трёхуровневая архитектура DNN

Входной слой: 6 узлов для получения {α̂, β, ρ, ν, T, K̂}
Скрытые слои: 5 слоёв по 64 узла в каждом, функция активации ELU
Выходной слой: 1 узел для вывода подразумеваемой волатильности, линейная функция активации
Оптимизатор: ADAM, максимум 500 эпох, механизм ранней остановки

3. Стратегия многоуровневого обучения

Разделение временного диапазона на три подмножества:

DNN 1: Краткосрочный период [0,25, 4 года)
DNN 2: Среднесрочный период [4, 10,5 года)
DNN 3: Долгосрочный период 10,5, 30 лет

Технические инновации

Полная динамика SABR: Параметр β не фиксируется, сохраняется полная гибкость модели
Высокоточное моделирование Монте-Карло: Использование несмещённого моделирования Монте-Карло для генерации эталонных данных, избегание ошибок аналитического приближения
Интеллектуальная выборка данных: Применение латинской гиперкубической выборки для обеспечения полного охвата пространства параметров
Механизм фильтрации ошибок: DNN действует как фильтр, извлекая истинную информацию и отбрасывая шум Монте-Карло

Экспериментальная установка

Набор данных

Обучающий набор: 1 572 864 случайные сетчатые поверхности, всего примерно 2,39 млрд точек волатильности
Набор валидации: 20% от обучающего набора (примерно 47,7 млн точек)
Набор тестирования: Независимо сгенерированные 40 960 образцов
Диапазон параметров:
- F₀: 0,25%, 5%
- α: 0,001, 0,2
- β: 0,05, 0,9
- ρ: -0,8, 0,6
- ν: 0,05, 1,6

Метрики оценки

RMSE: Среднеквадратическая ошибка
Относительная ошибка: |Δσ| = |σ_DNN - σ_MC|
RMSD: Относительное среднеквадратическое расстояние
ARD: Абсолютная относительная разница

Методы сравнения

SABR Hagan: Использование последней версии аналитического приближения Hagana и соавторов
MC SABR: Высокоточное моделирование Монте-Карло в качестве эталона

Детали реализации

Вычислительные ресурсы: 25 000-30 000 часов CPU, 256 CPU параллельно
Время обучения: Примерно 5 часов GPU для каждой DNN (включая настройку гиперпараметров)
Параметры Монте-Карло: 2^18 путей, временной шаг 0,5-3 дня

Результаты экспериментов

Основные результаты

1. Производительность обучения DNN

Метрика	Обучающий набор	Набор тестирования
RMSE	0,28%	0,25%
\|Δσ\| > 1%	1%	-
\|Δσ\| > 5%	0,26%	-

2. Точность рыночной калибровки в сравнении

На примере рыночных данных EUR Cap/Floor от 30 августа 2024 года:

Краткосрочный период (1,5 года):

SABR DNN и MC SABR DNN практически полностью совпадают
SABR Hagan и MC SABR Hagan имеют незначительные различия

Долгосрочный период (30 лет):

SABR DNN сохраняет высокую точность, RMSD < 1%
Ошибка SABR Hagan значительно возрастает, RMSD > 5% при наименьшей цене исполнения

3. Анализ ухудшения точности

Относительная ошибка приближения Hagana в зависимости от срока и цены исполнения:

Эффект срока: Опционы на 30 лет имеют примерно в 10 раз большую ошибку, чем опционы на 1,5 года
Эффект цены исполнения: Максимальная ошибка при наименьшей цене исполнения (-1,5%), достигая 10%
SABR DNN: Сохраняет стабильную ошибку < 2% во всех регионах

Абляционные эксперименты

Влияние глубины сети: Уменьшение количества скрытых слоёв приводит к снижению производительности, увеличение слоёв даёт убывающую отдачу
Размер набора данных: Больший набор данных повышает способность фильтрации шумных данных
Диапазон параметров: Итеративно оптимизированный диапазон параметров обеспечивает стабильность результатов калибровки

Вычислительная производительность

Автономный этап: Генерация данных и обучение требуют значительных вычислительных ресурсов (одноразово)
Онлайн-этап: Калибровка одной улыбки < 1 секунды, чрезвычайно высокая вычислительная эффективность
Без переобучения: Одна DNN может обрабатывать рыночные данные различных торговых дней

Связанные работы

Традиционные методы SABR

Hagan et al. (2002): Исходная модель SABR и аналитическое приближение
Hagan et al. (2016): Расширение shifted-SABR, обработка отрицательных процентных ставок

Методы машинного обучения SABR

McGhee (2021): Первое применение нейронных сетей к SABR, но ограничено случаем β=1
Jeon et al. (2022): GPU-ускоренное моделирование Монте-Карло для генерации набора данных
Funahashi (2023): Метод контрольных переменных для улучшения обучения
Hoshisashi et al. (2024): Нейронные сети с ограничениями производных для обеспечения безарбитражности

Преимущества данной работы

Полнота: Рассмотрение полной динамики shifted-SABR без упрощения параметра β
Масштаб: Размер набора обучающих данных превосходит предыдущие исследования на несколько порядков
Практичность: Прямое применение к реальным рыночным данным и торговой практике
Систематичность: Предоставление полного комплексного решения

Заключение и обсуждение

Основные выводы

Техническая осуществимость: Глубокие нейронные сети способны успешно обучаться сложной стохастической динамике SABR
Преимущества в точности: Значительное превосходство над аналитическим приближением в регионах с длительными сроками и экстремальными ценами исполнения
Практическая ценность: Соответствие требованиям точности и эффективности для ежедневной торговли и управления рисками
Робастность: Модель, обученная один раз, способна адаптироваться к различным рыночным условиям

Ограничения

Вычислительные затраты: Начальная генерация данных и обучение требуют значительных вычислительных ресурсов
Охват рынка: В настоящее время проверено только на рынке EUR Cap/Floor, требуется расширение на другие продукты
Рыночные институты: Значительные изменения рыночных институтов могут потребовать переобучения
Модельный риск: «Чёрный ящик» нейронной сети может привести к модельному риску

Направления будущих исследований

Расширение продуктов: Расширение на кубы Swaption и продукты овернайт-ставок
Многовалютность: Охват рынков других основных валют (USD, GBP и т.д.)
Оптимизация сети: Исследование более передовых архитектур сетей и стратегий обучения
Приложения управления рисками: Применение в историческом VaR и стресс-тестировании

Глубокая оценка

Сильные стороны

Высокая инновационность: Первое реализованное крупномасштабное машинное обучение полной модели SABR с новой технической схемой
Высокая практическая ценность: Прямое решение ключевых проблем финансовой практики с явными перспективами коммерческого применения
Полнота экспериментов: Сверхбольшой набор данных и комплексное тестирование обеспечивают надёжность результатов
Ясность изложения: Детальное описание технических аспектов обеспечивает воспроизводимость

Недостатки

Способность к обобщению: Проверено только на рынке EUR, применимость на других рынках требует подтверждения
Теоретический анализ: Отсутствие теоретического анализа ошибок аппроксимации нейронной сетью
Экстремальные ситуации: Недостаточный анализ робастности при экстремальных рыночных колебаниях
Вычислительный барьер: Высокие вычислительные затраты могут ограничить применение в средних и малых учреждениях

Влияние

Научный вклад: Предоставление важного примера для пересечения вычислительных финансов и машинного обучения
Влияние на отрасль: Возможность изменения стандартной практики ценообразования производных инструментов на процентные ставки
Методология: Предоставление идей для машинного обучения других сложных финансовых моделей

Сценарии применения

Крупные инвестиционные банки: Учреждения с достаточными вычислительными ресурсами могут применять напрямую
Управление рисками: Сценарии измерения рисков, требующие высокоточного ценообразования
Алгоритмическая торговля: Среды высокочастотной торговли с экстремальными требованиями к вычислительной эффективности
Академические исследования: Использование в качестве эталонной модели для дальнейших методологических исследований

Библиография

Hagan, P. et al. (2002). Managing Smile Risk. Wilmott Magazine.
Hagan, P. et al. (2016). Universal Smiles. Wilmott.
McGhee, W. A. (2021). An artificial neural network representation of the SABR stochastic volatility model. Journal of Computational Finance.
Baschetti, F. et al. (2024). Deep calibration with random grids. Quantitative Finance.

Общая оценка: Это высококачественное исследование с важной практической ценностью в области вычислительных финансов. Авторы систематически решили ключевые технические проблемы применения модели SABR, предоставив полное комплексное решение. Несмотря на такие ограничения, как высокие вычислительные затраты и необходимость проверки способности к обобщению, техническая инновационность и практическая ценность делают это исследование значительным вкладом в данную область.