Machine Learning models in finance are highly susceptible to model drift, where predictive performance declines as data distributions shift. This issue is especially acute in developing economies such as those in Central Asia and the Caucasus - including Tajikistan, Uzbekistan, Kazakhstan, and Azerbaijan - where frequent and unpredictable macroeconomics shocks destabilize financial data. To the best of our knowledge, this is among the first studies to examine drift mitigation methods on financial datasets from these regions. We investigate the use of synthetic outliers, a largely unexplored approach, to improve model stability against unforeseen shocks. To evaluate effectiveness, we introduce a two-level framework that measures both the extent of performance degradation and the severity of shocks. Our experiments on macroeconomic tabular datasets show that adding a small proportion of synthetic outliers generally improves stability compared to baseline models, though the optimal amount varies by dataset and model
- ID статьи: 2510.09294
- Название: Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers
- Авторы: Илья Варшавский, Бону Бобоева, Шухрат Халилбеков, Азизжон Азими, Сергей Шульгин, Ахлитдин Низамитдинов, Хайтц Саэс де Окариц Бордэ
- Категория: cs.LG (Машинное обучение)
- Конференция: 39-я конференция по нейронным системам обработки информации (NeurIPS 2025) Семинар: Генеративный ИИ в финансах
- Ссылка на статью: https://arxiv.org/abs/2510.09294
Модели машинного обучения в финансовой сфере подвержены дрейфу модели — снижению производительности прогнозирования при изменении распределения данных. Эта проблема особенно острая в развивающихся экономиках, особенно в Центральной Азии и на Кавказе (включая Таджикистан, Узбекистан, Казахстан и Азербайджан), где частые и непредсказуемые макроэкономические потрясения нарушают стабильность финансовых данных. По сведениям авторов, это одно из первых исследований методов смягчения дрейфа на финансовых наборах данных этих регионов. В статье исследуется малоизученный метод использования синтетических выбросов для повышения устойчивости модели к неожиданным потрясениям. Для оценки эффективности авторы предлагают двухуровневую схему, которая одновременно измеряет степень снижения производительности и серьезность потрясения. Эксперименты на макроэкономических табличных наборах данных показывают, что добавление небольшого количества синтетических выбросов обычно повышает стабильность по сравнению с базовыми моделями, хотя оптимальное количество варьируется в зависимости от набора данных и модели.
Данное исследование решает проблему дрейфа модели в финансовом машинном обучении при столкновении с изменениями распределения, особенно в развивающихся экономиках, где частые макроэкономические потрясения приводят к резкому снижению производительности модели.
- Серьезное экономическое воздействие: В развивающихся экономиках стоимость отказа модели может быть чрезвычайно высокой, особенно в критических финансовых приложениях, таких как оценка кредитного риска
- Частые и непредсказуемые потрясения: Центральная Азия и Кавказ часто сталкиваются с торговыми конфликтами, вооруженными конфликтами и другими внешними потрясениями, вызывающими резкие изменения распределения данных
- Пробел в исследованиях: Существующие исследования дрейфа модели в основном сосредоточены на развитых финансовых рынках, уделяя недостаточное внимание развивающимся экономикам
- Пассивный подход: Традиционные методы, такие как мониторинг показателей и переобучение, предпринимают действия только после возникновения дрейфа
- Зависимость от данных: Требуется ожидание реальных данных для переобучения модели
- Недостаточная региональная специфичность: Отсутствуют решения, адаптированные к особым условиям развивающихся экономик
Авторы предлагают активную стратегию, вводя синтетические выбросы на этапе обучения, чтобы заранее адаптировать модель к экстремальным ситуациям, повышая тем самым робастность модели при столкновении с неизвестными потрясениями.
- Предложена новая схема оценки стабильности: Включает два показателя — оценку стабилизации (SS) и повышение стабилизации (SU), которые количественно оценивают производительность модели при потрясениях
- Инновационное использование синтетических выбросов: Использование синтетических выбросов, генерируемых zGAN, для повышения робастности модели к внезапным потрясениям
- Заполнение пробела в региональных исследованиях: Первое систематическое исследование методов смягчения дрейфа модели на финансовых наборах данных Центральной Азии и Кавказа
- Предоставление открытой реализации: Выпуск полного кода, показателей и экспериментов, включая синтетические данные
Входные данные: Финансовые табличные данные (задача прогнозирования кредитного риска)
Выходные данные: Результат бинарной классификации (дефолт/нормально)
Цель: Сохранение стабильности прогнозной производительности модели при столкновении с внешними потрясениями, вызывающими изменения распределения данных
Потрясение определяется как внезапное событие в процессе генерации данных, вызывающее значительное немедленное изменение распределения признаков. Изменение распределения (DS) рассчитывается по формуле:
DS=∣C∣+∣N∣1(∑c∈CdTV(Pbaseline(c),Pshocked(c))+∑n∈NdKS(Pbaseline(n),Pshocked(n)))≥τ
где C и N обозначают категориальные и числовые признаки соответственно, dTV и dKS обозначают расстояние полной вариации и статистику Колмогорова-Смирнова.
Количественно оценивает способность модели сохранять производительность прогнозирования при дрейфе:
SS=1−1+log(1+DS+ε)∣A^base−A^shock∣∈[0.5,1]
где A^base и A^shock обозначают производительность модели на базовых и потрясенных данных соответственно.
Сравнивает относительное преимущество двух моделей при дрейфе:
SU=w⋅(wB′⋅SSB−wA′⋅SSA)
где веса рассчитываются через сигмоидную функцию, учитывая внутреннюю стабильность модели и относительное превосходство.
Использует генератор zGAN, включающий:
- Стандартные компоненты GAN: Архитектура генератор-дискриминатор
- Генератор ковариации условных выбросов (covGEN): Выборка макроскопических выбросов из многомерных распределений, совместимых с теорией экстремальных значений
- Условный VAE: Предоставление матриц ковариации
- Фильтр хеш-подобия: Избежание чрезмерного сходства с реальными записями
- Активная стратегия стабилизации: Вместо ожидания возникновения дрейфа модель подвергается воздействию экстремальных ситуаций на этапе обучения
- Двухуровневая схема оценки: SS измеряет стабильность отдельной модели, SU сравнивает относительное преимущество между моделями
- Дизайн с региональной спецификой: Методология разработана с учетом характеристик макроэкономических потрясений в развивающихся экономиках
- Немонотонная оптимизация: Обнаружено, что оптимальная доля выбросов обычно составляет 5-10%, а не чем больше, тем лучше
Эксперименты использовали приватные наборы данных по кредитному риску из 5 развивающихся экономик:
- A1 (Таджикистан): Потрясение торгового конфликта, DS=0.2250
- A4 (Узбекистан): Отсутствие явного потрясения, DS=0.0050
- A5 (Казахстан): Потрясение вооруженного конфликта, DS=0.1212
- A6 (Иордания): Отсутствие явного потрясения, DS=0.0026
- A9 (Азербайджан): Потрясение вооруженного конфликта, DS=0.1802
- Открытый набор данных (Lending Club): Потрясение торгового конфликта, DS=0.1193
Все задачи — бинарное прогнозирование дефолта с дисбалансом классов (примерно 2-12%).
- AUC_base: Производительность до потрясения
- AUC_shock: Производительность после потрясения
- SS: Оценка стабилизации
- SU: Повышение стабилизации
Протестированы 8 моделей машинного обучения:
- CatBoost, TabPFN, FT-Transformer, HGBoosting
- NGBoost, XGBoost, LightGBM, TabNet
- Разделение данных: разделение обучение/тест 80/20
- Доля синтетических данных: смешивание реальных/синтетических 50/50
- Доля выбросов: 0%, 1%, 3%, 5%, 7%, 10%, 50%, 100%
- Оценка методом Монте-Карло: 51 случайное разделение
- Глобальные гиперпараметры: (k1, k2, k3) = (100, 1000, 1000)
Согласно лучшим результатам в таблице 1:
- A1 (Таджикистан): TabNet без выбросов достигает SU=0.8441
- A4 (Узбекистан): TabPFN с 50% выбросов достигает SU=0.7449
- A9 (Азербайджан): TabPFN с 5% выбросов достигает SU=0.9981
- Открытый набор данных: FT-Transformer со 100% выбросов достигает SU=0.8884
- Гибкие архитектуры получают наибольшую пользу: TabPFN и FT-Transformer обычно достигают наивысших значений SU при потрясениях
- Доля выбросов немонотонна: Среднее введение (5-10%) часто максимизирует SU, слишком малое или слишком большое количество снижает выгоду
- Выгода коррелирует с интенсивностью потрясения: Наибольшие улучшения на наборах данных с высоким DS (A1, A9), ограниченные улучшения при минимальном DS (A4, A6)
Среди всех пар модель-набор данных:
- 53% случаев: Добавление ненулевой доли выбросов улучшает стабильность (135/256)
- 83% лучших конфигураций: Обучение с выбросами превосходит обучение без выбросов (10/12)
- Значительные различия между моделями: HGBoosting, NGBoost, XGBoost, LightGBM получают выгоду в 50% случаев, FT-Transformer в 75% случаев, CatBoost, TabPFN, TabNet в 100% случаев
Анализ признака "tjs/usd" обменного курса из набора данных Таджикистана показывает:
- Синтетические выбросы формируют разумные экстремальные значения в хвостах распределения
- Доля выбросов 5-10% обеспечивает достаточное воздействие экстремальных значений при сохранении реалистичности
- Проекция UMAP показывает высокое сходство синтетических данных с реальными данными, с выбросами, надлежащим образом распределенными в граничных областях
- Временной дрейф: Зависимости постепенно эволюционируют во времени
- Условный дрейф: Новые данные поступают из недостаточно представленных областей пространства признаков
- Контекстный дрейф: Внезапное изменение отношения вход-выход из-за внешних потрясений
Традиционные методы включают алгоритм ADWIN, инкрементальное обучение, скользящие окна и т.д., в основном это пассивные стратегии.
Связанные работы включают фреймворк TabOOD для генерации табличных выборок вне распределения и использование синтетических данных для обнаружения дрейфа в бизнес-процессах, но исследования целенаправленного использования синтетических выбросов для смягчения дрейфа остаются редкими.
- Синтетические выбросы эффективны: В большинстве случаев повышают стабильность модели при внезапных потрясениях
- Существует оптимальная доля: Обычно в диапазоне 5-10%, требуется баланс между воздействием экстремальных значений и качеством данных
- Чувствительность архитектуры: Гибкие архитектуры нейронных сетей лучше используют информацию о выбросах, чем традиционные древовидные модели
- Региональная применимость: Метод показывает эффективность на наборах данных из нескольких стран развивающихся экономик
- Отсутствие универсальных правил: Не найдено универсального метода выбора оптимального процента выбросов
- Ограничения набора данных: Проверка проводилась в основном на задачах кредитного риска, применимость к другим финансовым задачам неизвестна
- Ограничение типов потрясений: В основном ориентирован на макроэкономические потрясения, эффективность при других типах дрейфа неясна
- Вычислительные затраты: Требуется обучение дополнительной генеративной модели, что увеличивает вычислительные расходы
- Адаптивная доля выбросов: Разработка эвристических методов для автоматического определения оптимальной доли выбросов
- Множественные типы потрясений: Расширение на более разнообразные сценарии изменения распределения
- Адаптация в реальном времени: Интеграция с онлайн-обучением для динамической настройки
- Теоретический анализ: Предоставление более глубоких теоретических гарантий и анализа
- Выдающаяся важность проблемы: Сосредоточение на развивающихся экономиках — игнорируемом, но важном сценарии применения
- Сильная инновационность методологии: Активная стратегия введения выбросов обладает новизной и практической ценностью
- Совершенная схема оценки: Показатели SS и SU разумно спроектированы для комплексной оценки стабильности модели
- Строгий дизайн экспериментов: 51 повторение методом Монте-Карло, множество наборов данных, сравнение множества моделей
- Вклад в открытый исходный код: Предоставление полного кода и данных повышает воспроизводимость
- Приватность набора данных: Основные наборы данных не могут быть опубликованы, что ограничивает проверяемость результатов
- Слабая теоретическая база: Отсутствует глубокий теоретический анализ того, почему выбросы повышают стабильность
- Чувствительность гиперпараметров: Выбор параметров k1, k2, k3 показателя SU лишен достаточного теоретического обоснования
- Неясная область применения: Проверка проводилась в основном на табличных данных, применимость к другим типам данных неизвестна
- Вычислительная эффективность: Отсутствует анализ вычислительных затрат и масштабируемости методологии
- Академический вклад: Предоставляет новую перспективу и методологию для исследования дрейфа модели
- Практическая ценность: Имеет прямое применение для финансовых учреждений развивающихся экономик
- Вдохновляющая методология: Активная стратегия стабилизации может вдохновить дальнейшие исследования
- Ценность набора данных: Несмотря на приватность, обеспечивает важную эмпирическую базу для исследований в этом регионе
- Финансовые учреждения развивающихся экономик: Особенно подходит для финансовых сред, сталкивающихся с частыми внешними потрясениями
- Управление кредитным риском: Повышение робастности модели в критических задачах, таких как прогнозирование дефолта
- Макроэкономически нестабильные регионы: Любые рынки, сталкивающиеся с политической и экономической неопределенностью
- Активное управление рисками: Сценарии, требующие упреждающего предотвращения, а не пассивного реагирования
Статья цитирует 31 связанную работу, включая в основном:
- Фундаментальные исследования дрейфа модели: Обзорные работы Hinder et al. (2024), Halstead et al. (2022) и других о концептуальном дрейфе
- Методы обнаружения дрейфа: Алгоритм ADWIN (Bifet & Gavaldà, 2007), методы онлайн-обучения и т.д.
- Генерация синтетических данных: Работы, связанные с GAN (Goodfellow et al., 2014), фреймворк TabOOD (Puranik et al., 2024)
- Модели машинного обучения: Оригинальные статьи основных моделей CatBoost, XGBoost, LightGBM и т.д.
- Статистические методы: Теория экстремальных значений (de Haan & Ferreira, 2006), тест Колмогорова-Смирнова и т.д.
Общая оценка: Это высококачественная статья, предлагающая инновационное решение важной, но игнорируемой проблемы применения (финансовая стабильность в развивающихся экономиках). Методология новаторская, эксперименты полные, результаты имеют важное значение для практического применения, но есть возможности для улучшения в теоретической глубине и универсальности.