Machine Learning models in finance are highly susceptible to model drift, where predictive performance declines as data distributions shift. This issue is especially acute in developing economies such as those in Central Asia and the Caucasus - including Tajikistan, Uzbekistan, Kazakhstan, and Azerbaijan - where frequent and unpredictable macroeconomics shocks destabilize financial data. To the best of our knowledge, this is among the first studies to examine drift mitigation methods on financial datasets from these regions. We investigate the use of synthetic outliers, a largely unexplored approach, to improve model stability against unforeseen shocks. To evaluate effectiveness, we introduce a two-level framework that measures both the extent of performance degradation and the severity of shocks. Our experiments on macroeconomic tabular datasets show that adding a small proportion of synthetic outliers generally improves stability compared to baseline models, though the optimal amount varies by dataset and model
- 論文ID: 2510.09294
- タイトル: Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers
- 著者: Ilyas Varshavskiy, Bonu Boboeva, Shuhrat Khalilbekov, Azizjon Azimi, Sergey Shulgin, Akhlitdin Nizamitdinov, Haitz Sáez de Ocáriz Borde
- 分類: cs.LG(機械学習)
- 発表会議: 第39回ニューラル情報処理システム会議(NeurIPS 2025)ワークショップ:金融における生成AI
- 論文リンク: https://arxiv.org/abs/2510.09294
金融領域の機械学習モデルはモデルドリフト、すなわちデータ分布の変化に伴う予測性能の低下の影響を極めて受けやすい。この問題は発展途上国経済、特に中央アジアとコーカサス地域(タジキスタン、ウズベキスタン、カザフスタン、アゼルバイジャンを含む)において特に深刻である。頻繁で予測不可能なマクロ経済ショックが金融データの安定性を損なうためである。著者の知見では、これらの地域の金融データセットに対するドリフト緩和方法の研究は初めてのものである。本論文は、合成外れ値を用いるという基本的にまだ未探索の方法を用いて、予期しないショックに対するモデルの安定性を向上させることを研究している。有効性を評価するため、著者は性能低下の程度とショック重大度の両方を測定する二層フレームワークを導入した。マクロ経済表形式データセットに対する実験は、少量の合成外れ値を追加することが通常ベースラインモデルより安定性を向上させることを示しており、最適な数量はデータセットとモデルによって異なる。
本研究は、分布変化に直面する際の金融機械学習モデルにおけるモデルドリフト問題、特に発展途上国経済における頻繁なマクロ経済ショックに起因するモデル性能の急激な低下に対処することを目的としている。
- 経済的影響の深刻性:発展途上国経済では、モデル障害のコストは極めて高くなる可能性があり、特に信用リスク評価などの重要な金融応用において顕著である
- ショックの頻繁性と予測不可能性:中央アジアとコーカサス地域は貿易紛争や武力紛争などの外部ショックに頻繁に直面し、データ分布の急激な変化をもたらす
- 研究ギャップ:既存のモデルドリフト研究は主に成熟した金融市場に集中しており、発展途上国経済への関心が不足している
- 受動的対応:従来の方法(指標監視、再訓練など)はドリフト発生後にのみ対応する
- データ依存性:モデルの再訓練のために実世界データの到着を待つ必要がある
- 地域特異性の不足:発展途上国経済の特殊な状況に対応した解決策が欠けている
著者は能動的戦略を提案し、訓練段階で合成外れ値を導入することで、モデルを事前に極端な状況に適応させ、未知のショックに直面した際のモデルの堅牢性を向上させる。
- 新しい安定性評価フレームワークの提案:安定化スコア(SS)と安定化向上(SU)の2つの指標を含み、ショック下でのモデルの安定性パフォーマンスを定量化できる
- 合成外れ値の革新的使用:zGANで生成された合成外れ値を利用して、突発的なショックに対するモデルの堅牢性を強化する
- 地域研究ギャップの解消:中央アジアとコーカサス地域の金融データセットに対するモデルドリフト緩和方法の初めての体系的研究
- オープンソース実装の提供:完全なコード、指標、実験、合成データを含むリリース
入力:金融表形式データ(信用リスク予測タスク)
出力:二値分類結果(デフォルト/正常)
目標:外部ショックに起因するデータ分布変化に直面した際に、モデル予測性能の安定性を維持する
ショックは、データ生成プロセスにおいて特徴分布の即座で顕著な変化をもたらす突発的事象として定義される。分布変化(DS)は以下の式で計算される:
DS=∣C∣+∣N∣1(∑c∈CdTV(Pbaseline(c),Pshocked(c))+∑n∈NdKS(Pbaseline(n),Pshocked(n)))≥τ
ここで、CとNはそれぞれカテゴリ特徴と数値特徴を表し、dTVとdKSはそれぞれ全変動距離とコルモゴロフ-スミルノフ統計量を表す。
ドリフト下で予測性能を維持するモデルの能力を定量化する:
SS=1−1+log(1+DS+ε)∣A^base−A^shock∣∈[0.5,1]
ここで、A^baseとA^shockはそれぞれベースラインとショックデータ上のモデル性能を表す。
ドリフト下での2つのモデルの相対的優位性を比較する:
SU=w⋅(wB′⋅SSB−wA′⋅SSA)
ここで、重みはシグモイド関数を通じて計算され、モデルの内部安定性と相対的優越性を考慮する。
zGANジェネレータを使用し、以下を含む:
- 標準GAN成分:ジェネレータ-判別器アーキテクチャ
- 外れ値条件共分散ジェネレータ(covGEN):極値理論と互換性のある多変量分布からマクロ外れ値をサンプリング
- 条件VAE:共分散行列を提供
- ハッシュ類似性フィルタ:実際のレコードとの過度な類似性を回避
- 能動的安定化戦略:ドリフト発生後に対応するのではなく、訓練段階でモデルを極端な状況に接触させる
- 二層評価フレームワーク:SSは個別モデルの安定性を測定し、SUはモデル間の相対的優位性を比較する
- 地域特異性設計:発展途上国経済のマクロ経済ショックの特性に対応した方法設計
- 非単調最適化:最適な外れ値比率は通常5~10%であり、多いほど良いわけではないことを発見
実験は5つの発展途上国からの民間信用リスクデータセットを使用した:
- A1(タジキスタン):貿易紛争ショック、DS=0.2250
- A4(ウズベキスタン):明確なショックなし、DS=0.0050
- A5(カザフスタン):武力紛争ショック、DS=0.1212
- A6(ヨルダン):明確なショックなし、DS=0.0026
- A9(アゼルバイジャン):武力紛争ショック、DS=0.1802
- 公開データセット(Lending Club):貿易紛争ショック、DS=0.1193
すべてのタスクは二値デフォルト予測であり、クラス不均衡(約2~12%)がある。
- AUC_base:ショック前性能
- AUC_shock:ショック後性能
- SS:安定化スコア
- SU:安定化向上
8つの機械学習モデルをテストした:
- CatBoost、TabPFN、FT-Transformer、HGBoosting
- NGBoost、XGBoost、LightGBM、TabNet
- データ分割:80/20訓練テスト分割
- 合成データ比率:50/50実データ/合成混合
- 外れ値比率:0%、1%、3%、5%、7%、10%、50%、100%
- モンテカルロ評価:51回のランダム分割
- グローバルハイパーパラメータ:(k1, k2, k3) = (100, 1000, 1000)
表1の最良結果によると:
- A1(タジキスタン):TabNetが外れ値なしでSU=0.8441を達成
- A4(ウズベキスタン):TabPFNが50%外れ値でSU=0.7449を達成
- A9(アゼルバイジャン):TabPFNが5%外れ値でSU=0.9981を達成
- 公開データセット:FT-Transformerが100%外れ値でSU=0.8884を達成
- 柔軟なアーキテクチャが最も利益を得る:TabPFNとFT-Transformerはショック下で通常最高のSU値を獲得する
- 外れ値比率は非単調:中程度の注入量(5~10%)がしばしばSUを最大化し、過小または過大は利益を削弱する
- 利益はショック強度と相関:DS値が高いデータセット(A1、A9)で改善が最大であり、DS最小時(A4、A6)では改善が限定的である
すべてのモデル-データセットペアにおいて:
- 53%のケース:ゼロ以外の外れ値比率を追加することで安定性が改善される(135/256)
- 83%の最良構成:外れ値を含む訓練が外れ値なしを上回る(10/12)
- モデル間の差異が顕著:HGBoosting、NGBoost、XGBoost、LightGBMは50%のケースで利益を得、FT-Transformerは75%のケースで利益を得、CatBoost、TabPFN、TabNetは100%のケースで利益を得る
タジキスタンデータセットの「tjs/usd」為替レート特徴の分析から以下が観察できる:
- 合成外れ値は分布の尾部に合理的な極値を形成する
- 5~10%の外れ値比率は真正性を保ちながら十分な極値暴露を提供する
- UMAP投影は合成データが実データと高度に類似していることを示し、外れ値は境界領域に適切に分布している
- 時間的ドリフト:依存関係が時間とともに段階的に進化する
- 条件的ドリフト:新しいデータが特徴空間の不十分に表現された領域から来ている
- 文脈的ドリフト:外部ショックにより入力-出力関係が突然変化する
従来の方法にはADWINアルゴリズム、増分学習、スライディングウィンドウなどが含まれ、主に受動的対応戦略である。
関連研究にはTabOODフレームワークによる分布外表形式サンプルの生成、およびビジネスプロセスにおけるドリフト検出のための合成データの使用が含まれるが、ドリフト緩和のための合成外れ値の目的的使用に関する研究はまだ少ない。
- 合成外れ値は有効:ほとんどの場合、突発的なショック下でのモデルの安定性を向上させることができる
- 最適比率が存在:通常5~10%の範囲内であり、極値暴露とデータ品質のバランスが必要である
- アーキテクチャ感度:柔軟なニューラルネットワークアーキテクチャは従来のツリーモデルより外れ値情報をより活用できる
- 地域適用性:方法は発展途上国経済の複数国のデータセットで効果を示している
- 汎用規則の欠如:最適な外れ値パーセンテージを選択するための汎用方法が見つからない
- データセット制限:主に信用リスクタスクで検証され、他の金融タスクの適用性は不明である
- ショックタイプの限定:主にマクロ経済ショックに対応し、他のタイプのドリフトの効果は不明である
- 計算オーバーヘッド:追加の生成モデル訓練が必要で計算コストが増加する
- 適応的外れ値比率:最適な外れ値比率を自動的に決定できるヒューリスティック方法の開発
- 複数タイプのショック:より多くのタイプの分布変化シナリオへの拡張
- リアルタイム適応:オンライン学習と組み合わせた動的調整の実現
- 理論的分析:より深い理論的保証と分析の提供
- 問題の重要性が顕著:見落とされているが重要な応用シナリオ(発展途上国経済)に焦点を当てている
- 方法の革新性が強い:能動的外れ値注入戦略は新規性と実用価値を持つ
- 評価フレームワークが完善:SSとSU指標の設計は合理的で、モデル安定性を包括的に評価できる
- 実験設計が厳密:51回のモンテカルロ反復、複数データセット、複数モデルの比較実験
- オープンソース貢献:完全なコードとデータを提供し、再現性を向上させている
- データセットの私有性:核心データセットが公開されていないため、結果の検証可能性が制限される
- 理論的基礎が薄弱:外れ値がなぜ安定性を向上させるのかについての深い理論的分析が欠けている
- ハイパーパラメータ感度:SU指標のk1、k2、k3パラメータ選択に十分な理論的指導がない
- 適用範囲が不明:主に表形式データで検証され、他のデータタイプの適用性は不明である
- 計算効率:方法の計算オーバーヘッドとスケーラビリティの分析がない
- 学術的貢献:モデルドリフト研究に新しい視点と方法を提供する
- 実用価値:発展途上国経済の金融機関に直接的な応用価値を持つ
- 方法の示唆性:能動的安定化戦略はより多くの関連研究を刺激する可能性がある
- データセットの価値:私有であるが、該当地域の研究に重要な実証的基礎を提供する
- 発展途上国経済の金融機関:特に頻繁な外部ショックに直面する金融環境に適用可能
- 信用リスク管理:デフォルト予測などの重要なタスクでモデルの堅牢性を向上させる
- マクロ経済不安定地域:政治的・経済的不確実性に直面するあらゆる市場
- 能動的リスク管理:受動的対応ではなく事前防止が必要なシナリオ
論文は31篇の関連文献を引用しており、主に以下を含む:
- モデルドリフト基礎研究:Hinder et al.(2024)、Halstead et al.(2022)などの概念ドリフトに関する総説的研究
- ドリフト検出方法:ADWINアルゴリズム(Bifet & Gavaldà、2007)、オンライン学習方法など
- 合成データ生成:GAN関連研究(Goodfellow et al.、2014)、TabOODフレームワーク(Puranik et al.、2024)
- 機械学習モデル:CatBoost、XGBoost、LightGBMなど主流モデルの原論文
- 統計的方法:極値理論(de Haan & Ferreira、2006)、コルモゴロフ-スミルノフ検定など
総合評価:これは、重要だが見落とされている応用領域(発展途上国経済の金融安定性)において革新的な解決策を提案する高品質な論文である。方法は新規性があり、実験は十分であり、実際の応用に重要な価値を持つが、理論的深さと汎用性の面ではさらなる改善の余地がある。