Machine Learning models in finance are highly susceptible to model drift, where predictive performance declines as data distributions shift. This issue is especially acute in developing economies such as those in Central Asia and the Caucasus - including Tajikistan, Uzbekistan, Kazakhstan, and Azerbaijan - where frequent and unpredictable macroeconomics shocks destabilize financial data. To the best of our knowledge, this is among the first studies to examine drift mitigation methods on financial datasets from these regions. We investigate the use of synthetic outliers, a largely unexplored approach, to improve model stability against unforeseen shocks. To evaluate effectiveness, we introduce a two-level framework that measures both the extent of performance degradation and the severity of shocks. Our experiments on macroeconomic tabular datasets show that adding a small proportion of synthetic outliers generally improves stability compared to baseline models, though the optimal amount varies by dataset and model
- معرّف الورقة: 2510.09294
- العنوان: تخفيف انجراف النموذج في الاقتصادات النامية باستخدام البيانات الاصطناعية والقيم الشاذة
- المؤلفون: Ilyas Varshavskiy, Bonu Boboeva, Shuhrat Khalilbekov, Azizjon Azimi, Sergey Shulgin, Akhlitdin Nizamitdinov, Haitz Sáez de Ocáriz Borde
- التصنيف: cs.LG (تعلم الآلة)
- المؤتمر: المؤتمر الـ 39 لأنظمة معالجة المعلومات العصبية (NeurIPS 2025) - ورشة عمل: الذكاء الاصطناعي التوليدي في التمويل
- رابط الورقة: https://arxiv.org/abs/2510.09294
نماذج التعلم الآلي في المجال المالي معرضة بشدة لمشكلة انجراف النموذج، أي انخفاض الأداء التنبؤية عندما يحدث تغيير في توزيع البيانات. تتفاقم هذه المشكلة بشكل خاص في الاقتصادات النامية، وخاصة في منطقة آسيا الوسطى والقوقاز (بما في ذلك طاجيكستان وأوزبكستان وكازاخستان وأذربيجان)، حيث تؤدي الصدمات الاقتصادية الكلية المتكررة وغير المتوقعة إلى تقويض استقرار البيانات المالية. يعتقد المؤلفون أن هذه من أولى الدراسات التي تبحث في طرق تخفيف الانجراف على مجموعات البيانات المالية في هذه المناطق. تستكشف الورقة استخدام القيم الشاذة الاصطناعية - وهي طريقة لم تُستكشف بشكل كبير - لتحسين استقرار النموذج في مواجهة الصدمات غير المتوقعة. لتقييم الفعالية، يقدم المؤلفون إطار عمل ثنائي المستوى يقيس كلاً من درجة انخفاض الأداء وشدة الصدمة. تُظهر التجارب على مجموعات البيانات الجدولية الاقتصادية الكلية أن إضافة عدد قليل من القيم الشاذة الاصطناعية عادة ما تحسّن الاستقرار مقارنة بالنموذج الأساسي، على الرغم من أن العدد الأمثل يختلف باختلاف مجموعة البيانات والنموذج.
يهدف هذا البحث إلى حل مشكلة انجراف النموذج في نماذج التعلم الآلي المالية عند مواجهة تغييرات التوزيع، خاصة في الاقتصادات النامية حيث تؤدي الصدمات الاقتصادية الكلية المتكررة إلى انخفاض حاد في أداء النموذج.
- التأثير الاقتصادي الشديد: في الاقتصادات النامية، قد تكون تكاليف فشل النموذج مرتفعة جداً، خاصة في التطبيقات المالية الحرجة مثل تقييم مخاطر الائتمان
- الصدمات المتكررة وغير المتوقعة: تواجه منطقة آسيا الوسطى والقوقاز بشكل متكرر صدمات خارجية مثل النزاعات التجارية والنزاعات المسلحة، مما يؤدي إلى تغييرات حادة في توزيع البيانات
- فجوة بحثية: يركز البحث الحالي حول انجراف النموذج بشكل أساسي على الأسواق المالية الناضجة، مع إهمال الاقتصادات النامية
- الاستجابة السلبية: الطرق التقليدية مثل المراقبة والإعادة التدريب تتخذ إجراءات فقط بعد حدوث الانجراف
- الاعتماد على البيانات: تتطلب انتظار بيانات العالم الحقيقي لإعادة تدريب النموذج
- نقص التخصص الإقليمي: غياب الحلول المصممة خصيصاً للظروف الخاصة بالاقتصادات النامية
يقترح المؤلفون استراتيجية استباقية من خلال إدخال قيم شاذة اصطناعية في مرحلة التدريب لتكييف النموذج مسبقاً مع الحالات القصوى، وبالتالي تحسين قوة النموذج عند مواجهة صدمات غير معروفة.
- إطار عمل جديد لتقييم الاستقرار: يتضمن مؤشري درجة الاستقرار (SS) والتحسن المستقر (SU)، والتي تحدد كمياً أداء استقرار النموذج تحت الصدمات
- استخدام مبتكر للقيم الشاذة الاصطناعية: الاستفادة من القيم الشاذة الاصطناعية المولدة بواسطة zGAN لتعزيز قوة النموذج ضد الصدمات المفاجئة
- سد الفجوة البحثية الإقليمية: أول دراسة منهجية لطرق تخفيف انجراف النموذج على مجموعات البيانات المالية في آسيا الوسطى والقوقاز
- توفير تطبيق مفتوح المصدر: إصدار الكود الكامل والمؤشرات والتجارب، بما في ذلك البيانات الاصطناعية
الإدخال: بيانات جدولية مالية (مهمة التنبؤ بمخاطر الائتمان)
الإخراج: نتيجة تصنيف ثنائي (التخلف عن السداد/عادي)
الهدف: الحفاظ على استقرار أداء التنبؤ للنموذج عند مواجهة تغييرات في توزيع البيانات الناجمة عن صدمات خارجية
تُعرّف الصدمة بأنها حدث مفاجئ يسبب تغييراً كبيراً فوري في توزيع الميزات في عملية توليد البيانات. يُحسب تغيير التوزيع (DS) بالصيغة التالية:
DS=∣C∣+∣N∣1(∑c∈CdTV(Pbaseline(c),Pshocked(c))+∑n∈NdKS(Pbaseline(n),Pshocked(n)))≥τ
حيث يمثل C و N الميزات الفئوية والعددية على التوالي، و dTV و dKS يمثلان مسافة التباين الكلي وإحصائية Kolmogorov-Smirnov على التوالي.
تحدد كمياً قدرة النموذج على الحفاظ على أداء التنبؤ تحت الانجراف:
SS=1−1+log(1+DS+ε)∣A^base−A^shock∣∈[0.5,1]
حيث يمثل A^base و A^shock أداء النموذج على بيانات الأساس والصدمة على التوالي.
يقارن الميزة النسبية لنموذجين تحت الانجراف:
SU=w⋅(wB′⋅SSB−wA′⋅SSA)
حيث يتم حساب الأوزان من خلال دالة sigmoid، مع الأخذ في الاعتبار الاستقرار الداخلي للنموذج والتفوق النسبي.
استخدام مولد zGAN، الذي يتضمن:
- مكونات GAN القياسية: معمارية المولد-المميز
- مولد التباين المشروط للقيم الشاذة (covGEN): أخذ العينات من التوزيعات متعددة المتغيرات المتوافقة مع نظرية القيم القصوى
- VAE مشروط: توفير مصفوفة التباين
- مرشح التشابه بالتجزئة: تجنب التشابه المفرط مع السجلات الحقيقية
- استراتيجية الاستقرار الاستباقية: بدلاً من الانتظار حتى يحدث الانجراف، يتم تعريض النموذج للحالات القصوى في مرحلة التدريب
- إطار عمل التقييم ثنائي المستوى: SS يقيس استقرار النموذج الفردي، و SU يقارن الميزة النسبية بين النماذج
- التصميم الخاص بالمنطقة: طريقة مصممة خصيصاً لخصائص الصدمات الاقتصادية الكلية في الاقتصادات النامية
- التحسين غير الرتيب: اكتشاف أن نسبة القيم الشاذة المثلى عادة ما تكون في نطاق 5-10%، وليس كلما زادت كان أفضل
استخدمت التجارب مجموعات بيانات خاصة لتقييم مخاطر الائتمان من 5 اقتصادات نامية:
- A1 (طاجيكستان): صدمة النزاع التجاري، DS=0.2250
- A4 (أوزبكستان): بدون صدمة واضحة، DS=0.0050
- A5 (كازاخستان): صدمة النزاع المسلح، DS=0.1212
- A6 (الأردن): بدون صدمة واضحة، DS=0.0026
- A9 (أذربيجان): صدمة النزاع المسلح، DS=0.1802
- مجموعة بيانات مفتوحة (Lending Club): صدمة النزاع التجاري، DS=0.1193
جميع المهام عبارة عن تنبؤ ثنائي بالتخلف عن السداد، مع عدم توازن في الفئات (حوالي 2-12%).
- AUC_base: الأداء قبل الصدمة
- AUC_shock: الأداء بعد الصدمة
- SS: درجة الاستقرار
- SU: التحسن المستقر
تم اختبار 8 نماذج تعلم آلي:
- CatBoost, TabPFN, FT-Transformer, HGBoosting
- NGBoost, XGBoost, LightGBM, TabNet
- تقسيم البيانات: تقسيم تدريب/اختبار 80/20
- نسبة البيانات الاصطناعية: خليط 50/50 حقيقي/اصطناعي
- نسبة القيم الشاذة: 0%, 1%, 3%, 5%, 7%, 10%, 50%, 100%
- تقييم مونت كارلو: 51 تقسيم عشوائي
- المعاملات الفائقة العامة: (k1, k2, k3) = (100, 1000, 1000)
وفقاً للنتائج الأفضل في الجدول 1:
- A1 (طاجيكستان): TabNet بدون قيم شاذة حقق SU=0.8441
- A4 (أوزبكستان): TabPFN بـ 50% قيم شاذة حقق SU=0.7449
- A9 (أذربيجان): TabPFN بـ 5% قيم شاذة حقق SU=0.9981
- مجموعة البيانات المفتوحة: FT-Transformer بـ 100% قيم شاذة حقق SU=0.8884
- المعماريات المرنة تستفيد أكثر: عادة ما تحقق TabPFN و FT-Transformer أعلى قيم SU تحت الصدمات
- نسبة القيم الشاذة غير رتيبة: الحقن المتوسط (5-10%) غالباً ما يزيد SU، بينما الكميات الصغيرة جداً أو الكبيرة جداً تضعف الفوائد
- الفوائد مرتبطة بشدة الصدمة: التحسينات الأكبر على مجموعات البيانات ذات DS الأعلى (A1, A9)، مع تحسينات محدودة عندما يكون DS الأصغر (A4, A6)
عبر جميع أزواج النموذج-مجموعة البيانات:
- 53% من الحالات: إضافة نسبة غير صفرية من القيم الشاذة تحسّن الاستقرار (135/256)
- 83% من أفضل التكوينات: التدريب مع القيم الشاذة يتفوق على بدون قيم شاذة (10/12)
- الاختلافات بين النماذج كبيرة: HGBoosting و NGBoost و XGBoost و LightGBM تستفيد في 50% من الحالات، FT-Transformer في 75% من الحالات، CatBoost و TabPFN و TabNet في 100% من الحالات
من تحليل ميزة سعر الصرف "tjs/usd" من مجموعة بيانات طاجيكستان يمكن ملاحظة:
- القيم الشاذة الاصطناعية تشكل قيماً قصوى معقولة في ذيول التوزيع
- نسبة 5-10% من القيم الشاذة توفر تعريضاً كافياً للقيم القصوى مع الحفاظ على الواقعية
- إسقاط UMAP يُظهر أن البيانات الاصطناعية متشابهة جداً مع البيانات الحقيقية، مع توزيع مناسب للقيم الشاذة في المناطق الحدودية
- الانجراف الزمني: العلاقات تتطور تدريجياً عبر الزمن
- انجراف الشروط: البيانات الجديدة تأتي من مناطق ممثلة بشكل غير كافٍ في فضاء الميزات
- الانجراف السياقي: تغيير مفاجئ في العلاقة بين الإدخال والإخراج بسبب صدمات خارجية
تتضمن الطرق التقليدية خوارزمية ADWIN والتعلم الإضافي والنوافذ المنزلقة، وهي في الأساس استراتيجيات استجابة سلبية.
تتضمن الأعمال ذات الصلة إطار عمل TabOOD لتوليد عينات جدولية خارج التوزيع، واستخدام البيانات الاصطناعية لكشف الانجراف في العمليات التجارية، لكن البحث عن استخدام القيم الشاذة الاصطناعية بشكل موجه لتخفيف الانجراف لا يزال نادراً جداً.
- فعالية القيم الشاذة الاصطناعية: يمكنها في معظم الحالات تحسين استقرار النموذج تحت الصدمات المفاجئة
- وجود نسبة مثلى: عادة ما تكون في نطاق 5-10%، مما يتطلب موازنة بين التعريض للقيم القصوى وجودة البيانات
- حساسية المعمارية: المعماريات العصبية المرنة يمكنها الاستفادة بشكل أفضل من معلومات القيم الشاذة مقارنة بنماذج الأشجار التقليدية
- الانطباق الإقليمي: تُظهر الطريقة فعالية على مجموعات بيانات من عدة دول في الاقتصادات النامية
- غياب القواعد العامة: لم يتم العثور على طريقة عامة لاختيار نسبة القيم الشاذة المثلى
- قيود مجموعة البيانات: التحقق الأساسي على مهام تقييم مخاطر الائتمان، مع عدم معرفة الانطباق على مهام مالية أخرى
- قيود نوع الصدمة: موجهة بشكل أساسي نحو الصدمات الاقتصادية الكلية، مع عدم وضوح الفعالية ضد أنواع انجراف أخرى
- التكلفة الحسابية: يتطلب تدريب نماذج توليدية إضافية مما يزيد من التكلفة الحسابية
- نسبة القيم الشاذة التكيفية: تطوير طرق استكشافية يمكنها تحديد نسبة القيم الشاذة المثلى تلقائياً
- صدمات متعددة الأنواع: التوسع إلى سيناريوهات تغيير توزيع أكثر تنوعاً
- التكيف في الوقت الفعلي: الدمج مع التعلم عبر الإنترنت لتحقيق التعديل الديناميكي
- التحليل النظري: توفير ضمانات نظرية أعمق وتحليل
- بروز أهمية المشكلة: التركيز على الاقتصادات النامية - وهي حالة تطبيقية مهملة لكن مهمة
- قوة الابتكار الطريقة: استراتيجية حقن القيم الشاذة الاستباقية تتمتع بالجدة والقيمة العملية
- إطار عمل التقييم الشامل: مؤشرات SS و SU مصممة بشكل معقول وقادرة على تقييم استقرار النموذج بشكل شامل
- تصميم التجارب الدقيق: 51 تكرار مونت كارلو، مجموعات بيانات متعددة، تجارب مقارنة مع نماذج متعددة
- المساهمة مفتوحة المصدر: توفير الكود والبيانات الكاملة، مما يعزز قابلية إعادة الإنتاج
- خصوصية مجموعات البيانات: لا يمكن الإفصاح عن مجموعات البيانات الأساسية، مما يحد من قابلية التحقق من النتائج
- ضعف الأساس النظري: غياب التحليل النظري العميق لسبب قدرة القيم الشاذة على تحسين الاستقرار
- حساسية المعاملات الفائقة: اختيار معاملات SU (k1,k2,k3) يفتقر إلى التوجيه النظري الكافي
- عدم وضوح نطاق الانطباق: التحقق الأساسي على البيانات الجدولية، مع عدم معرفة الانطباق على أنواع بيانات أخرى
- الكفاءة الحسابية: لم يتم تحليل التكلفة الحسابية وقابلية التوسع للطريقة
- المساهمة الأكاديمية: توفير منظور وطريقة جديدة لأبحاث انجراف النموذج
- القيمة العملية: لها قيمة تطبيقية مباشرة للمؤسسات المالية في الاقتصادات النامية
- الإلهام الطريقة: قد تلهم استراتيجية الاستقرار الاستباقية المزيد من الأبحاث ذات الصلة
- قيمة مجموعة البيانات: على الرغم من كونها خاصة، إلا أنها توفر أساساً تجريبياً مهماً للبحث في المنطقة
- المؤسسات المالية في الاقتصادات النامية: مناسبة بشكل خاص للبيئات المالية التي تواجه صدمات خارجية متكررة
- إدارة مخاطر الائتمان: تحسين قوة النموذج في المهام الحرجة مثل التنبؤ بالتخلف عن السداد
- المناطق ذات عدم الاستقرار الاقتصادي الكلي: أي سوق يواجه عدم يقين سياسي واقتصادي
- إدارة المخاطر الاستباقية: السيناريوهات التي تتطلب الوقاية المسبقة بدلاً من الاستجابة السلبية
تستشهد الورقة بـ 31 مرجعاً ذا صلة، تتضمن بشكل أساسي:
- أبحاث أساسية في انجراف النموذج: أعمال استقصائية حول الانجراف المفاهيمي من Hinder et al. (2024), Halstead et al. (2022) وغيرهم
- طرق كشف الانجراف: خوارزمية ADWIN (Bifet & Gavaldà, 2007)، طرق التعلم عبر الإنترنت وغيرها
- توليد البيانات الاصطناعية: أعمال GAN ذات الصلة (Goodfellow et al., 2014)، إطار عمل TabOOD (Puranik et al., 2024)
- نماذج التعلم الآلي: الأوراق الأصلية للنماذج الرئيسية مثل CatBoost و XGBoost و LightGBM
- الطرق الإحصائية: نظرية القيم القصوى (de Haan & Ferreira, 2006)، اختبار Kolmogorov-Smirnov وغيرها
التقييم الإجمالي: هذه ورقة عالية الجودة تقترح حلاً مبتكراً في مجال تطبيقي مهم لكن مهمل (استقرار التمويل في الاقتصادات النامية). الطريقة مبتكرة، والتجارب شاملة، وللتطبيق العملي قيمة مهمة، لكن لا تزال هناك مجالات للتحسن من حيث العمق النظري والعمومية.