When a prediction algorithm serves a collection of users, disparities in prediction quality are likely to emerge. If users respond to accurate predictions by increasing engagement, inviting friends, or adopting trends, repeated learning creates a feedback loop that shapes both the model and the population of its users. In this work, we introduce evolutionary prediction games, a framework grounded in evolutionary game theory which models such feedback loops as natural-selection processes among groups of users. Our theoretical analysis reveals a gap between idealized and real-world learning settings: In idealized settings with unlimited data and computational power, repeated learning creates competition and promotes competitive exclusion across a broad class of behavioral dynamics. However, under realistic constraints such as finite data, limited compute, or risk of overfitting, we show that stable coexistence and mutualistic symbiosis between groups becomes possible. We analyze these possibilities in terms of their stability and feasibility, present mechanisms that can sustain their existence, and empirically demonstrate our findings.
- معرّف الورقة: 2503.03401
- العنوان: Evolutionary Prediction Games (ألعاب التنبؤ التطورية)
- المؤلفون: إيدن سايج، نير روزنفيلد (معهد تكنيون – معهد إسرائيل للتكنولوجيا)
- التصنيف: cs.LG (تعلم الآلة)، cs.CY (الحوسبة والمجتمع)، cs.GT (نظرية الألعاب)
- المؤتمر: NeurIPS 2025 (المؤتمر الـ 39 حول أنظمة معالجة المعلومات العصبية)
- رابط الورقة: https://arxiv.org/abs/2503.03401v3
عندما تخدم خوارزميات التنبؤ مجموعات من المستخدمين، يكون التباين في جودة التنبؤ أمراً حتمياً. إذا كان رد فعل المستخدمين على التنبؤات الدقيقة هو زيادة الانخراط أو دعوة الأصدقاء أو اعتماد الاتجاهات، فإن التعلم المتكرر ينشئ حلقة ردود فعل تشكل في الوقت ذاته النموذج ومجموعات المستخدمين. تقدم هذه الورقة إطار عمل ألعاب التنبؤ التطورية (evolutionary prediction games)، وتستند إلى نظرية الألعاب التطورية لنمذجة هذه الحلقة كعملية انتقاء طبيعي بين مجموعات المستخدمين. يكشف التحليل النظري عن الفجوة بين السيناريوهات المثالية والواقعية للتعلم: في الإعدادات المثالية ذات البيانات والقدرة الحسابية غير المحدودة، يخلق التعلم المتكرر منافسة ويعزز الاستبعاد التنافسي؛ ومع ذلك، تحت القيود الواقعية مثل البيانات المحدودة والقدرة الحسابية المحدودة أو خطر الإفراط في التدريب، يصبح التعايش المستقر والتعايش المتبادل بين المجموعات ممكناً.
تدرس الورقة حلقات ردود الفعل في أنظمة تعلم الآلة: عندما تؤثر دقة خوارزمية التنبؤ على سلوك المستخدمين (مثل الانخراط ومعدل الاحتفاظ)، وفي الوقت ذاته يغير سلوك المستخدمين توزيع بيانات التدريب، كيف تؤثر هذه الحلقة على التكوين السكاني طويل الأجل وأداء النموذج؟
- الانتشار الواسع: تعتمد المنصات الحديثة (توصيات المحتوى والأسواق الإلكترونية والخدمات الطبية والتعليم الشخصي) على نطاق واسع على تعلم الآلة
- التأثير الاجتماعي: قد يؤدي التباين في جودة التنبؤ إلى تهميش أو استبعاد منهجي لمجموعات مستخدمين معينة
- العواقب طويلة الأجل: قد يؤدي السعي الأعمى لتحسين الدقة إلى عواقب اجتماعية غير متوقعة وسلبية
- نماذج التعلم التقليدية: تفترض توزيع بيانات ثابت وتتجاهل تأثيرات ردود الفعل من الاختيار الذاتي للمستخدمين
- التنبؤ الأداء (Performative Prediction): على الرغم من دراسة تأثير نشر النموذج على توزيع البيانات، فإن التحليل في الإعدادات ذات الحالة صعب ويفتقر إلى تمثيل منخفض الأبعاد لديناميكيات المجموعات
- أبحاث العدالة: لا تستطيع تعريفات العدالة الثابتة التقاط اختفاء وظهور المجموعات في البيئات الديناميكية
اعتماد منظور تطوري لنمذجة الديناميكيات المشتركة للتعلم واختيار المستخدمين كعملية انتقاء طبيعي: تصبح دقة التنبؤ مورداً نادراً، وتتنافس المجموعات المختلفة عليها، وتصبح خوارزمية التعلم محرك ضغط الانتقاء.
- الإطار النظري: تقديم ألعاب التنبؤ التطورية، ربط دقة التنبؤ بالملاءمة التطورية، وتحليل موحد لحلقات ردود فعل متعددة
- توصيف الإعدادات المثالية (النظرية 1): إثبات أن التدريب المتكرر مع مصنفات أوراكل يؤدي إلى استبعاد تنافسي، حيث يمكن لمجموعة واحدة فقط أن تبقى مستقرة
- آليات التعايش تحت القيود الواقعية: إظهار كيف تجعل عوامل الممارسة العملية (الخسارة البديلة والبيانات المحدودة والاستيفاء) التعايش المستقر ممكناً (النظريات 2، D.4، D.5)
- خوارزمية التثبيت (الاقتراح 2): تقديم خوارزمية تعلم حساسة للديناميكيات، تثبت التوازنات المختلطة غير المستقرة من خلال إعادة ترجيح العينات
- التحقق التجريبي: التحقق من النتائج النظرية على مجموعات بيانات CIFAR-10 و MNIST و ACSIncome، وإظهار كيف تشكل الخيارات التصميمية المختلفة النتائج الاجتماعية
- إعداد التعلم الخاضع للإشراف: الميزات x∈X، التسميات y∈Y، المصنف h:X→Y
- هيكل المجموعات: K مجموعة، لكل مجموعة k توزيع ثابت Dk، الحجم النسبي pk يتطور عبر الزمن
- التوزيع المختلط: Dp=∑kpkDk، حيث p=(p1,…,pK)∈ΔK (السمبلكس)
- الديناميكيات: نشر المصنف → استجابة المستخدم → تغيير نسب المجموعات → إعادة التدريب → الحلقة
التعريف 1 (ألعاب التنبؤ التطورية):
بالنظر إلى خوارزمية التعلم A وتوزيعات المجموعات D1,…,DK، فإن الملاءمة التطورية للمجموعة k في الحالة p هي:
Fk(p)=Eh∼A(p)[acck(h)]
حيث acck(h)=Pr(x,y)∼Dk[h(x)=y] هي دقة المجموعة k الهامشية.
الخصائص الرئيسية:
- توازن ناش: p∗ هو توازن إذا وفقط إذا كان support(p∗)⊆argmaxkFk(p∗)
- الارتباط بالعدالة (الاقتراح 1): في حالة التوازن، يحقق المصنف مساواة الدقة الإجمالية
- افتراضات الديناميكيات:
- الاستمرارية: VF(p) مستمرة
- الارتباط الإيجابي: VF(p)⋅F(p)>0 (تنمو المجموعات ذات الملاءمة العالية)
- التطابق مع التوازن: النقاط الثابتة تتطابق مع توازنات ناش أو توازنات محدودة من ديناميكيات التقليد
بالنسبة لمصنف أوراكل hp∈argminh∈HEDp[ℓ(h)]:
- رتابة الدقة: dtdaccp(hp)≥0 (تتحسن الدقة الإجمالية عبر الزمن)
- الاستقرار: توازنات مستقرة موجودة دائماً (قد تكون متعددة)
- الاستبعاد التنافسي: جميع التوازنات المستقرة تحقق ∣support(p∗)∣=1 (هيمنة مجموعة واحدة)
- إمكانية التعايش: قد توجد توازنات بـ ∣support(p∗)∣≥2، لكنها غير مستقرة
جوهر الإثبات:
- استخدام إطار الألعاب المحتملة (potential game): f(p)=accp(hp) هي دالة محتملة
- حجة التحدب: f(p) كحد أقصى نقطة لدوال خطية هي دالة محدبة
- الحد الأقصى المحلي للدالة المحدبة على السمبلكس يقع في الرؤوس (حالات مجموعة واحدة)
توجد ألعاب تنبؤ تطورية تستخدم خسارة hinge و ℓ2 regularization، حيث التوازنات المختلطة مستقرة وتعظم الملاءمة.
نقاط البناء (انظر القسم D.6):
- مجموعتان، لكل منهما فئة أغلبية وأقلية، مع اختلاف الفئات الأغلبية
- خسارة Hinge لها انحياز تجاه الفئات الأقلية
- في حالة المزيج 50-50، ينسجم انحياز المجموعتين، مما يحقق الدقة المثلى
- الاستقرار: نمو أي مجموعة يؤدي إلى خسارة أكبر من تقلص المجموعة الأخرى
بالنسبة لخوارزمية أوراكل Aopt(p) مع توازن غير مستقر p∗، الخوارزمية A′(p)=Aopt(2p∗−p) تجعل p∗ مستقراً.
الآلية: من خلال إعادة ترجيح العينات wk=2pk∗−pkpk، "عكس" اتجاهات الديناميكيات الطبيعية.
- التمثيل منخفض الأبعاد: من خلال هيكل الاختيار الذاتي للمستخدمين، يتم تعيين التوزيعات عالية الأبعاد إلى سمبلكس (K−1) الأبعاد، مما يجعل مشاكل التنبؤ بالأداء ذات الحالة قابلة للمعالجة
- توصيف الألعاب المحتملة: إثبات أن لعبة مصنف أوراكل هي لعبة محتملة، واستخدام التحدب في دالة المحتملة لتحليل الاستقرار
- آلية التعايش المتبادل: تحديد كيف تؤدي عدم الكمال في التعلم العملي (الخسارة البديلة والبيانات المحدودة والاستيفاء) إلى إنشاء شروط التعايش من خلال الانحيازات المتكاملة بين المجموعات
- منظور العدالة المضادة للواقع: تقديم وجهة نظر "ما يبدو عادلاً الآن قد يكون لأن بعض المجموعات قد تم استبعادها بالفعل"
- CIFAR-10 (القسم 6.1)
- 60,000 صورة ملونة بحجم 32×32، 10 فئات
- تعريف المجموعات: A=الصور الأصلية، B=الصور المقلوبة أفقياً
- الهدف: اختبار تعزيز البيانات كآلية تعايش طبيعية
- MNIST (القسم 6.2)
- التعرف على الأرقام المكتوبة بخط اليد
- تعريف المجموعات: A منحازة نحو الأرقام الزوجية (4:1)، B منحازة نحو الأرقام الفردية (4:1)
- ضوضاء تسميات الفئة الأغلبية: احتمال 20% للتعيين إلى الرقم التالي بنفس التكافؤ
- الهدف: اختبار التعايش المستقر تحت الإفراط في المعاملات والضوضاء
- ACSIncome (القسم 6.3)
- مهمة التنبؤ بالدخل من Folktables (بيانات التعداد الأمريكي)
- تعريف المجموعات: كاليفورنيا (195,665 نقطة)، نيويورك (103,021 نقطة)، تكساس (135,924 نقطة)
- الهدف: عرض ديناميكيات ثلاث مجموعات ومشاكل العدالة
- الدقة الهامشية: acck(h) لكل مجموعة k
- الدقة الإجمالية: accp(h)=∑kpkacck(h)
- نسب المجموعات: pk(t) تتطور عبر الزمن
- الاستقرار: مجال جذب التوازن والتقارب
- مصنف خطي أوراكل: معيار نظري
- خوارزميات عملية: Soft-SVM, Hard-SVM, k-NN, ResNet-9, CNN
- خوارزمية التثبيت: A′(p)=A(2p∗−p)
- CIFAR-10: ResNet-9، إطار ffcv، معاملات تحسين افتراضية، 20 تكرار
- MNIST: شبكة عصبية بـ 2 طبقة التفاف + 2 طبقة متصلة بالكامل، SGD (lr=0.01, momentum=0.5)، 200 حقبة، 50 تكرار
- ACSIncome: LinearSVC, LogisticRegression, XGBoost، تنظيم افتراضي، 10 تكرارات
- محاكاة الديناميكيات: معادلة النسخ المتماثل المنفصلة (نموذج Taylor-Jonker)
- الأجهزة: بيانات اصطناعية على Macbook Pro M2، شبكات عصبية على AMD EPYC 7502 + RTX A4000
- هيكل اللعبة: ثلاث نقاط توازن
- توازنان مستقران لمجموعة واحدة (92.6±0.1%)
- توازن مختلط غير مستقر (93.5±0.1%)
- التبادلية: الدقة في الحالة المختلطة أعلى، المجموعتان تستفيدان
- تأثير التثبيت: استخدام طريقة الاقتراح 2 ينجح في تثبيت حالة 50-50، تحسين الدقة الإجمالية من 92.6% إلى 93.2%
- هيكل اللعبة: ضوضاء التسميات "تقلب" اللعبة
- دقة المجموعة الأقلية أعلى (accB>accA عندما pB<pA)
- توازن تعايش مستقر (80.4±0.2%)، قريب من الحد الأعلى النظري 84%
- الآلية: توازن المجموعات بشكل طبيعي، الشبكة الإفراط في المعاملات (دقة التدريب 98.7%) تحقق الاستيفاء
- التطور على مرحلتين:
- المرحلة المبكرة (t≤200): تتقلص مجموعة NY، تحتفظ CA و TX بالتوازن، الفرق بين المجموعات ≈2%
- المرحلة المتأخرة (t>300): يتم استبعاد NY (≤1%)، تتنافس CA و TX، ينخفض الفرق إلى ≈0.2%
- مفارقة العدالة: يبدو النظام "أكثر عدالة" في المرحلة المتأخرة، لكن فقط لأن مجموعة واحدة تم استبعادها بالفعل
- الاعتماد على الخوارزمية (الشكل 14):
- LinearSVM → هيمنة TX
- LogisticRegression → نقطة سرج التعايش
- XGBoost → هيمنة CA
- الطريقة: استخدام عملية غاوسية لملاءمة بيانات CIFAR-10، محاكاة مستويات ضوضاء مختلفة η
- النتائج:
- η=0 (بدون ضوضاء): نتائج حتمية
- η=1 (ضوضاء الملاحظة): قوية نسبياً، احتمال عالي لهيمنة B عندما pB0>0.5
- η=5 (ضوضاء 5 أضعاف): النتائج تصبح مشوشة، لا تزال مجموعة A لديها احتمال الهيمنة عندما pB0≈0.55
- الاكتشاف: وقت التقارب تقريباً خطي عندما pB0∈[0.1,0.4]∪[0.6,0.9]
- السلوك الحرج: عندما pB0→0.5 يميل وقت التقارب إلى اللانهاية، ضغط الانتقاء ضعيف جداً
- النتيجة: العلاقة خطية بين التوازن المقدر p^∗ والحالة النهائية
- المتانة: الأخطاء تؤثر بشكل أساسي على تكوين المجموعات، لا تؤثر على الرفاهية الإجمالية
التحقق من البناء النظري (الشكل 3):
- Soft-SVM: عند α=0.75 تظهر 5 نقاط توازن (2 مستقرة لمجموعة واحدة + 1 مستقرة للتعايش + 2 غير مستقرة للتعايش)، تحقق النظرية 2
- 1-NN: ضوضاء تسميات α=0.2، β=0.8 تعطي تعايش مستقر، تحقق النظرية D.4
- Hard-SVM: بيانات محدودة (n=21) تحت التعايش المتبادل، تحقق النظرية D.5
- إمكانية التعايش في الخوارزميات العملية: انحيازات الخوارزميات غير المثلى يمكن أن تخلق تعايش مستقر من خلال التكامل بين المجموعات
- الفوائد طويلة الأجل لتعزيز البيانات: التعزيز الطبيعي (مثل القلب الأفقي) لا يحسن الدقة قصيرة الأجل فحسب، بل يعزز أيضاً تنوع المجموعات طويل الأجل
- الطبيعة الديناميكية للعدالة: مقاييس العدالة الثابتة لا تستطيع التقاط الاستبعاد التاريخي، تحتاج إلى تحليل مضاد للواقع
- التأثير الاجتماعي لاختيار الخوارزمية: اختيارات تبدو محايدة (SVM مقابل XGBoost) قد تحدد المجموعات التي تبقى
- الأصول البيولوجية: Maynard Smith & Price (1973)، نمذجة الانتقاء الطبيعي
- التطبيقات الاقتصادية: Sandholm (2010)، وكلاء تفاعليين قريبي النظر على نطاق واسع
- ابتكار الورقة: تعريف اللعبة بشكل ضمني كحل لمشكلة تحسين إحصائية، ربط مبادئ الاستبعاد التنافسي بمشاكل التعايش
- الأدب الأساسي: Perdomo et al. (2020)، دراسة تأثير نشر النموذج على توزيع البيانات
- الإعدادات ذات الحالة: Brown et al. (2022)، بيئات ديناميكية صعبة
- مساهمة الورقة: توفير تمثيل منخفض الأبعاد من خلال الاختيار الذاتي للمستخدمين، توصيف مفاهيم استقرار أقوى
- الأعمال الموجودة:
- Liu et al. (2018): ضمانات العدالة تتآكل عبر الزمن
- Hashimoto et al. (2018): ديناميكيات دقة أسوأ مجموعة، تعتمد على تدفق مستخدم قوي
- Raab & Liu (2021): استمرارية الفروقات في معدلات التأهيل
- منظور الورقة: العدالة المضادة للواقع - قد تكون العدالة الحالية بسبب الاستبعاد التاريخي
- الأنظمة العملية: التعلم المعزز للتوصيات (Afsar et al. 2022)، التكيف مع تفضيلات المستخدم (Carroll et al. 2022)
- موضع الورقة: التركيز على قواعد التعلم المحلية، توفير منظور تطوري للتعلم الحساس للديناميكيات
- الفجوة بين النظرية والممارسة: التعلم المثالي يدفع الاستبعاد التنافسي، القيود العملية تجعل التعايش ممكناً
- المقايضة بين الاستقرار والأمثلية: إعادة التدريب الأمثل تخلق تعايش مفيد غير مستقر، يتطلب التدخل للتثبيت
- تأثير الخيارات التصميمية: الخيارات التي تبدو تقنية (الخوارزمية والتنظيم وحجم البيانات) تؤثر بعمق على النتائج الاجتماعية
- ضرورة الحماية: بدون تدخل، قد يدفع التعلم مجموعات المستخدمين نحو حالات غير مواتية، تحتاج إلى آليات مشابهة لحماية النظم البيئية
- حدود الافتراضات:
- التوزيعات الثابتة داخل المجموعات (بدون تحول داخل المجموعة)
- عدم وجود قوى خارجية (مثل التسويق والإعانات)
- عدم وجود اعتماديات مباشرة بين المجموعات (باستثناء من خلال المصنف)
- بروتوكول إعادة تدريب بسيط (استخدام البيانات الحالية فقط)
- تعريف المجموعات:
- افتراض مجموعات غير متداخلة، في الواقع العضوية غالباً ما تكون سائلة
- الاعتماد على سلوك الفرد على نتائج المجموعة قد لا يكون صارماً
- المقاييس الزمنية:
- "الانقراض" يشير إلى السلوك الحدي، صامت حول نقاط زمنية محدودة
- قد يكون وقت التقارب بطيئاً جداً (الشكل 13 يظهر أن وقت التقارب يميل إلى اللانهاية بالقرب من التوازن)
- النطاق التجريبي:
- التجارب تركز بشكل أساسي على رؤية الحاسوب والبيانات الجدولية
- نقص التحقق مع حلقات ردود فعل حقيقية للمستخدمين
- تصميم الآليات: تطوير آليات أكثر لتعزيز التنوع (مثل تقسيم الموارد والتباين البيئي في علم البيئة)
- التحسين الحساس للديناميكيات: دمج الاستقرار التطوري في أهداف التعلم
- اكتشاف المجموعات: تحديد المجموعات التي تم استبعادها تاريخياً
- التحقق عبر المجالات: اختبار الإطار في المجالات المالية والطبية والتعليمية
- تخفيف الافتراضات: دراسة تأثير تحول التوزيع داخل المجموعات والتأثيرات بين المجموعات والتدخلات الخارجية
- الصرامة النظرية:
- توصيف الألعاب المحتملة يربط بأناقة بين التحسين المحدب والاستقرار التطوري
- تقنية إثبات النظرية 1 مبتكرة (استخدام التحدب في أوراكل)
- التوسعات إلى الملاءمة غير المتجانسة (النظرية D.3) والمجموعات المكافئة (النظرية D.2)
- الصلة العملية:
- تحديد كيف تغير عوامل الممارسة الحقيقية (الخسارة البديلة والبيانات المحدودة والاستيفاء) التنبؤات النظرية
- خوارزمية التثبيت بسيطة وعملية (إعادة ترجيح العينات فقط)
- التجارب تغطي خوارزميات تعلم متعددة وأنواع بيانات
- المنظور متعدد التخصصات:
- دمج ناجح لمبادئ الاستبعاد التنافسي من علم البيئة في تعلم الآلة
- ربط نظرية الألعاب والعدالة والتنبؤ الأداء
- توفير منظور جديد لـ "الحماية الاجتماعية"
- كفاية الأدلة التجريبية:
- البناءات النظرية (النظريات 2، D.4، D.5) لها تحقق عددي
- تحليل الحساسية شامل (ضوضاء الأخذ، وقت التقارب، حساسية التثبيت)
- تجربة ACSIncome توضح ديناميكيات معقدة لثلاث مجموعات
- وضوح الكتابة:
- الأساسيات الدقيقة (الملحق C) توضح افتراضات النمذجة
- الرسوم البيانية بديهية (الأشكال 1-3)
- الملحق شامل (150+ صفحة من الأدلة والتوسعات)
- حدود الطريقة:
- خوارزمية التثبيت تتطلب معرفة أو تقدير p∗، قد يكون صعباً في الممارسة
- تركيز فقط على تعظيم الدقة، لا يتناول أهداف تعلم أخرى (مثل الحصانة والمعايرة)
- "جودة" التعايش تعتمد على السياق، الإطار نفسه لا يوفر إرشادات معيارية
- إعداد التجارب:
- تعريفات المجموعات اصطناعية (قلب أفقي، ولايات)، قد تكون المجموعات الحقيقية غامضة
- نقص التحقق مع حلقات ردود فعل حقيقية (المستخدمون لن يغيروا المجموعات بناءً على جودة التنبؤ)
- أشكال ديناميكيات أخرى لم يتم استكشافها بشكل كافٍ
- الفجوة بين النظرية والممارسة:
- النظرية 1 تتطلب مصنف أوراكل، لكن التجارب تستخدم عينات محدودة
- بناء التعايش (النظريات 2، D.4، D.5) محدد جداً، الشمولية غير واضحة
- شروط التعايش المستقر (مثل α∈(0,1−2β1) لـ Soft-SVM) صعبة التحقق مسبقاً
- تحليل التأثير الاجتماعي:
- قيمة "التنوع" لم يتم مناقشتها بعمق (متى يجب تعزيز التعايش؟)
- تحليل المقايضات مع المنافسة السوقية والعوائد الموحدة غير كافٍ
- الاعتبارات المحدودة لحوافز المنصة (قد تفضل المنصات مجموعة مستخدمين واحدة)
- المساهمة الأكاديمية:
- توفير أداة تحليل جديدة للتنبؤ الأداء (الألعاب المحتملة + الاستقرار التطوري)
- الكشف عن التأثيرات الاجتماعية للاختيار في خوارزميات التعلم
- ربط العدالة ونظرية الألعاب التطورية
- القيمة العملية:
- مساعدة مصممي الأنظمة على توقع ديناميكيات المجموعات طويلة الأجل
- توفير استراتيجيات تدخل (التثبيت والتسويق الموجه والإعانات)
- تحذير من العواقب الاجتماعية لاختيارات الخوارزمية
- إمكانية إعادة الإنتاج:
- الكود مفتوح المصدر (GitHub: edensaig/evolutionary-prediction-games)
- النتائج النظرية لها أدلة مفصلة (الملحق D، 80+ صفحة)
- تفاصيل التجارب كاملة (الملاحق E-F)
- القيود:
- قد يحد تعقيد الإطار من الاعتماد السريع
- يتطلب خبراء في المجال لتحديد المجموعات ذات الصلة
- يتطلب التحقق طويل الأجل بيانات طولية
- أنظمة التوصية: منصات المحتوى تريد الحفاظ على تنوع المنشئين والجماهير
- أسواق الائتمان: تريد السلطات التنظيمية فهم التأثير طويل الأجل للخوارزميات على المجموعات
- الذكاء الاصطناعي الطبي: ضمان أن أنظمة التشخيص لا تستبعد مجموعات مريضة معينة
- تكنولوجيا التعليم: منصات التعلم الشخصي تحتاج إلى موازنة أنماط التعلم المختلفة
- غير معمول به:
- السيناريوهات حيث حدود المجموعات غامضة أو تتغير بسرعة
- المهام حيث يكون سلوك المستخدم ضعيف الارتباط بجودة التنبؤ
- المنتجات التي تحتاج إلى تكرار سريع (تكاليف التحليل عالية)
- Perdomo et al. (2020): Performative Prediction. ICML. العمل الأساسي في التنبؤ الأداء
- Sandholm (2010): Population Games and Evolutionary Dynamics. MIT Press. كتاب نظرية الألعاب التطورية
- Hashimoto et al. (2018): Fairness Without Demographics in Repeated Loss Minimization. ICML. العدالة طويلة الأجل
- Hardin (1960): The Competitive Exclusion Principle. Science. مبدأ الاستبعاد التنافسي في علم البيئة
- Brown et al. (2022): Performative Prediction in a Stateful World. AISTATS. التنبؤ الأداء ذو الحالة
التقييم الشامل: هذه ورقة متينة نظرياً وشاملة تجريبياً وذات منظور مبتكر. من خلال عدسة نظرية الألعاب التطورية، يكشف المؤلفون عن آليات الاختيار الاجتماعي المخفية في أنظمة تعلم الآلة، مما يوفر أدوات مهمة لفهم وتصميم أنظمة ذكاء اصطناعي مسؤولة. النتائج النظرية (خاصة الاستبعاد التنافسي لمصنفات أوراكل وآليات التعايش في الخوارزميات العملية) مقنعة، والتجارب مصممة بذكاء للتحقق من التنبؤات الرئيسية. القيمة الأساسية للورقة تكمن في تغيير إطار فهمنا لتأثير خوارزميات التعلم على المجتمع - من العدالة الثابتة إلى منظور تطوري ديناميكي. على الرغم من وجود قيود في الافتراضات والتحقق التجريبي، يفتح هذا العمل اتجاهاً واعداً للبحث في التقاطع بين تعلم الآلة والعدالة ونظرية الألعاب، ويستحق النشر في NeurIPS.