تتناول هذه الدراسة مشكلة التحيز الديموغرافي في نماذج الذكاء الاصطناعي للصحة النفسية للأطفال، وتقترح نهجاً يركز على البيانات للتخفيف من التحيز. كشفت الدراسة عن مشكلة نقص تشخيصي منهجي لدى المريضات الإناث من المراهقين، حيث كانت دقة التشخيص أقل بنسبة 4% مقارنة بالمرضى الذكور، مع معدل إيجابي كاذب أعلى بنسبة 9%. من خلال تطبيق طرق التخفيف من التحيز بما في ذلك تصفية كثافة المعلومات واستبدال الكلمات المحايدة جنسياً، تم تقليل التحيز التشخيصي بنسبة 27%، مما يوفر حلاً فعالاً لتحقيق العدالة في الذكاء الاصطناعي الطبي.
الإدخال: سلسلة من نصوص الملاحظات السريرية لمريض طفل الإخراج: التنبؤ بالتصنيف الثنائي (قلق/بدون قلق) الهدف: تقليل الفروقات في الأداء بين المجموعات الجنسية المختلفة مع الحفاظ على دقة التنبؤ
استخدام مقاييس متعددة لتقييم التحيز في النموذج:
تحليل الفروقات في خصائص النص بين المجموعات السكانية المختلفة:
دمج تصفية كثافة المعلومات واستبدال الكلمات الجنسية للاستفادة من التأثيرات التآزرية
| المؤشر | الذكور | الإناث | الفرق |
|---|---|---|---|
| الدقة | - | -4% | أقل لدى الإناث |
| FNR | - | +9% | أعلى لدى الإناث |
| التنبؤات غير المؤكدة | - | +5% | أعلى لدى الإناث |
| طول الملاحظة | الأساس | -500 كلمة | أقصر لدى الإناث |
أفضل طريقة (tf-idf_filt):
| الطريقة | تحسن FNR | الحفاظ على الأداء | تقليل عدم التأكد |
|---|---|---|---|
| rnd_filt | بدون تأثير متسق | ✓ | - |
| tf-idf_filt | -0.024 | ✓ | -4% |
| gen_sub | +0.008 | ✓ | -3% |
| الطريقة المدمجة | -0.022 | ✓ | -12% |
استخدام LIME لتحليل المفردات التي يعتمد عليها النموذج:
تستشهد هذه الورقة بأدبيات مهمة في مجالات التعلم الآلي العادل، وإزالة التحيز من معالجة اللغة الطبيعية، والذكاء الاصطناعي الطبي، بما في ذلك:
التقييم الشامل: هذه ورقة بحثية ذات قيمة مهمة في مجال عدالة الذكاء الاصطناعي الطبي. لا تقتصر على تحديد مشكلة التحيز الجنسي في الذكاء الاصطناعي للصحة النفسية للأطفال فحسب، بل تقدم أيضاً حلاً عملياً. على الرغم من وجود مجال للتحسن في العمق النظري وتعقيد الطريقة، فإن قيمتها العملية وأهميتها الاجتماعية تجعلها مساهمة مهمة في هذا المجال.