The rapid advancement of large language models (LLMs) has transformed the landscape of natural language processing, enabling breakthroughs across a wide range of areas including question answering, machine translation, and text summarization. Yet, their deployment in real-world applications has raised concerns over reliability and trustworthiness, as LLMs remain prone to hallucinations that produce plausible but factually incorrect outputs. Uncertainty quantification (UQ) has emerged as a central research direction to address this issue, offering principled measures for assessing the trustworthiness of model generations. We begin by introducing the foundations of UQ, from its formal definition to the traditional distinction between epistemic and aleatoric uncertainty, and then highlight how these concepts have been adapted to the context of LLMs. Building on this, we examine the role of UQ in hallucination detection, where quantifying uncertainty provides a mechanism for identifying unreliable generations and improving reliability. We systematically categorize a wide spectrum of existing methods along multiple dimensions and present empirical results for several representative approaches. Finally, we discuss current limitations and outline promising future research directions, providing a clearer picture of the current landscape of LLM UQ for hallucination detection.
academic- معرّف الورقة: 2510.12040
- العنوان: تحديد الكمية للعدم اليقين في كشف الهلوسة في نماذج اللغة الكبيرة: الأسس والمنهجية والاتجاهات المستقبلية
- المؤلفون: Sungmin Kang, Yavuz Faruk Bakman, Duygu Nur Yaldiz, Baturalp Buyukates, Salman Avestimehr
- التصنيف: cs.CL (اللسانيات الحاسوبية)
- تاريخ النشر: 15 أكتوبر 2025 (نسخة أولية)
- رابط الورقة: https://arxiv.org/abs/2510.12040
أحدث التطور السريع لنماذج اللغة الكبيرة (LLMs) ثورة في مجال معالجة اللغات الطبيعية، محققة اختراقات في مجالات الإجابة على الأسئلة والترجمة الآلية وتلخيص النصوص. ومع ذلك، فإن نشرها في التطبيقات الواقعية يثير مخاوف بشأن الموثوقية والمصداقية، حيث تظل نماذج اللغة الكبيرة عرضة لإنتاج مخرجات هلوسة تبدو معقولة لكنها خاطئة من الناحية الواقعية. أصبح تحديد الكمية للعدم اليقين (UQ) اتجاهاً بحثياً أساسياً لمعالجة هذه المشكلة، حيث يوفر مقاييس منطقية لتقييم موثوقية ما يولده النموذج. تقدم هذه الورقة أولاً الأسس النظرية لتحديد الكمية للعدم اليقين، من التعريفات الرسمية إلى التمييز التقليدي بين عدم اليقين الإدراكي والعرضي، ثم تؤكد كيفية تكيف هذه المفاهيم مع سياق نماذج اللغة الكبيرة. بناءً على ذلك، نبحث دور تحديد الكمية للعدم اليقين في كشف الهلوسة، حيث يوفر تحديد الكمية للعدم اليقين آلية لتحديد التوليد غير الموثوق به وتحسين الموثوقية. نصنف الطرق الموجودة بشكل منهجي على طول عدة أبعاد ونعرض نتائج تجريبية لعدة طرق تمثيلية. أخيراً، نناقش القيود الحالية ونحدد اتجاهات البحث المستقبلية الواعدة.
المشكلة الأساسية التي يسعى هذا البحث لحلها هي كيفية كشف وتحديد كمية ظاهرة الهلوسة في نماذج اللغة الكبيرة بفعالية. وتشمل بشكل محدد:
- تحدي كشف الهلوسة: تنتج نماذج اللغة الكبيرة بشكل متكرر مخرجات تبدو معقولة لكنها خاطئة من الناحية الواقعية، وهذا خطير بشكل خاص في المجالات عالية المخاطر مثل الطب والقانون والتسويق
- تقييم المصداقية: نقص الآليات الفعالة لتقييم موثوقية وثقة مخرجات النموذج
- تحديات تحديد الكمية للعدم اليقين: يصعب تطبيق طرق تحديد الكمية للعدم اليقين التقليدية بشكل مباشر على نماذج اللغة الكبيرة ذات التوليد الانحداري
- القيمة العملية: في سيناريوهات التطبيقات عالية المخاطر، قد تؤدي مخرجات النموذج الخاطئة إلى عواقب وخيمة
- مصداقية النموذج: تحسين مصداقية نماذج اللغة الكبيرة هو شرط أساسي لتطبيقها على نطاق واسع
- الأهمية النظرية: توفير أساس نظري لتحديد الكمية للعدم اليقين في النماذج التوليدية
- عدم قابلية تطبيق طرق تحديد الكمية التقليدية: لا يمكن تطبيق طرق تحديد الكمية للعدم اليقين من مهام التصنيف بشكل مباشر على مهام التوليد المفتوحة
- نقص الإطار المنهجي: تفتقر طرق كشف الهلوسة الموجودة إلى إطار نظري موحد
- عدم اتساق معايير التقييم: تستخدم الطرق المختلفة مقاييس تقييم مختلفة، مما يجعل المقارنة العادلة صعبة
- المساهمة النظرية: تكييف منهجي لنظرية تحديد الكمية للعدم اليقين التقليدية مع سيناريو التوليد في نماذج اللغة الكبيرة، مع التمييز الواضح بين كيفية ظهور عدم اليقين الإدراكي والعرضي في نماذج اللغة الكبيرة
- إطار تصنيف الطرق: اقتراح نظام تصنيف رباعي الأبعاد (الطرق المفاهيمية، متطلبات الأخذ بالعينات، إمكانية الوصول إلى النموذج، الاعتماد على التدريب)، مع تنظيم منهجي لأكثر من 30 طريقة تحديد كمية للعدم اليقين
- التقييم التجريبي: إجراء مقارنة تجريبية شاملة للطرق التمثيلية على عدة مجموعات بيانات، مع توفير نتائج التقييم المرجعية
- توجيه الاتجاهات المستقبلية: تحليل متعمق لقيود الطرق الحالية، مع اقتراح 7 اتجاهات بحثية مستقبلية محددة
الإدخال: الاستعلام x والإجابة المولدة من النموذج y
الإخراج: درجة عدم اليقين UQ(x,y)، والتي يجب أن تكون مرتبطة سلباً بشكل مثالي بصحة الإجابة
الهدف: تعظيم E1_{U(x₁,y₁)<U(x₂,y₂)} · 1_{y₁∈Y₁∧y₂∉Y₂}، أي يجب أن تحصل المخرجات الصحيحة على درجات عدم يقين أقل
- طرق احتمالية الرموز: بناءً على الاحتمالية الشرطية للتسلسل المولد
- احتمالية التسلسل الشرطي (CSP): CSP(y,x) = log P(y|x) = Σⱼ log P(yⱼ|y<ⱼ,x)
- درجة التطبيع حسب الطول (LNS): متوسط احتمالية السجل لكل رمز
- الإنتروبيا الدلالية: حساب الإنتروبيا بناءً على التجميع الدلالي
- طرق اتساق المخرجات: التحقق من اتساق المخرجات من خلال أخذ عينات متعددة
- إنتروبيا اللغة النواة (KLE): استخدام إنتروبيا فون نيومان لتحديد كمية النواة الدلالية
- الكثافة الدلالية: تقدير كثافة الدعم للاستجابة في الفضاء الدلالي
- فحص الحالات الداخلية: تحليل التمثيلات الداخلية للنموذج
- مسافة ماهالانوبيس: قياس مسافة الحالة المخفية من توزيع التدريب
- تحليل الانتباه: الاستفادة من أنماط أوزان الانتباه لكشف عدم اليقين
- طرق الفحص الذاتي: التقييم الذاتي للنموذج
- P(True): تقدير احتمالية صحة مخرجات النموذج
- الثقة المصرح بها: السؤال المباشر للنموذج عن درجة الثقة
- أخذ عينات واحدة: يتطلب استدلالاً واحداً فقط، كفاءة حسابية عالية
- أخذ عينات متعددة: يتطلب استدلالات متعددة، تقدير عدم اليقين من خلال تنوع المخرجات
- الصندوق الأسود: الوصول فقط إلى نص المخرجات
- الصندوق الرمادي: يمكن الوصول إلى معلومات داخلية جزئية مثل احتمالية الرموز
- الصندوق الأبيض: الوصول الكامل إلى الحالات الداخلية والمعاملات للنموذج
- الطرق الخاضعة للإشراف: تتطلب بيانات معلمة لتدريب مقدر عدم اليقين
- الطرق غير الخاضعة للإشراف: تقدير عدم اليقين مباشرة من سلوك النموذج
- التكييف النظري: تكييف ناجح لنظرية تحليل عدم اليقين البايزي مع النماذج التوليدية لنماذج اللغة الكبيرة
- التصنيف متعدد الأبعاد: توفير إطار تصنيف أكثر دقة من السابق للطرق المختلفة
- التقييم الموحد: إنشاء بروتوكول تقييم ونظام مؤشرات متسقة
- توسيع النصوص الطويلة: توسيع تحديد الكمية للعدم اليقين من الإجابات على الأسئلة القصيرة إلى سيناريوهات التوليد طويل النص
- TriviaQA: 1000 عينة من الإجابة على الأسئلة المفتوحة، اختبار المعرفة الواقعية
- GSM8K: 1000 مسألة استدلال رياضي، اختبار القدرة على الاستدلال المنطقي
- FactScore-Bio: توليد نصوص طويلة من السيرة الذاتية، اختبار دقة البيانات المتعددة
- المؤشرات المستقلة عن العتبة (الاستخدام الرئيسي):
- AUROC: المساحة تحت منحنى خصائص التشغيل، النطاق 0.5-1.0
- PRR: نسبة التنبؤ والرفض، قياس فعالية تصفية التنبؤات منخفضة الثقة
- AUPRC: المساحة تحت منحنى الدقة والاستدعاء
- المؤشرات المعتمدة على العتبة:
- الدقة والدقة والاستدعاء ودرجة F1 (تتطلب معايرة)
تقييم 17 طريقة تحديد كمية للعدم اليقين التمثيلية، بما في ذلك:
- LARS و MARS و SAPLMA (الطرق الخاضعة للإشراف)
- Semantic Entropy و SAR و KLE (الطرق غير الخاضعة للإشراف)
- P(True) و Cross-Examination (طرق الفحص الذاتي)
- استخدام LLaMA-3-8B (مفتوح المصدر) و GPT-4o-mini (مغلق المصدر) كنموذجين
- إجراء التقييم الموحد من خلال مكتبة TruthTorchLM
- تطبيق طرق معايرة متعددة لضمان المقارنة العادلة
| فئة الطريقة | LLaMA-3 8B (TriviaQA) | GPT-4o-mini (TriviaQA) | LLaMA-3 8B (GSM8K) |
|---|
| LARS (خاضع للإشراف) | 0.861 AUROC | 0.852 AUROC | 0.834 AUROC |
| SAR (غير خاضع للإشراف) | 0.804 AUROC | 0.835 AUROC | 0.768 AUROC |
| Semantic Entropy | 0.799 AUROC | 0.813 AUROC | 0.699 AUROC |
| Verbalized Confidence | 0.759 AUROC | 0.836 AUROC | 0.579 AUROC |
- مزايا الطرق الخاضعة للإشراف: تحقق طرق مثل LARS و SAPLMA أفضل أداء في معظم المهام
- الاختلاف حسب المهمة: تختلف الطرق المثلى لمهام مختلفة، على سبيل المثال، يحقق Multi-LLM Collab أفضل أداء على GSM8K مع GPT-4o-mini (0.933 AUROC)
- تحدي النصوص الطويلة: تنخفض أداء جميع الطرق بشكل كبير على FactScore-Bio، مما يشير إلى أن تحديد الكمية للعدم اليقين في النصوص الطويلة لا يزال تحدياً
- الاعتماد على النموذج: يختلف أداء الطريقة الواحدة بشكل كبير على نماذج مختلفة
- تأثير عدد العينات: تتحسن أداء طرق أخذ العينات المتعددة مع زيادة عدد العينات، لكن التأثير الهامشي يتناقص
- أهمية المعايرة: تحسن المعايرة المناسبة بشكل كبير من قابلية المقارنة بين الطرق المختلفة
- أهمية الميزات: في طرق الحالة الداخلية، تكون ميزات الطبقات الوسيطة أكثر فعالية من ميزات طبقة الإخراج
- نظرية تحديد الكمية التقليدية: الشبكات العصبية البايزية والتعلم الجماعي وطرق المعايرة
- كشف الهلوسة في نماذج اللغة الكبيرة: التحقق من الحقائق والفحص المتسق والمساعدة بالأدوات الخارجية
- عدم اليقين في النماذج التوليدية: طرق تحديد الكمية للعدم اليقين على مستوى التسلسل
- المنهجية: توفير أول مسح شامل وتصنيف لتحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
- العملية: التركيز على سيناريوهات التطبيق العملي لكشف الهلوسة
- الشمولية: تغطية الأسس النظرية وتصنيف الطرق والتقييم التجريبي والاتجاهات المستقبلية
- فعالية تحديد الكمية للعدم اليقين: تحديد الكمية للعدم اليقين أداة فعالة لكشف هلوسة نماذج اللغة الكبيرة
- تنوع الطرق: لكل نوع من أنواع طرق تحديد الكمية للعدم اليقين مزايا وعيوب، وتطبيقات مختلفة
- أهمية التقييم: إطار التقييم الموحد ضروري لمقارنة الطرق
- مجال التطور: لا يزال هناك عدد كبير من المشاكل النظرية والعملية غير المحلولة في هذا المجال
- مشكلة حدود المعرفة: معرفة نماذج اللغة الكبيرة لها حساسية زمنية، وتحديد الكمية للعدم اليقين لا يمكنه حل مشكلة المعلومات القديمة
- قابلية تفسير الدرجات: تفتقر معظم طرق تحديد الكمية للعدم اليقين إلى تفسير احتمالي بديهي للدرجات المنتجة
- التكلفة الحسابية: تتطلب الطرق الجماعية تكاليف حسابية عالية على نطاق نماذج اللغة الكبيرة
- تحدي النصوص الطويلة: لا تزال تحديد الكمية للعدم اليقين في توليد النصوص الطويلة تفتقر إلى حلول فعالة
- الأسس النظرية: تطوير نظرية أكثر صرامة لتحديد الكمية للعدم اليقين في النماذج التوليدية
- تحديد الكمية للعدم اليقين في النصوص الطويلة: تطوير تحديد كمية عدم اليقين على مستوى البيان للنصوص الطويلة
- تأثير استراتيجيات فك التشفير: دراسة تأثير استراتيجيات فك التشفير المختلفة على تحديد الكمية للعدم اليقين
- تحليل عدم اليقين الجديد: تجاوز التقسيم الثنائي التقليدي للإدراكي والعرضي
- التطبيقات العملية: دمج تحديد الكمية للعدم اليقين في الأنظمة العملية مثل الاستدلال والحوار
- العمق النظري: تكييف منهجي لنظرية تحديد الكمية للعدم اليقين الكلاسيكية مع سياق نماذج اللغة الكبيرة، مع أساس نظري متين
- التصنيف الشامل: إطار التصنيف الرباعي الأبعاد واضح وشامل، مما يساعد على فهم خصائص الطرق المختلفة
- التجارب الكافية: إجراء مقارنة تجريبية شاملة على عدة مجموعات بيانات ونماذج
- القيمة العملية: توفير مكتبة تقييم قابلة للاستخدام المباشر ونتائج معايير
- الرؤية المستقبلية: تحليل متعمق للقيود واقتراح اتجاهات بحثية محددة
- الابتكار المحدود في الطرق: العمل بشكل أساسي استقصائي، مع مساهمات طرق أصلية نسبية محدودة
- عدم كفاية التجارب على النصوص الطويلة: تجارب تحديد الكمية للعدم اليقين على النصوص الطويلة نسبية بسيطة، والتحليل المتعمق غير كافٍ
- عمق التحليل النظري: يمكن أن يكون التحليل النظري للخصائص المختلفة للطرق أعمق
- تحليل الكفاءة الحسابية: نقص التحليل المنهجي للتعقيد الحسابي للطرق المختلفة
- القيمة الأكاديمية: توفير إطار نظري مهم ومعايير تجريبية لبحث تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
- القيمة العملية: توفير إرشادات عملية لتطبيق تحديد الكمية للعدم اليقين في الصناعة
- قابلية الاستنساخ: نشر مكتبة التقييم مفتوحة المصدر، مما يسهل استنساخ ومقارنة الأبحاث اللاحقة
- تقدم المجال: من المتوقع أن تصبح مرجعاً مهماً في هذا المجال
- مرجع البحث: مناسب كمادة مدخل ومرجع لبحث تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
- اختيار الطريقة: توفير إرشادات لاختيار طرق تحديد الكمية للعدم اليقين المناسبة في التطبيقات العملية
- التقييم المرجعي: توفير إطار تقييم موحد للطرق الجديدة
- مورد التدريس: يمكن استخدامه كمادة تدريسية للدورات ذات الصلة
تستشهد الورقة بمراجع غنية ذات صلة، تشمل بشكل أساسي:
- نظرية تحديد الكمية للعدم اليقين الكلاسيكية (الطرق البايزية والتعلم الجماعي)
- طرق كشف الهلوسة في نماذج اللغة الكبيرة (التحقق من الحقائق والفحص المتسق)
- طرق التقييم ومجموعات البيانات (TriviaQA و GSM8K و FactScore وغيرها)
- أحدث طرق تحديد الكمية للعدم اليقين (Semantic Entropy و MARS و LARS وغيرها)
توفر هذه الورقة مسحاً شاملاً وعميقاً لمجال تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة، لا تقتصر على تنظيم الأسس النظرية والطرق الموجودة، بل توفر أيضاً نتائج معايير قيمة من خلال التجارب وتوجه البحث المستقبلي. بالنسبة للباحثين والممارسين في هذا المجال، هذا مرجع ذو قيمة كبيرة جداً.