2025-11-15T02:58:11.720673

Uncertainty Quantification for Hallucination Detection in Large Language Models: Foundations, Methodology, and Future Directions

Kang, Bakman, Yaldiz et al.

The rapid advancement of large language models (LLMs) has transformed the landscape of natural language processing, enabling breakthroughs across a wide range of areas including question answering, machine translation, and text summarization. Yet, their deployment in real-world applications has raised concerns over reliability and trustworthiness, as LLMs remain prone to hallucinations that produce plausible but factually incorrect outputs. Uncertainty quantification (UQ) has emerged as a central research direction to address this issue, offering principled measures for assessing the trustworthiness of model generations. We begin by introducing the foundations of UQ, from its formal definition to the traditional distinction between epistemic and aleatoric uncertainty, and then highlight how these concepts have been adapted to the context of LLMs. Building on this, we examine the role of UQ in hallucination detection, where quantifying uncertainty provides a mechanism for identifying unreliable generations and improving reliability. We systematically categorize a wide spectrum of existing methods along multiple dimensions and present empirical results for several representative approaches. Finally, we discuss current limitations and outline promising future research directions, providing a clearer picture of the current landscape of LLM UQ for hallucination detection.

academic

تحديد الكمية للعدم اليقين في كشف الهلوسة في نماذج اللغة الكبيرة: الأسس والمنهجية والاتجاهات المستقبلية

المعلومات الأساسية

معرّف الورقة: 2510.12040
العنوان: تحديد الكمية للعدم اليقين في كشف الهلوسة في نماذج اللغة الكبيرة: الأسس والمنهجية والاتجاهات المستقبلية
المؤلفون: Sungmin Kang, Yavuz Faruk Bakman, Duygu Nur Yaldiz, Baturalp Buyukates, Salman Avestimehr
التصنيف: cs.CL (اللسانيات الحاسوبية)
تاريخ النشر: 15 أكتوبر 2025 (نسخة أولية)
رابط الورقة: https://arxiv.org/abs/2510.12040

الملخص

أحدث التطور السريع لنماذج اللغة الكبيرة (LLMs) ثورة في مجال معالجة اللغات الطبيعية، محققة اختراقات في مجالات الإجابة على الأسئلة والترجمة الآلية وتلخيص النصوص. ومع ذلك، فإن نشرها في التطبيقات الواقعية يثير مخاوف بشأن الموثوقية والمصداقية، حيث تظل نماذج اللغة الكبيرة عرضة لإنتاج مخرجات هلوسة تبدو معقولة لكنها خاطئة من الناحية الواقعية. أصبح تحديد الكمية للعدم اليقين (UQ) اتجاهاً بحثياً أساسياً لمعالجة هذه المشكلة، حيث يوفر مقاييس منطقية لتقييم موثوقية ما يولده النموذج. تقدم هذه الورقة أولاً الأسس النظرية لتحديد الكمية للعدم اليقين، من التعريفات الرسمية إلى التمييز التقليدي بين عدم اليقين الإدراكي والعرضي، ثم تؤكد كيفية تكيف هذه المفاهيم مع سياق نماذج اللغة الكبيرة. بناءً على ذلك، نبحث دور تحديد الكمية للعدم اليقين في كشف الهلوسة، حيث يوفر تحديد الكمية للعدم اليقين آلية لتحديد التوليد غير الموثوق به وتحسين الموثوقية. نصنف الطرق الموجودة بشكل منهجي على طول عدة أبعاد ونعرض نتائج تجريبية لعدة طرق تمثيلية. أخيراً، نناقش القيود الحالية ونحدد اتجاهات البحث المستقبلية الواعدة.

السياق البحثي والدافع

المشكلة الأساسية

المشكلة الأساسية التي يسعى هذا البحث لحلها هي كيفية كشف وتحديد كمية ظاهرة الهلوسة في نماذج اللغة الكبيرة بفعالية. وتشمل بشكل محدد:

تحدي كشف الهلوسة: تنتج نماذج اللغة الكبيرة بشكل متكرر مخرجات تبدو معقولة لكنها خاطئة من الناحية الواقعية، وهذا خطير بشكل خاص في المجالات عالية المخاطر مثل الطب والقانون والتسويق
تقييم المصداقية: نقص الآليات الفعالة لتقييم موثوقية وثقة مخرجات النموذج
تحديات تحديد الكمية للعدم اليقين: يصعب تطبيق طرق تحديد الكمية للعدم اليقين التقليدية بشكل مباشر على نماذج اللغة الكبيرة ذات التوليد الانحداري

أهمية المشكلة

القيمة العملية: في سيناريوهات التطبيقات عالية المخاطر، قد تؤدي مخرجات النموذج الخاطئة إلى عواقب وخيمة
مصداقية النموذج: تحسين مصداقية نماذج اللغة الكبيرة هو شرط أساسي لتطبيقها على نطاق واسع
الأهمية النظرية: توفير أساس نظري لتحديد الكمية للعدم اليقين في النماذج التوليدية

قيود الطرق الموجودة

عدم قابلية تطبيق طرق تحديد الكمية التقليدية: لا يمكن تطبيق طرق تحديد الكمية للعدم اليقين من مهام التصنيف بشكل مباشر على مهام التوليد المفتوحة
نقص الإطار المنهجي: تفتقر طرق كشف الهلوسة الموجودة إلى إطار نظري موحد
عدم اتساق معايير التقييم: تستخدم الطرق المختلفة مقاييس تقييم مختلفة، مما يجعل المقارنة العادلة صعبة

المساهمات الأساسية

المساهمة النظرية: تكييف منهجي لنظرية تحديد الكمية للعدم اليقين التقليدية مع سيناريو التوليد في نماذج اللغة الكبيرة، مع التمييز الواضح بين كيفية ظهور عدم اليقين الإدراكي والعرضي في نماذج اللغة الكبيرة
إطار تصنيف الطرق: اقتراح نظام تصنيف رباعي الأبعاد (الطرق المفاهيمية، متطلبات الأخذ بالعينات، إمكانية الوصول إلى النموذج، الاعتماد على التدريب)، مع تنظيم منهجي لأكثر من 30 طريقة تحديد كمية للعدم اليقين
التقييم التجريبي: إجراء مقارنة تجريبية شاملة للطرق التمثيلية على عدة مجموعات بيانات، مع توفير نتائج التقييم المرجعية
توجيه الاتجاهات المستقبلية: تحليل متعمق لقيود الطرق الحالية، مع اقتراح 7 اتجاهات بحثية مستقبلية محددة

شرح الطريقة

تعريف المهمة

الإدخال: الاستعلام x والإجابة المولدة من النموذج y الإخراج: درجة عدم اليقين UQ(x,y)، والتي يجب أن تكون مرتبطة سلباً بشكل مثالي بصحة الإجابة الهدف: تعظيم E1_{U(x₁,y₁)<U(x₂,y₂)} · 1_{y₁∈Y₁∧y₂∉Y₂}، أي يجب أن تحصل المخرجات الصحيحة على درجات عدم يقين أقل

إطار التصنيف الرباعي الأبعاد

1. بُعد الطرق المفاهيمية

طرق احتمالية الرموز: بناءً على الاحتمالية الشرطية للتسلسل المولد
- احتمالية التسلسل الشرطي (CSP): CSP(y,x) = log P(y|x) = Σⱼ log P(yⱼ|y<ⱼ,x)
- درجة التطبيع حسب الطول (LNS): متوسط احتمالية السجل لكل رمز
- الإنتروبيا الدلالية: حساب الإنتروبيا بناءً على التجميع الدلالي
طرق اتساق المخرجات: التحقق من اتساق المخرجات من خلال أخذ عينات متعددة
- إنتروبيا اللغة النواة (KLE): استخدام إنتروبيا فون نيومان لتحديد كمية النواة الدلالية
- الكثافة الدلالية: تقدير كثافة الدعم للاستجابة في الفضاء الدلالي
فحص الحالات الداخلية: تحليل التمثيلات الداخلية للنموذج
- مسافة ماهالانوبيس: قياس مسافة الحالة المخفية من توزيع التدريب
- تحليل الانتباه: الاستفادة من أنماط أوزان الانتباه لكشف عدم اليقين
طرق الفحص الذاتي: التقييم الذاتي للنموذج
- P(True): تقدير احتمالية صحة مخرجات النموذج
- الثقة المصرح بها: السؤال المباشر للنموذج عن درجة الثقة

2. بُعد متطلبات الأخذ بالعينات

أخذ عينات واحدة: يتطلب استدلالاً واحداً فقط، كفاءة حسابية عالية
أخذ عينات متعددة: يتطلب استدلالات متعددة، تقدير عدم اليقين من خلال تنوع المخرجات

3. بُعد إمكانية الوصول إلى النموذج

الصندوق الأسود: الوصول فقط إلى نص المخرجات
الصندوق الرمادي: يمكن الوصول إلى معلومات داخلية جزئية مثل احتمالية الرموز
الصندوق الأبيض: الوصول الكامل إلى الحالات الداخلية والمعاملات للنموذج

4. بُعد الاعتماد على التدريب

الطرق الخاضعة للإشراف: تتطلب بيانات معلمة لتدريب مقدر عدم اليقين
الطرق غير الخاضعة للإشراف: تقدير عدم اليقين مباشرة من سلوك النموذج

نقاط الابتكار التقني

التكييف النظري: تكييف ناجح لنظرية تحليل عدم اليقين البايزي مع النماذج التوليدية لنماذج اللغة الكبيرة
التصنيف متعدد الأبعاد: توفير إطار تصنيف أكثر دقة من السابق للطرق المختلفة
التقييم الموحد: إنشاء بروتوكول تقييم ونظام مؤشرات متسقة
توسيع النصوص الطويلة: توسيع تحديد الكمية للعدم اليقين من الإجابات على الأسئلة القصيرة إلى سيناريوهات التوليد طويل النص

إعداد التجربة

مجموعات البيانات

TriviaQA: 1000 عينة من الإجابة على الأسئلة المفتوحة، اختبار المعرفة الواقعية
GSM8K: 1000 مسألة استدلال رياضي، اختبار القدرة على الاستدلال المنطقي
FactScore-Bio: توليد نصوص طويلة من السيرة الذاتية، اختبار دقة البيانات المتعددة

مؤشرات التقييم

المؤشرات المستقلة عن العتبة (الاستخدام الرئيسي):
- AUROC: المساحة تحت منحنى خصائص التشغيل، النطاق 0.5-1.0
- PRR: نسبة التنبؤ والرفض، قياس فعالية تصفية التنبؤات منخفضة الثقة
- AUPRC: المساحة تحت منحنى الدقة والاستدعاء
المؤشرات المعتمدة على العتبة:
- الدقة والدقة والاستدعاء ودرجة F1 (تتطلب معايرة)

الطرق المقارنة

تقييم 17 طريقة تحديد كمية للعدم اليقين التمثيلية، بما في ذلك:

LARS و MARS و SAPLMA (الطرق الخاضعة للإشراف)
Semantic Entropy و SAR و KLE (الطرق غير الخاضعة للإشراف)
P(True) و Cross-Examination (طرق الفحص الذاتي)

تفاصيل التنفيذ

استخدام LLaMA-3-8B (مفتوح المصدر) و GPT-4o-mini (مغلق المصدر) كنموذجين
إجراء التقييم الموحد من خلال مكتبة TruthTorchLM
تطبيق طرق معايرة متعددة لضمان المقارنة العادلة

نتائج التجربة

النتائج الرئيسية

فئة الطريقة	LLaMA-3 8B (TriviaQA)	GPT-4o-mini (TriviaQA)	LLaMA-3 8B (GSM8K)
LARS (خاضع للإشراف)	0.861 AUROC	0.852 AUROC	0.834 AUROC
SAR (غير خاضع للإشراف)	0.804 AUROC	0.835 AUROC	0.768 AUROC
Semantic Entropy	0.799 AUROC	0.813 AUROC	0.699 AUROC
Verbalized Confidence	0.759 AUROC	0.836 AUROC	0.579 AUROC

الاكتشافات الرئيسية

مزايا الطرق الخاضعة للإشراف: تحقق طرق مثل LARS و SAPLMA أفضل أداء في معظم المهام
الاختلاف حسب المهمة: تختلف الطرق المثلى لمهام مختلفة، على سبيل المثال، يحقق Multi-LLM Collab أفضل أداء على GSM8K مع GPT-4o-mini (0.933 AUROC)
تحدي النصوص الطويلة: تنخفض أداء جميع الطرق بشكل كبير على FactScore-Bio، مما يشير إلى أن تحديد الكمية للعدم اليقين في النصوص الطويلة لا يزال تحدياً
الاعتماد على النموذج: يختلف أداء الطريقة الواحدة بشكل كبير على نماذج مختلفة

اكتشافات التجارب الاستئصالية

تأثير عدد العينات: تتحسن أداء طرق أخذ العينات المتعددة مع زيادة عدد العينات، لكن التأثير الهامشي يتناقص
أهمية المعايرة: تحسن المعايرة المناسبة بشكل كبير من قابلية المقارنة بين الطرق المختلفة
أهمية الميزات: في طرق الحالة الداخلية، تكون ميزات الطبقات الوسيطة أكثر فعالية من ميزات طبقة الإخراج

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

نظرية تحديد الكمية التقليدية: الشبكات العصبية البايزية والتعلم الجماعي وطرق المعايرة
كشف الهلوسة في نماذج اللغة الكبيرة: التحقق من الحقائق والفحص المتسق والمساعدة بالأدوات الخارجية
عدم اليقين في النماذج التوليدية: طرق تحديد الكمية للعدم اليقين على مستوى التسلسل

المزايا النسبية للورقة

المنهجية: توفير أول مسح شامل وتصنيف لتحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
العملية: التركيز على سيناريوهات التطبيق العملي لكشف الهلوسة
الشمولية: تغطية الأسس النظرية وتصنيف الطرق والتقييم التجريبي والاتجاهات المستقبلية

الخلاصة والمناقشة

الاستنتاجات الرئيسية

فعالية تحديد الكمية للعدم اليقين: تحديد الكمية للعدم اليقين أداة فعالة لكشف هلوسة نماذج اللغة الكبيرة
تنوع الطرق: لكل نوع من أنواع طرق تحديد الكمية للعدم اليقين مزايا وعيوب، وتطبيقات مختلفة
أهمية التقييم: إطار التقييم الموحد ضروري لمقارنة الطرق
مجال التطور: لا يزال هناك عدد كبير من المشاكل النظرية والعملية غير المحلولة في هذا المجال

القيود

مشكلة حدود المعرفة: معرفة نماذج اللغة الكبيرة لها حساسية زمنية، وتحديد الكمية للعدم اليقين لا يمكنه حل مشكلة المعلومات القديمة
قابلية تفسير الدرجات: تفتقر معظم طرق تحديد الكمية للعدم اليقين إلى تفسير احتمالي بديهي للدرجات المنتجة
التكلفة الحسابية: تتطلب الطرق الجماعية تكاليف حسابية عالية على نطاق نماذج اللغة الكبيرة
تحدي النصوص الطويلة: لا تزال تحديد الكمية للعدم اليقين في توليد النصوص الطويلة تفتقر إلى حلول فعالة

الاتجاهات المستقبلية

الأسس النظرية: تطوير نظرية أكثر صرامة لتحديد الكمية للعدم اليقين في النماذج التوليدية
تحديد الكمية للعدم اليقين في النصوص الطويلة: تطوير تحديد كمية عدم اليقين على مستوى البيان للنصوص الطويلة
تأثير استراتيجيات فك التشفير: دراسة تأثير استراتيجيات فك التشفير المختلفة على تحديد الكمية للعدم اليقين
تحليل عدم اليقين الجديد: تجاوز التقسيم الثنائي التقليدي للإدراكي والعرضي
التطبيقات العملية: دمج تحديد الكمية للعدم اليقين في الأنظمة العملية مثل الاستدلال والحوار

التقييم المتعمق

المزايا

العمق النظري: تكييف منهجي لنظرية تحديد الكمية للعدم اليقين الكلاسيكية مع سياق نماذج اللغة الكبيرة، مع أساس نظري متين
التصنيف الشامل: إطار التصنيف الرباعي الأبعاد واضح وشامل، مما يساعد على فهم خصائص الطرق المختلفة
التجارب الكافية: إجراء مقارنة تجريبية شاملة على عدة مجموعات بيانات ونماذج
القيمة العملية: توفير مكتبة تقييم قابلة للاستخدام المباشر ونتائج معايير
الرؤية المستقبلية: تحليل متعمق للقيود واقتراح اتجاهات بحثية محددة

أوجه القصور

الابتكار المحدود في الطرق: العمل بشكل أساسي استقصائي، مع مساهمات طرق أصلية نسبية محدودة
عدم كفاية التجارب على النصوص الطويلة: تجارب تحديد الكمية للعدم اليقين على النصوص الطويلة نسبية بسيطة، والتحليل المتعمق غير كافٍ
عمق التحليل النظري: يمكن أن يكون التحليل النظري للخصائص المختلفة للطرق أعمق
تحليل الكفاءة الحسابية: نقص التحليل المنهجي للتعقيد الحسابي للطرق المختلفة

التأثير

القيمة الأكاديمية: توفير إطار نظري مهم ومعايير تجريبية لبحث تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
القيمة العملية: توفير إرشادات عملية لتطبيق تحديد الكمية للعدم اليقين في الصناعة
قابلية الاستنساخ: نشر مكتبة التقييم مفتوحة المصدر، مما يسهل استنساخ ومقارنة الأبحاث اللاحقة
تقدم المجال: من المتوقع أن تصبح مرجعاً مهماً في هذا المجال

السيناريوهات المطبقة

مرجع البحث: مناسب كمادة مدخل ومرجع لبحث تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة
اختيار الطريقة: توفير إرشادات لاختيار طرق تحديد الكمية للعدم اليقين المناسبة في التطبيقات العملية
التقييم المرجعي: توفير إطار تقييم موحد للطرق الجديدة
مورد التدريس: يمكن استخدامه كمادة تدريسية للدورات ذات الصلة

المراجع

تستشهد الورقة بمراجع غنية ذات صلة، تشمل بشكل أساسي:

نظرية تحديد الكمية للعدم اليقين الكلاسيكية (الطرق البايزية والتعلم الجماعي)
طرق كشف الهلوسة في نماذج اللغة الكبيرة (التحقق من الحقائق والفحص المتسق)
طرق التقييم ومجموعات البيانات (TriviaQA و GSM8K و FactScore وغيرها)
أحدث طرق تحديد الكمية للعدم اليقين (Semantic Entropy و MARS و LARS وغيرها)

توفر هذه الورقة مسحاً شاملاً وعميقاً لمجال تحديد الكمية للعدم اليقين في نماذج اللغة الكبيرة، لا تقتصر على تنظيم الأسس النظرية والطرق الموجودة، بل توفر أيضاً نتائج معايير قيمة من خلال التجارب وتوجه البحث المستقبلي. بالنسبة للباحثين والممارسين في هذا المجال، هذا مرجع ذو قيمة كبيرة جداً.