How is a factual claim made credible? We propose the novel task of Epistemic Appeal Identification, which identifies whether and how factual statements have been anchored by external sources or evidence. To advance research on this task, we present FactAppeal, a manually annotated dataset of 3,226 English-language news sentences. Unlike prior resources that focus solely on claim detection and verification, FactAppeal identifies the nuanced epistemic structures and evidentiary basis underlying these claims and used to support them. FactAppeal contains span-level annotations which identify factual statements and mentions of sources on which they rely. Moreover, the annotations include fine-grained characteristics of factual appeals such as the type of source (e.g. Active Participant, Witness, Expert, Direct Evidence), whether it is mentioned by name, mentions of the source's role and epistemic credentials, attribution to the source via direct or indirect quotation, and other features. We model the task with a range of encoder models and generative decoder models in the 2B-9B parameter range. Our best performing model, based on Gemma 2 9B, achieves a macro-F1 score of 0.73.
academic- معرّف الورقة: 2510.10627
- العنوان: FactAppeal: تحديد الاستئنافات الحقائقية الإبستمولوجية في وسائل الإعلام
- المؤلفون: Guy Mor-Lan, Tamir Sheafer, Shaul R. Shenhav (جامعة العبرية بالقدس)
- التصنيف: cs.CL (اللسانيات الحاسوبية)
- تاريخ النشر: 12 أكتوبر 2025 (نسخة arXiv المسبقة)
- رابط الورقة: https://arxiv.org/abs/2510.10627
تقترح هذه الورقة مهمة جديدة ومبتكرة - تحديد الاستئنافات الإبستمولوجية (Epistemic Appeal Identification)، والتي تهدف إلى تحديد ما إذا كانت البيانات الحقائقية مدعومة بمصادر خارجية أو أدلة وكيفية ذلك. لتعزيز البحث في هذه المهمة، قام المؤلفون ببناء مجموعة بيانات FactAppeal التي تحتوي على تعليقات يدوية لـ 3,226 جملة إخبارية باللغة الإنجليزية. بخلاف الموارد السابقة التي تركز فقط على كشف المطالبات والتحقق منها، يحدد FactAppeal الهياكل الإبستمولوجية الدقيقة والأساس الدليلي الذي يدعم هذه المطالبات. تحتوي مجموعة البيانات على تعليقات على مستوى الامتداد تحدد البيانات الحقائقية والإشارات المصدرية التي تعتمد عليها. بالإضافة إلى ذلك، تتضمن التعليقات ميزات دقيقة الحبيبات للاستئنافات الحقائقية، مثل نوع المصدر (مثل المشاركين النشطين والشهود والخبراء والأدلة المباشرة)، وما إذا كانت مذكورة بالاسم، ودور المصدر والإشارات إلى المؤهلات الإبستمولوجية، والإسناد إلى المصادر من خلال الاقتباسات المباشرة أو غير المباشرة. استخدم المؤلفون نماذج مشفرة وفك تشفير توليدية بنطاق معاملات 2B-9B لنمذجة هذه المهمة، حيث حقق أفضل نموذج أداء بناءً على Gemma 2 9B درجة F1 ماكرو متوسطة بقيمة 0.73.
في عصر انتشار المعلومات الخاطئة والشكوك المتزايدة تجاه تقارير وسائل الإعلام، أصبح فهم كيفية تقديم البيانات الحقائقية مهماً أكثر من أي وقت مضى. لا تعتمد مصداقية البيان الحقائقي على محتواه فحسب، بل أيضاً على كيفية استئنافه إلى مصادر معرفة خارجية - سواء من خلال شهادة الخبراء أو البيانات الرسمية أو الأدلة التجريبية المباشرة.
على الرغم من التقدم الجوهري في أبحاث كشف المطالبات والتحقق منها، تركز الطرق الموجودة بشكل أساسي على محتوى البيانات المعزولة، متجاهلة الهياكل الإبستمولوجية التي تمنح هذه البيانات المصداقية والقوة الإقناعية. تفتقر أطر كشف الحقائق التقليدية إلى فهم عميق لكيفية بناء ودعم المطالبات في وسائل الإعلام الإخبارية.
- الحاجة إلى تحليل الهياكل الإبستمولوجية: فهم كيفية دعم البيانات الحقائقية من خلال مصادر السلطة الخارجية
- أبحاث مصداقية وسائل الإعلام: تحليل تدفق المعرفة وآليات التحقق في وسائل الإعلام الإخبارية
- تحسين التحقق الآلي من الحقائق: توفير أساس لتحقق من الحقائق أكثر وعياً بالسياق
- التطبيقات العلوم الاجتماعية: توفير أدوات لأبحاث الفلسفة السياسية والإبستمولوجيا الاجتماعية وأبحاث الاتصالات
- اقتراح مهمة جديدة: تعريف مهمة تحديد الاستئنافات الإبستمولوجية للمرة الأولى، متجاوزة كشف الحقائق التقليدي، مع إدخال طبقة غنية من التفكير الإبستمولوجي
- بناء مجموعة بيانات معلقة: إنشاء مجموعة بيانات FactAppeal تحتوي على تعليقات دقيقة الحبيبات على مستوى الامتداد لـ 3,226 جملة إخبارية
- إنشاء نظام تصنيفي: تطوير تصنيف منظم للاستئنافات الإبستمولوجية بناءً على القرب من المصدر والحدث (داخلي مقابل خارجي) ونوع المصدر (بشري مقابل غير بشري)
- تنفيذ نماذج أساسية: إنشاء خطوط أساس للمهمة باستخدام نماذج المشفر والفك التشفير التوليدية، حيث يحقق أفضل نموذج درجة F1 ماكرو متوسطة بقيمة 0.73
- القيمة متعددة التخصصات: توفير أداة مهمة للسانيات الحاسوبية والعلوم الاجتماعية وأبحاث وسائل الإعلام
تتطلب مهمة تحديد الاستئنافات الإبستمولوجية:
- تحديد ما إذا كانت الجملة تقدم بياناً حقائقياً
- إن كان الأمر كذلك، تحديد كيفية استدعائها لمصادر خارجية أو أدلة لدعم هذا البيان
- تحديد مصادر السلطة الإبستمولوجية
- تصنيف نوع وطريقة الاستئناف
- Fact Without Appeal: بيان حقائقي بدون استئناف إبستمولوجي
- Fact With Appeal: بيان حقائقي مع استئناف إبستمولوجي
- المعدلات: اقتباس مباشر (Direct quote) / اقتباس غير مباشر (Indirect quote)
- Source: المصدر الإبستمولوجي المنسوب إليه البيان
- حالة التسمية: مسمى (Named) / غير مسمى (Unnamed)
- نوع المصدر: تصنيف من 7 أنواع
- Source Attribute: الخصائص الإبستمولوجية ذات الصلة للمصدر
- Recipient: الكيان الذي يستقبل المعلومات
- Appeal Time: الوقت الذي يحدث فيه الاستئناف
- Appeal Location: المكان الذي يحدث فيه الاستئناف
يتم بناء التصنيف على بعدين:
- القرب من الحدث: داخلي (اتصال مباشر) مقابل خارجي (معرفة مهنية عامة)
- طبيعة المصدر: بشري مقابل غير بشري
المصادر الداخلية (بناءً على الاتصال المباشر):
- Active Participant: مشارك نشط في الحدث
- Witness: مراقب يقدم شهادة من الدرجة الأولى
- Official: مشارك يتمتع بسلطة قانونية أو سياسية أو بيروقراطية
- Direct Evidence: دليل مباشر يتم العثور عليه في الموقع
المصادر الخارجية (بناءً على المعرفة المهنية):
- Expert: عالم أو خبير يتمتع بخبرة متخصصة
- Expert Document: وثائق بحثية وتقارير علمية ومؤسسية
- News Report: الإشارة إلى تقارير إخبارية سابقة
- التعليق على مستوى الامتداد: يسمح بالتمييز بين الاستئنافات الحقائقية والحقائق بدون استئناف والمكونات غير الحقائقية في نص واحد
- دعم العلامات المتداخلة: يمكن أن تتداخل أنواع مختلفة من العلامات، مما يدعم الهياكل الإبستمولوجية المعقدة
- ميزات دقيقة الحبيبات: التقاط معلومات متعددة الأبعاد بما في ذلك نوع المصدر وحالة التسمية وطريقة الاقتباس وغيرها
- تصنيف السلطة الإبستمولوجية: نظام منظم لتصنيف المصادر بناءً على نظرية إبستمولوجية
- الحجم: 3,226 جملة من مقالات إخبارية باللغة الإنجليزية من 2020-2022
- المعلقون: معلقان (أحد المؤلفين ومساعد بحثي)
- تقسيم البيانات: مجموعة التدريب 70%، مجموعة التطوير 15%، مجموعة الاختبار 15%
- اتساق التعليق: متوسط IoU الكلي 0.74، Cohen's Kappa 0.82
- دقة ماكرو متوسطة على مستوى الكلمات والاستدعاء ودرجة F1
- تقييم التصنيف الثنائي متعدد العلامات لـ 18 فئة علامة
نماذج المشفر (التصنيف متعدد العلامات على مستوى الرمز):
- RoBERTa (base, 125M)
- DeBERTa v3 (base, 184M)
- ModernBERT (base, 150M)
نماذج فك التشفير التوليدية (من تسلسل إلى تسلسل):
- Gemma 2 (2B, 9B)
- Llama 3.1 (8B)
- Mistral v0.3 (7B)
- نماذج المشفر: التدريب باستخدام focal loss لمدة 12 حقبة كحد أقصى
- نماذج فك التشفير: الضبط الدقيق باستخدام QLORA مع تكمية 4-bit، التدريب لمدة 3 حقب
- الأجهزة: وحدة معالجة رسومات A100 واحدة (40GB VRAM)
- معدل التعلم: 1e-5
| النموذج | الدقة | الاستدعاء | F1 |
|---|
| Gemma 2 9B | 0.76 | 0.73 | 0.73 |
| RoBERTa (base) | 0.75 | 0.67 | 0.70 |
| Mistral v0.3 7B | 0.73 | 0.68 | 0.70 |
| DeBERTa v3 (base) | 0.73 | 0.67 | 0.69 |
| Llama 3.1 8B | 0.75 | 0.65 | 0.68 |
- مزايا النماذج التوليدية: يحقق أكبر نموذج فك تشفير Gemma 2 9B أفضل أداء
- قيود نماذج المشفر: تظهر نماذج المشفر تبايناً أكبر في الأداء عبر الفئات المختلفة
- تأثير تكرار العلامة: ترتبط أداء نماذج المشفر بقوة أكبر بعدد العلامات (ρs = 0.72 مقابل 0.66)
- كشف نوع المصدر: تظهر أداء تعليق نوع المصدر ارتباطاً أقل بشعبية العلامة
- كشف الحقائق: Fact w/o Appeal (0.89), Fact with Appeal (0.85)
- كشف المصدر: Source (0.84), Source Attribute (0.79)
- نوع الاقتباس: Indirect Quote (0.83), Direct Quote (0.80)
- نوع المصدر: تباين أداء أكبر، Active Participant (0.54), News Report (0.68)
- نسبة الجمل الحقائقية: أكثر من 80% من الجمل معلقة كحقائق
- توزيع نوع الاستئناف: الحقائق بدون استئناف حوالي ضعف الحقائق مع استئناف
- طريقة الاقتباس: 66% تستخدم إعادة الصياغة، 34% تستخدم الاقتباس المباشر
- حالة التسمية: 64% من المصادر مذكورة بالاسم
- الأعمال المبكرة: التركيز على تحديد الأحداث القابلة للتحقق (Sauri and Pustejovsky, 2009)
- المعايير الكبيرة: مجموعات بيانات FEVER و SciFact و FactRel وغيرها
- القيود: التركيز بشكل أساسي على كشف المطالبات والعلاقات بين المطالبات، مع عدم وجود وصف كامل للأنماط الإبستمولوجية
- الأنماط الإبستمولوجية: التقاط العلامات اللغوية للتأكد والمعتقد
- استخراج الحجج: استكشاف كيفية بناء ودعم المطالبات في الخطاب
- كشف الموقف الإبستمولوجي: نمذجة درجة التزام المصدر بالمطالبة
- كشف الاقتباس: كشف الاقتباسات وإسنادها إلى الكيانات
- القيود: عادة لا تصنف المصادر حسب النوع أو تلتقط ما إذا كان الاستئناف يتم من خلال الكلام المباشر أو إعادة الصياغة
- جدوى المهمة: مهمة تحديد الاستئنافات الإبستمولوجية قابلة للتطبيق لكنها تظل تحديات
- مزايا النماذج التوليدية: تظهر النماذج التوليدية أداء أفضل في التعامل مع الهياكل الإبستمولوجية المعقدة
- قيمة التحليل الدقيق: يمكن للتعليق على مستوى الامتداد أن يكشف الهياكل الإبستمولوجية المعقدة في وسائل الإعلام الإخبارية
- قيود مستوى الجملة: استخدام التعليق على مستوى الجملة فقط، مما يحد من المعلومات السياقية التي يمكن التقاطها
- ربط المصدر والبيان: لا يربط التعليق الحالي بشكل صريح كل مصدر ببيانه المقابل
- نطاق اللغة والوقت: مقتصر على مقالات إخبارية باللغة الإنجليزية من 2020-2022
- حجم التعليق: حجم مجموعة البيانات نسبياً صغير، قد يؤثر على قدرة النموذج على التعميم
- التوسع إلى مستوى الفقرة/المقالة: نمذجة الهياكل الخطابية المعقدة في وحدات نصية أكبر
- التوسع متعدد اللغات: تطبيق على لغات وخلفيات ثقافية أخرى
- نمذجة علاقات المصدر والبيان: نمذجة صريحة للعلاقات المقابلة بين المصادر والبيانات
- تطبيق وسائل التواصل الاجتماعي: التوسع إلى أنواع خطاب أخرى مثل وسائل التواصل الاجتماعي
- تحليل الديناميكيات الزمنية: دراسة التغييرات الزمنية في أنماط الاستئنافات الإبستمولوجية
- ابتكار المهمة: تعريف وبحث منهجي لمهمة تحديد الاستئنافات الإبستمولوجية للمرة الأولى، ملء فجوة بحثية مهمة
- أساس نظري قوي: بناء نظام تصنيفي على أساس نظريات إبستمولوجية ولسانية، مع أساس نظري متين
- جودة تعليق عالية: تعليق دقيق على مستوى الامتداد، اتساق معلقين جيد (Kappa=0.82)
- قيمة متعددة التخصصات: توفير مورد قيم للسانيات الحاسوبية والعلوم السياسية وأبحاث الاتصالات وغيرها
- تجارب شاملة: مقارنة معماريات نماذج متعددة، توفير تحليل أداء مفصل
- قيود حجم البيانات: حجم 3,226 جملة نسبياً صغير، قد يحد من أداء النموذج والقدرة على التعميم
- تعقيد التعليق: بعض فئات العلامات تحتوي على عينات نادرة، مما يؤثر على تعلم النموذج
- مقاييس التقييم الموحدة: استخدام درجة F1 بشكل أساسي، مع نقص مقاييس التقييم الخاصة بالمهمة
- تحليل الأخطاء غير كافٍ: نقص التحليل المتعمق لأنواع أخطاء النموذج
- التحقق من التطبيق العملي: عدم التحقق من الفعالية في مهام التحقق الآلي من الحقائق أو تحليل وسائل الإعلام الحقيقية
- المساهمة الأكاديمية: فتح اتجاه بحثي جديد في مجال معالجة اللغة الطبيعية
- القيمة العملية: يمكن تطبيقها على التحقق الآلي من الحقائق وكشف انحياز وسائل الإعلام وبناء الرسوم البيانية للمعرفة وغيرها
- الأهمية الاجتماعية: تساعد على فهم وتحليل آليات نشر المعلومات والتحقق في وسائل الإعلام
- إمكانية إعادة الإنتاج: نشر البيانات والأكواد علناً، مما يسهل الأبحاث اللاحقة
- تحليل وسائل الإعلام الإخبارية: تحليل أنماط استخدام الأدلة في التقارير الإخبارية
- مساعدة التحقق من الحقائق: توفير معلومات سياقية أغنى لأنظمة التحقق الآلي من الحقائق
- تعليم محو الأمية الإعلامية: المساعدة في تحديد وتحليل استراتيجيات الاستئناف الإبستمولوجي في وسائل الإعلام
- تحليل الخطاب السياسي: دراسة أنماط الاستئناف للسلطة في الاتصالات السياسية
- بناء الرسوم البيانية للمعرفة: توفير أساس لبناء رسوم بيانية للمعرفة تتضمن علاقات الأدلة
- Thorne et al. (2018): مجموعة بيانات FEVER، استخراج والتحقق من الحقائق على نطاق واسع
- Sauri and Pustejovsky (2009): العمل المبكر في كشف الحقائق
- Da San Martino et al. (2019): التحليل الدقيق لتقنيات الدعاية
- Collins and Evans (2002): الموجة الثالثة من أبحاث الخبرة والمعرفة
- Anderson (2021): الفقاعات الإبستمولوجية والسياسة الاستبدادية
تقدم هذه الورقة مساهمة رائدة في مهمة تحديد الاستئنافات الإبستمولوجية الناشئة، حيث توفر ليس فقط مجموعة بيانات معلقة عالية الجودة، بل أيضاً إطار نظري منظم وخطوط أساس تجريبية. على الرغم من وجود مجال للتحسن في حجم البيانات وأداء النموذج، فإن قيمتها البحثية متعددة التخصصات وإمكانيات تطبيقها العملية تجعلها عملاً مهماً في هذا المجال.