يشكل الانتشار السريع للمعلومات المضللة على المنصات الرقمية تهديداً للخطاب العام والاستقرار العاطفي واتخاذ القرارات. بينما استكشفت الأعمال السابقة هجمات عدائية متنوعة في كشف المعلومات المضللة، إلا أن التحويلات المحددة المدروسة في هذه الورقة لم تحظَ بدراسة منهجية. على وجه الخصوص، تحقق هذه الورقة في تبديل اللغات عبر الإنجليزية والفرنسية والإسبانية والعربية والهندية والصينية، وكذلك الترجمة اللاحقة. كما تدرس توسيع طول الاستعلام قبل التلخيص وإعادة الصياغة الهيكلية كأسئلة متعددة الخيارات. تقترح هذه الورقة إطار عمل متعدد اللغات ومتعدد الوكلاء لنماذج اللغة الكبيرة، يجمع تقنيات الاسترجاع المعزز للتوليد، ويمكن نشره كمكون إضافي على المنصات الإلكترونية. يؤكد هذا العمل على أهمية كشف المعلومات المضللة المدفوع بالذكاء الاصطناعي في حماية سلامة الحقائق عبر الإنترنت، مع إظهار جدوى النشر القائم على المكونات الإضافية في تطبيقات الويب الحقيقية.
تتمثل المشكلة الأساسية التي يعالجها هذا البحث في افتقار نماذج اللغة الكبيرة (LLMs) إلى قدرات فعالة في كشف المعلومات المضللة عند مواجهة هجمات عدائية، مما يجعلها عرضة لتضخيم انتشار المعلومات المضللة بشكل غير مقصود.
يقترح المؤلفون الحاجة إلى تطوير نظام كشف معلومات مضللة متعدد اللغات يمكنه الصمود أمام هجمات عدائية متعددة، ونشره كمكون إضافي ويب عملي.
الإدخال: محتوى نصي من الويب (مقالات إخبارية وتعليقات المستخدمين ومنشورات وسائل التواصل الاجتماعي وغيرها)، قد يتضمن تحويلات عدائية الإخراج: نتيجة تصنيف ثنائي (صحيح/خاطئ) للحكم على ما إذا كان النص المدخل يحتوي على معلومات مضللة القيود: يجب أن يعمل النظام في إعداد الصندوق الأسود، بناءً فقط على التغذية الراجعة الثنائية
يتضمن النظام أربعة وكلاء متعاونين:
| نوع الهجوم | دقة الكشف عن المعلومات المضللة | دقة الكشف عن الحقائق |
|---|---|---|
| الأسئلة المباشرة | 99.76% | 85.25% |
| الأسئلة متعددة الخيارات | 97.38% | 89.85% |
| التلخيص | 99.3% | 95.15% |
| الترجمة الفرنسية | 97.72% | 87.25% |
| الترجمة العربية | 97.26% | 88.65% |
| الترجمة الهندية | 95.2% | 87.4% |
| الترجمة الصينية | 96.44% | 93.5% |
| الترجمة الإسبانية | 97.9% | 90.9% |
| نموذج التضمين | متوسط دقة الأسئلة متعددة الخيارات | متوسط دقة التلخيص | متوسط دقة الترجمة |
|---|---|---|---|
| text-embedding-3-large | 93.62% | 97.23% | 93.22% |
| jina-embeddings-v3 | 95.29% | 89.08% | 93.35% |
| multilingual-e5-large | 95.26% | 89.02% | 93.92% |
تستشهد هذه الورقة بـ 50 مرجعاً ذا صلة، تغطي مجالات متعددة بما فيها نماذج اللغة الكبيرة وRAG والأنظمة متعددة الوكلاء والهجمات العدائية وغيرها، مما يوفر أساساً نظرياً متيناً للبحث.
التقييم الشامل: هذه ورقة ذات مساهمة مهمة في مجال كشف المعلومات المضللة، تقترح إطار عمل RAG متعدد الوكلاء مبتكراً، وتحقق نتائج تجريبية ممتازة في إعدادات متعددة اللغات وأنواع هجمات متعددة. على الرغم من وجود بعض القيود، فإن قيمتها العملية والابتكار التقني يجعلانها تقدماً مهماً في هذا المجال.