2025-11-11T10:34:09.859553

When Retrieval Succeeds and Fails: Rethinking Retrieval-Augmented Generation for LLMs

Wang, Yu, Song et al.

Large Language Models (LLMs) have enabled a wide range of applications through their powerful capabilities in language understanding and generation. However, as LLMs are trained on static corpora, they face difficulties in addressing rapidly evolving information or domain-specific queries. Retrieval-Augmented Generation (RAG) was developed to overcome this limitation by integrating LLMs with external retrieval mechanisms, allowing them to access up-to-date and contextually relevant knowledge. However, as LLMs themselves continue to advance in scale and capability, the relative advantages of traditional RAG frameworks have become less pronounced and necessary. Here, we present a comprehensive review of RAG, beginning with its overarching objectives and core components. We then analyze the key challenges within RAG, highlighting critical weakness that may limit its effectiveness. Finally, we showcase applications where LLMs alone perform inadequately, but where RAG, when combined with LLMs, can substantially enhance their effectiveness. We hope this work will encourage researchers to reconsider the role of RAG and inspire the development of next-generation RAG systems.

academic

عندما ينجح الاسترجاع ويفشل: إعادة التفكير في الجيل المعزز بالاسترجاع للنماذج اللغوية الكبيرة

المعلومات الأساسية

معرّف الورقة: 2510.09106
العنوان: When Retrieval Succeeds and Fails: Rethinking Retrieval-Augmented Generation for LLMs
المؤلفون: Yongjie Wang, Yue Yu, Kaisong Song, Jun Lin, Zhiqi Shen
التصنيف: cs.CL (اللسانيات الحسابية)
تاريخ النشر: 10 أكتوبر 2025 (نسخة أولية من arXiv)
رابط الورقة: https://arxiv.org/abs/2510.09106

الملخص

حققت النماذج اللغوية الكبيرة (LLMs) تطبيقات واسعة من خلال قدرات فهم وتوليد لغة قوية. ومع ذلك، نظراً لأن النماذج اللغوية الكبيرة تم تدريبها على مجموعات نصوص ثابتة، فإنها تواجه صعوبات في التعامل مع المعلومات سريعة التطور أو الاستعلامات الخاصة بالمجال. يتغلب الجيل المعزز بالاسترجاع (RAG) على هذا القيد من خلال دمج النماذج اللغوية الكبيرة مع آليات استرجاع خارجية، مما يمكّنها من الوصول إلى المعرفة الحديثة والمرتبطة بالسياق. ومع ذلك، مع التقدم المستمر للنماذج اللغوية الكبيرة في الحجم والقدرة، أصبحت الميزة النسبية للإطار التقليدي للـ RAG أقل وضوحاً وضرورة. تقدم هذه الورقة مراجعة شاملة للـ RAG، بدءاً من أهدافها الكلية والمكونات الأساسية، ثم تحلل التحديات الرئيسية في RAG، مع تسليط الضوء على نقاط الضعف الرئيسية التي قد تحد من فعاليتها. وأخيراً، تعرض سيناريوهات تطبيقية حيث تؤدي النماذج اللغوية الكبيرة بمفردها أداءً ضعيفاً، لكن RAG مع النماذج اللغوية الكبيرة يمكن أن يعزز فعاليتها بشكل كبير.

خلفية البحث والدافع

تعريف المشكلة

المشكلة الأساسية: مع التحسن السريع في قدرات النماذج اللغوية الكبيرة، يتم التشكيك في ضرورة وفعالية إطار RAG التقليدي
التحديات المحددة:
- قيود المعرفة للنماذج اللغوية الكبيرة على بيانات التدريب الثابتة
- صعوبة التعامل مع الاستعلامات الخاصة بالمجال والمعلومات سريعة التطور
- الانتشار الواسع لظاهرة الهلوسة (hallucination)

أهمية البحث

الاحتياجات العملية: المهام الكثيفة بالمعرفة والوصول المخصص للمعلومات والتكامل المعرفي في الوقت الفعلي لا تزال تتطلب RAG
التطور التكنولوجي: الحاجة إلى إعادة تقييم دور وقيمة RAG في سياق النماذج اللغوية الكبيرة الحديثة
الأهمية النظرية: توفير إرشادات لتطوير أنظمة RAG من الجيل القادم

قيود الطرق الموجودة

آليات تشغيل الاسترجاع غير الملائمة: نقص التحليل لحدود المعرفة الموجودة في النماذج اللغوية الكبيرة
فهم الاستعلامات المعقدة غير الكافي: قدرات تحليل النية محدودة، مما يؤثر على تحديد الكلمات الرئيسية
تضارب المعرفة غير المحلول: وجود معلومات متضاربة غير مثبتة في قواعس البيانات الخارجية
فهم آلية التعلم في السياق (ICL) محدود: نقص الفهم العميق لآليات عمل التعلم في السياق في إطار الاسترجاع المعزز

المساهمات الأساسية

مراجعة منهجية: توفير مراجعة شاملة لتكنولوجيا RAG، بما في ذلك العمارة والمكونات والتحديات
تحديد المشاكل: تحليل متعمق لأربعة تحديات أساسية تواجه أنظمة RAG الحالية
توضيح السيناريوهات التطبيقية: تحديد وشرح ثلاثة مجالات تطبيقية لا غنى عن RAG فيها
الاتجاهات المستقبلية: توفير اتجاهات بحثية واضحة لتطوير أنظمة RAG من الجيل القادم

شرح الطريقة

عمارة نظام RAG

تقسم هذه الورقة نظام RAG إلى أربع وحدات أساسية:

1. وحدة الفهرسة (Indexing Module)

تقسيم المستندات: تقسيم المستندات إلى أجزاء قابلة للإدارة، مع الترميز باستخدام BM25 أو تضمينات النموذج اللغوي الكبير
تحسين الرسم البياني للمعرفة:
- تحويل المصادر الخارجية إلى رسم بياني للمعرفة (KG)
- تمثل العقد الكيانات أو المفاهيم، والحواف تشفر العلاقات
- تنظيم التجميع الهرمي للكيانات في هياكل مجتمعية متعددة الطبقات
التحديات: تطوير أنظمة فهرسة فعالة تطابق استعلامات المستخدم؛ إدارة مصادر البيانات غير المتجانسة

2. وحدة الاسترجاع (Retrieval Module)

تحتوي على ثلاث خطوات متسلسلة:

تحليل الاستعلام:

إعادة صياغة الاستعلام: إعادة صياغة الاستعلام من زوايا متعددة
تحليل الاستعلام: تقسيم المشاكل المعقدة إلى مشاكل فرعية بسيطة
استدلال الإجابة: توليد إجابات افتراضية لتوجيه الاسترجاع
استخراج الكلمات الرئيسية: تحديد المصطلحات المهمة الخاصة بالمجال

استرجاع الفقرات:

المطابقة الدلالية: استخدام المشفرات المتفرقة (BM25) والتضمينات الكثيفة (SBERT)
اجتياز الرسم البياني: الاسترجاع القائم على KG من خلال اجتياز هيكل الرسم البياني
الطرق المختلطة: الجمع بين الاسترجاع الخشن (استدعاء عالي) والاسترجاع الدلالي (دقة عالية)

إعادة الترتيب والتصفية:

تقنيات إعادة الترتيب: إعادة ترتيب بناءً على صلة الاستعلام
تقنيات التلخيص: الاحتفاظ بالأجزاء الأكثر إفادة، وتقليل طول السياق

3. وحدة التوليد (Generation Module)

هندسة الفورمات: ضمان استخدام النموذج اللغوي الكبير بفعالية للمستندات المسترجعة
معالجة التضارب: حل التضارب بين الأدلة المسترجعة والمعرفة البارامترية
الضبط الدقيق المتخصص: تدريب النموذج اللغوي الكبير على التمييز بين المستندات ذات الصلة وغير ذات الصلة

4. وحدة التنسيق (Orchestration Module)

إدارة سير العمل: تنسيق التفاعلات وتدفق البيانات بين الوحدات
التكيف الديناميكي: تفعيل المكونات المناسبة بناءً على احتياجات الاستعلام المحددة
تحسين الكفاءة: تحسين تنوع النظام والكفاءة

نقاط الابتكار التقني

التصميم المعياري: تقسيم منهجي لنظام RAG إلى أربع وحدات مستقلة لكن متعاونة
التحليل الموجه نحو التحديات: تحديد الاختناقات التقنية بناءً على المشاكل العملية
القيادة بالسيناريوهات التطبيقية: إعادة تعريف قيمة RAG بناءً على الاحتياجات الفعلية

تحليل التحديات الأساسية

1. توقيت تشغيل الاسترجاع (متى يجب أن أسترجع؟)

المشكلة: عدم وضوح حدود معرفة النموذج اللغوي الكبير

الوضع الحالي: معظم طرق RAG لا تقيّم ما يعرفه النموذج اللغوي الكبير وما لا يعرفه
الحل المقترح:
- الطرق القائمة على عدم اليقين لتقييم تباين التنبؤ
- عدم اليقين الدلالي وعدم اليقين الذاتي ودرجة ثقة التنبؤ
- تفعيل RAG فقط عندما لا يستطيع النموذج اللغوي الكبير إنتاج تنبؤ واثق

2. اختيار محتوى الاسترجاع (ماذا يجب أن أسترجع؟)

المشكلة: عدم فعالية طرق الاسترجاع

صعوبة المهام المعقدة للاستدلال: الإجابة على الأسئلة متعددة القفزات والاستدلال الرياضي تتطلب فهماً عميقاً للنية
قيود KG-RAG:
- تقديم كيانات غير ذات صلة من خلال طرق الحي K-hop
- البحث الموجه بالنموذج اللغوي الكبير مكلف حسابياً وغير متسق
اتجاهات الحل: الأطر القائمة على الوكيل و Agentic RAG

3. موثوقية مصدر البيانات (ماذا يجب أن أثق؟)

المشكلة: مخاطر مصادر البيانات غير المثبتة

مشكلة الافتراض: معظم طرق RAG تفترض أن المعرفة الخارجية موثوقة بطبيعتها
الواقع الفعلي: حتى قواعد البيانات الموثوقة مثل PubMed تحتوي على بيانات احتيالية
الحل المقترح: بناء قواعس بيانات عالية الجودة وفعالة في الاسترجاع

4. آلية عمل RAG (كيف يعمل RAG؟)

المشكلة: عدم شفافية آلية التعلم في السياق (ICL)

حل التضارب: آلية حل التضارب بين الأدلة المسترجعة والذاكرة البارامترية غير واضحة
حد الأداء: النماذج اللغوية الكبيرة تميل إلى الاعتماد على المحتوى المسترجع دون الأخذ في الاعتبار دقته
اتجاهات البحث: تحليل تدفق الانتباه والتتبع السببي واستكشاف التمثيل

5. RAG مقابل النماذج اللغوية الكبيرة ذات السياق الطويل

التحليل المقارن:

مزايا النماذج اللغوية الكبيرة ذات السياق الطويل: معالجة المستندات الكاملة، تقليل الاعتماد على الاسترجاع
عيوب النماذج اللغوية الكبيرة ذات السياق الطويل: قطع المعرفة وتكاليف الاستدلال العالية والحساسية للضوضاء وندرة بيانات التدريب
التكامل: إطار موحد يجمع بين استرجاع الحقائق الدقيقة والاستدلال الشامل عبر المستندات

تحليل السيناريوهات التطبيقية

1. التطبيقات الكثيفة بالمعرفة

السيناريوهات النموذجية: جرعات الأدوية وتشخيص الأمراض النادرة
قيمة RAG: الوصول إلى قواعس بيانات عالية الجودة خاصة بالمجال، دعم الأدلة السلطوية

2. إدارة المعرفة الخاصة

السيناريوهات النموذجية: المستندات المؤسسية والملاحظات الشخصية والحوارات متعددة الأدوار
قيمة RAG: استرجاع المعرفة المخصصة والآمنة وحماية خصوصية البيانات

3. التكامل المعرفي في الوقت الفعلي

السيناريوهات النموذجية: الأخبار والأسواق المالية وتحديثات اللوائح
قيمة RAG: استرجاع المعلومات الحديثة بشكل مستمر كمستخرج ومُلخّص للمعلومات

إعداد التجارب

كورقة استقصائية، تدعم هذه الورقة وجهات نظرها بشكل أساسي من خلال:

البحث الأدبي: فحص منهجي للتقدم في البحث المتعلق بـ RAG
تحليل الحالات: تشريح المشاكل في السيناريوهات المحددة
التحليل النظري: التفكير العميق بناءً على البحث الموجود

الأعمال ذات الصلة

تطور RAG

الأعمال المبكرة: Lewis et al. (2020) اقترح إطار RAG الأساسي
تحسين الاستعلام: تحويل الاستعلام وضبط نماذج التضمين
استراتيجيات الفهرسة: GraphRAG و HippoRAG و KAG وطرق تحسين KG الأخرى
التكامل مع الوكيل: Agentic RAG يجمع وكلاء النموذج اللغوي الكبير الذكية

التصنيف التقني

تقنيات الفهرسة: تقسيم المستندات والرسوم البيانية للمعرفة والهياكل الهرمية
تقنيات الاسترجاع: المطابقة الدلالية واجتياز الرسم البياني والطرق المختلطة
تقنيات التوليد: هندسة الفورمات والضبط الدقيق الخاضع للإشراف والتعلم المعزز

الخلاصة والمناقشة

الاستنتاجات الرئيسية

RAG لا يزال ذا قيمة: على الرغم من تحسن قدرات النماذج اللغوية الكبيرة، RAG لا غنى عنه في سيناريوهات محددة
التحديات واضحة: تحديد أربعة تحديات تقنية أساسية
اتجاه التطور واضح: توفير إرشادات واضحة لأنظمة RAG من الجيل القادم

القيود

التحليل النظري بشكل أساسي: نقص التحقق التجريبي على نطاق واسع
تصور الحلول: معظم الحلول المقترحة توجيهات اتجاهية
معايير التقييم المفقودة: عدم توفير إطار تقييم موحد لأنظمة RAG

الاتجاهات المستقبلية

الاسترجاع التكيفي: آليات تشغيل ذكية بناءً على حدود معرفة النموذج اللغوي الكبير
فهم النية العميق: التحليل والتحليل الدقيق للاستعلامات المعقدة
النظام البيئي للبيانات الموثوقة: بناء قواعس بيانات عالية الجودة وقابلة للتحقق
شفافية الآلية: البحث المتعمق في آليات التعلم في السياق وتفاعل RAG

التقييم المتعمق

المزايا

قوة النظام: تغطية شاملة لجميع جوانب تكنولوجيا RAG
التوجيه نحو المشاكل: تحليل متعمق بناءً على التحديات العملية
الرؤية المستقبلية الجيدة: توفير اتجاهات بحثية واضحة
الهيكل الواضح: التحليل المعياري يسهل الفهم والتطبيق

أوجه القصور

نقص التجريب: كورقة استقصائية، تفتقر إلى التحقق التجريبي الأصلي
الحلول المجردة: معظم الحلول المقترحة تبقى على المستوى المفاهيمي
المقارنة المفقودة: عدم توفير مقارنة منهجية لطرق RAG المختلفة

التأثير

القيمة الأكاديمية: توفير إطار نظري مهم وتوجيه المشاكل لبحث RAG
القيمة العملية: توفير إرشادات لتصميم وتحسين أنظمة RAG الصناعية
الإلهام: تحفيز إعادة التفكير في جوهر وقيمة RAG

السيناريوهات المناسبة

الباحثون: مرجع مهم لبحث تكنولوجيا RAG
المهندسون: إرشادات لتصميم وتحسين أنظمة RAG
مديرو المنتجات: دعم القرار لاختيار سيناريوهات تطبيق RAG

المراجع

تستشهد هذه الورقة بعدد كبير من الأعمال ذات الصلة، وتشمل بشكل أساسي:

Lewis et al. (2020): ورقة RAG الأصلية
Edge et al. (2024): GraphRAG
Gutiérrez et al. (2024): HippoRAG
Singh et al. (2025): Agentic RAG
وعدد كبير من الأبحاث المتعلقة بـ LLM و ICL والرسوم البيانية للمعرفة

التقييم الشامل: هذه ورقة استقصائية عالية الجودة لتكنولوجيا RAG، تحلل بشكل منهجي الوضع الحالي والتحديات والاتجاهات المستقبلية لـ RAG. تكمن المساهمة الرئيسية للورقة في توفير إطار تحليل واضح موجه نحو المشاكل، مما يشير إلى الاتجاهات المستقبلية لمزيد من التطوير في هذا المجال. على الرغم من نقص المساهمات التقنية الأصلية والتحقق التجريبي، فإن قيمتها النظرية وأهميتها التوجيهية كورقة استقصائية كبيرة جداً.