تُظهر نماذج اللغة الكبيرة المعززة بالاسترجاع (RAG-LLMs) أداءً متفوقاً في المجال الطبي من خلال دمج المعرفة الخارجية، خاصة في التشخيص السريري. ومع ذلك، تواجه طرق RAG الحالية صعوبة في تخصيص استراتيجيات الاسترجاع وفقاً لصعوبة التشخيص وكمية المعلومات في العينات المدخلة، مما يؤدي إلى استرجاع مفرط وغير ضروري يضر بالكفاءة الحسابية ويزيد من خطر إدخال الضوضاء، وبالتالي يقلل من دقة التشخيص. لمعالجة هذه المشكلة، نقترح ICA-RAG (الاسترجاع المعزز التكيفي الموجه بإكمال المعلومات)، وهو إطار عمل جديد لتعزيز موثوقية RAG في تشخيص الأمراض. يستفيد ICA-RAG من وحدة تحكم تكيفية لتقييم ضرورة الاسترجاع بناءً على إكمال المعلومات للمدخلات، من خلال تحسين الاسترجاع وتصفية المعرفة، ما يحقق محاذاة أفضل بين عمليات الاسترجاع والاحتياجات السريرية. تُظهر التجارب على ثلاث مجموعات بيانات للسجلات الطبية الإلكترونية الصينية أن ICA-RAG يتفوق بشكل ملحوظ على الطرق الأساسية، مما يبرز فعاليته في التشخيص السريري.
تواجه نماذج اللغة الكبيرة تحديين رئيسيين في المهام الطبية:
التشخيص المباشر للمرض: بالنظر إلى تسلسل الرموز الذي يمثل النص المدخل ، يمكن صياغة توليد النصوص بواسطة LLM على النحو التالي:
تشخيص المرض بـ RAG: استرجاع المعرفة ذات الصلة من مصادر المعرفة الخارجية ودمجها: حيث
تشخيص المرض بـ RAG التكيفي: إدخال دالة تحكم F لتقييم المدخل Q:
\text{LLM}(Q, \text{prompt}), & \text{if } F(Q) = \langle\text{Activate}\rangle \\ \text{LLM}(Q, d, \text{prompt}), & \text{otherwise} \end{cases}$$ ### معمارية النموذج يتضمن إطار عمل ICA-RAG ثلاث مراحل رئيسية: #### المرحلة (أ): تحسين قرار الاسترجاع بناءً على إكمال المعلومات للمدخل 1. **تقسيم النص**: تقسيم المدخل Q إلى وحدات نصية (الجملة بشكل افتراضي): $Q = \{s_i\}_{i=1}^n$ 2. **تصنيف الأهمية**: تدريب مصنف للتنبؤ بأهمية كل وحدة: $$l_i = \text{Classifier}(s_i) \quad \forall i \in \{1, 2, ..., n\}$$ تنقسم التسميات إلى ثلاث فئات: - A: معلومات حاسمة لقرار التشخيص - B: معلومات تساهم بشكل إيجابي في الاسترجاع لكن لا يمكن استنتاج النتيجة مباشرة منها - C: معلومات نسبياً غير مهمة 3. **حساب إكمال المعلومات**: $$I_{\text{norm}}(Q) = \frac{1}{\alpha \cdot n} \sum_{i=1}^n (\alpha \cdot I(l_i = A) + \beta \cdot I(l_i = B) + \gamma \cdot I(l_i = C))$$ #### المرحلة (ب): الاسترجاع بناءً على تقسيم الوثائق والتعيين 1. **الاسترجاع على مستوى الجملة**: استرجاع أفضل m كتل نصية ذات صلة لكل جملة 2. **إعادة ترتيب على مستوى الوثيقة**: إحصاء عدد الكتل المسترجعة من كل وثيقة وإعادة ترتيبها 3. **استراتيجية التعيين**: تعيين كتل النصوص مرة أخرى إلى الوثائق الأصلية وإعادة ترتيبها بناءً على عدد الكتل #### المرحلة (ج): تصفية المعرفة والتشخيص بناءً على الموجهات الموجهة استخدام قالب موجه التشخيص التفاضلي لتصفية الوثائق غير ذات الصلة، محاكاة عملية التشخيص التفاضلي للطبيب. ### نقاط الابتكار التقني 1. **تقييم إكمال المعلومات**: تحويل فهم الوثائق المعقد إلى مهمة بسيطة على مستوى الجملة 2. **استراتيجية التسمية بالإخفاء**: الحصول التلقائي على تسميات التدريب من خلال عمليات إخفاء التسلسل 3. **إعادة ترتيب تعيين الكتلة والوثيقة**: الحساب بناءً فقط على القيم الرقمية للنتائج المسترجعة، مما يقلل من استهلاك الذاكرة 4. **تصفية التشخيص التفاضلي**: محاكاة عملية التشخيص التفاضلي السريري لتصفية المعلومات غير ذات الصلة ## إعداد التجارب ### مجموعات البيانات - **CMEMR**: مجموعة بيانات السجلات الطبية الإلكترونية الصينية - **ClinicalBench**: مجموعة البيانات الأساسية السريرية - **CMB-Clin**: مجموعة البيانات الطبية الصينية الأساسية السريرية تم تكوين جميع مجموعات البيانات كمهام تشخيص من النهاية إلى النهاية، مع معلومات المريض كمدخل وخلاصة التشخيص من الطبيب كتسمية حقيقية. ### مقاييس التقييم استخدام التصنيف الدولي للأمراض (ICD-10) لتوحيد مصطلحات الأمراض، مع حساب الدقة والاستدعاء و F1-score على مستوى المجموعة باستخدام المطابقة الضبابية (حد 0.5). ### الطرق المقارنة 1. **الطرق غير المستندة إلى الاسترجاع**: CoT, SC-CoT, ATP 2. **طرق الاسترجاع القياسية**: RAG2, LongRAG 3. **طرق الاسترجاع التكيفي**: Adaptive-RAG, DRAGIN, SEAKR ### تفاصيل التنفيذ - **النموذج الأساسي**: qwen2.5-7B-instruct - **المصنف**: BERT-base-Chinese - **المسترجع**: BM25 - **قاعدة المعرفة الخارجية**: قاعدة بيانات المعرفة الطبية السريرية CMKD ## نتائج التجارب ### النتائج الرئيسية | الطريقة | CMEMR F1(%) | ClinicalBench F1(%) | CMB-Clin F1(%) | |--------|-------------|---------------------|-----------------| | CoT | 48.82 | 38.46 | 52.14 | | LongRAG | 49.07 | 39.25 | 51.81 | | Adaptive-RAG | 49.27 | 38.04 | 53.44 | | **ICA-RAG** | **50.88** | **40.79** | **53.53** | النتائج الرئيسية: 1. يحقق ICA-RAG أفضل أو قريب من أفضل درجات F1 على جميع مجموعات البيانات 2. مقارنة بـ LongRAG، تحسنت قيم F1 بنسبة 1.81% و 1.54% و 1.72% على التوالي 3. يتفوق بشكل ملحوظ على طرق RAG التكيفي الأخرى ### تجارب الاستئصال نتائج الاستئصال على مجموعة بيانات CMEMR: | المتغير | F1(%) | حجم الانخفاض | |--------|-------|-------------| | ICA-RAG | 50.88 | - | | بدون قرار | 48.07 | -2.81% | | بدون كتلة | 49.78 | -1.10% | | بدون إعادة ترتيب M | 49.59 | -1.29% | | بدون تفاضل | 49.85 | -1.03% | ### تحليل الكفاءة - **الكفاءة الزمنية**: تحسن ملحوظ مقارنة بطرق RAG غير التكيفية - **كفاءة المعاملات**: مصنف BERT-Base (110M معامل) أخف وزناً من T5-Large (770M معامل) المستخدم في Adaptive-RAG - **القابلية للتطبيق**: لا تتطلب الوصول إلى توزيع احتمالات مخرجات LLM، مما يجعلها مناسبة للنماذج المغلقة والنشر عبر API ## الأعمال ذات الصلة ### تطبيق RAG في التشخيص السريري للأمراض - تستخدم معظم الدراسات طرق استرجاع أساسية، من خلال ترميز المعرفة الخارجية والاستعلامات المتعلقة بالمهام باستخدام نماذج التضمين - تُستخدم الرسوم البيانية للمعرفة على نطاق واسع أيضاً - يفتقر إلى التحسينات المخصصة لخصوصية المجال الطبي ### RAG التكيفي - **FLARE و DRAGIN**: تفعيل البحث عندما يولد LLM رموز ثقة منخفضة - **Self-RAG**: تدريب النموذج على الاسترجاع والنقد والتوليد الديناميكي للنصوص - **Adaptive-RAG**: تقييم تعقيد الاستعلام لتحديد ضرورة الاسترجاع - تركز الطرق الحالية بشكل أساسي على مهام الإجابة على الأسئلة، وتواجه صعوبة في الانتقال المباشر إلى التشخيص الطبي ## الخلاصة والمناقشة ### الاستنتاجات الرئيسية يعالج ICA-RAG بشكل فعال مشكلة استراتيجيات الاسترجاع الجامدة في الطرق التقليدية المعززة بالاسترجاع من خلال تحسين قرارات الاسترجاع التكيفي بناءً على إكمال المعلومات للمدخل، مما يُظهر قدرة تكيف قوية في السيناريوهات السريرية المعقدة. ### القيود 1. **قيود استراتيجية التسمية**: نظراً لأن معلومات المريض قد تحتوي على محتوى متكرر، قد يتمكن LLM من الوصول إلى التشخيص الصحيح حتى بعد إخفاء الجمل الرئيسية، مما يؤدي إلى عدم دقة تسميات التسمية 2. **تعقيد النصوص الطبية**: تحتوي النصوص الطبية السريرية على اختصارات ومرادفات وأسماء بديلة، وتختلف طرق التسجيل بشكل كبير بين الأطباء المختلفين، مما يؤثر على دقة الاسترجاع 3. **الحاجة إلى الفحص اليدوي**: لا تزال استراتيجية التسمية التلقائية تتطلب فحصاً يدوياً وتصحيحاً ### الاتجاهات المستقبلية 1. استكشاف استراتيجيات معالجة مسبقة أكثر فعالية للنصوص الطبية لتحسين جودة الاسترجاع 2. تطبيق ICA-RAG على مهام طبية أخرى 3. تحسين عملية الاسترجاع بشكل أكبر ## التقييم المتعمق ### المميزات 1. **ابتكار قوي**: أول من يقترح آلية قرار استرجاع تكيفي قائمة على إكمال المعلومات 2. **قابلية عملية عالية**: لا تتطلب ضبط نموذج LLM الأساسي، مع قابلية تطبيق قوية 3. **تجارب شاملة**: تقييم شامل وتجارب استئصال على عدة مجموعات بيانات 4. **تحسن الكفاءة**: تحسن ملحوظ في الكفاءة الحسابية مع الحفاظ على الأداء ### أوجه القصور 1. **قيود مجموعة البيانات**: التحقق فقط على مجموعات بيانات السجلات الطبية الإلكترونية الصينية، مع افتقار التحقق عبر اللغات والمجالات 2. **جودة التسمية**: استراتيجية التسمية التلقائية تحتوي على ضوضاء، وتتطلب تدخلاً يدوياً 3. **تحديد الحد الأدنى**: تحديد حدود إكمال المعلومات θ₁ و θ₂ يفتقر إلى التوجيه النظري 4. **الاعتماد على قاعدة المعرفة**: يعتمد الأداء بشكل كبير على جودة قاعدة المعرفة الخارجية ### التأثير 1. **المساهمة الأكاديمية**: توفير أفكار جديدة لتطبيق RAG في مجال الذكاء الاصطناعي الطبي 2. **القيمة العملية**: يمكن تطبيقها مباشرة على أنظمة دعم القرار السريري 3. **قابلية إعادة الإنتاج**: وصف الطريقة مفصل، وإعداد التجارب واضح ### السيناريوهات المعمول بها 1. **التشخيص السريري**: مناسب بشكل خاص للحالات ذات الأعراض المعقدة التي تتطلب تشخيصاً تفاضلياً 2. **أنظمة الإجابة على الأسئلة الطبية**: يمكن تحسين دقة وكفاءة أنظمة الاستشارات الطبية 3. **التعليم الطبي**: يمكن استخدامه كأداة مساعدة لتعلم الطلاب الطبيين ## المراجع تستشهد الورقة بـ 41 مرجعاً ذا صلة، تغطي أعمالاً مهمة في عدة مجالات بما في ذلك نماذج اللغة الكبيرة والاسترجاع المعزز والذكاء الاصطناعي الطبي، مما يوفر أساساً نظرياً متيناً للبحث. --- **التقييم الإجمالي**: هذه ورقة عالية الجودة ذات مساهمة مهمة في مجال الذكاء الاصطناعي الطبي. يعالج المؤلفون القيود في طرق RAG الحالية في التشخيص الطبي بحل مبتكر، ويتحققون من فعالية الطريقة من خلال تجارب شاملة. على الرغم من وجود بعض القيود، فإن ابتكارها وقابليتها العملية تجعلها تقدماً مهماً في هذا المجال.