पुनर्प्राप्ति-संवर्धित बड़े भाषा मॉडल (RAG-LLMs) बाहरी ज्ञान को एकीकृत करके चिकित्सा क्षेत्र में असाधारण प्रदर्शन प्रदर्शित करते हैं, विशेष रूप से नैदानिक निदान में। हालांकि, मौजूदा RAG विधियां निदान की कठिनाई और इनपुट नमूने की सूचना मात्रा के अनुसार पुनर्प्राप्ति रणनीति को अनुकूलित करने में विफल रहती हैं, जिससे अत्यधिक और अनावश्यक पुनर्प्राप्ति होती है, जो कम्प्यूटेशनल दक्षता को नुकसान पहुंचाती है और शोर परिचय का जोखिम बढ़ाती है, जिससे निदान सटीकता में कमी आती है। इस समस्या को हल करने के लिए, यह पेपर ICA-RAG (सूचना पूर्णता निर्देशित अनुकूली पुनर्प्राप्ति-संवर्धित पीढ़ी) प्रस्तावित करता है, जो रोग निदान में RAG की विश्वसनीयता को बढ़ाने के लिए एक नया ढांचा है। ICA-RAG इनपुट की सूचना पूर्णता के आधार पर पुनर्प्राप्ति की आवश्यकता का मूल्यांकन करने के लिए अनुकूली नियंत्रण मॉड्यूल का उपयोग करता है, पुनर्प्राप्ति और ज्ञान फ़िल्टरिंग को अनुकूलित करके, पुनर्प्राप्ति संचालन को नैदानिक आवश्यकताओं के साथ बेहतर ढंग से संरेखित करता है। तीन चीनी इलेक्ट्रॉनिक चिकित्सा रिकॉर्ड डेटासेट पर प्रयोग दर्शाते हैं कि ICA-RAG आधारभूत विधियों से काफी बेहतर है, जो नैदानिक निदान में इसकी प्रभावशीलता को उजागर करता है।
बड़े भाषा मॉडल चिकित्सा कार्यों में दो प्रमुख चुनौतियों का सामना करते हैं:
प्रत्यक्ष रोग निदान: इनपुट पाठ का प्रतिनिधित्व करने वाले टोकन अनुक्रम दिया गया है, LLM पाठ पीढ़ी को निम्नानुसार औपचारिक किया जा सकता है:
RAG रोग निदान: बाहरी ज्ञान स्रोत से संबंधित ज्ञान पुनर्प्राप्त करना और एकीकृत करना: जहां
अनुकूली RAG रोग निदान: इनपुट Q का मूल्यांकन करने के लिए नियंत्रण फ़ंक्शन F का परिचय:
\text{LLM}(Q, \text{prompt}), & \text{if } F(Q) = \langle\text{Activate}\rangle \\ \text{LLM}(Q, d, \text{prompt}), & \text{otherwise} \end{cases}$$ ### मॉडल आर्किटेक्चर ICA-RAG ढांचे में तीन मुख्य चरण हैं: #### चरण (a): इनपुट सूचना पूर्णता पर आधारित पुनर्प्राप्ति निर्णय अनुकूलन 1. **पाठ विभाजन**: इनपुट Q को पाठ इकाइयों में विभाजित करना (डिफ़ॉल्ट रूप से वाक्य): $Q = \{s_i\}_{i=1}^n$ 2. **महत्व वर्गीकरण**: प्रत्येक इकाई की महत्व की भविष्यवाणी करने के लिए वर्गीकरणकर्ता को प्रशिक्षित करना: $$l_i = \text{Classifier}(s_i) \quad \forall i \in \{1, 2, ..., n\}$$ लेबल तीन श्रेणियों में विभाजित हैं: - A: निदान निर्णय के लिए महत्वपूर्ण जानकारी - B: पुनर्प्राप्ति में सकारात्मक योगदान लेकिन सीधे परिणाम का अनुमान नहीं लगा सकते - C: अपेक्षाकृत महत्वहीन जानकारी 3. **सूचना पूर्णता गणना**: $$I_{\text{norm}}(Q) = \frac{1}{\alpha \cdot n} \sum_{i=1}^n (\alpha \cdot I(l_i = A) + \beta \cdot I(l_i = B) + \gamma \cdot I(l_i = C))$$ #### चरण (b): दस्तावेज़ विभाजन और मैपिंग पर आधारित पुनर्प्राप्ति 1. **वाक्य-स्तरीय पुनर्प्राप्ति**: प्रत्येक वाक्य को शीर्ष-m संबंधित पाठ ब्लॉक पुनर्प्राप्त करने के लिए क्वेरी के रूप में उपयोग करना 2. **दस्तावेज़-स्तरीय पुनः रैंकिंग**: प्रत्येक दस्तावेज़ के लिए पुनर्प्राप्त ब्लॉक की संख्या की गणना करके पुनः रैंकिंग करना 3. **मैपिंग रणनीति**: पाठ ब्लॉक को मूल दस्तावेज़ में वापस मैप करना और ब्लॉक गणना के आधार पर पुनः रैंकिंग करना #### चरण (c): प्रॉम्प्ट-निर्देशित ज्ञान फ़िल्टरिंग और निदान पीढ़ी असंबंधित दस्तावेज़ों को फ़िल्टर करने के लिए विभेदक निदान प्रॉम्प्ट टेम्पलेट का उपयोग करना, चिकित्सक की विभेदक निदान प्रक्रिया का अनुकरण करना। ### तकनीकी नवाचार बिंदु 1. **सूचना पूर्णता मूल्यांकन**: जटिल दस्तावेज़ समझ को सरल वाक्य-स्तरीय कार्य में परिवर्तित करना 2. **मास्क एनोटेशन रणनीति**: अनुक्रम मास्किंग संचालन के माध्यम से स्वचालित रूप से प्रशिक्षण लेबल प्राप्त करना 3. **ब्लॉक-दस्तावेज़ मैपिंग पुनः रैंकिंग**: केवल पुनर्प्राप्ति परिणाम संख्याओं के आधार पर गणना, मेमोरी ओवरहेड को कम करना 4. **विभेदक निदान फ़िल्टरिंग**: नैदानिक विभेदक निदान प्रक्रिया का अनुकरण करके असंबंधित जानकारी को फ़िल्टर करना ## प्रायोगिक सेटअप ### डेटासेट - **CMEMR**: चीनी इलेक्ट्रॉनिक चिकित्सा रिकॉर्ड डेटासेट - **ClinicalBench**: नैदानिक बेंचमार्क डेटासेट - **CMB-Clin**: चीनी चिकित्सा बेंचमार्क नैदानिक डेटासेट सभी डेटासेट एंड-टू-एंड निदान कार्य के रूप में कॉन्फ़िगर किए गए हैं, रोगी की जानकारी को इनपुट के रूप में और चिकित्सक के निदान निष्कर्ष को सत्य लेबल के रूप में। ### मूल्यांकन मेट्रिक्स अंतर्राष्ट्रीय रोग वर्गीकरण (ICD-10) मानकीकृत रोग शब्दावली का उपयोग करना, फ़ज़ी मिलान (थ्रेसहोल्ड 0.5) का उपयोग करके सेट-स्तरीय Precision, Recall और F1-score की गणना करना। ### तुलनात्मक विधियां 1. **गैर-पुनर्प्राप्ति विधियां**: CoT, SC-CoT, ATP 2. **मानक पुनर्प्राप्ति विधियां**: RAG2, LongRAG 3. **अनुकूली पुनर्प्राप्ति विधियां**: Adaptive-RAG, DRAGIN, SEAKR ### कार्यान्वयन विवरण - **बैकबोन मॉडल**: qwen2.5-7B-instruct - **वर्गीकरणकर्ता**: BERT-base-Chinese - **पुनर्प्राप्तिकर्ता**: BM25 - **बाहरी ज्ञान आधार**: CMKD नैदानिक चिकित्सा ज्ञान डेटाबेस ## प्रायोगिक परिणाम ### मुख्य परिणाम | विधि | CMEMR F1(%) | ClinicalBench F1(%) | CMB-Clin F1(%) | |------|-------------|---------------------|-----------------| | CoT | 48.82 | 38.46 | 52.14 | | LongRAG | 49.07 | 39.25 | 51.81 | | Adaptive-RAG | 49.27 | 38.04 | 53.44 | | **ICA-RAG** | **50.88** | **40.79** | **53.53** | मुख्य निष्कर्ष: 1. ICA-RAG सभी डेटासेट पर इष्टतम या निकट-इष्टतम F1 स्कोर प्राप्त करता है 2. LongRAG की तुलना में, F1 मान क्रमशः 1.81%, 1.54%, 1.72% में सुधार 3. अन्य अनुकूली RAG विधियों से काफी बेहतर ### विलोपन प्रयोग CMEMR डेटासेट पर विलोपन परिणाम: | वेरिएंट | F1(%) | कमी | |------|-------|----------| | ICA-RAG | 50.88 | - | | w/o Decision | 48.07 | -2.81% | | w/o Chunk | 49.78 | -1.10% | | w/o M-rerank | 49.59 | -1.29% | | w/o Diff | 49.85 | -1.03% | ### दक्षता विश्लेषण - **समय दक्षता**: गैर-अनुकूली RAG विधियों की तुलना में महत्वपूर्ण सुधार - **पैरामीटर दक्षता**: BERT-Base वर्गीकरणकर्ता (110M पैरामीटर) Adaptive-RAG के T5-Large (770M पैरामीटर) की तुलना में अधिक हल्का - **प्रयोज्यता**: LLM आउटपुट संभाव्यता वितरण तक पहुंच की आवश्यकता नहीं, बंद-स्रोत मॉडल और API तैनाती के लिए उपयुक्त ## संबंधित कार्य ### नैदानिक रोग निदान में RAG का अनुप्रयोग - अधिकांश अनुसंधान बुनियादी पुनर्प्राप्ति विधियों का उपयोग करते हैं, एम्बेडिंग मॉडल के माध्यम से बाहरी ज्ञान और कार्य प्रश्नों को एन्कोड करते हैं - ज्ञान ग्राफ भी व्यापक रूप से अपनाए जाते हैं - चिकित्सा क्षेत्र की विशेषताओं के लिए अनुकूलन की कमी ### अनुकूली RAG - **FLARE और DRAGIN**: जब LLM कम आत्मविश्वास टोकन उत्पन्न करता है तो खोज सक्रिय करना - **Self-RAG**: गतिशील रूप से पुनर्प्राप्ति, आलोचना और पाठ पीढ़ी के लिए मॉडल को प्रशिक्षित करना - **Adaptive-RAG**: प्रश्न जटिलता का मूल्यांकन करके पुनर्प्राप्ति की आवश्यकता निर्धारित करना - मौजूदा विधियां मुख्य रूप से प्रश्नोत्तर कार्यों के लिए हैं, चिकित्सा निदान में सीधे स्थानांतरण में कठिनाई ## निष्कर्ष और चर्चा ### मुख्य निष्कर्ष ICA-RAG इनपुट सूचना पूर्णता के आधार पर अनुकूली पुनर्प्राप्ति निर्णय अनुकूलन के माध्यम से, पारंपरिक पुनर्प्राप्ति-संवर्धित विधियों में कठोर पुनर्प्राप्ति रणनीति की समस्या को प्रभावी ढंग से हल करता है, जटिल नैदानिक परिदृश्यों में मजबूत अनुकूलन क्षमता प्रदर्शित करता है। ### सीमाएं 1. **एनोटेशन रणनीति सीमाएं**: रोगी की जानकारी में दोहराई गई सामग्री हो सकती है, मुख्य वाक्य को मास्क करने के बाद LLM अभी भी सही निदान पर पहुंच सकता है, जिससे एनोटेशन लेबल अशुद्धि होती है 2. **चिकित्सा पाठ जटिलता**: नैदानिक चिकित्सा पाठ में संक्षिप्त रूप, समानार्थी शब्द और वैकल्पिक नाम होते हैं, विभिन्न चिकित्सकों द्वारा रिकॉर्डिंग विधि में महत्वपूर्ण अंतर, पुनर्प्राप्ति सटीकता को प्रभावित करता है 3. **मानव जांच की आवश्यकता**: स्वचालित एनोटेशन रणनीति को अभी भी मानव जांच और सुधार की आवश्यकता है ### भविष्य की दिशाएं 1. चिकित्सा पाठ प्रीप्रोसेसिंग की अधिक प्रभावी रणनीतियों की खोज करना ताकि पुनर्प्राप्ति गुणवत्ता में सुधार हो 2. ICA-RAG को अन्य चिकित्सा कार्यों में लागू करना 3. पुनर्प्राप्ति प्रक्रिया को और अनुकूलित करना ## गहन मूल्यांकन ### लाभ 1. **मजबूत नवाचार**: सूचना पूर्णता के आधार पर अनुकूली पुनर्प्राप्ति निर्णय तंत्र प्रस्तावित करने वाला पहला 2. **उच्च व्यावहारिकता**: बैकबोन LLM को ट्यून करने की आवश्यकता नहीं, मजबूत प्रयोज्यता 3. **पर्याप्त प्रयोग**: कई डेटासेट पर व्यापक मूल्यांकन और विलोपन प्रयोग 4. **दक्षता में सुधार**: प्रदर्शन बनाए रखते हुए कम्प्यूटेशनल दक्षता में महत्वपूर्ण सुधार ### कमियां 1. **डेटासेट सीमाएं**: केवल चीनी EMR डेटासेट पर सत्यापित, क्रॉस-भाषा और क्रॉस-डोमेन सत्यापन की कमी 2. **एनोटेशन गुणवत्ता**: स्वचालित एनोटेशन रणनीति में शोर है, मानव हस्तक्षेप की आवश्यकता है 3. **थ्रेसहोल्ड सेटिंग**: सूचना पूर्णता थ्रेसहोल्ड θ₁ और θ₂ की सेटिंग में सैद्धांतिक मार्गदर्शन की कमी है 4. **ज्ञान आधार निर्भरता**: प्रदर्शन बाहरी ज्ञान आधार की गुणवत्ता पर बहुत अधिक निर्भर है ### प्रभाव 1. **शैक्षणिक योगदान**: चिकित्सा AI क्षेत्र में RAG अनुप्रयोग के लिए नई सोच प्रदान करता है 2. **व्यावहारिक मूल्य**: नैदानिक निर्णय समर्थन प्रणालियों में सीधे लागू किया जा सकता है 3. **पुनरुत्पादनीयता**: विधि विवरण विस्तृत, प्रायोगिक सेटअप स्पष्ट ### लागू परिदृश्य 1. **नैदानिक निदान**: विशेष रूप से जटिल लक्षण वाले मामलों के लिए उपयुक्त, विभेदक निदान की आवश्यकता 2. **चिकित्सा प्रश्नोत्तर प्रणाली**: चिकित्सा परामर्श प्रणाली की सटीकता और दक्षता में सुधार कर सकता है 3. **चिकित्सा शिक्षा**: चिकित्सा छात्रों के सीखने के लिए सहायक उपकरण के रूप में काम कर सकता है ## संदर्भ पेपर ने 41 संबंधित संदर्भों का हवाला दिया है, जो बड़े भाषा मॉडल, पुनर्प्राप्ति-संवर्धित पीढ़ी, चिकित्सा AI और अन्य कई क्षेत्रों के महत्वपूर्ण कार्यों को शामिल करते हैं, अनुसंधान के लिए एक ठोस सैद्धांतिक आधार प्रदान करते हैं। --- **समग्र मूल्यांकन**: यह चिकित्सा AI क्षेत्र में महत्वपूर्ण योगदान वाला एक उच्च गुणवत्ता वाला पेपर है। लेखकों ने चिकित्सा निदान में मौजूदा RAG विधियों की सीमाओं के लिए एक नवीन समाधान प्रस्तावित किया है, और पर्याप्त प्रयोगों के माध्यम से विधि की प्रभावशीलता को सत्यापित किया है। हालांकि कुछ सीमाएं हैं, इसकी नवाचार और व्यावहारिकता इसे इस क्षेत्र में एक महत्वपूर्ण प्रगति बनाती है।