পুনরুদ্ধার-বর্ধিত বৃহৎ ভাষা মডেল (RAG-LLMs) বাহ্যিক জ্ঞান একীভূত করে চিকিৎসা ক্ষেত্রে উৎকর্ষ প্রদর্শন করে, বিশেষত ক্লিনিকাল রোগ নির্ণয়ে। তবে, বিদ্যমান RAG পদ্ধতিগুলি রোগ নির্ণয়ের কঠিনতা এবং ইনপুট নমুনার তথ্য পরিমাণ অনুযায়ী পুনরুদ্ধার কৌশল কাস্টমাইজ করতে অসমর্থ, যা অত্যধিক এবং অপ্রয়োজনীয় পুনরুদ্ধারের দিকে পরিচালিত করে, গণনামূলক দক্ষতা ক্ষতিগ্রস্ত করে এবং শব্দ প্রবর্তনের ঝুঁকি বৃদ্ধি করে, যার ফলে রোগ নির্ণয়ের নির্ভুলতা হ্রাস পায়। এই সমস্যা সমাধানের জন্য, এই পত্রটি ICA-RAG (তথ্য সম্পূর্ণতা-নির্দেশিত অভিযোজিত পুনরুদ্ধার-বর্ধিত প্রজন্ম) প্রস্তাব করে, যা রোগ নির্ণয়ে RAG এর নির্ভরযোগ্যতা বৃদ্ধির একটি নতুন কাঠামো। ICA-RAG ইনপুটের তথ্য সম্পূর্ণতার উপর ভিত্তি করে পুনরুদ্ধারের প্রয়োজনীয়তা মূল্যায়ন করতে অভিযোজিত নিয়ন্ত্রণ মডিউল ব্যবহার করে, পুনরুদ্ধার এবং জ্ঞান ফিল্টারিং অপ্টিমাইজ করে, পুনরুদ্ধার ক্রিয়াকলাপকে ক্লিনিকাল চাহিদার সাথে আরও ভালভাবে সারিবদ্ধ করে। তিনটি চীনা ইলেকট্রনিক স্বাস্থ্য রেকর্ড ডেটাসেটে পরীক্ষা-নিরীক্ষা দেখায় যে ICA-RAG বেসলাইন পদ্ধতিগুলিকে উল্লেখযোগ্যভাবে অতিক্রম করে, ক্লিনিকাল রোগ নির্ণয়ে এর কার্যকারিতা তুলে ধরে।
বৃহৎ ভাষা মডেলগুলি চিকিৎসা কাজে দুটি প্রধান চ্যালেঞ্জের সম্মুখীন হয়:
সরাসরি রোগ নির্ণয়: ইনপুট পাঠ্য প্রতিনিধিত্ব করে এমন টোকেন ক্রম দেওয়া, LLM পাঠ্য প্রজন্ম নিম্নরূপ আনুষ্ঠানিক করা যায়:
RAG রোগ নির্ণয়: বাহ্যিক জ্ঞান উৎস থেকে প্রাসঙ্গিক জ্ঞান পুনরুদ্ধার এবং একীভূত করা: যেখানে
অভিযোজিত RAG রোগ নির্ণয়: ইনপুট Q মূল্যায়ন করতে নিয়ন্ত্রণ ফাংশন F প্রবর্তন করা:
\text{LLM}(Q, \text{prompt}), & \text{if } F(Q) = \langle\text{Activate}\rangle \\ \text{LLM}(Q, d, \text{prompt}), & \text{otherwise} \end{cases}$$ ### মডেল স্থাপত্য ICA-RAG কাঠামোতে তিনটি প্রধান পর্যায় রয়েছে: #### পর্যায় (a): ইনপুট তথ্য সম্পূর্ণতার উপর ভিত্তি করে পুনরুদ্ধার সিদ্ধান্ত অপ্টিমাইজেশন 1. **পাঠ্য বিভাজন**: ইনপুট Q কে পাঠ্য ইউনিটে বিভক্ত করা (ডিফল্টরূপে বাক্য): $Q = \{s_i\}_{i=1}^n$ 2. **গুরুত্ব শ্রেণীবিভাগ**: প্রতিটি ইউনিটের গুরুত্ব পূর্বাভাস দিতে শ্রেণীবিভাগকারী প্রশিক্ষণ দেওয়া: $$l_i = \text{Classifier}(s_i) \quad \forall i \in \{1, 2, ..., n\}$$ লেবেলগুলি তিনটি বিভাগে বিভক্ত: - A: রোগ নির্ণয় সিদ্ধান্তের জন্য গুরুত্বপূর্ণ তথ্য - B: পুনরুদ্ধারে ইতিবাচক অবদান রাখে কিন্তু সরাসরি ফলাফল অনুমান করতে পারে না এমন তথ্য - C: তুলনামূলকভাবে অপ্রয়োজনীয় তথ্য 3. **তথ্য সম্পূর্ণতা গণনা**: $$I_{\text{norm}}(Q) = \frac{1}{\alpha \cdot n} \sum_{i=1}^n (\alpha \cdot I(l_i = A) + \beta \cdot I(l_i = B) + \gamma \cdot I(l_i = C))$$ #### পর্যায় (b): নথি বিভাজন এবং ম্যাপিং এর উপর ভিত্তি করে পুনরুদ্ধার 1. **বাক্য-স্তরের পুনরুদ্ধার**: প্রতিটি বাক্য শীর্ষ-m সম্পর্কিত পাঠ্য ব্লক পুনরুদ্ধার করার জন্য একটি প্রশ্ন হিসাবে কাজ করে 2. **নথি-স্তরের পুনর্র্যাঙ্কিং**: প্রতিটি নথি পুনরুদ্ধৃত ব্লকের সংখ্যা পুনর্র্যাঙ্কিং এর জন্য পরিসংখ্যান করা 3. **ম্যাপিং কৌশল**: পাঠ্য ব্লকগুলি মূল নথিতে ম্যাপ করা এবং ব্লক গণনার উপর ভিত্তি করে পুনর্র্যাঙ্ক করা #### পর্যায় (c): প্রম্পট-নির্দেশিত জ্ঞান ফিল্টারিং এবং রোগ নির্ণয় প্রজন্ম অপ্রাসঙ্গিক নথি ফিল্টার করতে পার্থক্যমূলক রোগ নির্ণয় প্রম্পট টেমপ্লেট ব্যবহার করা, চিকিৎসকের পার্থক্যমূলক রোগ নির্ণয় প্রক্রিয়া অনুকরণ করা। ### প্রযুক্তিগত উদ্ভাবন পয়েন্ট 1. **তথ্য সম্পূর্ণতা মূল্যায়ন**: জটিল নথি বোঝাকে সহজ বাক্য-স্তরের কাজে রূপান্তরিত করা 2. **মাস্কিং টীকা কৌশল**: ক্রম মাস্কিং অপারেশনের মাধ্যমে স্বয়ংক্রিয়ভাবে প্রশিক্ষণ লেবেল অর্জন করা 3. **ব্লক-নথি ম্যাপিং পুনর্র্যাঙ্কিং**: শুধুমাত্র পুনরুদ্ধার ফলাফল সংখ্যার উপর ভিত্তি করে গণনা করা, মেমরি ওভারহেড হ্রাস করা 4. **পার্থক্যমূলক রোগ নির্ণয় ফিল্টারিং**: ক্লিনিকাল পার্থক্যমূলক রোগ নির্ণয় প্রক্রিয়া অনুকরণ করে অপ্রাসঙ্গিক তথ্য ফিল্টার করা ## পরীক্ষা সেটআপ ### ডেটাসেট - **CMEMR**: চীনা ইলেকট্রনিক স্বাস্থ্য রেকর্ড ডেটাসেট - **ClinicalBench**: ক্লিনিকাল বেঞ্চমার্ক ডেটাসেট - **CMB-Clin**: চীনা চিকিৎসা বেঞ্চমার্ক ক্লিনিকাল ডেটাসেট সমস্ত ডেটাসেট শেষ-থেকে-শেষ রোগ নির্ণয় কাজ হিসাবে কনফিগার করা হয়েছে, রোগীর তথ্য ইনপুট হিসাবে এবং ডাক্তারের রোগ নির্ণয় সিদ্ধান্ত সত্য লেবেল হিসাবে। ### মূল্যায়ন মেট্রিক্স আন্তর্জাতিক রোগ শ্রেণীবিভাগ (ICD-10) মান ব্যবহার করে রোগের পদ শব্দ, অস্পষ্ট ম্যাচিং (থ্রেশহোল্ড 0.5) ব্যবহার করে সেট-স্তরের নির্ভুলতা, স্মরণ এবং F1-স্কোর গণনা করা। ### তুলনা পদ্ধতি 1. **অ-পুনরুদ্ধার পদ্ধতি**: CoT, SC-CoT, ATP 2. **মান পুনরুদ্ধার পদ্ধতি**: RAG2, LongRAG 3. **অভিযোজিত পুনরুদ্ধার পদ্ধতি**: Adaptive-RAG, DRAGIN, SEAKR ### বাস্তবায়ন বিবরণ - **মূল মডেল**: qwen2.5-7B-instruct - **শ্রেণীবিভাগকারী**: BERT-base-Chinese - **পুনরুদ্ধারকারী**: BM25 - **বাহ্যিক জ্ঞান ভাণ্ডার**: CMKD ক্লিনিকাল চিকিৎসা জ্ঞান ডেটাবেস ## পরীক্ষার ফলাফল ### প্রধান ফলাফল | পদ্ধতি | CMEMR F1(%) | ClinicalBench F1(%) | CMB-Clin F1(%) | |--------|-------------|---------------------|-----------------| | CoT | 48.82 | 38.46 | 52.14 | | LongRAG | 49.07 | 39.25 | 51.81 | | Adaptive-RAG | 49.27 | 38.04 | 53.44 | | **ICA-RAG** | **50.88** | **40.79** | **53.53** | মূল অনুসন্ধান: 1. ICA-RAG সমস্ত ডেটাসেটে সর্বোত্তম বা কাছাকাছি সর্বোত্তম F1 স্কোর অর্জন করে 2. LongRAG এর তুলনায়, F1 মান যথাক্রমে 1.81%, 1.54%, 1.72% বৃদ্ধি পায় 3. অন্যান্য অভিযোজিত RAG পদ্ধতির চেয়ে উল্লেখযোগ্যভাবে উন্নত ### বিলোপ পরীক্ষা CMEMR ডেটাসেটে বিলোপ ফলাফল: | ভেরিয়েন্ট | F1(%) | হ্রাস মাত্রা | |-----------|-------|------------| | ICA-RAG | 50.88 | - | | w/o Decision | 48.07 | -2.81% | | w/o Chunk | 49.78 | -1.10% | | w/o M-rerank | 49.59 | -1.29% | | w/o Diff | 49.85 | -1.03% | ### দক্ষতা বিশ্লেষণ - **সময় দক্ষতা**: অ-অভিযোজিত RAG পদ্ধতির তুলনায় উল্লেখযোগ্য উন্নতি - **প্যারামিটার দক্ষতা**: BERT-Base শ্রেণীবিভাগকারী (110M প্যারামিটার) Adaptive-RAG এর T5-Large (770M প্যারামিটার) এর চেয়ে আরও হালকা - **প্রযোজ্যতা**: LLM আউটপুট সম্ভাব্যতা বিতরণে অ্যাক্সেসের প্রয়োজন নেই, বন্ধ-উৎস মডেল এবং API স্থাপনার জন্য প্রযোজ্য ## সম্পর্কিত কাজ ### ক্লিনিকাল রোগ নির্ণয়ে RAG এর প্রয়োগ - বেশিরভাগ গবেষণা মৌলিক পুনরুদ্ধার পদ্ধতি ব্যবহার করে, এম্বেডিং মডেলের মাধ্যমে বাহ্যিক জ্ঞান এবং কাজের প্রশ্ন এনকোড করে - জ্ঞান গ্রাফও ব্যাপকভাবে গৃহীত হয় - চিকিৎসা ক্ষেত্রের বিশেষত্বের জন্য অপ্টিমাইজেশনের অভাব ### অভিযোজিত RAG - **FLARE এবং DRAGIN**: যখন LLM কম আত্মবিশ্বাসের টোকেন তৈরি করে তখন অনুসন্ধান সক্রিয় করা - **Self-RAG**: গতিশীলভাবে পুনরুদ্ধার, সমালোচনা এবং পাঠ্য তৈরি করতে মডেল প্রশিক্ষণ দেওয়া - **Adaptive-RAG**: প্রশ্নের জটিলতা মূল্যায়ন করে পুনরুদ্ধারের প্রয়োজনীয়তা নির্ধারণ করা - বিদ্যমান পদ্ধতিগুলি প্রধানত প্রশ্নোত্তর কাজের জন্য, চিকিৎসা রোগ নির্ণয়ে সরাসরি স্থানান্তর করা কঠিন ## উপসংহার এবং আলোচনা ### প্রধান উপসংহার ICA-RAG ইনপুট তথ্য সম্পূর্ণতার উপর ভিত্তি করে অভিযোজিত পুনরুদ্ধার সিদ্ধান্ত অপ্টিমাইজেশনের মাধ্যমে, ঐতিহ্যবাহী পুনরুদ্ধার-বর্ধিত পদ্ধতিতে কঠোর পুনরুদ্ধার কৌশলের সমস্যা কার্যকরভাবে সমাধান করে, জটিল ক্লিনিকাল পরিস্থিতিতে শক্তিশালী অভিযোজনযোগ্যতা প্রদর্শন করে। ### সীমাবদ্ধতা 1. **টীকা কৌশল সীমাবদ্ধতা**: রোগীর তথ্যে সম্ভাব্য পুনরাবৃত্ত বিষয়বস্তুর কারণে, মূল বাক্যগুলি মাস্ক করার পরেও LLM সঠিক রোগ নির্ণয় করতে পারে, যার ফলে টীকা লেবেল অনির্ভুল হয় 2. **চিকিৎসা পাঠ্যের জটিলতা**: ক্লিনিকাল চিকিৎসা পাঠ্যে সংক্ষিপ্ত রূপ, সমার্থক শব্দ এবং বিকল্প নাম রয়েছে, বিভিন্ন ডাক্তারের রেকর্ড পদ্ধতিতে উল্লেখযোগ্য পার্থক্য রয়েছে, পুনরুদ্ধার নির্ভুলতা প্রভাবিত করে 3. **মানব পরীক্ষার প্রয়োজন**: স্বয়ংক্রিয় টীকা কৌশল এখনও মানব পরীক্ষা এবং সংশোধনের প্রয়োজন ### ভবিষ্যত দিকনির্দেশনা 1. চিকিৎসা পাঠ্য প্রাক-প্রক্রিয়াকরণের আরও কার্যকর কৌশল অন্বেষণ করা পুনরুদ্ধার গুণমান উন্নত করতে 2. ICA-RAG অন্যান্য চিকিৎসা কাজে প্রয়োগ করা 3. পুনরুদ্ধার প্রক্রিয়া আরও অপ্টিমাইজ করা ## গভীর মূল্যায়ন ### সুবিধা 1. **শক্তিশালী উদ্ভাবনী**: প্রথমবারের মতো তথ্য সম্পূর্ণতার উপর ভিত্তি করে অভিযোজিত পুনরুদ্ধার সিদ্ধান্ত প্রক্রিয়া প্রস্তাব করা 2. **উচ্চ ব্যবহারিকতা**: মূল LLM সূক্ষ্ম-সুর করার প্রয়োজন নেই, শক্তিশালী প্রযোজ্যতা 3. **পর্যাপ্ত পরীক্ষা-নিরীক্ষা**: একাধিক ডেটাসেটে ব্যাপক মূল্যায়ন এবং বিলোপ পরীক্ষা 4. **দক্ষতা উন্নতি**: কর্মক্ষমতা বজায় রেখে গণনামূলক দক্ষতা উল্লেখযোগ্যভাবে উন্নত করা ### অপর্যাপ্ততা 1. **ডেটাসেট সীমাবদ্ধতা**: শুধুমাত্র চীনা EMR ডেটাসেটে যাচাই করা, ক্রস-ভাষা এবং ক্রস-ডোমেইন যাচাইকরণের অভাব 2. **টীকা গুণমান**: স্বয়ংক্রিয় টীকা কৌশলে শব্দ রয়েছে, মানব হস্তক্ষেপের প্রয়োজন 3. **থ্রেশহোল্ড সেটিং**: তথ্য সম্পূর্ণতা থ্রেশহোল্ড θ₁ এবং θ₂ এর সেটিং তাত্ত্বিক নির্দেশনার অভাব 4. **জ্ঞান ভাণ্ডার নির্ভরতা**: কর্মক্ষমতা বাহ্যিক জ্ঞান ভাণ্ডার গুণমানের উপর অনেকাংশে নির্ভর করে ### প্রভাব 1. **একাডেমিক অবদান**: চিকিৎসা AI ক্ষেত্রের RAG প্রয়োগের জন্য নতুন চিন্তাভাবনা প্রদান করা 2. **ব্যবহারিক মূল্য**: ক্লিনিকাল সিদ্ধান্ত সহায়তা সিস্টেমে সরাসরি প্রয়োগ করা যায় 3. **পুনরুৎপাদনযোগ্যতা**: পদ্ধতি বর্ণনা বিস্তারিত, পরীক্ষা সেটআপ স্পষ্ট ### প্রযোজ্য পরিস্থিতি 1. **ক্লিনিকাল রোগ নির্ণয়**: বিশেষত জটিল উপসর্গ, পার্থক্যমূলক রোগ নির্ণয়ের প্রয়োজন এমন ক্ষেত্রে উপযুক্ত 2. **চিকিৎসা প্রশ্নোত্তর সিস্টেম**: চিকিৎসা পরামর্শ সিস্টেমের নির্ভুলতা এবং দক্ষতা উন্নত করতে পারে 3. **চিকিৎসা শিক্ষা**: চিকিৎসা শিক্ষার্থীদের শেখার জন্য সহায়ক সরঞ্জাম হিসাবে কাজ করতে পারে ## রেফারেন্স পত্রটি 41টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা বৃহৎ ভাষা মডেল, পুনরুদ্ধার-বর্ধিত প্রজন্ম, চিকিৎসা AI এবং অন্যান্য একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য একটি দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে। --- **সামগ্রিক মূল্যায়ন**: এটি চিকিৎসা AI ক্ষেত্রে গুরুত্বপূর্ণ অবদান রাখা একটি উচ্চ মানের পত্র। লেখকরা বিদ্যমান RAG পদ্ধতিতে চিকিৎসা রোগ নির্ণয়ের সীমাবদ্ধতার বিরুদ্ধে একটি উদ্ভাবনী সমাধান প্রস্তাব করেছেন এবং পর্যাপ্ত পরীক্ষা-নিরীক্ষার মাধ্যমে পদ্ধতির কার্যকারিতা যাচাই করেছেন। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এর উদ্ভাবনী এবং ব্যবহারিক মূল্য এটিকে এই ক্ষেত্রের একটি গুরুত্বপূর্ণ অগ্রগতি করে তোলে।