বৃহৎ ভাষা মডেল (LLM) ব্যবহার করে সিউডো-প্রাসঙ্গিক প্রতিক্রিয়া (PRF) এর সাম্প্রতিক পদ্ধতিগুলি সাধারণত প্রতিষ্ঠিত প্রতিক্রিয়া মডেল (যেমন Rocchio এবং RM3) ব্যবহার করে না যা বিরল পুনরুদ্ধারকারীদের (যেমন BM25) জন্য প্রশ্ন সম্প্রসারণ করে, বরং সহজভাবে প্রশ্নটি LLM-উৎপাদিত সম্প্রসারিত বিষয়বস্তুর সাথে স্ট্রিং সংযোজন করে। এই পেপারটি HyDE-তে ঐতিহ্যবাহী প্রতিক্রিয়া মডেলগুলির প্রয়োগ সম্পর্কে পদ্ধতিগতভাবে পুনর্বিবেচনা করে (এটি একটি জনপ্রিয় পদ্ধতি যা প্রশ্নের প্রতিনিধিত্ব সমৃদ্ধ করতে LLM দ্বারা উৎপাদিত অনুমানমূলক উত্তর নথি ব্যবহার করে)। পরীক্ষাগুলি দেখায় যে Rocchio এর মতো প্রতিক্রিয়া অ্যালগরিদম ব্যবহার করে সম্প্রসারিত পদগুলি নিষ্কাশন এবং ওজন করার মাধ্যমে, HyDE এর কার্যকারিতা উল্লেখযোগ্যভাবে উন্নত করা যায়, যা LLM-ভিত্তিক PRF পদ্ধতিগুলি উন্নত করার জন্য একটি সহজ এবং কার্যকর পথ প্রদান করে।
এই পেপারটি যে মূল সমস্যাটি সমাধান করতে চায় তা হল: বর্তমান LLM-ভিত্তিক প্রশ্ন সম্প্রসারণ পদ্ধতিগুলি (যেমন HyDE) BM25 প্রশ্ন প্রতিনিধিত্ব আপডেট করার সময়, তথ্য পুনরুদ্ধারে ঐতিহ্যবাহী প্রতিষ্ঠিত প্রতিক্রিয়া মডেলগুলি পর্যাপ্তভাবে ব্যবহার করছে কিনা?
১. HyDE এর সীমাবদ্ধতা: HyDE কার্যকরভাবে LLM-উৎপাদিত অনুমানমূলক নথি ব্যবহার করে প্রশ্ন এবং প্রাসঙ্গিক নথির মধ্যে শব্দভাণ্ডার ব্যবধান পূরণ করে, কিন্তু উৎপাদিত বিষয়বস্তু BM25 পুনরুদ্ধারে একীভূত করার সময় সহজ স্ট্রিং সংযোজন কৌশল ব্যবহার করে
२. ঐতিহ্যবাহী পদ্ধতি উপেক্ষা করা: তথ্য পুনরুদ্ধার ক্ষেত্রে সিউডো-প্রাসঙ্গিক প্রতিক্রিয়ায় দশকের গবেষণা সঞ্চয় রয়েছে, যার মধ্যে Rocchio এবং RM3 এর মতো সম্পূর্ণভাবে যাচাইকৃত প্রতিক্রিয়া মডেল রয়েছে, কিন্তু এই পদ্ধতিগুলি LLM যুগে প্রান্তিক হয়ে গেছে
३. অপ্টিমাইজেশন স্থান অন্বেষণ করা হয়নি: যদিও প্রতিক্রিয়া উৎস (পুনরুদ্ধৃত নথি থেকে LLM-উৎপাদিত নথিতে) পরিবর্তিত হয়েছে, প্রতিক্রিয়া প্রক্রিয়াটি নিজেই পরিবর্তনের প্রয়োজন কিনা তা এখনও পদ্ধতিগতভাবে অধ্যয়ন করা হয়নি
१. সহজ সংযোজন কৌশল: Query2Doc, MuGI এবং অন্যান্য পদ্ধতি সরাসরি প্রশ্ন এবং LLM-উৎপাদিত পাঠ সংযোজন করে, সম্প্রসারিত পদগুলির নির্বাচন এবং ওজনের অভাব রয়েছে
२. দুই-পর্যায়ের কাঠামো উপেক্ষা করা: ঐতিহ্যবাহী PRF দুটি মূল পর্যায় অন্তর্ভুক্ত করে—পদ নির্বাচন এবং ওজন বরাদ্দ, যখন বর্তমান LLM পদ্ধতিগুলি এই পদক্ষেপগুলি এড়িয়ে যায়
३. পদ্ধতিগত তুলনার অভাব: বিদ্যমান গবেষণা প্রধানত LLM-উৎপাদিত সম্প্রসারিত বিষয়বস্তু উন্নত করার উপর দৃষ্টি নিবদ্ধ করে, যখন এই বিষয়বস্তুটি আরও ভালভাবে কীভাবে ব্যবহার করতে হয় তা কম মনোযোগ পায়
লেখকরা আবিষ্কার করেছেন যে ঐতিহ্যবাহী PRF এবং LLM প্রতিক্রিয়া পদ্ধতির মূল পার্থক্য শুধুমাত্র প্রতিক্রিয়া উৎসে রয়েছে, কিন্তু প্রশ্ন আপডেট প্রক্রিয়া সম্পূর্ণভাবে আলাদা। এটি লেখকদের এই অনুমান প্রস্তাব করতে উৎসাহিত করে: ঐতিহ্যবাহী প্রতিক্রিয়া মডেলগুলি LLM-উৎপাদিত প্রতিক্রিয়া বিষয়বস্তুর জন্য সমানভাবে প্রযোজ্য হতে পারে এবং কর্মক্ষমতা উন্নতি আনতে পারে।
१. প্রথম পদ্ধতিগত মূল্যায়ন: LLM-উৎপাদিত প্রতিক্রিয়ার প্রেক্ষাপটে, ঐতিহ্যবাহী প্রতিক্রিয়া মডেল (Rocchio, RM3) এবং আধুনিক স্ট্রিং সংযোজন পদ্ধতির কার্যকারিতা প্রথমবারের মতো ব্যাপকভাবে তুলনা করা হয়েছে
२. ঐতিহ্যবাহী পদ্ধতির মূল্য প্রমাণ করা: পরীক্ষাগুলি দেখায় যে HyDE-তে Rocchio এর মতো ঐতিহ্যবাহী প্রতিক্রিয়া অ্যালগরিদম প্রয়োগ করা উল্লেখযোগ্যভাবে পুনরুদ্ধার প্রভাব উন্নত করতে পারে, গড়ে ১.৪ পয়েন্ট (৪.२%) উন্নতি, কম সম্পদ কাজে २.२ পয়েন্ট (६%) উন্নতি
३. ব্যবহারিক উন্নতি সমাধান প্রদান করা: HyDE এর জন্য একটি সহজ কিন্তু কার্যকর উন্নতি পদ্ধতি প্রদান করা হয়েছে, যা LLM উৎপাদন প্রক্রিয়া সংশোধনের প্রয়োজন নেই, শুধুমাত্র প্রতিক্রিয়া একীকরণ প্রক্রিয়া পরিবর্তন করতে হবে
४. ওপেন সোর্স বাস্তবায়ন: সম্পূর্ণ কোড বাস্তবায়ন প্রকাশ করা হয়েছে, যা সম্প্রদায়ের পুনরুৎপাদন এবং আরও গবেষণা সহজতর করে
ইনপুট: ব্যবহারকারীর প্রশ্ন
আউটপুট: আপডেট করা প্রশ্ন প্রতিনিধিত্ব , BM25 পুনরুদ্ধারের জন্য ব্যবহৃত
লক্ষ্য: LLM-উৎপাদিত অনুমানমূলক উত্তর নথি একীভূত করে প্রশ্ন প্রতিনিধিত্ব উন্নত করা, পুনরুদ্ধার স্মরণ উন্নত করা
१. প্রদত্ত প্রশ্ন এর জন্য, LLM কে অনুমানমূলক উত্তর নথি উৎপাদন করতে অনুরোধ করুন २. টি বৈকল্পিক নমুনা করুন: ३. এই অনুমানমূলক নথিগুলি ব্যবহার করে প্রশ্ন প্রতিনিধিত্ব আপডেট করুন ४. আপডেট করা প্রশ্ন ব্যবহার করে BM25 পুনরুদ্ধার সম্পাদন করুন
এই পেপারে প্রস্তাবিত কাঠামোতে দুটি মূল পর্যায় রয়েছে:
१. শব্দ ফ্রিকোয়েন্সি ভেক্টর উৎপাদন: প্রতিটি অনুমানমূলক নথি এর জন্য সাধারণীকৃত শব্দ ফ্রিকোয়েন্সি ভেক্টর উৎপাদন করুন २. সাধারণ শব্দ ফিল্টার করুন: কর্পাসের ১०% এর বেশি নথিতে উপস্থিত উচ্চ-ফ্রিকোয়েন্সি শব্দ সরান ३. র্যাঙ্ক এবং ছাঁটাই করুন:
পদ্ধতি १: গড় ভেক্টর (Average Vector) এটি HyDE মূল পদ্ধতির ব্যাগ-অফ-ওয়ার্ডস স্পেসে অভিযোজন:
যেখানে (প্রশ্নটিকে অতিরিক্ত প্রতিক্রিয়া নথি হিসাবে বিবেচনা করা হয়)
বৈশিষ্ট্য:
পদ্ধতি २: Rocchio অ্যালগরিদম ক্লাসিক ভেক্টর স্পেস প্রতিক্রিয়া মডেল, প্রশ্ন এবং প্রতিক্রিয়া নথির আপেক্ষিক ওজন নিয়ন্ত্রণ করার জন্য পরামিতি প্রবর্তন করে:
পরামিতি সেটিং:
পদ্ধতি३: RM३ (Relevance Model 3) ভাষা মডেলের উপর ভিত্তি করে প্রতিক্রিয়া পদ্ধতি, প্রাসঙ্গিক নথিতে শব্দের পর্যবেক্ষণ সম্ভাবনা অনুমান করে:
পরামিতি সেটিং:
স্ট্রিং সংযোজন পদ্ধতি:
१. Naive Concat:
२. Query2Doc:
३. MuGI: স্ব-অভিযোজনশীল প্রশ্ন পুনরাবৃত্তি
१. একীভূত কাঠামো: ঐতিহ্যবাহী PRF এবং LLM প্রতিক্রিয়া পদ্ধতিগুলি একই কাঠামোর অধীনে তুলনা করা, দুটির মধ্যে প্রক্রিয়াগত পার্থক্য প্রকাশ করা
२. পদ নির্বাচনের মূল্য: পদ নির্বাচন সহ/ছাড়া পদ্ধতি তুলনা করে, শব্দ ফিল্টারিংয়ের অবদান পরিমাণ করা
३. প্যারামিটারাইজড ওজন নিয়ন্ত্রণ: Rocchio এর এবং পরামিতি স্ট্রিং পুনরাবৃত্তির চেয়ে আরও স্থিতিশীল ওজন নিয়ন্ত্রণ প্রদান করে
४. ক্রস-প্রতিক্রিয়া-উৎস মূল্যায়ন: ঐতিহ্যবাহী BM25 নথি প্রতিক্রিয়া এবং LLM-উৎপাদিত নথি প্রতিক্রিয়া উভয়ই মূল্যায়ন করা, LLM প্রতিক্রিয়ার উচ্চতর কার্যকারিতা প্রমাণ করা
MS MARCO ডেটাসেট (५টি ওয়েব অনুসন্ধান কাজ):
BEIR ডেটাসেট (९টি কম-সম্পদ পুনরুদ্ধার কাজ):
ডেটাসেট বৈশিষ্ট্য:
Recall@२०: শীর্ষ २० পুনরুদ্ধৃত ফলাফলে প্রাসঙ্গিক নথি অন্তর্ভুক্ত করার অনুপাত
সম্প্রসারণ ছাড়া ভিত্তি:
ঐতিহ্যবাহী PRF (BM२५ পুনরুদ্ধৃত নথি ব্যবহার করে):
LLM প্রতিক্রিয়া পদ্ধতি (HyDE-উৎপাদিত নথি ব্যবহার করে):
LLM কনফিগারেশন:
প্রতিক্রিয়া মডেল পরামিতি:
পুনরুদ্ধার সিস্টেম:
সর্বোত্তম পদ্ধতি: HyDE + Rocchio সমস্ত LLM এ সর্বোত্তম কর্মক্ষমতা প্রদর্শন করে
সবচেয়ে শক্তিশালী স্ট্রিং সংযোজন ভিত্তির (MuGI) তুলনায় উন্নতি:
MS MARCO ডেটাসেট:
BEIR ডেটাসেট (কম-সম্পদ কাজ):
সাধারণ কেস:
প্রতিক্রিয়া মডেল নিয়ন্ত্রণ করুন, প্রতিক্রিয়া উৎস তুলনা করুন:
gpt-oss-२०b এর উদাহরণ (সমস্ত ডেটাসেট গড়):
সিদ্ধান্ত: একই প্রতিক্রিয়া প্রক্রিয়ার অধীনে, LLM-উৎপাদিত অনুমানমূলক নথি পুনরুদ্ধৃত নথির চেয়ে প্রতিক্রিয়া উৎস হিসাবে আরও কার্যকর
আকর্ষণীয় পর্যবেক্ষণ:
গড় ভেক্টর বনাম Naive Concat তুলনা:
কর্মক্ষমতা ব্যবধান (সমস্ত ডেটাসেট গড়):
BEIR ডেটাসেটে আরও স্পষ্ট:
সিদ্ধান্ত: শব্দ পদ ফিল্টার করা (যেমন উচ্চ-ফ্রিকোয়েন্সি শব্দ) HyDE প্রভাব উন্নত করার জন্য গুরুত্বপূর্ণ
Rocchio বনাম গড় ভেক্টর:
কর্মক্ষমতা তুলনা (সমস্ত ডেটাসেট গড়):
ব্যাখ্যা:
ঐতিহ্যবাহী PRF (LLM ছাড়াই) BEIR এ প্রতিযোগিতামূলকতা:
নির্দেশনা:
সমস্ত LLM এ প্রবণতা সামঞ্জস্যপূর্ণ: १. Rocchio সর্বদা সর্বোত্তম २. পদ নির্বাচন উল্লেখযোগ্য উন্নতি নিয়ে আসে ३. BEIR এ প্রতিক্রিয়া মডেল সুবিধা আরও স্পষ্ট
LLM গুণমানের প্রভাব:
१. Rocchio অ্যালগরিদম१४: ভেক্টর স্পেস মডেলে ক্লাসিক প্রতিক্রিয়া পদ্ধতি, প্রশ্ন ভেক্টর প্রাসঙ্গিক নথির কাছাকাছি সামঞ্জস্য করে २. Relevance Model (RM३)१, १२: ভাষা মডেলের উপর ভিত্তি করে প্রতিক্রিয়া, প্রাসঙ্গিক নথির শব্দ বিতরণ অনুমান করে ३. প্রতিক্রিয়া শব্দ নির্বাচন३: প্রতিক্রিয়া নথি থেকে উচ্চ-গুণমানের সম্প্রসারিত শব্দ নির্বাচন করার পদ্ধতি অধ্যয়ন করে
१. HyDE९: শূন্য-নমুনা ঘন পুনরুদ্ধারের জন্য অনুমানমূলক উত্তর নথি উৎপাদন করতে LLM ব্যবহার করে २. Query२Doc१६: একক অনুমানমূলক নথি উৎপাদন করে এবং প্রশ্ন ५ বার পুনরাবৃত্তি করে ३. MuGI२०: LLM প্রশ্ন সম্প্রসারণের সর্বোত্তম অনুশীলন অন্বেষণ করে, স্ব-অভিযোজনশীল প্রশ্ন পুনরাবৃত্তি প্রস্তাব করে
१. ঐতিহ্যবাহী প্রতিক্রিয়া মডেল এখনও কার্যকর: Rocchio এবং RM३ এর মতো ক্লাসিক পদ্ধতি LLM যুগে এখনও প্রযোজ্য এবং শক্তিশালী
२. উল্লেখযোগ্য কর্মক্ষমতা উন্নতি:
३. দুটি উন্নতি উৎস:
४. শক্তিশালীতা সুবিধা: প্রতিক্রিয়া মডেল প্রশ্ন বৈচিত্র্যময় BEIR ডেটাসেটে আরও স্থিতিশীল কর্মক্ষমতা প্রদর্শন করে
१. পরামিতি সংবেদনশীলতা পর্যাপ্তভাবে অন্বেষণ করা হয়নি:
२. গণনা খরচ বিশ্লেষণ অনুপস্থিত:
३. সীমিত LLM নির্বাচন:
४. ঘন পুনরুদ্ধার জড়িত নয়:
५. ইন্টারঅ্যাকশন প্রভাব অন্বেষণ করা হয়নি:
१. স্ব-অভিযোজনশীল পরামিতি সামঞ্জস্য:
२. মিশ্র প্রতিক্রিয়া উৎস:
३. ঘন পুনরুদ্ধারে সম্প্রসারণ:
४. শেষ-থেকে-শেষ অপ্টিমাইজেশন:
५. বহু-রাউন্ড প্রতিক্রিয়া:
१. সমস্যা অবস্থান নির্ভুল:
२. পদ্ধতি কঠোর:
३. পরীক্ষা পর্যাপ্ত এবং অন্তর্দৃষ্টিপূর্ণ:
४. ব্যবহারিক মূল্য উচ্চ:
५. লেখা স্পষ্ট:
१. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত:
२. পরামিতি সংবেদনশীলতা গবেষণা অনুপস্থিত:
३. গণনা খরচ আলোচনা করা হয়নি:
४. কেস বিশ্লেষণ অপর্যাপ্ত:
५. প্রযোজ্য পরিসীমা সীমিত:
६. পরিসংখ্যান উল্লেখযোগ্যতা পরীক্ষা অনুপস্থিত:
ক্ষেত্রে অবদান: १. ক্লাসিক পদ্ধতি পুনরায় সক্রিয় করা: সম্প্রদায়কে LLM যুগে ঐতিহ্যবাহী IR প্রযুক্তি উপেক্ষা না করতে স্মরণ করায় २. মূল্যায়ন মানদণ্ড প্রতিষ্ঠা: ভবিষ্যত LLM প্রশ্ন সম্প্রসারণ গবেষণার জন্য তুলনা ভিত্তি প্রদান করে ३. মিশ্র পদ্ধতি অনুপ্রাণিত করা: ঐতিহ্যবাহী এবং আধুনিক প্রযুক্তি একত্রিত করতে উৎসাহিত করে
ব্যবহারিক মূল্য: १. তাৎক্ষণিক ব্যবহারযোগ্য: বর্তমান HyDE ব্যবহারকারীরা Rocchio উন্নতি সরাসরি প্রয়োগ করতে পারে २. খরচ-কার্যকারিতা উচ্চ: LLM পুনরায় প্রশিক্ষণ ছাড়াই উন্নতি পেতে পারে ३. শিল্প প্রযোজ্যতা: BM२५ শিল্পে ব্যাপকভাবে ব্যবহৃত হয়, এই পদ্ধতি স্থাপন করা সহজ
পুনরুৎপাদনযোগ্যতা: १. ✅ ওপেন সোর্স কোড २. ✅ জনসাধারণ ডেটাসেট ব্যবহার করে ३. ✅ বিস্তারিত হাইপারপ্যারামিটার নির্দেশনা ④. ✅ পরিপক্ক সরঞ্জাম (Pyserini, vLLM) এর উপর ভিত্তি করে
সম্ভাব্য উদ্ধৃতি মূল্য:
সুপারিশকৃত ব্যবহার দৃশ্য: १. কম-সম্পদ পুনরুদ্ধার কাজ: BEIR ধরনের বৈচিত্র্যময় প্রশ্ন দৃশ্য २. BM२५ বিরল পুনরুদ্ধার: প্রথম-পর্যায়ের পুনরুদ্ধার বা মিশ্র পুনরুদ্ধার সিস্টেম ३. সীমিত গণনা সম্পদ: স্নায়ু পুনরুদ্ধারকারী প্রশিক্ষণের তুলনায় প্রতিক্রিয়া মডেল খরচ ছোট ४. ব্যাখ্যাযোগ্যতা প্রয়োজন: শব্দ ওজন ভিজ্যুয়ালাইজেশন এবং ডিবাগিং
অপ্রযোজ্য দৃশ্য: १. ঘন পুনরুদ্ধার সিস্টেম: আরও গবেষণা অভিযোজন পদ্ধতি প্রয়োজন २. রিয়েল-টাইম পুনরুদ্ধার: সূচক পরিসংখ্যান অ্যাক্সেস বিলম্ব বৃদ্ধি করতে পারে ३. অতি-ছোট প্রশ্ন: প্রশ্ন শব্দ খুব কম হলে প্রতিক্রিয়া ওজন ভারসাম্য করা কঠিন ४. শেষ-থেকে-শেষ অপ্টিমাইজেশন প্রয়োজন: প্রতিক্রিয়া মডেল পরামিতি LLM এর সাথে যৌথভাবে প্রশিক্ষিত নয়
বাস্তবায়ন সুপারিশ: १. প্রথমে Rocchio চেষ্টা করুন () २. কাজের বৈশিষ্ট্য অনুযায়ী পরামিতি সামঞ্জস্য করুন (প্রশ্ন গুরুত্ব বেশি হলে বৃদ্ধি করুন) ३. পদ নির্বাচনের সাথে একত্রিত করুন (উচ্চ-ফ্রিকোয়েন্সি শব্দ ফিল্টার করুন, শীর্ষ-१२८ শব্দ রাখুন) ४. বিভিন্ন ডেটাসেটে কর্মক্ষমতা পর্যবেক্ষণ করুন, প্রয়োজনে পরামিতি সামঞ্জস্য করুন
१ Abdul-Jaleel et al., २००४. UMass at TREC २००४: Novelty and HARD
९ Gao et al., २०२३. Precise Zero-Shot Dense Retrieval without Relevance Labels (ACL)
१४ Rocchio, १९७१. Relevance Feedback in Information Retrieval
१६ Wang et al., २०२३. Query२doc: Query Expansion with Large Language Models (EMNLP)
२० Zhang et al., २०२४. Exploring the Best Practices of Query Expansion with Large Language Models (EMNLP)
এই পেপারটি একটি সমস্যা-ভিত্তিক স্পষ্ট, পদ্ধতি সংক্ষিপ্ত এবং কার্যকর, পরীক্ষা পর্যাপ্ত এবং কঠোর উচ্চ-মানের IR গবেষণা। লেখক LLM প্রশ্ন সম্প্রসারণ গবেষণায় একটি উপেক্ষা করা কিন্তু গুরুত্বপূর্ণ সমস্যা তীক্ষ্ণভাবে চিহ্নিত করেছেন, পদ্ধতিগত পরীক্ষার মাধ্যমে ঐতিহ্যবাহী প্রতিক্রিয়া মডেলের ক্রমাগত মূল্য প্রমাণ করেছেন। পেপারের প্রধান অন্তর্দৃষ্টি হল: প্রযুক্তিগত অগ্রগতি ক্লাসিক পদ্ধতি পরিত্যাগের খরচে আসা উচিত নয়, ঐতিহ্যবাহী এবং আধুনিক প্রযুক্তির সংমিশ্রণ প্রায়শই আরও ভাল সমাধান তৈরি করে।
যদিও পেপারটি তাত্ত্বিক গভীরতা এবং পরামিতি অপ্টিমাইজেশনে উন্নতির জায়গা রয়েছে, এর ব্যবহারিক শক্তি শক্তিশালী এবং পুনরুৎপাদনযোগ্যতা ভাল, এবং LLM যুগের তথ্য পুনরুদ্ধার গবেষণায় ইতিবাচক প্রভাব ফেলার প্রত্যাশা করা হয়। অনুশীলনকারীদের জন্য, এটি একটি কম খরচ, উচ্চ রিটার্ন উন্নতি সমাধান; গবেষক্ষদের জন্য, এটি গভীর অন্বেষণের যোগ্য একটি নতুন দিক।