2025-11-20T17:34:15.321910

ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG

Hu, Zhu, Tang et al.

Knowledge graphs (KGs), with their structured representation capabilities, offer promising avenue for enhancing Retrieval Augmented Generation (RAG) systems, leading to the development of KG-RAG systems. Nevertheless, existing methods often struggle to achieve effective synergy between system effectiveness and cost efficiency, leading to neither unsatisfying performance nor excessive LLM prompt tokens and inference time. To this end, this paper proposes REMINDRAG, which employs an LLM-guided graph traversal featuring node exploration, node exploitation, and, most notably, memory replay, to improve both system effectiveness and cost efficiency. Specifically, REMINDRAG memorizes traversal experience within KG edge embeddings, mirroring the way LLMs "memorize" world knowledge within their parameters, but in a train-free manner. We theoretically and experimentally confirm the effectiveness of REMINDRAG, demonstrating its superiority over existing baselines across various benchmark datasets and LLM backbones. Our code is available at https://github.com/kilgrims/ReMindRAG.

academic

ReMindRAG: কম খরচের LLM-গাইডেড নলেজ গ্রাফ ট্রাভার্সাল দক্ষ RAG এর জন্য

মৌলিক তথ্য

পেপার আইডি: 2510.13193
শিরোনাম: ReMindRAG: Low-Cost LLM-Guided Knowledge Graph Traversal for Efficient RAG
লেখক: Yikuan Hu, Jifeng Zhu, Lanrui Tang, Chen Huang
শ্রেণীবিভাগ: cs.IR (তথ্য পুনরুদ্ধার)
প্রকাশনা সম্মেলন: ৩৯তম নিউরাল ইনফরমেশন প্রসেসিং সিস্টেম সম্মেলন (NeurIPS 2025)
পেপার লিঙ্ক: https://arxiv.org/abs/2510.13193
কোড লিঙ্ক: https://github.com/kilgrims/ReMindRAG

সারসংক্ষেপ

নলেজ গ্রাফ (KG) তার কাঠামোগত প্রতিনিধিত্ব ক্ষমতার মাধ্যমে, পুনরুদ্ধার-বর্ধিত প্রজন্ম (RAG) সিস্টেম উন্নত করার জন্য প্রতিশ্রুতিশীল পথ প্রদান করে, KG-RAG সিস্টেমের উন্নয়ন প্রচার করেছে। তবে, বিদ্যমান পদ্ধতিগুলি প্রায়শই সিস্টেম কার্যকারিতা এবং খরচ দক্ষতার মধ্যে কার্যকর সমন্বয় অর্জনে সংগ্রাম করে, যা দুর্বল কর্মক্ষমতা বা অত্যধিক LLM প্রম্পট টোকেন এবং অনুমান সময়ের দিকে পরিচালিত করে। এই সমস্যা সমাধানের জন্য, এই পেপারটি REMINDRAG প্রস্তাব করে, যা LLM-গাইডেড গ্রাফ ট্রাভার্সাল ব্যবহার করে, যার মধ্যে রয়েছে নোড অন্বেষণ, নোড ব্যবহার, এবং সবচেয়ে গুরুত্বপূর্ণভাবে স্মৃতি পুনরায় চালানোর প্রক্রিয়া, সিস্টেম কার্যকারিতা এবং খরচ দক্ষতা উন্নত করতে। নির্দিষ্টভাবে, REMINDRAG KG এজ এম্বেডিংয়ে ট্রাভার্সাল অভিজ্ঞতা স্মরণ করে, LLM যেভাবে তার পরামিতিতে বিশ্ব জ্ঞান "স্মরণ" করে তার অনুরূপ, কিন্তু প্রশিক্ষণ-মুক্ত পদ্ধতি ব্যবহার করে। আমরা তাত্ত্বিক এবং পরীক্ষামূলক উভয় দিক থেকে REMINDRAG এর কার্যকারিতা নিশ্চিত করি, বিভিন্ন বেঞ্চমার্ক ডেটাসেট এবং LLM ব্যাকবোন জুড়ে বিদ্যমান বেসলাইনকে ছাড়িয়ে যাওয়ার প্রমাণ দিই।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যা সংজ্ঞা

ঐতিহ্যবাহী RAG পদ্ধতি প্রাসঙ্গিক পাঠ্য অংশ চিহ্নিত করতে প্রধানত ঘন ভেক্টর পুনরুদ্ধারের উপর নির্ভর করে, কিন্তু বহু-হপ যুক্তি বা দীর্ঘ-পরিসর নির্ভরতা ক্যাপচার করার প্রয়োজন এমন জটিল কাজে সীমিত কর্মক্ষমতা প্রদর্শন করে। নলেজ গ্রাফ তার কাঠামোগত সত্তা এবং সম্পর্ক প্রতিনিধিত্বের মাধ্যমে এই সমস্যা সমাধানের জন্য নতুন পথ প্রদান করে।

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

ঐতিহ্যবাহী গ্রাফ অনুসন্ধান অ্যালগরিদম: PageRank এবং GNN পদ্ধতির মতো, গ্রাফে সূক্ষ্ম শব্দার্থিক সম্পর্ক ক্যাপচার করতে অসুবিধা, সিস্টেম কার্যকারিতা অপর্যাপ্ত করে
LLM-গাইডেড গ্রাফ ট্রাভার্সাল পদ্ধতি: যদিও উচ্চতর কর্মক্ষমতা প্রদর্শন করে, তবে প্রচুর LLM আহ্বান প্রয়োজন, খরচ এবং অনুমান সময় উল্লেখযোগ্যভাবে বৃদ্ধি করে
দক্ষতা এবং কার্যকারিতার ভারসাম্য: বিদ্যমান KG-RAG সিস্টেমগুলি সিস্টেম কার্যকারিতা এবং খরচ দক্ষতার মধ্যে কার্যকর ভারসাম্য খুঁজে পেতে অসুবিধা করে

গবেষণা প্রেরণা

এই পেপারটি KG-RAG সিস্টেমে সিস্টেম কার্যকারিতা এবং খরচ দক্ষতার সহ-অপ্টিমাইজেশন সমস্যা সমাধানের লক্ষ্য রাখে, যা বাস্তব স্থাপনা এবং স্কেলেবিলিটির প্রধান চ্যালেঞ্জ।

মূল অবদান

মূল চ্যালেঞ্জ চিহ্নিত করা: KG-RAG সিস্টেমে সিস্টেম কার্যকারিতা এবং খরচ দক্ষতার সহ-অপ্টিমাইজেশনের চ্যালেঞ্জ স্পষ্টভাবে নির্দেশ করা
REMINDRAG ফ্রেমওয়ার্ক প্রস্তাব: LLM-গাইডেড KG ট্রাভার্সাল ব্যবহার করে, যার মধ্যে নোড অন্বেষণ, নোড ব্যবহার এবং স্মৃতি পুনরায় চালানোর প্রক্রিয়া রয়েছে
তাত্ত্বিক বিশ্লেষণ: গ্রাফ ট্রাভার্সাল স্মৃতি পুনরায় চালানোর কার্যকারিতা তাত্ত্বিকভাবে প্রমাণ করা
পরীক্ষামূলক যাচাইকরণ: একাধিক বেঞ্চমার্ক ডেটাসেট এবং LLM ব্যাকবোন জুড়ে REMINDRAG এর উচ্চতর কর্মক্ষমতা যাচাই করা

পদ্ধতি বিস্তারিত

কাজের সংজ্ঞা

অ-কাঠামোগত পাঠ্য নথি এবং ব্যবহারকারী প্রশ্ন দেওয়া, লক্ষ্য হল একটি নলেজ গ্রাফ তৈরি করা এবং দক্ষ গ্রাফ ট্রাভার্সাল প্রক্রিয়ার মাধ্যমে প্রাসঙ্গিক তথ্য পুনরুদ্ধার করা, নির্ভুল উত্তর তৈরি করা, একই সাথে LLM আহ্বান খরচ কমানো।

মডেল আর্কিটেকচার

১. নলেজ গ্রাফ নির্মাণ

REMINDRAG বিষমজাত নলেজ গ্রাফ তৈরি করে, যার মধ্যে রয়েছে:

সত্তা নোড: পাঠ্য থেকে নিষ্কাশিত নামকৃত সত্তা
অ্যাঙ্কর নোড: পাঠ্য ব্লক শিরোনাম সংরক্ষণ করে
পাঠ্য ব্লক সংগ্রহ: বিভক্ত মূল নথি
সম্পর্ক সংযোগ: সত্তা-সম্পর্ক-সত্তা ট্রিপল এবং প্রসঙ্গ কঙ্কাল নেটওয়ার্ক

২. LLM-গাইডেড নলেজ গ্রাফ ট্রাভার্সাল

নোড অন্বেষণ কৌশল:

সম্ভাব্য নোডগুলি অন্বেষণকে অগ্রাধিকার দিন যা উত্তরের দিকে পরিচালিত করতে পারে
প্রতিটি পুনরাবৃত্তিতে, LLM সাবগ্রাফ S-তে সমস্ত নোড মূল্যায়ন করে, লক্ষ্য নোড a নির্বাচন করে যা সবচেয়ে বেশি উত্তরের দিকে পরিচালিত করার সম্ভাবনা রাখে

নোড ব্যবহার কৌশল:

পূর্বে অন্বেষণ করা নোডগুলি ব্যবহারে ফোকাস করুন, এই নোডগুলির সাথে পথ প্রসারিত করুন
নির্বাচিত নোড a দেওয়া, LLM তার সংলগ্ন নোড সেট Sa থেকে সর্বোত্তম সম্প্রসারণ নোড p নির্বাচন করে

३. স্মৃতি পুনরায় চালানোর প্রক্রিয়া

স্মৃতি বিষয়বস্তু:

কার্যকর পথ: সঠিক উত্তরের দিকে পরিচালিত পথ (ইতিবাচক শক্তিশালীকরণ)
অকার্যকর পথ: উত্তরের দিকে পরিচালিত না হওয়া পথ (নেতিবাচক শক্তিশালীকরণ)

স্মৃতি পদ্ধতি: বন্ধ-ফর্ম সমীকরণ ব্যবহার করে এজ এম্বেডিং আপডেট করা:

ওজন ফাংশন: δ(x) = (2/π)cos(π||x||₂/2)
কার্যকর পথ বৃদ্ধি: v̂ = v + δ(v) · q/||q||₂
অকার্যকর পথ শাস্তি: v̂ = v - δ(v·q/||q||₂) · v·q/||q||₂

দ্রুত জাগরণ এবং ড্যাম্পিং আপডেট:

দ্রুত জাগরণ: যখন এজ এম্বেডিং v এর নর্ম ছোট থাকে, δ ফাংশন বড় দিকনির্দেশক আপডেট তৈরি করে
ড্যাম্পিং আপডেট: যখন এজ এম্বেডিং v নর্ম বড় থাকে, δ ফাংশন শুধুমাত্র ছোট আপডেট তৈরি করে, স্থিতিশীলতা বজায় রাখে

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

প্রশিক্ষণ-মুক্ত স্মৃতি প্রক্রিয়া: এজ এম্বেডিংয়ের মাধ্যমে ট্রাভার্সাল অভিজ্ঞতা স্মরণ করা, অতিরিক্ত প্রশিক্ষণের প্রয়োজন নেই
অন্বেষণ এবং ব্যবহারের ভারসাম্য: নোড অন্বেষণ এবং ব্যবহার কৌশল একত্রিত করা, বৈশ্বিক এবং স্থানীয় সর্বোত্তম অনুসন্ধান অর্জন করা
অভিযোজিত ওজন আপডেট: ভেক্টর নর্মের উপর ভিত্তি করে অভিযোজিত আপডেট কৌশল, দ্রুত শেখা এবং দীর্ঘমেয়াদী স্থিতিশীলতা উভয়ই বিবেচনা করা

পরীক্ষামূলক সেটআপ

ডেটাসেট

দীর্ঘ নির্ভরতা QA: LooGLE ডেটাসেট, দীর্ঘ-পরিসর শব্দার্থিক পুনরুদ্ধার ক্ষমতা পরীক্ষা করা
বহু-হপ QA: HotpotQA ডেটাসেট, বহু-পদক্ষেপ যুক্তি ক্ষমতা মূল্যায়ন করা
সাধারণ QA: LooGLE স্বল্প নির্ভরতা QA, সরাসরি সম্পর্কিত তথ্য নিষ্কাশন ক্ষমতা পরীক্ষা করা

মূল্যায়ন মেট্রিক্স

কার্যকারিতা মূল্যায়ন: উত্তর নির্ভুলতা মূল্যায়ন করতে LLM বিচারক হিসাবে GPT-4o ব্যবহার করা
খরচ দক্ষতা মূল্যায়ন: ট্রাভার্সাল প্রক্রিয়ায় প্রতিটি প্রশ্নের জন্য গড় ব্যয়িত LLM টোকেন সংখ্যা

তুলনামূলক পদ্ধতি

ঐতিহ্যবাহী পুনরুদ্ধার পদ্ধতি: BM25, NaiveRAG
গ্রাফ অনুসন্ধান অ্যালগরিদম ব্যবহার করে KG-RAG সিস্টেম: GraphRAG, LightRAG, HippoRAG2
LLM-গাইডেড KG-RAG সিস্টেম: Plan-on-Graph

বাস্তবায়ন বিবরণ

LLM ব্যাকবোন: GPT-4o-mini, Deepseek-V3
এম্বেডিং মডেল: nomic-ai/nomic-embed-text-v2-moe
পাঠ্য খণ্ডকরণ: ৭৫০ টোকেন দৈর্ঘ্য
মূল পরামিতি: α=0.1 (নোড প্রাসঙ্গিকতা ওজন), λ=0.55 (শক্তিশালী সংযোগ থ্রেশহোল্ড)

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

QA প্রকার	GPT-4o-mini	Deepseek-V3
দীর্ঘ নির্ভরতা QA	57.04%	59.73%
বহু-হপ QA	74.22%	79.38%
সাধারণ QA	76.67%	77.01%

REMINDRAG সমস্ত কাজে বেসলাইন পদ্ধতিকে উল্লেখযোগ্যভাবে অতিক্রম করে:

দীর্ঘ নির্ভরতা QA: গড় ১২.০৮% উন্নতি
বহু-হপ QA: গড় ১০.३১% উন্নতি
সাধারণ QA: গড় ४.६६% উন্নতি

খরচ দক্ষতা বিশ্লেষণ

সেটআপ প্রকার	নির্ভুলতা	টোকেন খরচ	খরচ হ্রাস
স্মৃতি ছাড়া	57.04%	14.91K	-
১ রাউন্ড স্মৃতি	56.48%	9.68K	35.1%
२ রাউন্ড স্মৃতি	58.01%	7.55K	49.4%
३ রাউন্ড স্মৃতি	60.31%	6.71K	55.0%

বহু-রাউন্ড স্মৃতির পরে, REMINDRAG গড়ে ५८.८% টোকেন খরচ হ্রাস অর্জন করে।

বিলোপন পরীক্ষা

প্রসঙ্গ কঙ্কাল নেটওয়ার্কের প্রভাব:

প্রসঙ্গ কঙ্কাল নেটওয়ার্ক সরানোর পরে, দীর্ঘ নির্ভরতা QA কর্মক্ষমতা ५७.०४% থেকে ५१.०१% এ হ্রাস পায়
প্রসঙ্গ তথ্য ক্যাপচারের গুরুত্ব যাচাই করা

হপ সংখ্যা সেটিংয়ের প্রভাব:

সর্বাধিক হপ সংখ্যা বৃদ্ধির সাথে, সিস্টেম কর্মক্ষমতা একঘেয়েভাবে বৃদ্ধি পায়
বৃহত্তর হপ সংখ্যা নোডগুলিকে আরও বিস্তৃত প্রতিবেশী তথ্য অ্যাক্সেস করতে সক্ষম করে

কেস বিশ্লেষণ

স্ব-সংশোধন ক্ষমতা:

প্রাথমিক ত্রুটির উত্তরের পরে, সিস্টেম স্মৃতি নিয়মের উপর ভিত্তি করে অপ্রাসঙ্গিক নোড শাস্তি দিতে পারে
পরবর্তী প্রশ্নে স্মৃতি-অপ্টিমাইজড সাবগ্রাফে স্যুইচ করা, ত্রুটি স্ব-সংশোধন অর্জন করা

স্মৃতি স্থিতিশীলতা:

জটিল বহু-রাউন্ড স্মৃতি সেটআপে স্থিতিশীল কর্মক্ষমতা বজায় রাখা
বিষমজাত ডেটাসেট বিকল্পভাবে পরিচালনা করার সময় শক্তিশালীতা প্রদর্শন করা

তাত্ত্বিক বিশ্লেষণ

স্মৃতি ক্ষমতা উপপাদ্য

নির্দিষ্ট শব্দার্থিক সাদৃশ্য সহ প্রশ্ন সেটের জন্য, যখন এম্বেডিং মাত্রা d যথেষ্ট বড় হয়, এজ এম্বেডিং কার্যকরভাবে প্রশ্ন তথ্য স্মরণ করতে পারে, শর্ত হল:

θ ≤ lim[d→∞] [2 arcsin(√(1/2 sin(arccos(λ))))]

যেখানে θ হল প্রশ্ন এম্বেডিং জোড়ার মধ্যে সর্বাধিক কোণ, λ হল শক্তিশালী সংযোগ থ্রেশহোল্ড।

তাত্ত্বিক গ্যারান্টি

λ এর তাত্ত্বিক উপরের সীমা ০.७७५, বিদ্যমান শব্দার্থিক সাদৃশ্য থ্রেশহোল্ড ০.६ গবেষণার সাথে সামঞ্জস্যপূর্ণ
যখন এম্বেডিং মাত্রা ১০০ অতিক্রম করে, তাত্ত্বিক অনুমান ব্যবহারিকভাবে উল্লেখযোগ্য ব্যবহারিকতা রাখে

সিদ্ধান্ত এবং আলোচনা

প্রধান সিদ্ধান্ত

REMINDRAG সফলভাবে সিস্টেম কার্যকারিতা এবং খরচ দক্ষতার সহ-অপ্টিমাইজেশন অর্জন করেছে
স্মৃতি পুনরায় চালানোর প্রক্রিয়া পরবর্তী প্রশ্নের দক্ষতা উল্লেখযোগ্যভাবে উন্নত করেছে
স্ব-সংশোধন ক্ষমতা সিস্টেমের শক্তিশালীতা বৃদ্ধি করেছে

সীমাবদ্ধতা

প্রাথমিক গ্রাফ ট্রাভার্সাল খরচ: প্রথম ট্রাভার্সাল এখনও একাধিক LLM আহ্বান প্রয়োজন
বড় আকারের নথি প্রক্রিয়াকরণ: নলেজ গ্রাফ নির্মাণ প্রচুর সময় এবং গণনা সম্পদ প্রয়োজন
স্মৃতি ক্ষমতা সীমাবদ্ধতা: তাত্ত্বিক বিশ্লেষণ অসীম মাত্রার অনুমানের উপর ভিত্তি করে, বাস্তব প্রয়োগে সীমাবদ্ধ হতে পারে

ভবিষ্যত দিকনির্দেশনা

প্রাক-প্রশিক্ষিত স্মৃতি আরম্ভকরণ: ডোমেইন-নির্দিষ্ট FAQ ব্যবহার করে মডেল স্মৃতি প্রাক-আরম্ভ করা
বিতরণকৃত গ্রাফ নির্মাণ: বড় আকারের নথির গ্রাফ নির্মাণ দক্ষতা অপ্টিমাইজ করা
গতিশীল স্মৃতি ব্যবস্থাপনা: দীর্ঘমেয়াদী স্মৃতির বিস্মরণ এবং আপডেট প্রক্রিয়া গবেষণা করা

গভীর মূল্যায়ন

সুবিধা

শক্তিশালী উদ্ভাবনী: প্রথমবারের মতো প্রশিক্ষণ-মুক্ত গ্রাফ ট্রাভার্সাল স্মৃতি প্রক্রিয়া প্রস্তাব করা
দৃঢ় তাত্ত্বিক ভিত্তি: স্মৃতি ক্ষমতার তাত্ত্বিক বিশ্লেষণ এবং গ্যারান্টি প্রদান করা
ব্যাপক পরীক্ষা: একাধিক ডেটাসেট, একাধিক ব্যাকবোন নেটওয়ার্কের সম্পূর্ণ মূল্যায়ন
উচ্চ ব্যবহারিক মূল্য: উল্লেখযোগ্য কর্মক্ষমতা উন্নতি এবং খরচ হ্রাস

অপূর্ণতা

পরামিতি সংবেদনশীলতা: একাধিক হাইপারপ্যারামিটারের সেটিং কর্মক্ষমতা প্রভাবিত করতে পারে
স্কেলেবিলিটি সমস্যা: অতি-বড় আকারের নলেজ গ্রাফের প্রযোজ্যতা সম্পূর্ণভাবে যাচাই করা হয়নি
স্মৃতি আপডেট কৌশল: সাধারণ রৈখিক আপডেট সমস্ত পরিস্থিতিতে উপযুক্ত নাও হতে পারে

প্রভাব

একাডেমিক অবদান: KG-RAG ক্ষেত্রে নতুন অপ্টিমাইজেশন চিন্তাভাবনা প্রদান করা
ব্যবহারিক প্রয়োগ: প্রশ্নোত্তর সিস্টেম, তথ্য পুনরুদ্ধার ইত্যাদি ক্ষেত্রে ব্যাপক প্রয়োগ সম্ভাবনা
পুনরুৎপাদনযোগ্যতা: ওপেন সোর্স কোড প্রদান করা, গবেষণা সম্প্রদায়কে যাচাইকরণ এবং সম্প্রসারণ সহজতর করা

প্রযোজ্য পরিস্থিতি

বহু-রাউন্ড কথোপকথন সিস্টেম: ঐতিহাসিক মিথস্ক্রিয়া স্মরণ করতে পারে, প্রতিক্রিয়া দক্ষতা উন্নত করে
ডোমেইন-নির্দিষ্ট প্রশ্নোত্তর: নির্দিষ্ট ডোমেইনের মধ্যে ট্রাভার্সাল অভিজ্ঞতা সংগ্রহ এবং ব্যবহার করতে পারে
খরচ-সংবেদনশীল প্রয়োগ: LLM আহ্বান খরচের জন্য কঠোর প্রয়োজনীয়তা সহ পরিস্থিতি

তথ্যসূত্র

এই পেপারটি RAG, নলেজ গ্রাফ, গ্রাফ নিউরাল নেটওয়ার্ক ইত্যাদি একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ উদ্ধৃত করেছে, যার মধ্যে রয়েছে:

Lewis et al. (2020): জ্ঞান-নিবিড় NLP কাজের জন্য পুনরুদ্ধার-বর্ধিত প্রজন্ম
Edge et al. (2024): প্রশ্ন-কেন্দ্রিক সংক্ষিপ্তকরণের জন্য GraphRAG পদ্ধতি
Guo et al. (2024): LightRAG সাধারণ এবং দ্রুত পুনরুদ্ধার-বর্ধিত প্রজন্ম
এবং অন্যান্য ५५টি সম্পর্কিত সাহিত্য

সামগ্রিক মূল্যায়ন: REMINDRAG একটি উচ্চ-মানের গবেষণা কাজ, KG-RAG ক্ষেত্রে একটি উদ্ভাবনী সমাধান প্রস্তাব করেছে। এই পদ্ধতি শুধুমাত্র প্রযুক্তিগতভাবে অগ্রগামী নয়, আরও গুরুত্বপূর্ণভাবে বাস্তব প্রয়োগে মূল সমস্যা সমাধান করেছে—কার্যকারিতা এবং দক্ষতার ভারসাম্য। তাত্ত্বিক বিশ্লেষণ কঠোর, পরীক্ষামূলক ডিজাইন যুক্তিসঙ্গত, ফলাফল প্রভাবশালী। যদিও কিছু সীমাবদ্ধতা রয়েছে, তবে এর অবদান উল্লেখযোগ্য, KG-RAG প্রযুক্তির ব্যবহারিকীকরণ প্রচারে গুরুত্বপূর্ণ অর্থ রাখে।