Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
সিমান্টিক-কন্ডিশন টিউনিং: জ্ঞান গ্রাফ সমাপ্তির জন্য গ্রাফ প্রসঙ্গ এবং বৃহৎ ভাষা মডেলগুলির সংমিশ্রণ
এই পেপারটি সিমান্টিক-কন্ডিশন টিউনিং (এসসিটি) প্রস্তাব করে, যা জ্ঞান গ্রাফ সমাপ্তি কাজে জ্ঞান গ্রাফ এবং বৃহৎ ভাষা মডেলের সংমিশ্রণ সমস্যা সমাধানের জন্য একটি নতুন জ্ঞান ইনজেকশন প্যারাডাইম। ঐতিহ্যবাহী উপসর্গ টিউনিং পদ্ধতি সহজভাবে জ্ঞান এম্বেডিং এবং পাঠ্য ইনপুট সংযুক্ত করে, যা এই অগভীর সংমিশ্রণ জ্ঞান গ্রাফের সমৃদ্ধ সম্পর্ক শব্দার্থবিদ্যা উপেক্ষা করে এবং এলএলএম-এর উপর ভারী অন্তর্নিহিত অনুমান বোঝা চাপিয়ে দেয়। এসসিটি দুটি মূল মডিউল অন্তর্ভুক্ত করে: সিমান্টিক গ্রাফ মডিউল স্থানীয় গ্রাফ প্রতিবেশী থেকে প্রসঙ্গ-সচেতন সিমান্টিক শর্ত নিষ্কাশনের জন্য গ্রাফ নিউরাল নেটওয়ার্ক ব্যবহার করে; শর্ত-অভিযোজিত সংমিশ্রণ মডিউল দুটি প্যারামিটারযুক্ত প্রজেক্টরের মাধ্যমে পাঠ্য এম্বেডিং অভিযোজিতভাবে মডুলেট করে, গভীর, বৈশিষ্ট্য-স্তর এবং জ্ঞান-সচেতন মিথস্ক্রিয়া বাস্তবায়ন করে।
জ্ঞান গ্রাফের অসম্পূর্ণতা: বাস্তব-বিশ্বের জ্ঞান গ্রাফগুলি অন্তর্নিহিতভাবে অসম্পূর্ণ, যা ডাউনস্ট্রিম অ্যাপ্লিকেশনে তাদের উপযোগিতা সীমিত করে
অগভীর সংমিশ্রণের সীমাবদ্ধতা: বিদ্যমান উপসর্গ টিউনিং পদ্ধতি শুধুমাত্র সহজ সংযোগ অপারেশন সম্পাদন করে, জ্ঞান গ্রাফের কাঠামোগত তথ্য সম্পূর্ণভাবে ব্যবহার করতে পারে না
সম্পর্ক শব্দার্থবিদ্যার গতিশীলতা: সম্পর্কের অর্থ তার চারপাশের শব্দার্থগত প্রসঙ্গ অনুযায়ী গতিশীলভাবে পরিবর্তিত হয়, যেমন চিত্র ১-এ দেখানো "চিকিৎসা" সম্পর্ক বিভিন্ন প্রসঙ্গে বিভিন্ন চিকিৎসা প্রক্রিয়া প্রতিনিধিত্ব করে
এসসিটি ফ্রেমওয়ার্ক প্রস্তাব: প্রথম প্রসঙ্গ-সচেতন এবং অভিযোজিত এম্বেডিং সংমিশ্রণ একীভূত করা সিমান্টিক শর্ত টিউনিং ফ্রেমওয়ার্ক, যা বিদ্যমান সহজ উপসর্গ টিউনিং সংযোগের সীমাবদ্ধতা অতিক্রম করে
সিমান্টিক গ্রাফ মডিউল: উপন্যাস সম্পর্ক-কেন্দ্রিক বার্তা পাসিং প্রক্রিয়া প্রস্তাব করে, প্রতিবেশী নির্বাচন জ্ঞান-বর্ধিত সম্পর্ক বর্ণনার স্পষ্ট শব্দার্থগত সাদৃশ্য স্কোর দ্বারা পরিচালিত হয়
শর্ত-অভিযোজিত সংমিশ্রণ মডিউল: সংমিশ্রণ প্রক্রিয়া প্রবর্তন করে যা শব্দার্থগত শর্ত ব্যবহার করে ইনপুট পাঠ্য এম্বেডিংয়ের সরাসরি বৈশিষ্ট্য-স্তর অ্যাফাইন রূপান্তর শিখে, গ্রাফ প্রসঙ্গের গভীর সহযোগী একীকরণ বাস্তবায়ন করে
কর্মক্ষমতা যাচাইকরণ: একাধিক বেঞ্চমার্ক জুড়ে এসসিটির অত্যাধুনিক কর্মক্ষমতা এবং উচ্চ প্যারামিটার দক্ষতা প্রদর্শন করে
জ্ঞান গ্রাফ জি ত্রিপদ সেট T = {(h, r, t) | h, t ∈ E, r ∈ R} হিসাবে সংজ্ঞায়িত করা হয়, যেখানে E এবং R যথাক্রমে সত্তা এবং সম্পর্ক সেট প্রতিনিধিত্ব করে। জ্ঞান গ্রাফ সমাপ্তি কাজ প্রদত্ত ত্রিপদে অনুপস্থিত উপাদান অনুমান করা, যেমন প্রশ্ন (h, r, ?) এর লেজ সত্তা t পূর্বাভাস দেওয়া। এলএলএম-ভিত্তিক কেজিসি-তে, এই কাজটি পাঠ্য প্রজন্ম সমস্যা হিসাবে আনুষ্ঠানিক করা হয়।
শব্দার্থগত বর্ধন প্রভাব:
প্রশ্ন (বারাক ওবামা, /সরকার/রাজনীতিবিদ/সরকার_অবস্থান_অনুষ্ঠিত..., ?) এর উদাহরণ:
জ্ঞান বর্ধন ছাড়া: শব্দকোষগত ওভারল্যাপের উপর ভিত্তি করে, গভর্নমেন্ট পজিশন (শিরোনাম) ইত্যাদি উচ্চ র্যাঙ্কে
জ্ঞান বর্ধন সহ: পার্সন (জাতীয়তা) ইত্যাদি শব্দার্থগতভাবে প্রাসঙ্গিক ধারণা র্যাঙ্কিং উন্নত, অগভীর পাঠ্য ম্যাচিং থেকে প্রকৃত শব্দার্থগত প্রাসঙ্গিকতায় রূপান্তর প্রতিফলিত করে
হাইপারপ্যারামিটার সংবেদনশীলতা:
শীর্ষ-কে প্যারামিটার কে=১০ এ সর্বোত্তম কর্মক্ষমতা অর্জন করে (MRR=০.৪৭১, Hit@1=০.৩৮০), খুব ছোট (কে=৪) তথ্য অপ্রতুল, খুব বড় (কে=৩২) শব্দ প্রবর্তন করে।
পেপারটি ৮০টি সম্পর্কিত সাহিত্য উদ্ধৃত করে, যা জ্ঞান গ্রাফ এম্বেডিং, গ্রাফ নিউরাল নেটওয়ার্ক, বৃহৎ ভাষা মডেল ইত্যাদি একাধিক ক্ষেত্রের গুরুত্বপূর্ণ কাজ অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি প্রদান করে। মূল সাহিত্যের মধ্যে রয়েছে ট্রান্সই, রোটেট ইত্যাদি ক্লাসিক কেজি এম্বেডিং পদ্ধতি, এবং কেজি-বার্ট, কোপিএ ইত্যাদি এলএলএম-কেজি সংমিশ্রণের প্রতিনিধিত্বমূলক কাজ।