Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
본 논문은 지식 그래프 완성 작업에서 지식 그래프와 대규모 언어 모델(LLM) 융합 문제를 해결하기 위한 새로운 지식 주입 패러다임인 의미론적 조건 튜닝(Semantic-Condition Tuning, SCT)을 제안합니다. 기존의 접두사 튜닝 방법은 지식 임베딩과 텍스트 입력을 단순히 연결하는데, 이러한 얕은 수준의 융합은 지식 그래프의 풍부한 관계 의미론을 무시하고 LLM에 무거운 암묵적 추론 부담을 줍니다. SCT는 두 가지 핵심 모듈을 포함합니다: 의미론적 그래프 모듈은 그래프 신경망을 사용하여 국소 그래프 이웃에서 컨텍스트 인식 의미론적 조건을 추출하고, 조건 적응형 융합 모듈은 두 개의 매개변수화된 프로젝터를 통해 텍스트 임베딩을 적응적으로 조절하여 깊은 수준의 특성 기반 지식 인식 상호작용을 실현합니다.
지식 그래프 G는 삼중항 집합 T = {(h, r, t) | h, t ∈ E, r ∈ R}으로 정의되며, 여기서 E와 R은 각각 실체와 관계 집합을 나타냅니다. 지식 그래프 완성 작업은 주어진 삼중항에서 누락된 요소를 추론하는 것입니다. 예를 들어 쿼리(h, r, ?)에서 꼬리 실체 t를 예측합니다. LLM 기반 KGC에서 이 작업은 텍스트 생성 문제로 형식화됩니다.
본 논문은 80편의 관련 문헌을 인용하였으며, 지식 그래프 임베딩, 그래프 신경망, 대규모 언어 모델 등 여러 분야의 중요한 연구를 포함하여 연구에 견고한 이론적 기초를 제공합니다. 주요 참고 문헌에는 TransE, RotatE 등 고전적 KG 임베딩 방법과 KG-BERT, KoPA 등 LLM-KG 융합의 대표적 연구가 포함됩니다.