Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion
Liu, Wen, Sun et al.
Fusing Knowledge Graphs with Large Language Models is crucial for knowledge-intensive tasks like knowledge graph completion. The prevailing paradigm, prefix-tuning, simply concatenates knowledge embeddings with text inputs. However, this shallow fusion overlooks the rich relational semantics within KGs and imposes a significant implicit reasoning burden on the LLM to correlate the prefix with the text. To address these, we propose Semantic-condition Tuning (SCT), a new knowledge injection paradigm comprising two key modules. First, a Semantic Graph Module employs a Graph Neural Network to extract a context-aware semantic condition from the local graph neighborhood, guided by knowledge-enhanced relations. Subsequently, this condition is passed to a Condition-Adaptive Fusion Module, which, in turn, adaptively modulates the textual embedding via two parameterized projectors, enabling a deep, feature-wise, and knowledge-aware interaction. The resulting pre-fused embedding is then fed into the LLM for fine-tuning. Extensive experiments on knowledge graph benchmarks demonstrate that SCT significantly outperforms prefix-tuning and other strong baselines. Our analysis confirms that by modulating the input representation with semantic graph context before LLM inference, SCT provides a more direct and potent signal, enabling more accurate and robust knowledge reasoning.
academic
Семантико-Условная Настройка: Интеграция Контекста Графа с Большими Языковыми Моделями для Дополнения Графов Знаний
В данной статье предлагается Semantic-Condition Tuning (SCT) — новая парадигма внедрения знаний для решения проблемы интеграции графов знаний и больших языковых моделей при дополнении графов знаний. Традиционные методы префиксной настройки просто конкатенируют вложения знаний с текстовым входом, что приводит к поверхностному слиянию и игнорирует богатую реляционную семантику в графах знаний, возлагая на LLM тяжелое бремя неявного логического вывода. SCT включает два ключевых модуля: семантический модуль графа использует графовые нейронные сети для извлечения контекстно-зависимых семантических условий из локальной окрестности графа; модуль адаптивного условного слияния адаптивно модулирует текстовые вложения через два параметризованных проектора, обеспечивая глубокое, признаковое и знаниевое взаимодействие.
Неполнота графов знаний: Графы знаний в реальном мире по своей природе неполны, что ограничивает их полезность в нижестоящих приложениях
Ограничения поверхностного слияния: Существующие методы префиксной настройки выполняют только простые операции конкатенации, неспособные полностью использовать структурную информацию графов знаний
Динамичность реляционной семантики: Значение отношений динамически изменяется в зависимости от окружающего семантического контекста, как показано на рисунке 1, где отношение "treats" представляет различные механизмы лечения в разных контекстах
Предложение структуры SCT: Первая структура семантико-условной настройки, интегрирующая контекстно-зависимое и адаптивное слияние вложений, преодолевающая ограничения существующей простой префиксной конкатенации
Семантический модуль графа: Предложен новый механизм передачи сообщений, ориентированный на отношения, где выбор соседей направляется явными оценками семантического сходства, основанными на знаниевых описаниях отношений
Модуль адаптивного условного слияния: Введен механизм слияния, использующий семантические условия для обучения прямым признаковым аффинным преобразованиям входных текстовых вложений, обеспечивая глубокую синергетическую интеграцию контекста графа
Проверка производительности: Демонстрация передовой производительности SCT и высокой параметрической эффективности на нескольких эталонных тестах
Граф знаний G определяется как набор троек T = {(h, r, t) | h, t ∈ E, r ∈ R}, где E и R обозначают соответственно наборы сущностей и отношений. Задача дополнения графа знаний заключается в предсказании недостающих элементов в данной тройке, например, предсказание хвостовой сущности t для запроса (h, r, ?). В дополнении графа знаний на основе LLM эта задача формализуется как задача генерации текста.
Глубокое слияние против поверхностной конкатенации: В отличие от простой префиксной конкатенации, SCT обеспечивает признаковое глубокое взаимодействие
Семантически управляемый выбор соседей: Использование обогащенных LLM описаний отношений для расчета семантического сходства вместо представлений, специфичных для задачи
Обработка графа, ориентированная на отношения: Сосредоточение на отношениях вместо сущностей, более эффективно и семантически показательно
Эффект семантического обогащения:
На примере запроса (Barack Obama, /government/politician/government_positions_held..., ?):
Без обогащения знаниями: На основе лексического перекрытия Gov Position (Title) и т.д. занимают высокие позиции
С обогащением знаниями: Семантически релевантные концепции, такие как Person (Nationality), повышают свой рейтинг, отражая переход от поверхностного текстового сопоставления к истинной семантической релевантности
Чувствительность гиперпараметров:
Параметр Top-K достигает оптимальной производительности при K=10 (MRR=0,471, Hit@1=0,380), слишком малое значение (K=4) приводит к недостаточности информации, слишком большое (K=32) вводит шум.
Статья цитирует 80 связанных работ, охватывающих встраивание графов знаний, графовые нейронные сети, большие языковые модели и другие важные области, обеспечивая прочную теоретическую основу для исследования. Ключевые цитируемые работы включают классические методы встраивания KG, такие как TransE, RotatE, а также представительные работы по интеграции LLM-KG, такие как KG-BERT, KoPA.