2025-11-12T19:43:10.253640

Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation

Peng, Kumar, Wu et al.

Retrieval-Augmented Generation (RAG) systems leverage Large Language Models (LLMs) to generate accurate and reliable responses that are grounded in retrieved context. However, LLMs often generate inconsistent outputs for semantically equivalent inputs, a problem compounded by the scarcity of consistency-focused training data and the limitations of current fine-tuning techniques in enhancing output consistency. We propose a new approach combining systematic synthetic data generation, triplet loss for better embeddings, and a novel layer-wise model merging approach. Using consistency-aware weights derived from intermediate layer activations, our method effectively integrates knowledge from specialized models. Experimental results how that our merged model significantly enhances output consistency, achieving a ~47.5\% improvement in response similarity over the baseline, thus offering a practical solution for increasing the reliability of an industrial RAG system.

academic

Гармонизация разнообразных моделей: стратегия послойного слияния для согласованной генерации

Основная информация

ID статьи: 2510.14915
Название: Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation
Авторы: Xujun Peng, Anoop Kumar, Jingyu Wu, Parker Glenn, Daben Liu (Capital One AI Foundations)
Категория: cs.CL (Вычислительная лингвистика)
Дата публикации: 16 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.14915

Аннотация

Системы генерации с дополнением поиском (RAG) используют большие языковые модели (LLM) для генерации точных и надежных ответов на основе извлеченного контекста. Однако LLM часто генерируют несогласованные выходные данные при столкновении с семантически эквивалентными входными данными. Эта проблема усугубляется отсутствием ориентированных на согласованность обучающих данных и ограничениями современных методов тонкой настройки в повышении согласованности выходных данных. В данной работе предлагается подход, сочетающий систематическую генерацию синтетических данных, триплетную потерю и новый метод послойного слияния моделей. Используя веса, осведомленные о согласованности, полученные из активаций промежуточных слоев, метод эффективно интегрирует знания специализированных моделей. Экспериментальные результаты показывают, что объединенная модель значительно повышает согласованность выходных данных, достигая 47,5% улучшения в сравнении с базовым уровнем по метрике сходства ответов.

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема, решаемая в данном исследовании, — это проблема согласованности выходных данных в системах RAG. Конкретные проявления:

Семантически эквивалентные запросы генерируют различные ответы: как показано на рисунке 1, простое наличие или отсутствие вопросительного знака может привести к совершенно различным ответам системы RAG
Практические вызовы при развертывании в промышленности: в производственной среде разнообразные варианты пользовательских запросов представляют угрозу надежности системы

Значимость проблемы

Требования надежности: в высокорисковых областях, таких как финансы и здравоохранение, несогласованные ответы серьезно влияют на доверие пользователей
Практическое воздействие: в работе эмпирически показано, что генератор более чувствителен к вариациям запросов, чем поисковик
Стабильность системы: несогласованность выходных данных напрямую влияет на внедрение систем RAG в промышленной среде

Ограничения существующих методов

Дефицит обучающих данных: отсутствие специализированных данных для обучения, ориентированных на согласованность
Ограничения методов тонкой настройки: традиционные методы тонкой настройки имеют ограниченную эффективность в повышении согласованности выходных данных
Отсутствие эталонных оценок: нехватка специализированных эталонов и наборов данных для оценки согласованности

Основные вклады

Классификация вариантов запросов: систематическое выявление и классификация типов вариантов запросов, вызывающих несогласованность ответов в промышленных системах RAG
Система метрик согласованности: разработка системы оценки согласованности, включающей точное совпадение (EM), сходство ответов (RS) и сходство BERT (BS)
Метод послойного слияния моделей: предложение новой стратегии послойного слияния моделей на основе весов, осведомленных о согласованности
Комплексное решение: интеграция генерации синтетических данных, обучения с триплетной потерей и слияния моделей в единую методологию

Подробное описание метода

Определение задачи

Дано исходный запрос Q и его семантически эквивалентный вариант Q'. Цель состоит в том, чтобы генератор системы RAG производил согласованные ответы S и S' для обоих запросов, то есть максимизировать семантическое сходство между S и S' при сохранении точности ответов.

Архитектура модели

1. Стратегия генерации синтетических данных

На основе анализа производственных запросов выявлены три основных типа вариантов:

Варианты "How to/do":

Переформулировка методологических вопросов
Систематическая генерация с использованием регулярных выражений

Варианты единственного/множественного числа и артиклей:

Изменение числа существительных (например, "apple" vs "apples")
Изменение использования артиклей (например, "a", "an", "the")
Случайное переключение между единственным и множественным числом и изменение артиклей

Семантические варианты:

Изменения, сохраняющие основное значение, но использующие различный словарь
Генерация парафраз с использованием Llama-3.1-70B-Instruct

2. Обучение с триплетной потерей

Введение триплетной потери для повышения способности модели к семантическому представлению:

L(A,P,N) = max(0, d(f(A), f(P)) - d(f(A), f(N)) + α)

Где:

A — опорный запрос
P — положительный образец (семантически сходный)
N — отрицательный образец (семантически несходный)
α — параметр границы

Итоговая функция потерь объединяет потерю кросс-энтропии и триплетную потерю:

L = L_CE + α · L_Triplet

3. Алгоритм послойного слияния моделей

Основная идея: динамическое распределение весов слияния на основе вклада каждого слоя в согласованность.

Процесс вычисления весов:

Извлечение активаций: извлечение активаций α_k^(l) каждого слоя l каждой модели k из набора разработки S_dev
Вычисление матриц сходства: вычисление матриц сходства активаций Σ_k^(l)
Построение эталонной матрицы: использование кодировщика предложений для построения эталонной матрицы сходства Σ_r
Вычисление расстояния: d_k^(l) = |Σ_k^(l) - Σ_r|
Нормализация весов: получение итоговых весов w_k^(l) посредством обратной нелинейной нормализации

Формула слияния:

θ_merged^(l) = θ_P^(l) + Σ_k w_k^(l) · Δθ_k^(l)

Технические инновации

Проектирование весов, ориентированное на согласованность: впервые предложен метод вычисления весов слияния моделей на основе сходства активаций послойных слоев
Разнообразная стратегия синтетических данных: методы генерации вариантов запросов, разработанные с учетом особенностей промышленных сценариев
Интеграция триплетной потери: применение триплетной потери из метрического обучения к тонкой настройке LLM для повышения качества семантического представления

Экспериментальная установка

Наборы данных

Базовые данные: 2 738 репрезентативных запросов с извлеченным контекстом, аннотированные экспертами в предметной области
Разделение данных: 1 421 обучающий образец, 1 317 тестовых образцов
Синтетические данные:
- 150 вариантов запросов "how to/do"
- 1 421 парафразированный запрос
- 952 варианта с изменением единственного/множественного числа и артиклей
Набор для тестирования согласованности: 1 579 вариантов (176 "how to/do", 912 парафраз, 491 изменение единственного/множественного числа)

Метрики оценки

Метрики точности:

ROUGE-L: мера перекрытия текста
BLEU (до 4-грамм): мера выравнивания словарного запаса

Метрики согласованности:

Точное совпадение (EM): полное совпадение строк
Сходство ответов (RS): определение семантической эквивалентности на основе порога ROUGE
Сходство BERT (BS): семантическое сходство на основе BERT

Методы сравнения

Базовые модели (Llama-3.1-8B-Instruct, Gemma-3-12B-Instruct)
Стандартная контролируемая тонкая настройка (SFT)
SFT + триплетная потеря
Специализированные модели для отдельных типов вариантов
Модель совместного обучения на всех данных

Детали реализации

Базовые модели: Llama-3.1-8B-Instruct и Gemma-3-12B-Instruct
Количество эпох обучения: 2
Построение триплетов: выборка из топ-10 и нижних 10 соседей в пространстве семантических признаков

Экспериментальные результаты

Основные результаты

Результаты для модели Llama-3.1-8B-Instruct:

Метод	ROUGE	BLEU	EM	RS	BS
Базовая модель	0.5123	0.2928	0.1051	0.2799	0.9246
Объединенная модель	0.5379	0.3380	0.2521	0.4129	0.9292

Ключевые находки:

Значительное повышение согласованности: улучшение EM на 139,87%, улучшение RS на 47,52%
Сохранение точности: ROUGE и BLEU остаются на конкурентном уровне
Оптимальный баланс: объединенная модель достигает оптимальных результатов по всем метрикам согласованности

Результаты для модели Gemma-3-12B-Instruct:

Аналогичные тенденции улучшения, подтверждающие универсальность метода
Более крупная модель показывает небольшое преимущество в точности, но закономерность улучшения согласованности остается неизменной

Абляционные исследования

Анализ вклада каждого компонента:

Эффект триплетной потери: по сравнению со стандартной SFT, улучшение EM на 73,4%, улучшение RS на 26,1%
Преимущества специализированных моделей: модели, обученные на одном типе вариантов, превосходят базовую модель как по точности, так и по согласованности
Эффект стратегии слияния: объединенная модель превосходит все отдельные модели по метрикам согласованности

Экспериментальные находки

Генератор vs поисковик: подтверждена гипотеза о том, что генератор более чувствителен к вариациям запросов, чем поисковик
Специализация vs универсальность: специализированные модели превосходят совместно обученные модели по точности, но совместно обученные модели лучше по согласованности
Влияние размера модели: более крупные модели не автоматически гарантируют лучшую согласованность

Связанные работы

Определение и оценка согласованности

Теоретическая база: основана на определении семантической эквивалентности Patwardhan et al.
Методы оценки: заимствованы из фреймворка оценки семантической согласованности Raj et al.
Автоматизированная оценка: ссылка на инструменты оценки согласованности Zhao et al.

Улучшение согласованности LLM

Инженерия подсказок: метод самосогласованности Wang et al.
Синтетические данные: методы многошагового подсказывания и синтетических данных Raj et al.
Методы ансамбля: методы ансамбля на основе логитов Wu et al.

Технологии слияния моделей

Базовые методы: алгоритм слияния DARE-TIES
Усреднение весов: ограничения традиционных методов слияния моделей
Операции в пространстве параметров: операции над разностями параметров, а не над абсолютными весами

Выводы и обсуждение

Основные выводы

Характеристика проблемы: успешное выявление и количественная оценка проблемы согласованности в промышленных системах RAG
Эффективность метода: предложенный метод послойного слияния значительно повышает согласованность выходных данных (улучшение на 47,5%)
Практическая ценность: предоставление практического решения для повышения надежности промышленных систем RAG

Ограничения

Ограничения по диапазону данных: эксперименты в основном основаны на промышленных данных, отсутствуют тесты на открытых эталонах
Предположение о поисковике: предполагается стабильность результатов поиска, не рассматривается несогласованность поиска
Диапазон моделей: проверка только на двух LLM, конфигурация гиперпараметров требует дальнейшего изучения

Направления будущих исследований

Построение открытого эталона: планируется построение и публикация эталона оценки согласованности
Согласованность поиска: расширение на проблему несогласованности поисковика
Адаптивное слияние: исследование методов динамической корректировки стратегии слияния
Проверка на разных доменах: верификация эффективности метода на большем количестве открытых наборов данных

Глубокая оценка

Преимущества

Высокая целевая направленность проблемы: прямое решение практических проблем промышленных систем RAG
Инновационность метода: новизна проектирования весов послойного слияния, осведомленного о согласованности
Полнота экспериментов: систематическая оценка на нескольких моделях и метриках
Высокая практическая ценность: улучшение согласованности на 47,5% имеет значительное практическое значение

Недостатки

Недостаточный теоретический анализ: отсутствие глубокого теоретического объяснения того, почему послойное слияние повышает согласованность
Отсутствие анализа вычислительных затрат: не проведен анализ вычислительной сложности вычисления послойных весов и процесса слияния
Ограниченная проверка способности к обобщению: проверка в основном в специфическом промышленном сценарии, способность к обобщению на разные домены требует доказательства
Ограничения эталонных данных: отсутствие проверки на стандартных открытых наборах данных

Влияние

Академический вклад: предоставление нового технического пути для исследований согласованности LLM
Промышленная ценность: прямое решение ключевых проблем при развертывании систем RAG
Воспроизводимость метода: относительно четкое описание алгоритма, обладающее хорошей воспроизводимостью
Вдохновение для последующих исследований: открытие новых направлений для исследований слияния моделей и оптимизации согласованности

Применимые сценарии

Сценарии с высокими требованиями к надежности: области финансов, здравоохранения, права и других, где согласованность критична
Развертывание промышленных систем RAG: системы вопросов и ответов в крупномасштабной производственной среде
Сценарии интеграции нескольких моделей: приложения, требующие интеграции знаний из нескольких специализированных моделей
Приложения, чувствительные к пользовательскому опыту: интерактивные системы со строгими требованиями к согласованности ответов

Библиография

В статье цитируются многие важные связанные работы, включая:

Lewis et al. (2020): основополагающая работа по фреймворку RAG
Yu et al. (2024), Yadav et al. (2023): методы слияния моделей DARE-TIES
Schroff et al. (2015): оригинальная работа по триплетной потере
Patwardhan et al. (2024): определение и анализ согласованности LLM

Общая оценка: это высококачественная прикладная исследовательская работа, ориентированная на решение практических промышленных проблем, с значительными вкладами как в методологическую инновацию, так и в практическую ценность. Хотя существует место для улучшения в теоретической глубине и проверке способности к обобщению, решаемая проблема имеет важное практическое значение, а предложенный метод обладает хорошей операциональностью и эффективностью.