2025-11-12T19:43:10.253640

Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation

Peng, Kumar, Wu et al.

Retrieval-Augmented Generation (RAG) systems leverage Large Language Models (LLMs) to generate accurate and reliable responses that are grounded in retrieved context. However, LLMs often generate inconsistent outputs for semantically equivalent inputs, a problem compounded by the scarcity of consistency-focused training data and the limitations of current fine-tuning techniques in enhancing output consistency. We propose a new approach combining systematic synthetic data generation, triplet loss for better embeddings, and a novel layer-wise model merging approach. Using consistency-aware weights derived from intermediate layer activations, our method effectively integrates knowledge from specialized models. Experimental results how that our merged model significantly enhances output consistency, achieving a ~47.5\% improvement in response similarity over the baseline, thus offering a practical solution for increasing the reliability of an industrial RAG system.

academic

다양한 모델의 조화: 일관된 생성을 위한 계층별 병합 전략

기본 정보

논문 ID: 2510.14915
제목: Harmonizing Diverse Models: A Layer-wise Merging Strategy for Consistent Generation
저자: Xujun Peng, Anoop Kumar, Jingyu Wu, Parker Glenn, Daben Liu (Capital One AI Foundations)
분류: cs.CL (전산 언어학)
발표 시간: 2025년 10월 16일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.14915

초록

검색 증강 생성(RAG) 시스템은 대규모 언어 모델(LLMs)을 활용하여 검색된 맥락을 기반으로 정확하고 신뢰할 수 있는 응답을 생성합니다. 그러나 LLMs는 의미론적으로 동등한 입력에 직면할 때 종종 불일치한 출력을 생성하며, 이 문제는 일관성 지향 훈련 데이터의 부족과 현재 미세 조정 기술의 출력 일관성 강화 측면의 한계로 인해 악화됩니다. 본 논문은 체계적인 합성 데이터 생성, 삼중항 손실 및 새로운 계층별 모델 병합을 결합한 방법을 제안합니다. 중간층 활성화에서 도출된 일관성 인식 가중치를 사용함으로써, 이 방법은 특화된 모델의 지식을 효과적으로 통합합니다. 실험 결과는 병합 모델이 출력 일관성을 크게 향상시켰으며, 응답 유사성에서 기준선 대비 47.5%의 개선을 달성했음을 보여줍니다.

연구 배경 및 동기

문제 정의

본 연구가 해결하는 핵심 문제는 RAG 시스템의 생성 모델의 출력 일관성 문제입니다. 구체적으로 다음과 같이 나타납니다:

의미론적으로 동등한 쿼리가 서로 다른 응답을 생성: 그림 1에서 보듯이, 물음표의 존재 여부만으로도 RAG 시스템이 완전히 다른 답변을 제공할 수 있습니다
산업 배포의 실제 과제: 프로덕션 환경에서 사용자 쿼리의 다양한 변형은 시스템 신뢰성에 위협이 됩니다

문제의 중요성

신뢰성 요구사항: 금융, 의료 등 고위험 분야에서 불일치한 응답은 사용자 신뢰에 심각한 영향을 미칩니다
실제 영향: 논문은 실증적 관찰을 통해 검색기에 비해 생성기가 쿼리 변화에 더 민감함을 발견했습니다
시스템 안정성: 출력 불일치는 산업 환경에서 RAG 시스템 채택에 직접적인 영향을 미칩니다

기존 방법의 한계

훈련 데이터 부족: 일관성을 위한 전문화된 훈련 데이터 부족
미세 조정 기술의 제한: 전통적인 미세 조정 방법은 출력 일관성 향상 측면에서 효과가 제한적입니다
평가 기준 부재: 전문화된 일관성 평가 기준 및 데이터셋 부재

핵심 기여

쿼리 변형 분류: 산업용 RAG 시스템의 응답 불일치를 야기하는 쿼리 변형 유형을 체계적으로 식별 및 분류
일관성 측정 체계: 정확 일치(EM), 응답 유사성(RS), BERT 유사성(BS)을 포함한 일관성 평가 지표 수립
계층별 모델 병합 방법: 일관성 인식 가중치 기반의 새로운 계층별 모델 병합 전략 제안
종합적 해결책: 합성 데이터 생성, 삼중항 손실 훈련 및 모델 병합을 통합한 완전한 방법론

방법 상세 설명

작업 정의

원본 쿼리 Q와 그 의미론적으로 동등한 변형 Q'이 주어졌을 때, RAG 시스템의 생성기가 두 쿼리에 대해 일관된 응답 S와 S'을 생성하도록 하는 것이 목표입니다. 즉, S와 S' 사이의 의미론적 유사성을 최대화하면서 응답의 정확성을 유지합니다.

모델 아키텍처

1. 합성 데이터 생성 전략

프로덕션 쿼리 분석을 기반으로 세 가지 주요 변형을 식별합니다:

How to/do 변형:

방법론적 질문의 재표현
정규식 규칙을 사용한 체계적 생성

단수/복수 및 관사 변형:

명사 수량 변화("apple" vs "apples")
관사 사용 변화("a", "an", "the")
단수/복수 형식 및 관사 무작위 교환

의미론적 변형:

핵심 의미를 유지하면서 다른 어휘를 사용한 변화
Llama-3.1-70B-Instruct를 활용한 의역 생성

2. 삼중항 손실 훈련

모델의 의미론적 표현 능력을 강화하기 위해 삼중항 손실을 도입합니다:

L(A,P,N) = max(0, d(f(A), f(P)) - d(f(A), f(N)) + α)

여기서:

A는 앵커 쿼리
P는 긍정 샘플(의미론적으로 유사)
N은 부정 샘플(의미론적으로 유사하지 않음)
α는 여유 매개변수

최종 손실 함수는 교차 엔트로피 손실과 삼중항 손실을 결합합니다:

L = L_CE + α · L_Triplet

3. 계층별 모델 병합 알고리즘

핵심 개념: 각 계층의 일관성 기여도에 따라 동적으로 병합 가중치를 할당합니다.

가중치 계산 프로세스:

활성화 추출: 개발 집합 S_dev에서 각 모델 k의 각 계층 l의 활성화 α_k^(l) 추출
유사성 행렬 계산: 활성화의 유사성 행렬 Σ_k^(l) 계산
참조 행렬 구성: 문장 인코더를 사용하여 참조 유사성 행렬 Σ_r 구성
거리 계산: d_k^(l) = |Σ_k^(l) - Σ_r|
가중치 정규화: 역 비선형 정규화를 통해 최종 가중치 w_k^(l) 획득

병합 공식:

θ_merged^(l) = θ_P^(l) + Σ_k w_k^(l) · Δθ_k^(l)

기술 혁신 포인트

일관성 지향 가중치 설계: 계층별 활성화 유사성 기반의 모델 병합 가중치 계산 방법을 처음으로 제안
다양한 합성 데이터 전략: 산업 시나리오의 특성을 고려한 쿼리 변형 생성 방법
삼중항 손실 통합: 메트릭 학습의 삼중항 손실을 LLM 미세 조정에 도입하여 의미론적 표현 품질 향상

실험 설정

데이터셋

기본 데이터: 영역 전문가가 주석을 단 2,738개의 대표적 쿼리 및 검색 맥락
데이터 분할: 1,421개 훈련 샘플, 1,317개 테스트 샘플
합성 데이터:
- 150개의 "how to/do" 변형 쿼리
- 1,421개의 의역 쿼리
- 952개의 단수/복수 및 관사 변형 쿼리
일관성 테스트 집합: 1,579개 변형(176개 "how to/do", 912개 의역, 491개 단수/복수/관사 변화)

평가 지표

정확성 지표:

ROUGE-L: 텍스트 중복 측정
BLEU(최대 4-gram): 어휘 정렬 측정

일관성 지표:

정확 일치(EM): 문자열 완전 일치
응답 유사성(RS): ROUGE 임계값 기반의 의미론적 동등성 판단
BERT 유사성(BS): BERT 기반의 의미론적 유사도

비교 방법

기준선 모델(Llama-3.1-8B-Instruct, Gemma-3-12B-Instruct)
표준 감독 미세 조정(SFT)
SFT + 삼중항 손실
단일 변형 유형 특화 모델
모든 데이터 결합 훈련 모델

구현 세부사항

기본 모델: Llama-3.1-8B-Instruct 및 Gemma-3-12B-Instruct
훈련 에포크: 2개
삼중항 구성: 의미론적 특성 공간의 상위 10개 및 하위 10개 근처에서 샘플링

실험 결과

주요 결과

Llama-3.1-8B-Instruct 모델 결과:

방법	ROUGE	BLEU	EM	RS	BS
기준선	0.5123	0.2928	0.1051	0.2799	0.9246
병합 모델	0.5379	0.3380	0.2521	0.4129	0.9292

주요 발견:

일관성 현저한 향상: EM 139.87% 향상, RS 47.52% 향상
정확성 유지: ROUGE 및 BLEU 경쟁력 있는 수준 유지
최적 균형: 병합 모델이 모든 일관성 지표에서 최고 성능 달성

Gemma-3-12B-Instruct 모델 결과:

유사한 개선 추세로 방법의 보편성 검증
더 큰 모델이 정확성에서 약간의 이점을 보이지만, 일관성 개선 패턴은 일치

제거 실험

각 구성 요소 기여도 분석:

삼중항 손실 효과: 표준 SFT 대비 EM 73.4% 향상, RS 26.1% 향상
특화 모델의 장점: 단일 변형 훈련 모델이 정확성과 일관성 모두에서 기준선 초과
병합 전략 효과: 병합 모델이 모든 단일 모델을 일관성 지표에서 초과

실험 발견

생성기 vs 검색기: 생성기가 검색기보다 쿼리 변화에 더 민감하다는 가설 검증
특화 vs 범용: 특화 모델이 정확성에서 결합 훈련 모델보다 우수하지만, 결합 훈련이 일관성에서 더 우수
모델 규모 영향: 더 큰 모델이 자동으로 더 나은 일관성을 보장하지는 않음

결론 및 논의

주요 결론

문제 표현: 산업용 RAG 시스템의 일관성 문제를 성공적으로 식별 및 정량화
방법 유효성: 제안된 계층별 병합 방법이 출력 일관성을 크게 향상(47.5% 개선)
실용적 가치: 산업용 RAG 시스템에 신뢰성 향상을 위한 실질적인 솔루션 제공

한계

데이터 범위 제한: 실험이 주로 산업 데이터 기반으로 공개 벤치마크 테스트 부족
검색기 가정: 검색기 결과가 안정적이라고 가정하며 검색 불일치 미포함
모델 범위: 두 개의 LLM에서만 검증되었으며 초매개변수 구성 추가 탐색 필요

향후 방향

공개 벤치마크 구축: 일관성 평가 벤치마크 구축 및 공개 계획
검색 일관성: 검색기 불일치 문제로 확장
적응형 병합: 병합 전략을 동적으로 조정하는 방법 탐색
교차 도메인 검증: 더 많은 공개 데이터셋에서 방법 유효성 검증

심층 평가

장점

문제 지향성 강함: 산업용 RAG 시스템의 실제 문제점을 직접 해결
방법 혁신성: 계층별 일관성 인식 가중치 설계의 새로운 성격
실험 포괄성: 다양한 모델, 다중 지표를 포함한 체계적 평가
실용적 가치 높음: 47.5%의 일관성 향상은 현저한 실용적 의의

부족한 점

이론 분석 부족: 계층별 병합이 일관성을 향상시키는 이유에 대한 심층 이론적 설명 부재
계산 오버헤드 분석 누락: 계층별 가중치 계산 및 병합 프로세스의 계산 복잡도 분석 미흡
일반화 능력 검증 제한: 주로 특정 산업 시나리오에서 검증되었으며 교차 도메인 일반화 능력 미증명
벤치마크 데이터 한계: 표준 공개 데이터셋에서의 검증 부족

영향력

학술적 기여: LLM 일관성 연구에 새로운 기술 경로 제공
산업적 가치: RAG 시스템 배포의 핵심 문제 직접 해결
방법 재현성: 알고리즘 설명이 상대적으로 명확하여 재현 가능성 보유
후속 연구 영감: 모델 병합 및 일관성 최적화를 위한 새로운 방향 개척

적용 시나리오

높은 신뢰성 요구 시나리오: 금융, 의료, 법률 등 일관성 요구도가 극히 높은 분야
산업용 RAG 배포: 대규모 프로덕션 환경의 질의응답 시스템
다중 모델 통합 시나리오: 여러 특화 모델의 지식을 통합해야 하는 응용
사용자 경험 민감 응용: 응답 일관성에 엄격한 요구사항이 있는 상호작용 시스템

참고문헌

논문은 다음을 포함한 여러 중요한 관련 연구를 인용합니다:

Lewis et al. (2020): RAG 프레임워크의 기초 연구
Yu et al. (2024), Yadav et al. (2023): DARE-TIES 모델 병합 방법
Schroff et al. (2015): 삼중항 손실의 원본 연구
Patwardhan et al. (2024): LLM 일관성의 정의 및 분석

전체 평가: 이는 실제 산업 문제를 다루는 고품질 응용 연구 논문으로, 방법 혁신성과 실용적 가치 측면에서 모두 현저한 기여를 하고 있습니다. 이론적 깊이와 일반화 검증 측면에서 개선의 여지가 있지만, 해결하는 문제의 중요한 실제 의의와 제안된 방법의 우수한 조작성 및 유효성을 고려할 때 가치 있는 연구입니다.