2025-11-19T19:10:14.291595

FrameEOL: Semantic Frame Induction using Causal Language Models

Yano, Yamada, Tsukagoshi et al.

Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.

academic

FrameEOL: 인과 언어 모델을 이용한 의미 프레임 유도

기본 정보

논문 ID: 2510.09097
제목: FrameEOL: Semantic Frame Induction using Causal Language Models
저자: Chihiro Yano¹, Kosuke Yamada¹'², Hayato Tsukagoshi¹, Ryohei Sasano¹, Koichi Takeda³
소속: ¹나고야 대학교, ²CyberAgent, ³국립정보학연구소
분류: cs.CL (계산언어학)
발표 시간: 2025년 10월 10일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.09097

초록

의미 프레임 유도는 프레임 활성화 단어가 유발하는 의미 프레임에 따라 이를 군집화하는 작업입니다. 최근 BERT와 같은 마스크 언어 모델(MLM)로부터 얻은 프레임 활성화 단어 임베딩이 의미 프레임 유도에서 높은 성능을 달성했습니다. GPT 및 Llama 시리즈와 같은 인과 언어 모델(CLM)이 광범위한 언어 이해 작업에서 성공을 거두었고 프레임 이해와 같은 대화를 수행할 수 있음에도 불구하고, 의미 프레임 유도에는 아직 적용되지 않았습니다. 본 논문은 CLM 기반의 의미 프레임 유도를 위한 새로운 방법인 FrameEOL을 제안합니다. 이는 프레임 이름을 레이블로 출력하는 프레임 임베딩을 획득하기 위한 프롬프트 기반 방법입니다. 프레임 유도에 더 적합한 임베딩을 획득하기 위해 문맥 내 학습(ICL)과 심층 메트릭 학습(DML)을 활용했습니다. 실험 결과는 영어 및 일본어 FrameNet 데이터셋에서 기존 방법을 능가하는 성능을 보여줍니다. 특히 광범위한 프레임 자원이 부족한 일본어의 경우, 단 5개의 ICL 예제만 사용하는 CLM 방법이 DML 미세조정을 사용한 MLM 방법과 동등한 성능을 달성했습니다.

연구 배경 및 동기

문제 정의

의미 프레임 유도는 동일한 의미 프레임을 유발하는 동사 인스턴스를 자동으로 식별하고 군집화하는 방법을 해결하는 것을 목표로 합니다. 예를 들어, 동사 "lost"는 다양한 문맥에서 다른 의미 프레임을 유발할 수 있습니다:

"He lost the gold medal by just .02 points" → FINISH_COMPETITION 프레임
"He lost his gold medal at the restaurant" → LOSING 프레임

연구의 중요성

자원 부족: 수작업으로 의미 프레임 자원을 구축하는 비용이 매우 크므로 자동 구축이 시급함
다국어 요구: 영어 외 다른 언어의 프레임 자원이 극히 제한적임
도메인 적응성: 특정 도메인에서는 다양한 입도의 프레임 표현이 필요할 수 있음

기존 방법의 한계

MLM 의존성: 기존 방법은 주로 BERT 등의 마스크 언어 모델에 기반함
자원 의존성: 효과적인 훈련을 위해 대량의 주석 데이터 필요
언어 제한: 저자원 언어에서 성능 부족

연구 동기

GPT-4o와 같은 현대 CLM이 의미 프레임 이해 능력을 보여주고 있음에도 불구하고(그림 1의 ChatGPT 예제 참조), 의미 프레임 유도 작업에 체계적으로 적용되지 않았습니다. 본 논문은 이러한 공백을 메우는 것을 목표로 합니다.

핵심 기여

CLM의 의미 프레임 유도 최초 적용: FrameEOL 방법 제안, 프레임 임베딩 획득을 위해 PromptEOL 확장
다중 전략 최적화: 문맥 내 학습(ICL)과 심층 메트릭 학습(DML)을 결합하여 임베딩 품질 향상
기존 방법 초과: 영어 FrameNet에서 최고 성능 달성, BcF 점수 71.9
저자원 언어 돌파: 일본어 FrameNet에서 단 5개의 ICL 예제만으로 DML 미세조정 MLM과 동등한 성능 달성
이중 언어 검증: 영어 및 일본어 데이터셋에서 방법의 유효성 검증

방법 상세 설명

작업 정의

입력: 프레임 활성화 동사를 포함하는 문장 집합 출력: 유발된 의미 프레임에 따라 동사 인스턴스를 군집화 제약: 미리 정의된 프레임 레이블 집합 불필요

모델 아키텍처

3.1 FrameEOL 핵심 방법

FrameEOL은 PromptEOL에서 영감을 받아 특별히 설계된 프롬프트 템플릿을 통해 프레임 임베딩을 획득합니다:

프롬프트 템플릿:

The FrameNet frame evoked by "[verb]" in "[sentence]" is

주요 설계:

[verb]: 프레임 활성화 동사 자리 표시자
[sentence]: 해당 동사를 포함하는 문장 자리 표시자
마지막 토큰 "is"의 최종 계층 임베딩을 프레임 임베딩으로 사용

3.2 문맥 내 학습 최적화(ICL)

저자원 언어 문제에 대응하기 위해 ICL 방법을 도입합니다:

예제 구성:

The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.

The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is

장점: 소수의 예제(5-20개)만으로도 성능을 크게 향상시킬 수 있으며, 특히 훈련 데이터가 부족한 상황에 적합합니다.

3.3 심층 메트릭 학습 최적화(DML)

삼중항 손실 함수를 사용하여 임베딩 공간을 최적화합니다:

$L_{tri} = \max(D(x_a, x_p) - D(x_a, x_n) + m, 0)$

여기서:

$x_a, x_p, x_n$ : 앵커, 양성 샘플, 음성 샘플의 프레임 임베딩
$D(\cdot, \cdot)$ : 정규화된 임베딩의 유클리드 거리
$m$ : 마진 매개변수

구현 세부사항:

LoRA를 사용한 매개변수 효율적 미세조정
LoRA rank r=8, α=32
20개 에포크 훈련, 배치 크기 32

기술 혁신점

프롬프트 설계 혁신: PromptEOL의 일반 문장 임베딩 방법을 프레임 임베딩 작업에 특화
이중 최적화 전략: ICL은 저자원 시나리오에 적합, DML은 지도 학습 시나리오에 적합
매개변수 효율적 훈련: LoRA를 사용하여 계산 자원 요구 감소
교차 언어 적응: 간단한 프롬프트 번역을 통해 다국어 지원 실현

실험 설정

데이터셋

영어 FrameNet 1.7

규모: 82,610개 인스턴스, 642개 프레임, 2,492개 동사
분할: 3-폴드 교차 검증, 평균 27,537개 훈련 인스턴스
특징: 테스트 집합에는 훈련 중 보지 못한 프레임 포함(평균 135.3/434.3)

일본어 FrameNet

규모: 3,130개 인스턴스, 344개 프레임, 766개 동사
분할: 3-폴드 교차 검증, 평균 1,043개 훈련 인스턴스
도전: 영어 데이터셋의 3.2%에 불과함

평가 지표

B-cubed 정확도(BCP), 재현율(BCR) 및 F값(BCF)을 주요 평가 지표로 사용하며, BCF를 주요 평가 기준으로 사용합니다.

비교 방법

MLM 기준선: BERTbase/large, ModernBERTbase/large, RoBERTalarge
군집화 방법: 1단계 군집화(그룹 평균) 및 2단계 군집화(X-means + 그룹 평균)
훈련 설정: 미세조정 없음 및 DML 미세조정 두 가지 구성

구현 세부사항

모델: Gemma 3-12B, Llama 3.1-8B 등
ICL 설정: 5/10/20개 예제, 최대 시퀀스 길이 2048
하이퍼매개변수: 학습률 {3e-5, 5e-5, 1e-4}, 마진 {0.1, 0.2, 0.5, 1.0}

실험 결과

주요 결과

영어 FrameNet 성능

모델	훈련 방법	1단계 군집화 BCF	2단계 군집화 BCF
RoBERTalarge + DML	DML	67.9	69.6
Gemma 3 + DML	DML	71.9	70.6
Llama 3.1 + DML	DML	70.8	70.9

주요 발견:

CLM+DML 방법이 최고 MLM 방법을 크게 능가
Gemma 3이 1단계 군집화에서 최고 71.9 BCF 달성
ICL 방법이 예제 수 증가에 따라 성능 향상

일본어 FrameNet 성능

모델	훈련 방법	1단계 군집화 BCF	2단계 군집화 BCF
Japanese ModernBERTbase + DML	DML	60.0	58.4
LLM-jp-3 + DML	DML	61.3	59.2
Llama 3.1 + ICL(5-shot)	ICL	59.9	57.4

중요 발견:

단 5개의 ICL 예제만으로 DML과 동등한 성능 달성
저자원 언어에서 CLM의 우위 증명

소거 실험

"FrameNet" 용어 영향 분석

프롬프트에서 "FrameNet" 용어를 제거한 경우 성능 영향이 제한적:

ICL 및 DML 설정에서 성능 저하 1% 미만
모델이 사전훈련의 FrameNet 지식에 단순히 의존하지 않음을 증명

실험 발견

CLM 우위: 충분한 훈련 데이터가 있을 때 CLM+DML이 MLM 방법을 크게 능가
ICL 잠재력: 소수의 예제만으로 경쟁력 있는 성능 획득, 특히 저자원 시나리오에 적합
군집화 전략: DML/ICL 최적화 후 1단계 군집화로 충분히 효과적
교차 언어 능력: CLM이 우수한 다국어 프레임 이해 능력 시연

결론 및 논의

주요 결론

최초 성공적 적용: CLM을 의미 프레임 유도에 효과적으로 사용할 수 있으며, 기존 MLM 방법을 능가하는 성능 달성
저자원 우위: ICL 방법이 데이터 부족 시나리오에서 거대한 잠재력 시연
교차 언어 유효성: 방법이 영어 및 일본어에서 모두 우수한 성능 달성

한계

계산 자원: 대규모 CLM은 상당한 계산 자원 필요
언어 범위: 영어 및 일본어에서만 검증, 다른 언어의 일반화 가능성 미지수
도메인 적응: 특정 도메인의 적용 가능성은 추가 검증 필요

향후 방향

다국어 확장: 더 많은 언어에서 방법의 유효성 검증
도메인 적응: 특정 도메인의 적용 효과 탐색
효율성 최적화: 더 효율적인 훈련 및 추론 방법 개발

심층 평가

장점

높은 혁신성: 의미 프레임 유도에 CLM을 체계적으로 최초 적용
완성된 방법: ICL 및 DML 두 가지 최적화 전략 제공, 다양한 자원 조건에 적응
충분한 실험: 두 가지 언어, 여러 모델에서 포괄적 평가 수행
실용적 가치: 저자원 언어의 프레임 구축을 위한 실행 가능한 솔루션 제공

부족한 점

이론적 분석: CLM이 이 작업에서 더 나은 성능을 보이는 이유에 대한 심층 이론적 설명 부족
계산 비용: MLM 방법과의 계산 비용 비교 충분히 논의되지 않음
오류 분석: 실패 사례에 대한 상세 분석 부족
일반화 가능성: FrameNet 데이터에서만 검증, 다른 프레임 자원의 적용 가능성 미지수

영향력

학술적 기여: 의미 프레임 연구에 새로운 기술 경로 개척
실용적 가치: 다국어 프레임 자원 구축을 위한 실용적 도구 제공
재현성: 상세한 실험 설정 및 하이퍼매개변수 구성 제공

적용 시나리오

저자원 언어: 프레임 자원이 부족한 언어
도메인 적응: 특정 도메인 프레임 구축이 필요한 경우
빠른 프로토타입: 프레임 시스템을 빠르게 구축해야 하는 응용

참고문헌

본 논문은 의미 프레임, 심층 메트릭 학습, 프롬프트 기반 학습 등 여러 분야의 중요한 연구를 인용하여 방법 설계에 견고한 이론적 기초를 제공합니다. 특히 Yamada et al. (2021, 2023)의 MLM 기반 프레임 유도 분야의 기초 연구와 Jiang et al. (2024)이 제안한 PromptEOL 방법이 주목할 만합니다.

전체 평가: 이는 인과 언어 모델을 의미 프레임 유도 작업에 성공적으로 도입한 고품질 연구 논문입니다. 방법 혁신, 실험 검증 및 실용적 가치 측면에서 모두 현저한 기여를 하고 있습니다. 특히 저자원 언어 시나리오에서의 획기적인 성능은 관련 분야의 발전에 중요한 참고 자료를 제공합니다.