FrameEOL: Semantic Frame Induction using Causal Language Models
Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
의미 프레임 유도는 프레임 활성화 단어가 유발하는 의미 프레임에 따라 이를 군집화하는 작업입니다. 최근 BERT와 같은 마스크 언어 모델(MLM)로부터 얻은 프레임 활성화 단어 임베딩이 의미 프레임 유도에서 높은 성능을 달성했습니다. GPT 및 Llama 시리즈와 같은 인과 언어 모델(CLM)이 광범위한 언어 이해 작업에서 성공을 거두었고 프레임 이해와 같은 대화를 수행할 수 있음에도 불구하고, 의미 프레임 유도에는 아직 적용되지 않았습니다. 본 논문은 CLM 기반의 의미 프레임 유도를 위한 새로운 방법인 FrameEOL을 제안합니다. 이는 프레임 이름을 레이블로 출력하는 프레임 임베딩을 획득하기 위한 프롬프트 기반 방법입니다. 프레임 유도에 더 적합한 임베딩을 획득하기 위해 문맥 내 학습(ICL)과 심층 메트릭 학습(DML)을 활용했습니다. 실험 결과는 영어 및 일본어 FrameNet 데이터셋에서 기존 방법을 능가하는 성능을 보여줍니다. 특히 광범위한 프레임 자원이 부족한 일본어의 경우, 단 5개의 ICL 예제만 사용하는 CLM 방법이 DML 미세조정을 사용한 MLM 방법과 동등한 성능을 달성했습니다.
The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.
The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is
장점: 소수의 예제(5-20개)만으로도 성능을 크게 향상시킬 수 있으며, 특히 훈련 데이터가 부족한 상황에 적합합니다.
본 논문은 의미 프레임, 심층 메트릭 학습, 프롬프트 기반 학습 등 여러 분야의 중요한 연구를 인용하여 방법 설계에 견고한 이론적 기초를 제공합니다. 특히 Yamada et al. (2021, 2023)의 MLM 기반 프레임 유도 분야의 기초 연구와 Jiang et al. (2024)이 제안한 PromptEOL 방법이 주목할 만합니다.
전체 평가: 이는 인과 언어 모델을 의미 프레임 유도 작업에 성공적으로 도입한 고품질 연구 논문입니다. 방법 혁신, 실험 검증 및 실용적 가치 측면에서 모두 현저한 기여를 하고 있습니다. 특히 저자원 언어 시나리오에서의 획기적인 성능은 관련 분야의 발전에 중요한 참고 자료를 제공합니다.