FrameEOL: Semantic Frame Induction using Causal Language Models
Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
academic
FrameEOL: Induzione di Frame Semantici Utilizzando Modelli di Linguaggio Causali
L'induzione di frame semantici è il compito di raggruppare le parole che evocano frame in base ai frame semantici da esse evocati. Recentemente, gli embedding delle parole che evocano frame ottenuti utilizzando modelli di linguaggio mascherati (MLM) come BERT hanno raggiunto elevate prestazioni nell'induzione di frame semantici. Sebbene i modelli di linguaggio causali (CLM) come le serie GPT e Llama abbiano avuto successo in un'ampia gamma di compiti di comprensione del linguaggio e dimostrino di comprendere i frame in conversazioni, non sono ancora stati applicati all'induzione di frame semantici. Questo articolo propone FrameEOL, un nuovo metodo basato su CLM per l'induzione di frame semantici, un approccio basato su prompt per ottenere embedding di frame che producono un nome di frame come etichetta. Per ottenere embedding più adatti all'induzione di frame, utilizziamo l'apprendimento in contesto (ICL) e l'apprendimento metrico profondo (DML). I risultati sperimentali dimostrano che il metodo supera gli approcci esistenti sui dataset FrameNet in inglese e giapponese. In particolare, per il giapponese, dove mancano risorse di frame estese, il metodo CLM con soli 5 esempi ICL raggiunge prestazioni comparabili al metodo MLM con fine-tuning DML.
L'induzione di frame semantici mira a risolvere il problema di identificare e raggruppare automaticamente istanze di verbi che evocano lo stesso frame semantico. Ad esempio, il verbo "lost" in diversi contesti può evocare frame semantici differenti:
"He lost the gold medal by just .02 points" → frame FINISH_COMPETITION
"He lost his gold medal at the restaurant" → frame LOSING
Scarsità di Risorse: La costruzione manuale di risorse di frame semantici è estremamente costosa, rendendo la costruzione automatica un'esigenza urgente
Necessità Multilingue: Al di fuori dell'inglese, le risorse di frame per altre lingue sono estremamente limitate
Adattamento al Dominio: Domini specifici potrebbero richiedere rappresentazioni di frame con granularità diverse
Sebbene i CLM moderni come GPT-4o dimostrino la capacità di comprendere frame semantici (come mostrato nell'esempio di ChatGPT in Figura 1), non sono ancora stati sistematicamente applicati al compito di induzione di frame semantici. Questo articolo mira a colmare questa lacuna.
Prima Applicazione di CLM all'Induzione di Frame Semantici: Propone il metodo FrameEOL, estendendo PromptEOL per l'acquisizione di embedding di frame
Ottimizzazione Multi-Strategia: Combina l'apprendimento in contesto (ICL) e l'apprendimento metrico profondo (DML) per migliorare la qualità degli embedding
Superamento dei Metodi Esistenti: Raggiunge le migliori prestazioni su FrameNet in inglese, con un punteggio BcF di 71,9
Avanzamento nelle Lingue a Bassa Risorsa: Su FrameNet giapponese, con soli 5 esempi ICL raggiunge prestazioni comparabili al fine-tuning DML su MLM
Verifica Bilingue: Valida l'efficacia del metodo su dataset in inglese e giapponese
Input: Insieme di frasi contenenti verbi che evocano frame
Output: Raggruppamento di istanze di verbi in base ai frame semantici evocati
Vincoli: Non richiede un insieme predefinito di etichette di frame
Per affrontare le sfide delle lingue a bassa risorsa, introduciamo il metodo ICL:
Costruzione di Esempi:
The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.
The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is
Vantaggi: Attraverso un piccolo numero di esempi (5-20) è possibile migliorare significativamente le prestazioni, particolarmente adatto per scenari con dati di addestramento scarsi.
Utilizza la precisione B-cubed (BCP), il richiamo (BCR) e il punteggio F (BCF) come metriche di valutazione principali, con BCF come standard di valutazione principale.
Prima Applicazione di Successo: I CLM possono essere efficacemente utilizzati per l'induzione di frame semantici, con prestazioni superiori ai metodi MLM tradizionali
Vantaggi nelle Risorse Limitate: Il metodo ICL dimostra un enorme potenziale in scenari con dati scarsi
Efficacia Multilingue: Il metodo raggiunge prestazioni eccellenti sia in inglese che in giapponese
Questo articolo cita importanti lavori in molteplici aree inclusi frame semantici, apprendimento metrico profondo e apprendimento basato su prompt, fornendo una base teorica solida per la progettazione del metodo. Particolarmente degni di nota sono i lavori fondamentali di Yamada et al. (2021, 2023) nell'induzione di frame basata su MLM, e il metodo PromptEOL proposto da Jiang et al. (2024).
Valutazione Complessiva: Questo è un articolo di ricerca di alta qualità che introduce con successo i modelli di linguaggio causali al compito di induzione di frame semantici, con contributi significativi in innovazione metodologica, verifica sperimentale e valore pratico. In particolare, le prestazioni rivoluzionarie in scenari di lingue a bassa risorsa forniscono importanti riferimenti per lo sviluppo del campo correlato.