FrameEOL: Semantic Frame Induction using Causal Language Models
Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
Die semantische Rahmeninduktion ist eine Aufgabe, bei der Rahmenauslöser-Wörter entsprechend ihrer semantischen Rahmen gruppiert werden. In jüngster Zeit haben Rahmenauslöser-Einbettungen, die mit maskierten Sprachmodellen (MLMs) wie BERT gewonnen wurden, hohe Leistungen bei der semantischen Rahmeninduktion erzielt. Obwohl kausale Sprachmodelle (CLMs) wie GPT und Llama-Serien bei einer Vielzahl von Sprachverständnisaufgaben erfolgreich sind und Rahmen wie in Gesprächen verstehen können, wurden sie bisher nicht auf die semantische Rahmeninduktion angewendet. Dieser Artikel schlägt FrameEOL vor, eine neue Methode zur semantischen Rahmeninduktion basierend auf CLMs, die ein prompt-basierter Ansatz ist, um Rahmeneinbettungen zu erhalten, die einen Rahmennamen als Etikett ausgeben. Um Einbettungen zu erhalten, die besser für die Rahmeninduktion geeignet sind, nutzen wir In-Context Learning (ICL) und Deep Metric Learning (DML). Experimentelle Ergebnisse zeigen, dass die Methode bestehende Methoden auf englischen und japanischen FrameNet-Datensätzen übertrifft. Besonders für Japanisch, das über begrenzte Rahmenressourcen verfügt, erreicht die CLM-Methode mit nur 5 ICL-Beispielen eine Leistung, die mit der DML-mikrogestimmten MLM-Methode vergleichbar ist.
Die semantische Rahmeninduktion zielt darauf ab, automatisch zu erkennen und zu gruppieren, welche Verbinstanzen denselben semantischen Rahmen auslösen. Beispielsweise kann das Verb „lost" in verschiedenen Kontexten unterschiedliche semantische Rahmen auslösen:
"He lost the gold medal by just .02 points" → FINISH_COMPETITION-Rahmen
"He lost his gold medal at the restaurant" → LOSING-Rahmen
Obwohl moderne CLMs wie GPT-4o die Fähigkeit zeigen, semantische Rahmen zu verstehen (wie in Abbildung 1 gezeigtes ChatGPT-Beispiel), wurden sie bisher nicht systematisch auf die Aufgabe der semantischen Rahmeninduktion angewendet. Dieser Artikel zielt darauf ab, diese Lücke zu schließen.
Erstmalige Anwendung von CLMs auf semantische Rahmeninduktion: Vorschlag der FrameEOL-Methode, Erweiterung von PromptEOL zur Rahmeneinbettungsgewinnung
Multi-Strategie-Optimierung: Kombination von In-Context Learning (ICL) und Deep Metric Learning (DML) zur Verbesserung der Einbettungsqualität
Überwindung bestehender Methoden: Erreichung der besten Leistung auf englischem FrameNet mit BcF-Score von 71,9
Durchbruch bei Sprachen mit geringen Ressourcen: Auf japanischem FrameNet erreicht die Methode mit nur 5 ICL-Beispielen eine Leistung, die mit DML-mikrogestimmtem MLM vergleichbar ist
Zweisprachige Validierung: Validierung der Methodeneffektivität auf englischen und japanischen Datensätzen
Eingabe: Menge von Sätzen mit Rahmenauslöser-Verben
Ausgabe: Gruppierung von Verbinstanzen nach ihren ausgelösten semantischen Rahmen
Einschränkung: Keine vordefinierten Rahmenetikett-Mengen erforderlich
Zur Bewältigung von Herausforderungen bei Sprachen mit geringen Ressourcen wird die ICL-Methode eingeführt:
Beispielkonstruktion:
The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.
The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is
Vorteile: Durch wenige Beispiele (5-20) kann die Leistung erheblich verbessert werden, besonders geeignet für Szenarien mit knappen Trainingsdaten.
Erstmalige erfolgreiche Anwendung: CLMs können effektiv für die semantische Rahmeninduktion eingesetzt werden und übertreffen traditionelle MLM-Methoden
Vorteile bei geringen Ressourcen: ICL-Methode zeigt enormes Potenzial in datenknappen Szenarien
Sprachübergreifende Effektivität: Methode zeigt hervorragende Leistung auf Englisch und Japanisch
Dieser Artikel zitiert wichtige Arbeiten aus mehreren Bereichen wie semantische Rahmen, Deep Metric Learning und Prompt-basiertes Lernen und bietet eine solide theoretische Grundlage für das Methodendesign. Besonders hervorzuheben sind die grundlegenden Arbeiten von Yamada et al. (2021, 2023) zur MLM-basierten Rahmeninduktion sowie die von Jiang et al. (2024) vorgeschlagene PromptEOL-Methode.
Gesamtbewertung: Dies ist ein hochqualitatives Forschungspapier, das kausale Sprachmodelle erfolgreich in die Aufgabe der semantischen Rahmeninduktion einführt und in Bezug auf methodische Innovation, experimentelle Validierung und praktischen Wert erhebliche Beiträge leistet. Besonders der Durchbruch bei Sprachen mit geringen Ressourcen bietet wichtige Referenzen für die Entwicklung verwandter Bereiche.