FrameEOL: Semantic Frame Induction using Causal Language Models
Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
academic
FrameEOL : Induction de cadres sémantiques utilisant des modèles de langage causaux
L'induction de cadres sémantiques est la tâche de regrouper les cadres sémantiques évoqués par les mots déclencheurs de cadres. Récemment, les plongements de mots déclencheurs de cadres obtenus à partir de modèles de langage masqués (MLMs) tels que BERT ont atteint des performances élevées dans l'induction de cadres sémantiques. Bien que les modèles de langage causaux (CLMs) tels que les séries GPT et Llama aient connu du succès dans un large éventail de tâches de compréhension du langage et soient capables de discuter de la compréhension des cadres, ils n'ont pas encore été appliqués à l'induction de cadres sémantiques. Cet article propose FrameEOL, une nouvelle approche d'induction de cadres sémantiques basée sur les CLMs, qui est une méthode basée sur des invites pour obtenir des plongements de cadres qui produisent un nom de cadre comme étiquette. Pour obtenir des plongements mieux adaptés à l'induction de cadres, nous exploitons l'apprentissage en contexte (ICL) et l'apprentissage métrique profond (DML). Les résultats expérimentaux montrent que cette approche surpasse les méthodes existantes sur les ensembles de données FrameNet en anglais et en japonais. En particulier, pour le japonais, qui manque de ressources de cadres étendues, la méthode CLM utilisant seulement 5 exemples ICL atteint des performances comparables à la méthode MLM affinée avec DML.
L'induction de cadres sémantiques vise à résoudre comment identifier et regrouper automatiquement les instances de verbes qui évoquent le même cadre sémantique. Par exemple, le verbe « lost » peut évoquer différents cadres sémantiques dans différents contextes :
« He lost the gold medal by just .02 points » → cadre FINISH_COMPETITION
« He lost his gold medal at the restaurant » → cadre LOSING
Rareté des ressources: La construction manuelle de ressources de cadres sémantiques est extrêmement coûteuse, ce qui rend la construction automatique impérative
Besoins multilingues: Les ressources de cadres pour les langues autres que l'anglais sont extrêmement limitées
Adaptation au domaine: Les domaines spécifiques peuvent nécessiter différentes granularités de représentation des cadres
Bien que les CLMs modernes tels que GPT-4o démontrent la capacité à comprendre les cadres sémantiques (comme le montre l'exemple ChatGPT à la figure 1), ils n'ont pas encore été appliqués systématiquement à la tâche d'induction de cadres sémantiques. Cet article vise à combler cette lacune.
Première application des CLMs à l'induction de cadres sémantiques: Propose la méthode FrameEOL, extension de PromptEOL pour l'acquisition de plongements de cadres
Optimisation multi-stratégies: Combine l'apprentissage en contexte (ICL) et l'apprentissage métrique profond (DML) pour améliorer la qualité des plongements
Dépassement des méthodes existantes: Atteint les meilleures performances sur FrameNet en anglais, avec un score BcF de 71,9
Percée pour les langues à faibles ressources: Sur FrameNet en japonais, atteint des performances comparables à MLM affiné avec DML en utilisant seulement 5 exemples ICL
Validation bilingue: Valide l'efficacité de la méthode sur les ensembles de données en anglais et en japonais
Entrée: Ensemble de phrases contenant des verbes déclencheurs de cadres
Sortie: Regroupement des instances de verbes selon les cadres sémantiques évoqués
Contrainte: Aucun ensemble de labels de cadres prédéfini requis
Introduit la méthode ICL pour relever les défis des langues à faibles ressources :
Construction d'exemples:
The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.
The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is
Avantages: Améliore significativement les performances avec peu d'exemples (5-20), particulièrement adapté aux scénarios où les données d'entraînement sont rares.
Utilise la précision B-cubed (BCP), le rappel (BCR) et la mesure F (BCF) comme métriques d'évaluation principales, avec BCF comme critère d'évaluation principal.
Application réussie pour la première fois: Les CLMs peuvent être efficacement utilisés pour l'induction de cadres sémantiques, surpassant les méthodes MLM traditionnelles
Avantages pour les faibles ressources: La méthode ICL démontre un potentiel énorme dans les scénarios de données rares
Efficacité multilingue: La méthode atteint d'excellentes performances en anglais et en japonais
Cet article cite des travaux importants dans plusieurs domaines incluant les cadres sémantiques, l'apprentissage métrique profond et l'apprentissage basé sur des invites, fournissant une base théorique solide pour la conception de la méthode. Particulièrement dignes d'attention sont les travaux fondateurs de Yamada et al. (2021, 2023) sur l'induction de cadres basée sur MLM, ainsi que la méthode PromptEOL proposée par Jiang et al. (2024).
Évaluation générale: Ceci est un article de recherche de haute qualité qui introduit avec succès les modèles de langage causaux dans la tâche d'induction de cadres sémantiques, avec des contributions significatives en innovation méthodologique, validation expérimentale et valeur pratique. En particulier, la performance révolutionnaire dans les scénarios de langues à faibles ressources fournit une référence importante pour le développement du domaine connexe.