FrameEOL: Semantic Frame Induction using Causal Language Models
Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
academic
FrameEOL: استحثاث الإطارات الدلالية باستخدام نماذج اللغة السببية
استحثاث الإطارات الدلالية هو مهمة تجميع الكلمات المثيرة للإطارات وفقاً للإطارات الدلالية التي تستحثها. حققت التضمينات المستخرجة من نماذج اللغة المقنعة (MLMs) مثل BERT أداءً عالياً في استحثاث الإطارات الدلالية في السنوات الأخيرة. على الرغم من نجاح نماذج اللغة السببية (CLMs) مثل سلاسل GPT و Llama في مهام فهم اللغة الواسعة وقدرتها على فهم الإطارات كما في الحوارات، إلا أنها لم تُطبّق بعد على استحثاث الإطارات الدلالية. تقترح هذه الورقة FrameEOL، وهي طريقة جديدة لاستحثاث الإطارات الدلالية قائمة على CLMs، وهي طريقة قائمة على المحفزات للحصول على تضمينات الإطارات التي تُخرج اسم إطار كعلامة. للحصول على تضمينات أكثر ملاءمة لاستحثاث الإطارات، نستفيد من التعلم السياقي (ICL) والتعلم المتري العميق (DML). تُظهر النتائج التجريبية أن الطريقة تتفوق على الطرق الموجودة على مجموعات بيانات FrameNet الإنجليزية واليابانية. بشكل خاص، بالنسبة للغة اليابانية التي تفتقر إلى موارد إطارات واسعة، حققت طريقة CLM باستخدام 5 أمثلة ICL فقط أداءً مماثلاً لطريقة MLM المضبوطة بـ DML.
يهدف استحثاث الإطارات الدلالية إلى حل كيفية التعرف التلقائي وتجميع حالات الأفعال التي تستحث نفس الإطار الدلالي. على سبيل المثال، قد يستحث الفعل "lost" في سياقات مختلفة إطارات دلالية مختلفة:
"He lost the gold medal by just .02 points" → إطار FINISH_COMPETITION
"He lost his gold medal at the restaurant" → إطار LOSING
على الرغم من أن نماذج اللغة السببية الحديثة مثل GPT-4o تُظهر قدرة على فهم الإطارات الدلالية (كما هو موضح في مثال ChatGPT في الشكل 1)، إلا أنها لم تُطبّق بشكل منهجي على مهمة استحثاث الإطارات الدلالية. تهدف هذه الورقة إلى سد هذه الفجوة.
الإدخال: مجموعة من الجمل تحتوي على أفعال مثيرة للإطارات
الإخراج: تجميع حالات الأفعال وفقاً للإطارات الدلالية المستحثة
القيود: لا حاجة لمجموعة محددة مسبقاً من علامات الإطارات
لمعالجة تحديات اللغات منخفضة الموارد، يتم إدخال طريقة ICL:
بناء الأمثلة:
The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.
The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is
المزايا: تحسين الأداء بشكل كبير من خلال عدد قليل من الأمثلة (5-20)، وهو مناسب بشكل خاص للسيناريوهات التي تفتقر إلى بيانات التدريب.
تستشهد هذه الورقة بأعمال مهمة من عدة مجالات تشمل الإطارات الدلالية والتعلم المتري العميق والتعلم القائم على المحفزات، مما يوفر أساساً نظرياً متيناً لتصميم الطريقة. من الجدير بالملاحظة بشكل خاص أعمال Yamada et al. (2021, 2023) الأساسية في استحثاث الإطارات القائم على MLM، وطريقة PromptEOL المقترحة من قبل Jiang et al. (2024).
التقييم الشامل: هذه ورقة بحثية عالية الجودة نجحت في إدخال نماذج اللغة السببية إلى مهمة استحثاث الإطارات الدلالية، مع مساهمات كبيرة في الابتكار الطريقة والتحقق التجريبي والقيمة العملية. الأداء الرائدة بشكل خاص في السيناريوهات منخفضة الموارد توفر مرجعاً مهماً لتطوير المجالات ذات الصلة.