2025-11-19T19:10:14.291595

FrameEOL: Semantic Frame Induction using Causal Language Models

Yano, Yamada, Tsukagoshi et al.
Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.
academic

FrameEOL: Inducción de Marcos Semánticos Utilizando Modelos de Lenguaje Causal

Información Básica

  • ID del Artículo: 2510.09097
  • Título: FrameEOL: Semantic Frame Induction using Causal Language Models
  • Autores: Chihiro Yano¹, Kosuke Yamada¹'², Hayato Tsukagoshi¹, Ryohei Sasano¹, Koichi Takeda³
  • Instituciones: ¹Universidad de Nagoya, ²CyberAgent, ³Instituto Nacional de Informática
  • Clasificación: cs.CL (Lingüística Computacional)
  • Fecha de Publicación: 10 de octubre de 2025 (preimpresión arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.09097

Resumen

La inducción de marcos semánticos es la tarea de agrupar palabras que evocan marcos semánticos según los marcos que despiertan. Recientemente, los incrustamientos de palabras que evocan marcos obtenidos mediante modelos de lenguaje enmascarados (MLMs) como BERT han logrado un alto rendimiento en la inducción de marcos semánticos. Aunque los modelos de lenguaje causal (CLMs) como las series GPT y Llama han tenido éxito en una amplia gama de tareas de comprensión del lenguaje y pueden comprender marcos en conversaciones, aún no se han aplicado a la inducción de marcos semánticos. Este artículo propone FrameEOL, un nuevo método de inducción de marcos semánticos basado en CLMs, que es un método basado en indicaciones para obtener incrustamientos de marcos que generan un nombre de marco como etiqueta. Para obtener incrustamientos más adecuados para la inducción de marcos, utilizamos aprendizaje en contexto (ICL) y aprendizaje de métricas profundas (DML). Los resultados experimentales demuestran que el método supera los métodos existentes en los conjuntos de datos de FrameNet en inglés y japonés. Particularmente para el japonés, que carece de recursos de marcos extensos, el método CLM utilizando solo 5 ejemplos de ICL logra un rendimiento comparable al del método MLM ajustado con DML.

Antecedentes de Investigación y Motivación

Definición del Problema

La inducción de marcos semánticos tiene como objetivo resolver cómo identificar y agrupar automáticamente instancias de verbos que comparten el mismo marco semántico. Por ejemplo, el verbo "lost" en diferentes contextos puede evocar diferentes marcos semánticos:

  • "He lost the gold medal by just .02 points" → marco FINISH_COMPETITION
  • "He lost his gold medal at the restaurant" → marco LOSING

Importancia de la Investigación

  1. Escasez de Recursos: La construcción manual de recursos de marcos semánticos es enormemente costosa, lo que hace que la construcción automática sea una necesidad urgente
  2. Necesidades Multilingües: Fuera del inglés, los recursos de marcos en otros idiomas son extremadamente limitados
  3. Adaptación de Dominio: Dominios específicos pueden requerir representaciones de marcos con diferentes granularidades

Limitaciones de Métodos Existentes

  1. Dependencia de MLMs: Los métodos existentes se basan principalmente en modelos de lenguaje enmascarados como BERT
  2. Dependencia de Recursos: Requieren grandes cantidades de datos anotados para un entrenamiento efectivo
  3. Limitaciones Lingüísticas: Rendimiento deficiente en idiomas de bajos recursos

Motivación de la Investigación

Aunque los CLMs modernos como GPT-4o demuestran la capacidad de comprender marcos semánticos (como se muestra en el ejemplo de ChatGPT en la Figura 1), aún no se han aplicado sistemáticamente a la tarea de inducción de marcos semánticos. Este artículo tiene como objetivo llenar este vacío.

Contribuciones Principales

  1. Primera Aplicación de CLMs a la Inducción de Marcos Semánticos: Propone el método FrameEOL, extendiendo PromptEOL para la obtención de incrustamientos de marcos
  2. Optimización Multiestratégica: Combina aprendizaje en contexto (ICL) y aprendizaje de métricas profundas (DML) para mejorar la calidad de los incrustamientos
  3. Superación de Métodos Existentes: Logra el mejor rendimiento en FrameNet en inglés, con una puntuación BcF de 71.9
  4. Avance en Idiomas de Bajos Recursos: En FrameNet en japonés, con solo 5 ejemplos de ICL se logra un rendimiento comparable al del MLM ajustado con DML
  5. Validación Bilingüe: Verifica la efectividad del método en conjuntos de datos en inglés y japonés

Explicación Detallada del Método

Definición de la Tarea

Entrada: Conjunto de oraciones que contienen verbos que evocan marcos Salida: Agrupación de instancias de verbos según los marcos semánticos que despiertan Restricción: No requiere un conjunto predefinido de etiquetas de marcos

Arquitectura del Modelo

3.1 Método Principal de FrameEOL

FrameEOL se inspira en PromptEOL, obteniendo incrustamientos de marcos mediante plantillas de indicaciones especialmente diseñadas:

Plantilla de Indicación:

The FrameNet frame evoked by "[verb]" in "[sentence]" is

Diseños Clave:

  • [verb]: Marcador de posición del verbo que evoca el marco
  • [sentence]: Marcador de posición de la oración que contiene el verbo
  • Se utiliza el incrustamiento de la capa final del último token "is" como incrustamiento del marco

3.2 Optimización de Aprendizaje en Contexto (ICL)

Para abordar los desafíos de idiomas de bajos recursos, se introduce el método ICL:

Construcción de Ejemplos:

The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.

The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is

Ventajas: Mediante una pequeña cantidad de ejemplos (5-20) se puede mejorar significativamente el rendimiento, siendo particularmente adecuado para escenarios con datos de entrenamiento escasos.

3.3 Optimización de Aprendizaje de Métricas Profundas (DML)

Se adopta la función de pérdida de tripletes para optimizar el espacio de incrustamientos:

Ltri=max(D(xa,xp)D(xa,xn)+m,0)L_{tri} = \max(D(x_a, x_p) - D(x_a, x_n) + m, 0)

Donde:

  • xa,xp,xnx_a, x_p, x_n: Incrustamientos de marcos de punto de anclaje, muestra positiva y muestra negativa
  • D(,)D(\cdot, \cdot): Distancia euclidiana de incrustamientos normalizados
  • mm: Parámetro de margen

Detalles de Implementación:

  • Se utiliza LoRA para ajuste fino eficiente en parámetros
  • Rango de LoRA r=8, α=32
  • Entrenamiento durante 20 épocas, tamaño de lote 32

Puntos de Innovación Técnica

  1. Innovación en Diseño de Indicaciones: Especializa el método de incrustamiento de oraciones genérico de PromptEOL para la tarea de incrustamiento de marcos
  2. Estrategia de Optimización Dual: ICL es adecuado para escenarios de bajos recursos, DML para escenarios supervisados
  3. Entrenamiento Eficiente en Parámetros: Utiliza LoRA para reducir los requisitos de recursos computacionales
  4. Adaptación Multilingüe: Logra soporte multilingüe mediante traducción simple de indicaciones

Configuración Experimental

Conjuntos de Datos

FrameNet en Inglés 1.7

  • Escala: 82,610 instancias, 642 marcos, 2,492 verbos
  • División: Validación cruzada de tres pliegues, promedio de 27,537 instancias de entrenamiento
  • Características: El conjunto de prueba incluye marcos no vistos durante el entrenamiento (promedio 135.3/434.3)

FrameNet en Japonés

  • Escala: 3,130 instancias, 344 marcos, 766 verbos
  • División: Validación cruzada de tres pliegues, promedio de 1,043 instancias de entrenamiento
  • Desafío: Solo el 3.2% del conjunto de datos en inglés

Métricas de Evaluación

Se utilizan precisión B-cubed (BCP), recuperación (BCR) y valor F (BCF) como métricas de evaluación principales, siendo BCF el estándar de evaluación principal.

Métodos de Comparación

  • Líneas Base MLM: BERTbase/large, ModernBERTbase/large, RoBERTalarge
  • Métodos de Agrupación: Agrupación de un paso (promedio de grupo) y agrupación de dos pasos (X-means + promedio de grupo)
  • Configuraciones de Entrenamiento: Sin ajuste fino y con ajuste fino DML

Detalles de Implementación

  • Modelos: Gemma 3-12B, Llama 3.1-8B, etc.
  • Configuración de ICL: 5/10/20 ejemplos, longitud máxima de secuencia 2048
  • Hiperparámetros: Tasa de aprendizaje {3e-5, 5e-5, 1e-4}, margen {0.1, 0.2, 0.5, 1.0}

Resultados Experimentales

Resultados Principales

Rendimiento en FrameNet en Inglés

ModeloMétodo de EntrenamientoBCF de Agrupación de Un PasoBCF de Agrupación de Dos Pasos
RoBERTalarge + DMLDML67.969.6
Gemma 3 + DMLDML71.970.6
Llama 3.1 + DMLDML70.870.9

Hallazgos Clave:

  • El método CLM+DML supera significativamente el mejor método MLM
  • Gemma 3 logra el máximo de 71.9 BCF en agrupación de un paso
  • El método ICL mejora el rendimiento con el aumento del número de ejemplos

Rendimiento en FrameNet en Japonés

ModeloMétodo de EntrenamientoBCF de Agrupación de Un PasoBCF de Agrupación de Dos Pasos
Japanese ModernBERTbase + DMLDML60.058.4
LLM-jp-3 + DMLDML61.359.2
Llama 3.1 + ICL(5-shot)ICL59.957.4

Hallazgos Importantes:

  • Con solo 5 ejemplos de ICL se logra un rendimiento comparable al de DML
  • Demuestra las ventajas de CLM en idiomas de bajos recursos

Experimentos de Ablación

Análisis del Impacto del Término "FrameNet"

La eliminación del término "FrameNet" en la indicación tiene un impacto limitado en el rendimiento:

  • La disminución de rendimiento en configuraciones de ICL y DML es inferior al 1%
  • Demuestra que el modelo no depende simplemente del conocimiento de FrameNet en el preentrenamiento

Hallazgos Experimentales

  1. Ventajas de CLM: Con datos de entrenamiento suficientes, CLM+DML supera significativamente a los métodos MLM
  2. Potencial de ICL: Una pequeña cantidad de ejemplos puede lograr un rendimiento competitivo, siendo particularmente adecuado para escenarios de bajos recursos
  3. Estrategia de Agrupación: Después de la optimización con DML/ICL, la agrupación de un paso es suficientemente efectiva
  4. Capacidad Multilingüe: CLM demuestra una buena capacidad de comprensión de marcos multilingües

Trabajo Relacionado

Investigación en Inducción de Marcos Semánticos

  • Métodos No Supervisados: Utilización de incrustamientos contextualizados de MLM como BERT para agrupación
  • Métodos Supervisados: Optimización del espacio de incrustamientos mediante aprendizaje de métricas profundas
  • Agrupación de Dos Pasos: Solución al problema de dispersión excesiva de métodos tradicionales

Incrustamiento de Texto Basado en Indicaciones

  • PromptBERT: Utilización de predicción enmascarada para obtener incrustamientos de oraciones
  • PromptEOL: Utilización de la capacidad de predicción de siguiente palabra de CLM para obtener incrustamientos
  • Contribución de Este Artículo: Especialización de métodos de incrustamiento genéricos para la tarea de incrustamiento de marcos

Conclusiones y Discusión

Conclusiones Principales

  1. Primera Aplicación Exitosa: Los CLMs pueden aplicarse efectivamente a la inducción de marcos semánticos, con rendimiento superior a los métodos MLM tradicionales
  2. Ventajas en Bajos Recursos: El método ICL demuestra un enorme potencial en escenarios de escasez de datos
  3. Efectividad Multilingüe: El método logra un rendimiento excelente tanto en inglés como en japonés

Limitaciones

  1. Recursos Computacionales: Los CLMs a gran escala requieren recursos computacionales significativos
  2. Cobertura Lingüística: Solo se verifica en inglés y japonés, la generalización a otros idiomas es desconocida
  3. Adaptación de Dominio: La aplicabilidad en dominios específicos requiere verificación adicional

Direcciones Futuras

  1. Expansión Multilingüe: Verificación de la efectividad del método en más idiomas
  2. Adaptación de Dominio: Exploración de efectos de aplicación en dominios específicos
  3. Optimización de Eficiencia: Desarrollo de métodos de entrenamiento e inferencia más eficientes

Evaluación Profunda

Fortalezas

  1. Fuerte Innovación: Primera aplicación sistemática de CLM a la inducción de marcos semánticos
  2. Método Completo: Proporciona dos estrategias de optimización (ICL y DML) adaptadas a diferentes condiciones de recursos
  3. Evaluación Exhaustiva: Evaluación integral en dos idiomas y múltiples modelos
  4. Valor Práctico: Proporciona una solución viable para la construcción de marcos en idiomas de bajos recursos

Deficiencias

  1. Análisis Teórico: Falta de explicación teórica profunda sobre por qué CLM tiene mejor rendimiento en esta tarea
  2. Costo Computacional: Discusión insuficiente sobre la comparación de costos computacionales con métodos MLM
  3. Análisis de Errores: Falta de análisis detallado de casos de fallo
  4. Generalización: Solo se verifica en datos de FrameNet, la aplicabilidad a otros recursos de marcos es desconocida

Impacto

  1. Contribución Académica: Abre un nuevo camino técnico para la investigación de marcos semánticos
  2. Valor Práctico: Proporciona herramientas prácticas para la construcción de recursos de marcos multilingües
  3. Reproducibilidad: Proporciona configuración experimental detallada y configuración de hiperparámetros

Escenarios de Aplicación

  1. Idiomas de Bajos Recursos: Idiomas con recursos de marcos escasos
  2. Adaptación de Dominio: Escenarios que requieren construcción de marcos específicos de dominio
  3. Prototipado Rápido: Aplicaciones que requieren construcción rápida de sistemas de marcos

Referencias

Este artículo cita trabajos importantes de múltiples campos incluyendo marcos semánticos, aprendizaje de métricas profundas y aprendizaje basado en indicaciones, proporcionando una base teórica sólida para el diseño del método. Particularmente dignos de atención son los trabajos fundamentales de Yamada et al. (2021, 2023) en inducción de marcos basada en MLM, así como el método PromptEOL propuesto por Jiang et al. (2024).


Evaluación General: Este es un artículo de investigación de alta calidad que introduce exitosamente modelos de lenguaje causal a la tarea de inducción de marcos semánticos, con contribuciones significativas en innovación de métodos, verificación experimental y valor práctico. Particularmente, el rendimiento innovador en escenarios de idiomas de bajos recursos proporciona una referencia importante para el desarrollo del campo relacionado.