2025-11-19T19:10:14.291595

FrameEOL: Semantic Frame Induction using Causal Language Models

Yano, Yamada, Tsukagoshi et al.

Semantic frame induction is the task of clustering frame-evoking words according to the semantic frames they evoke. In recent years, leveraging embeddings of frame-evoking words that are obtained using masked language models (MLMs) such as BERT has led to high-performance semantic frame induction. Although causal language models (CLMs) such as the GPT and Llama series succeed in a wide range of language comprehension tasks and can engage in dialogue as if they understood frames, they have not yet been applied to semantic frame induction. We propose a new method for semantic frame induction based on CLMs. Specifically, we introduce FrameEOL, a prompt-based method for obtaining Frame Embeddings that outputs One frame-name as a Label representing the given situation. To obtain embeddings more suitable for frame induction, we leverage in-context learning (ICL) and deep metric learning (DML). Frame induction is then performed by clustering the resulting embeddings. Experimental results on the English and Japanese FrameNet datasets demonstrate that the proposed methods outperform existing frame induction methods. In particular, for Japanese, which lacks extensive frame resources, the CLM-based method using only 5 ICL examples achieved comparable performance to the MLM-based method fine-tuned with DML.

academic

FrameEOL: Inducción de Marcos Semánticos Utilizando Modelos de Lenguaje Causal

Información Básica

ID del Artículo: 2510.09097
Título: FrameEOL: Semantic Frame Induction using Causal Language Models
Autores: Chihiro Yano¹, Kosuke Yamada¹'², Hayato Tsukagoshi¹, Ryohei Sasano¹, Koichi Takeda³
Instituciones: ¹Universidad de Nagoya, ²CyberAgent, ³Instituto Nacional de Informática
Clasificación: cs.CL (Lingüística Computacional)
Fecha de Publicación: 10 de octubre de 2025 (preimpresión arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.09097

Resumen

La inducción de marcos semánticos es la tarea de agrupar palabras que evocan marcos semánticos según los marcos que despiertan. Recientemente, los incrustamientos de palabras que evocan marcos obtenidos mediante modelos de lenguaje enmascarados (MLMs) como BERT han logrado un alto rendimiento en la inducción de marcos semánticos. Aunque los modelos de lenguaje causal (CLMs) como las series GPT y Llama han tenido éxito en una amplia gama de tareas de comprensión del lenguaje y pueden comprender marcos en conversaciones, aún no se han aplicado a la inducción de marcos semánticos. Este artículo propone FrameEOL, un nuevo método de inducción de marcos semánticos basado en CLMs, que es un método basado en indicaciones para obtener incrustamientos de marcos que generan un nombre de marco como etiqueta. Para obtener incrustamientos más adecuados para la inducción de marcos, utilizamos aprendizaje en contexto (ICL) y aprendizaje de métricas profundas (DML). Los resultados experimentales demuestran que el método supera los métodos existentes en los conjuntos de datos de FrameNet en inglés y japonés. Particularmente para el japonés, que carece de recursos de marcos extensos, el método CLM utilizando solo 5 ejemplos de ICL logra un rendimiento comparable al del método MLM ajustado con DML.

Antecedentes de Investigación y Motivación

Definición del Problema

La inducción de marcos semánticos tiene como objetivo resolver cómo identificar y agrupar automáticamente instancias de verbos que comparten el mismo marco semántico. Por ejemplo, el verbo "lost" en diferentes contextos puede evocar diferentes marcos semánticos:

"He lost the gold medal by just .02 points" → marco FINISH_COMPETITION
"He lost his gold medal at the restaurant" → marco LOSING

Importancia de la Investigación

Escasez de Recursos: La construcción manual de recursos de marcos semánticos es enormemente costosa, lo que hace que la construcción automática sea una necesidad urgente
Necesidades Multilingües: Fuera del inglés, los recursos de marcos en otros idiomas son extremadamente limitados
Adaptación de Dominio: Dominios específicos pueden requerir representaciones de marcos con diferentes granularidades

Limitaciones de Métodos Existentes

Dependencia de MLMs: Los métodos existentes se basan principalmente en modelos de lenguaje enmascarados como BERT
Dependencia de Recursos: Requieren grandes cantidades de datos anotados para un entrenamiento efectivo
Limitaciones Lingüísticas: Rendimiento deficiente en idiomas de bajos recursos

Motivación de la Investigación

Aunque los CLMs modernos como GPT-4o demuestran la capacidad de comprender marcos semánticos (como se muestra en el ejemplo de ChatGPT en la Figura 1), aún no se han aplicado sistemáticamente a la tarea de inducción de marcos semánticos. Este artículo tiene como objetivo llenar este vacío.

Contribuciones Principales

Primera Aplicación de CLMs a la Inducción de Marcos Semánticos: Propone el método FrameEOL, extendiendo PromptEOL para la obtención de incrustamientos de marcos
Optimización Multiestratégica: Combina aprendizaje en contexto (ICL) y aprendizaje de métricas profundas (DML) para mejorar la calidad de los incrustamientos
Superación de Métodos Existentes: Logra el mejor rendimiento en FrameNet en inglés, con una puntuación BcF de 71.9
Avance en Idiomas de Bajos Recursos: En FrameNet en japonés, con solo 5 ejemplos de ICL se logra un rendimiento comparable al del MLM ajustado con DML
Validación Bilingüe: Verifica la efectividad del método en conjuntos de datos en inglés y japonés

Explicación Detallada del Método

Definición de la Tarea

Entrada: Conjunto de oraciones que contienen verbos que evocan marcos Salida: Agrupación de instancias de verbos según los marcos semánticos que despiertan Restricción: No requiere un conjunto predefinido de etiquetas de marcos

Arquitectura del Modelo

3.1 Método Principal de FrameEOL

FrameEOL se inspira en PromptEOL, obteniendo incrustamientos de marcos mediante plantillas de indicaciones especialmente diseñadas:

Plantilla de Indicación:

The FrameNet frame evoked by "[verb]" in "[sentence]" is

Diseños Clave:

[verb]: Marcador de posición del verbo que evoca el marco
[sentence]: Marcador de posición de la oración que contiene el verbo
Se utiliza el incrustamiento de la capa final del último token "is" como incrustamiento del marco

3.2 Optimización de Aprendizaje en Contexto (ICL)

Para abordar los desafíos de idiomas de bajos recursos, se introduce el método ICL:

Construcción de Ejemplos:

The FrameNet frame evoked by "wear" in "On his head he wore a white nightcap..." is Wearing.
The FrameNet frame evoked by "type" in "I typed it out for Diana Morrison." is Text_creation.
The FrameNet frame evoked by "kneel" in "He knelt up and leaned towards Lucien." is Change_posture.

The FrameNet frame evoked by "lost" in "He lost his gold medal at the restaurant." is

Ventajas: Mediante una pequeña cantidad de ejemplos (5-20) se puede mejorar significativamente el rendimiento, siendo particularmente adecuado para escenarios con datos de entrenamiento escasos.

3.3 Optimización de Aprendizaje de Métricas Profundas (DML)

Se adopta la función de pérdida de tripletes para optimizar el espacio de incrustamientos:

$L_{tri} = \max(D(x_a, x_p) - D(x_a, x_n) + m, 0)$

Donde:

$x_a, x_p, x_n$ : Incrustamientos de marcos de punto de anclaje, muestra positiva y muestra negativa
$D(\cdot, \cdot)$ : Distancia euclidiana de incrustamientos normalizados
$m$ : Parámetro de margen

Detalles de Implementación:

Se utiliza LoRA para ajuste fino eficiente en parámetros
Rango de LoRA r=8, α=32
Entrenamiento durante 20 épocas, tamaño de lote 32

Puntos de Innovación Técnica

Innovación en Diseño de Indicaciones: Especializa el método de incrustamiento de oraciones genérico de PromptEOL para la tarea de incrustamiento de marcos
Estrategia de Optimización Dual: ICL es adecuado para escenarios de bajos recursos, DML para escenarios supervisados
Entrenamiento Eficiente en Parámetros: Utiliza LoRA para reducir los requisitos de recursos computacionales
Adaptación Multilingüe: Logra soporte multilingüe mediante traducción simple de indicaciones

Configuración Experimental

Conjuntos de Datos

FrameNet en Inglés 1.7

Escala: 82,610 instancias, 642 marcos, 2,492 verbos
División: Validación cruzada de tres pliegues, promedio de 27,537 instancias de entrenamiento
Características: El conjunto de prueba incluye marcos no vistos durante el entrenamiento (promedio 135.3/434.3)

FrameNet en Japonés

Escala: 3,130 instancias, 344 marcos, 766 verbos
División: Validación cruzada de tres pliegues, promedio de 1,043 instancias de entrenamiento
Desafío: Solo el 3.2% del conjunto de datos en inglés

Métricas de Evaluación

Se utilizan precisión B-cubed (BCP), recuperación (BCR) y valor F (BCF) como métricas de evaluación principales, siendo BCF el estándar de evaluación principal.

Métodos de Comparación

Líneas Base MLM: BERTbase/large, ModernBERTbase/large, RoBERTalarge
Métodos de Agrupación: Agrupación de un paso (promedio de grupo) y agrupación de dos pasos (X-means + promedio de grupo)
Configuraciones de Entrenamiento: Sin ajuste fino y con ajuste fino DML

Detalles de Implementación

Modelos: Gemma 3-12B, Llama 3.1-8B, etc.
Configuración de ICL: 5/10/20 ejemplos, longitud máxima de secuencia 2048
Hiperparámetros: Tasa de aprendizaje {3e-5, 5e-5, 1e-4}, margen {0.1, 0.2, 0.5, 1.0}

Resultados Experimentales

Resultados Principales

Rendimiento en FrameNet en Inglés

Modelo	Método de Entrenamiento	BCF de Agrupación de Un Paso	BCF de Agrupación de Dos Pasos
RoBERTalarge + DML	DML	67.9	69.6
Gemma 3 + DML	DML	71.9	70.6
Llama 3.1 + DML	DML	70.8	70.9

Hallazgos Clave:

El método CLM+DML supera significativamente el mejor método MLM
Gemma 3 logra el máximo de 71.9 BCF en agrupación de un paso
El método ICL mejora el rendimiento con el aumento del número de ejemplos

Rendimiento en FrameNet en Japonés

Modelo	Método de Entrenamiento	BCF de Agrupación de Un Paso	BCF de Agrupación de Dos Pasos
Japanese ModernBERTbase + DML	DML	60.0	58.4
LLM-jp-3 + DML	DML	61.3	59.2
Llama 3.1 + ICL(5-shot)	ICL	59.9	57.4

Hallazgos Importantes:

Con solo 5 ejemplos de ICL se logra un rendimiento comparable al de DML
Demuestra las ventajas de CLM en idiomas de bajos recursos

Experimentos de Ablación

Análisis del Impacto del Término "FrameNet"

La eliminación del término "FrameNet" en la indicación tiene un impacto limitado en el rendimiento:

La disminución de rendimiento en configuraciones de ICL y DML es inferior al 1%
Demuestra que el modelo no depende simplemente del conocimiento de FrameNet en el preentrenamiento

Hallazgos Experimentales

Ventajas de CLM: Con datos de entrenamiento suficientes, CLM+DML supera significativamente a los métodos MLM
Potencial de ICL: Una pequeña cantidad de ejemplos puede lograr un rendimiento competitivo, siendo particularmente adecuado para escenarios de bajos recursos
Estrategia de Agrupación: Después de la optimización con DML/ICL, la agrupación de un paso es suficientemente efectiva
Capacidad Multilingüe: CLM demuestra una buena capacidad de comprensión de marcos multilingües

Trabajo Relacionado

Investigación en Inducción de Marcos Semánticos

Métodos No Supervisados: Utilización de incrustamientos contextualizados de MLM como BERT para agrupación
Métodos Supervisados: Optimización del espacio de incrustamientos mediante aprendizaje de métricas profundas
Agrupación de Dos Pasos: Solución al problema de dispersión excesiva de métodos tradicionales

Incrustamiento de Texto Basado en Indicaciones

PromptBERT: Utilización de predicción enmascarada para obtener incrustamientos de oraciones
PromptEOL: Utilización de la capacidad de predicción de siguiente palabra de CLM para obtener incrustamientos
Contribución de Este Artículo: Especialización de métodos de incrustamiento genéricos para la tarea de incrustamiento de marcos

Conclusiones y Discusión

Conclusiones Principales

Primera Aplicación Exitosa: Los CLMs pueden aplicarse efectivamente a la inducción de marcos semánticos, con rendimiento superior a los métodos MLM tradicionales
Ventajas en Bajos Recursos: El método ICL demuestra un enorme potencial en escenarios de escasez de datos
Efectividad Multilingüe: El método logra un rendimiento excelente tanto en inglés como en japonés

Limitaciones

Recursos Computacionales: Los CLMs a gran escala requieren recursos computacionales significativos
Cobertura Lingüística: Solo se verifica en inglés y japonés, la generalización a otros idiomas es desconocida
Adaptación de Dominio: La aplicabilidad en dominios específicos requiere verificación adicional

Direcciones Futuras

Expansión Multilingüe: Verificación de la efectividad del método en más idiomas
Adaptación de Dominio: Exploración de efectos de aplicación en dominios específicos
Optimización de Eficiencia: Desarrollo de métodos de entrenamiento e inferencia más eficientes

Evaluación Profunda

Fortalezas

Fuerte Innovación: Primera aplicación sistemática de CLM a la inducción de marcos semánticos
Método Completo: Proporciona dos estrategias de optimización (ICL y DML) adaptadas a diferentes condiciones de recursos
Evaluación Exhaustiva: Evaluación integral en dos idiomas y múltiples modelos
Valor Práctico: Proporciona una solución viable para la construcción de marcos en idiomas de bajos recursos

Deficiencias

Análisis Teórico: Falta de explicación teórica profunda sobre por qué CLM tiene mejor rendimiento en esta tarea
Costo Computacional: Discusión insuficiente sobre la comparación de costos computacionales con métodos MLM
Análisis de Errores: Falta de análisis detallado de casos de fallo
Generalización: Solo se verifica en datos de FrameNet, la aplicabilidad a otros recursos de marcos es desconocida

Impacto

Contribución Académica: Abre un nuevo camino técnico para la investigación de marcos semánticos
Valor Práctico: Proporciona herramientas prácticas para la construcción de recursos de marcos multilingües
Reproducibilidad: Proporciona configuración experimental detallada y configuración de hiperparámetros

Escenarios de Aplicación

Idiomas de Bajos Recursos: Idiomas con recursos de marcos escasos
Adaptación de Dominio: Escenarios que requieren construcción de marcos específicos de dominio
Prototipado Rápido: Aplicaciones que requieren construcción rápida de sistemas de marcos

Referencias

Este artículo cita trabajos importantes de múltiples campos incluyendo marcos semánticos, aprendizaje de métricas profundas y aprendizaje basado en indicaciones, proporcionando una base teórica sólida para el diseño del método. Particularmente dignos de atención son los trabajos fundamentales de Yamada et al. (2021, 2023) en inducción de marcos basada en MLM, así como el método PromptEOL propuesto por Jiang et al. (2024).

Evaluación General: Este es un artículo de investigación de alta calidad que introduce exitosamente modelos de lenguaje causal a la tarea de inducción de marcos semánticos, con contribuciones significativas en innovación de métodos, verificación experimental y valor práctico. Particularmente, el rendimiento innovador en escenarios de idiomas de bajos recursos proporciona una referencia importante para el desarrollo del campo relacionado.