PAGE: Prompt Augmentation for text Generation Enhancement
Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic
PAGE: Aumento de Indicaciones para la Mejora de la Generación de Texto
En años recientes, los modelos de generación de lenguaje natural han demostrado un desempeño excepcional en tareas de generación de texto. Sin embargo, cuando se enfrentan a tareas específicas o requisitos especiales, estos modelos pueden tener un desempeño deficiente o requerir una cantidad significativa de datos adicionales para su ajuste. Esta investigación propone PAGE (Aumento de Indicaciones para la Mejora de la Generación de Texto), un marco que asiste a estos modelos mediante el uso de módulos auxiliares simples. Estos módulos auxiliares son modelos ligeros, como clasificadores o extractores, capaces de proporcionar información de razonamiento a partir del texto de entrada. La salida de los módulos auxiliares se utiliza para construir entradas enriquecidas, mejorando así la calidad y controlabilidad de la generación. A diferencia de otros métodos de asistencia generativa, PAGE no requiere modelos generativos auxiliares, sino que propone una arquitectura más simple, modular y fácil de adaptar a diferentes tareas.
Desempeño insuficiente en tareas específicas: Aunque los modelos de lenguaje grandes (LLM) funcionan bien en tareas genéricas de generación de texto, a menudo tienen un desempeño deficiente cuando se enfrentan a tareas de dominio específico o con requisitos especiales
Costo elevado del ajuste fino: La solución tradicional es reentrenar o ajustar el modelo, pero esto requiere una gran cantidad de datos de alta calidad y recursos computacionales
Problemas de limitación de recursos: Muchos escenarios de aplicación no pueden obtener suficientes datos de entrenamiento y capacidad computacional
Propuesta del marco PAGE: Una arquitectura innovadora de aumento de indicaciones que mejora la calidad de generación de texto mediante módulos auxiliares simples
Diseño modular: A diferencia de otros métodos, PAGE no depende de modelos generativos auxiliares, sino que utiliza clasificadores ligeros, extractores, etc.
Amigable con recursos: Reduce significativamente los requisitos de datos de entrenamiento y recursos computacionales
Validación práctica: Prueba de concepto en el campo de la ingeniería de requisitos de software, utilizando sintaxis EARS para generar requisitos estructurados
Mejora de desempeño: Logra mejoras significativas en métricas ROUGE en comparación con métodos de referencia (aumento de ROUGE-1 del 65,41%, aumento de ROUGE-2 del 205,62%)
Entrada: Descripción de texto original (como descripción de requisitos en lenguaje natural)
Salida: Texto estructurado y de alta calidad (como expresión de requisitos que cumple con normas sintácticas específicas)
Objetivo: Enriquecer la indicación de entrada mediante información auxiliar, mejorando la calidad de generación sin necesidad de reentrenar el modelo principal
Asistencia ligera: En comparación con el uso de grandes modelos generativos auxiliares, PAGE utiliza componentes ligeros como clasificadores simples
Arquitectura modular: Cada componente puede optimizarse y reemplazarse independientemente, con gran adaptabilidad
Sin necesidad de reentrenamiento: El modelo generativo principal permanece sin cambios, mejorando el desempeño únicamente mediante aumento de indicaciones
Alta interpretabilidad: La salida del módulo auxiliar es una estructura de texto explícita, facilitando la comprensión y depuración
Rango de validación limitado: Validación solo en un dominio específico (ingeniería de requisitos)
Conjunto de datos pequeño: El conjunto de datos de 253 instancias puede ser insuficiente para validar completamente la capacidad de generalización del método
Comparación de línea base insuficiente: Carece de comparación directa con otros métodos de mejora de indicaciones
Análisis teórico deficiente: Falta análisis teórico profundo sobre por qué el método es efectivo
Ausencia de evaluación humana: Depende completamente de métricas automáticas, careciendo de evaluación de expertos
El artículo cita múltiples trabajos relacionados importantes, incluyendo:
Trabajos fundamentales de arquitectura Transformer (Vaswani et al., 2017)
Principales modelos de lenguaje grande (GPT, BERT, T5, Llama, etc.)
Especificación de sintaxis de requisitos EARS (Mavin et al., 2009)
Métricas de evaluación ROUGE (Lin, 2004)
Métodos relacionados de mejora generativa, etc.
Evaluación General: Este es un artículo de investigación que propone un método innovador. El marco PAGE proporciona nuevas perspectivas para la mejora de generación de texto. Aunque hay espacio para mejora en el rango de validación y análisis teórico, su valor práctico e innovación técnica son dignos de reconocimiento. Este método es particularmente adecuado para escenarios de aplicación que requieren adaptación rápida a tareas específicas con recursos limitados.