2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale

In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.

academic

PAGE: Aumento de Indicaciones para la Mejora de la Generación de Texto

Información Básica

ID del Artículo: 2510.13880
Título: PAGE: Prompt Augmentation for text Generation Enhancement
Autores: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentina)
Clasificación: cs.CL cs.AI
Institución: Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentina
Enlace del Artículo: https://arxiv.org/abs/2510.13880

Resumen

En años recientes, los modelos de generación de lenguaje natural han demostrado un desempeño excepcional en tareas de generación de texto. Sin embargo, cuando se enfrentan a tareas específicas o requisitos especiales, estos modelos pueden tener un desempeño deficiente o requerir una cantidad significativa de datos adicionales para su ajuste. Esta investigación propone PAGE (Aumento de Indicaciones para la Mejora de la Generación de Texto), un marco que asiste a estos modelos mediante el uso de módulos auxiliares simples. Estos módulos auxiliares son modelos ligeros, como clasificadores o extractores, capaces de proporcionar información de razonamiento a partir del texto de entrada. La salida de los módulos auxiliares se utiliza para construir entradas enriquecidas, mejorando así la calidad y controlabilidad de la generación. A diferencia de otros métodos de asistencia generativa, PAGE no requiere modelos generativos auxiliares, sino que propone una arquitectura más simple, modular y fácil de adaptar a diferentes tareas.

Contexto de Investigación y Motivación

Problemas Centrales

Desempeño insuficiente en tareas específicas: Aunque los modelos de lenguaje grandes (LLM) funcionan bien en tareas genéricas de generación de texto, a menudo tienen un desempeño deficiente cuando se enfrentan a tareas de dominio específico o con requisitos especiales
Costo elevado del ajuste fino: La solución tradicional es reentrenar o ajustar el modelo, pero esto requiere una gran cantidad de datos de alta calidad y recursos computacionales
Problemas de limitación de recursos: Muchos escenarios de aplicación no pueden obtener suficientes datos de entrenamiento y capacidad computacional

Motivación de la Investigación

Reducir requisitos de recursos: Proporcionar un método para mejorar la calidad de generación sin necesidad de reentrenamiento a gran escala
Mejorar la controlabilidad: Enriquecer la entrada mediante información estructurada, haciendo la generación más controlable y precisa
Diseño modular: Crear una arquitectura flexible fácil de adaptar a diferentes tareas
Interpretabilidad: Utilizar módulos auxiliares simples e interpretables, facilitando la comprensión y depuración

Contribuciones Principales

Propuesta del marco PAGE: Una arquitectura innovadora de aumento de indicaciones que mejora la calidad de generación de texto mediante módulos auxiliares simples
Diseño modular: A diferencia de otros métodos, PAGE no depende de modelos generativos auxiliares, sino que utiliza clasificadores ligeros, extractores, etc.
Amigable con recursos: Reduce significativamente los requisitos de datos de entrenamiento y recursos computacionales
Validación práctica: Prueba de concepto en el campo de la ingeniería de requisitos de software, utilizando sintaxis EARS para generar requisitos estructurados
Mejora de desempeño: Logra mejoras significativas en métricas ROUGE en comparación con métodos de referencia (aumento de ROUGE-1 del 65,41%, aumento de ROUGE-2 del 205,62%)

Explicación Detallada del Método

Definición de la Tarea

Entrada: Descripción de texto original (como descripción de requisitos en lenguaje natural) Salida: Texto estructurado y de alta calidad (como expresión de requisitos que cumple con normas sintácticas específicas) Objetivo: Enriquecer la indicación de entrada mediante información auxiliar, mejorando la calidad de generación sin necesidad de reentrenar el modelo principal

Arquitectura del Modelo

El marco PAGE contiene tres componentes principales:

1. Módulo Auxiliar (Auxiliary Module)

Función: Realizar razonamiento sobre el texto de entrada, extrayendo información estructurada
Tipos:
- Clasificador: Asignar etiquetas relevantes al texto de entrada
- Extractor de entidades: Identificar y clasificar entidades clave en el texto
- Analizador de sentimientos: Detectar la tendencia de sentimiento o intención del texto
Características: Ligero, altamente interpretable, bajo costo de entrenamiento

2. Compositor de Indicaciones (Prompt Composer)

Función: Combinar la salida del módulo auxiliar con el texto original, construyendo una indicación mejorada
Implementación: Utilizar plantillas configurables para integrar información estructurada en la entrada
Salida: Indicación enriquecida con contexto, proporcionando más información de orientación al modelo generativo

3. Modelo Generativo (Generative Model)

Función: Generar texto final basado en la indicación mejorada
Características: Puede utilizar cualquier LLM existente, sin necesidad de modificación o reentrenamiento
Técnica: Soporta técnicas de indicación zero-shot, one-shot, few-shot, etc.

Flujo de Trabajo

Texto original → Módulo auxiliar → Información estructurada
    ↓           ↓
    └→ Compositor de indicaciones ←┘
           ↓
    Indicación mejorada → Modelo generativo → Salida final

El usuario proporciona entrada de texto original
El módulo auxiliar procesa la entrada en paralelo, generando información de razonamiento estructurada
El compositor de indicaciones combina el texto original con la información auxiliar
El modelo generativo produce la salida final basada en la indicación mejorada

Puntos de Innovación Técnica

Asistencia ligera: En comparación con el uso de grandes modelos generativos auxiliares, PAGE utiliza componentes ligeros como clasificadores simples
Arquitectura modular: Cada componente puede optimizarse y reemplazarse independientemente, con gran adaptabilidad
Sin necesidad de reentrenamiento: El modelo generativo principal permanece sin cambios, mejorando el desempeño únicamente mediante aumento de indicaciones
Alta interpretabilidad: La salida del módulo auxiliar es una estructura de texto explícita, facilitando la comprensión y depuración

Configuración Experimental

Conjunto de Datos

Fuente: Integración de múltiples conjuntos de datos
- Conjunto de datos PURE: Colección pública de documentos de requisitos
- Conjunto de datos de Requisitos Funcionales de Software
- Requisitos de documentos de especificación pública
Escala: 253 instancias
Estructura:
- Expresión de requisitos original (sin estructura sintáctica específica)
- Etiquetas de categoría EARS
- Expresión de requisitos sintaxis EARS escrita manualmente
Distribución de categorías: Cubre cinco categorías EARS (Ubicua, Impulsada por eventos, Impulsada por estado, No deseada, Opcional)

Métricas de Evaluación

Utiliza la familia de métricas ROUGE para evaluar la calidad de generación:

ROUGE-1: Superposición a nivel de palabra
ROUGE-2: Coincidencia de bigramas
ROUGE-L: Subsecuencia común más larga, midiendo la preservación de estructura

Cada métrica calcula tres dimensiones: Precisión, Recuperación y Puntuación F1.

Métodos de Comparación

Se diseñaron tres grupos de experimentos para comparación:

Línea base Zero-shot: Uso directo de LLM sin mejora alguna
Límite superior ideal: Uso de etiquetas correctas del conjunto de datos como información auxiliar
Implementación completa de PAGE: Uso de clasificador entrenado como módulo auxiliar

Detalles de Implementación

Clasificador auxiliar: Modelo Random Forest
- Profundidad máxima: 10
- Muestras mínimas para división: 5
- Número de estimadores: 100
- Precisión: 82,35%
Modelo generativo: Llama 3.1-8B, implementado localmente mediante Ollama
División de datos: 80% entrenamiento, 20% prueba, validación cruzada de 5 pliegues

Resultados Experimentales

Resultados Principales

Método	Métrica	Precisión	Recuperación	Puntuación F1
Zero-Shot	ROUGE-1	0,509	0,489	0,485
	ROUGE-2	0,206	0,204	0,199
	ROUGE-L	0,413	0,395	0,392
Muestras-Dataset	ROUGE-1	0,852	0,815	0,827
	ROUGE-2	0,653	0,630	0,636
	ROUGE-L	0,803	0,770	0,781
PAGE	ROUGE-1	0,849	0,809	0,822
	ROUGE-2	0,648	0,622	0,630
	ROUGE-L	0,796	0,761	0,772

Análisis de Mejora de Desempeño

Magnitud de mejora relativa al método de referencia:

ROUGE-1: Mejora del 65,41%
ROUGE-2: Mejora del 205,62%
ROUGE-L: Mejora del 92,79%

PAGE logra un desempeño cercano al límite superior ideal, quedando solo 2-4 puntos porcentuales por debajo, demostrando la efectividad del método.

Análisis de Casos

Ejemplo 1 (Categoría Ubicua):

Entrada original: "The system shall allow a customer to place an order online"
Salida Zero-shot: Descripción estructurada compleja (Actor, Evento, Rol, etc.)
Salida PAGE: "The system shall always allow a customer to place an order online"
Salida esperada: "The system shall allow a customer to place an order online"

Ejemplo 2 (Categoría Impulsada por eventos):

Entrada original: "When a driver completes a ride, the system shall allow the driver to leave a review"
Salida Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
Salida PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

Hallazgos Experimentales

Papel clave del módulo auxiliar: La precisión de clasificación afecta directamente la calidad de generación final
Efecto significativo del aprendizaje Few-shot: Proporcionar ejemplos relevantes mejora significativamente la estructura de generación
Ventajas modulares: Permite evaluar y optimizar independientemente la contribución de cada componente
Eficiencia de recursos: Evita el alto costo del reentrenamiento de grandes modelos

Trabajo Relacionado

Métodos de Mejora Generativa

Du et al.: Combinación de indicaciones explícitas y conocimiento semántico externo para mejorar el razonamiento textual
He et al.: Uso de resúmenes codificados por BERT para guiar la generación de GPT-2
Zeldes et al.: Técnica de Ajuste Auxiliar, combinando modelos auxiliares a nivel de logits

Generación Mejorada por Conocimiento

Zhang et al.: Marco IAG, utilizando modelos generativos auxiliares para inducción de conocimiento
Liao et al.: Generación Aumentada Despertada, activando conocimiento latente mediante tareas auxiliares

Singularidad de PAGE

En comparación con métodos existentes, las ventajas de PAGE son:

No requiere modelos generativos auxiliares, reduciendo complejidad
Utiliza componentes auxiliares ligeros e interpretables
Diseño modular, fácil de adaptar a diferentes tareas
Requisitos de recursos bajos, adecuado para aplicaciones prácticas

Conclusiones y Discusión

Conclusiones Principales

Validación de efectividad: PAGE supera significativamente el método de referencia en la tarea de generación de requisitos de software
Amigable con recursos: Logra mejora de desempeño mediante módulos auxiliares simples, evitando costos de reentrenamiento
Ventajas arquitectónicas: El diseño modular proporciona buena interpretabilidad y adaptabilidad
Valor práctico: Proporciona una solución viable para optimización de generación de texto en entornos con recursos limitados

Limitaciones

Dependencia del módulo auxiliar: La calidad de generación está limitada por la precisión del módulo auxiliar
Especialización de dominio: La validación actual se limita al campo de la ingeniería de requisitos
Escala del conjunto de datos: El conjunto de datos utilizado en experimentos es relativamente pequeño (253 instancias)
Limitaciones de métricas de evaluación: Se basa principalmente en métricas ROUGE, careciendo de evaluación humana

Direcciones Futuras

Implementación del marco: Desarrollar un marco de software Python, proporcionando implementación reutilizable de PAGE
Validación multidisciplinaria: Probar la efectividad del marco en más campos de aplicación
Optimización del módulo auxiliar: Investigar estrategias de diseño de módulos auxiliares más eficientes
Perfeccionamiento del sistema de evaluación: Introducir métricas de evaluación más completas y evaluación humana

Evaluación Profunda

Fortalezas

Fuerte innovación: Propone una solución única de mejora auxiliar ligera
Alto valor práctico: Resuelve problemas de limitación de recursos en aplicaciones reales
Diseño razonable: La arquitectura modular facilita la comprensión, implementación y extensión
Experimentos suficientes: Diseña experimentos de comparación razonables, incluyendo análisis de límite superior ideal
Resultados significativos: Logra mejoras de desempeño sustanciales en múltiples métricas

Insuficiencias

Rango de validación limitado: Validación solo en un dominio específico (ingeniería de requisitos)
Conjunto de datos pequeño: El conjunto de datos de 253 instancias puede ser insuficiente para validar completamente la capacidad de generalización del método
Comparación de línea base insuficiente: Carece de comparación directa con otros métodos de mejora de indicaciones
Análisis teórico deficiente: Falta análisis teórico profundo sobre por qué el método es efectivo
Ausencia de evaluación humana: Depende completamente de métricas automáticas, careciendo de evaluación de expertos

Impacto

Contribución académica: Proporciona una nueva dirección de investigación para mejora de generación de texto
Valor práctico: Proporciona solución práctica para optimización de generación en escenarios con recursos limitados
Reproducibilidad: La descripción del método es clara, la implementación es relativamente simple
Extensibilidad: El diseño del marco tiene buena extensibilidad

Escenarios de Aplicación

Generación de texto en dominios especializados: Como documentación técnica, textos legales, etc., que requieren formato específico
Entornos con recursos limitados: Escenarios de aplicación donde no es posible realizar ajuste fino de grandes modelos
Desarrollo rápido de prototipos: Aplicaciones que requieren adaptación rápida a nuevas tareas
Escenarios con altos requisitos de interpretabilidad: Aplicaciones que necesitan comprender el proceso de generación

Referencias

El artículo cita múltiples trabajos relacionados importantes, incluyendo:

Trabajos fundamentales de arquitectura Transformer (Vaswani et al., 2017)
Principales modelos de lenguaje grande (GPT, BERT, T5, Llama, etc.)
Especificación de sintaxis de requisitos EARS (Mavin et al., 2009)
Métricas de evaluación ROUGE (Lin, 2004)
Métodos relacionados de mejora generativa, etc.

Evaluación General: Este es un artículo de investigación que propone un método innovador. El marco PAGE proporciona nuevas perspectivas para la mejora de generación de texto. Aunque hay espacio para mejora en el rango de validación y análisis teórico, su valor práctico e innovación técnica son dignos de reconocimiento. Este método es particularmente adecuado para escenarios de aplicación que requieren adaptación rápida a tareas específicas con recursos limitados.