2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic

PAGE: Aumento de Indicaciones para la Mejora de la Generación de Texto

Información Básica

  • ID del Artículo: 2510.13880
  • Título: PAGE: Prompt Augmentation for text Generation Enhancement
  • Autores: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentina)
  • Clasificación: cs.CL cs.AI
  • Institución: Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentina
  • Enlace del Artículo: https://arxiv.org/abs/2510.13880

Resumen

En años recientes, los modelos de generación de lenguaje natural han demostrado un desempeño excepcional en tareas de generación de texto. Sin embargo, cuando se enfrentan a tareas específicas o requisitos especiales, estos modelos pueden tener un desempeño deficiente o requerir una cantidad significativa de datos adicionales para su ajuste. Esta investigación propone PAGE (Aumento de Indicaciones para la Mejora de la Generación de Texto), un marco que asiste a estos modelos mediante el uso de módulos auxiliares simples. Estos módulos auxiliares son modelos ligeros, como clasificadores o extractores, capaces de proporcionar información de razonamiento a partir del texto de entrada. La salida de los módulos auxiliares se utiliza para construir entradas enriquecidas, mejorando así la calidad y controlabilidad de la generación. A diferencia de otros métodos de asistencia generativa, PAGE no requiere modelos generativos auxiliares, sino que propone una arquitectura más simple, modular y fácil de adaptar a diferentes tareas.

Contexto de Investigación y Motivación

Problemas Centrales

  1. Desempeño insuficiente en tareas específicas: Aunque los modelos de lenguaje grandes (LLM) funcionan bien en tareas genéricas de generación de texto, a menudo tienen un desempeño deficiente cuando se enfrentan a tareas de dominio específico o con requisitos especiales
  2. Costo elevado del ajuste fino: La solución tradicional es reentrenar o ajustar el modelo, pero esto requiere una gran cantidad de datos de alta calidad y recursos computacionales
  3. Problemas de limitación de recursos: Muchos escenarios de aplicación no pueden obtener suficientes datos de entrenamiento y capacidad computacional

Motivación de la Investigación

  • Reducir requisitos de recursos: Proporcionar un método para mejorar la calidad de generación sin necesidad de reentrenamiento a gran escala
  • Mejorar la controlabilidad: Enriquecer la entrada mediante información estructurada, haciendo la generación más controlable y precisa
  • Diseño modular: Crear una arquitectura flexible fácil de adaptar a diferentes tareas
  • Interpretabilidad: Utilizar módulos auxiliares simples e interpretables, facilitando la comprensión y depuración

Contribuciones Principales

  1. Propuesta del marco PAGE: Una arquitectura innovadora de aumento de indicaciones que mejora la calidad de generación de texto mediante módulos auxiliares simples
  2. Diseño modular: A diferencia de otros métodos, PAGE no depende de modelos generativos auxiliares, sino que utiliza clasificadores ligeros, extractores, etc.
  3. Amigable con recursos: Reduce significativamente los requisitos de datos de entrenamiento y recursos computacionales
  4. Validación práctica: Prueba de concepto en el campo de la ingeniería de requisitos de software, utilizando sintaxis EARS para generar requisitos estructurados
  5. Mejora de desempeño: Logra mejoras significativas en métricas ROUGE en comparación con métodos de referencia (aumento de ROUGE-1 del 65,41%, aumento de ROUGE-2 del 205,62%)

Explicación Detallada del Método

Definición de la Tarea

Entrada: Descripción de texto original (como descripción de requisitos en lenguaje natural) Salida: Texto estructurado y de alta calidad (como expresión de requisitos que cumple con normas sintácticas específicas) Objetivo: Enriquecer la indicación de entrada mediante información auxiliar, mejorando la calidad de generación sin necesidad de reentrenar el modelo principal

Arquitectura del Modelo

El marco PAGE contiene tres componentes principales:

1. Módulo Auxiliar (Auxiliary Module)

  • Función: Realizar razonamiento sobre el texto de entrada, extrayendo información estructurada
  • Tipos:
    • Clasificador: Asignar etiquetas relevantes al texto de entrada
    • Extractor de entidades: Identificar y clasificar entidades clave en el texto
    • Analizador de sentimientos: Detectar la tendencia de sentimiento o intención del texto
  • Características: Ligero, altamente interpretable, bajo costo de entrenamiento

2. Compositor de Indicaciones (Prompt Composer)

  • Función: Combinar la salida del módulo auxiliar con el texto original, construyendo una indicación mejorada
  • Implementación: Utilizar plantillas configurables para integrar información estructurada en la entrada
  • Salida: Indicación enriquecida con contexto, proporcionando más información de orientación al modelo generativo

3. Modelo Generativo (Generative Model)

  • Función: Generar texto final basado en la indicación mejorada
  • Características: Puede utilizar cualquier LLM existente, sin necesidad de modificación o reentrenamiento
  • Técnica: Soporta técnicas de indicación zero-shot, one-shot, few-shot, etc.

Flujo de Trabajo

Texto original → Módulo auxiliar → Información estructurada
    ↓           ↓
    └→ Compositor de indicaciones ←┘
           ↓
    Indicación mejorada → Modelo generativo → Salida final
  1. El usuario proporciona entrada de texto original
  2. El módulo auxiliar procesa la entrada en paralelo, generando información de razonamiento estructurada
  3. El compositor de indicaciones combina el texto original con la información auxiliar
  4. El modelo generativo produce la salida final basada en la indicación mejorada

Puntos de Innovación Técnica

  1. Asistencia ligera: En comparación con el uso de grandes modelos generativos auxiliares, PAGE utiliza componentes ligeros como clasificadores simples
  2. Arquitectura modular: Cada componente puede optimizarse y reemplazarse independientemente, con gran adaptabilidad
  3. Sin necesidad de reentrenamiento: El modelo generativo principal permanece sin cambios, mejorando el desempeño únicamente mediante aumento de indicaciones
  4. Alta interpretabilidad: La salida del módulo auxiliar es una estructura de texto explícita, facilitando la comprensión y depuración

Configuración Experimental

Conjunto de Datos

  • Fuente: Integración de múltiples conjuntos de datos
    • Conjunto de datos PURE: Colección pública de documentos de requisitos
    • Conjunto de datos de Requisitos Funcionales de Software
    • Requisitos de documentos de especificación pública
  • Escala: 253 instancias
  • Estructura:
    • Expresión de requisitos original (sin estructura sintáctica específica)
    • Etiquetas de categoría EARS
    • Expresión de requisitos sintaxis EARS escrita manualmente
  • Distribución de categorías: Cubre cinco categorías EARS (Ubicua, Impulsada por eventos, Impulsada por estado, No deseada, Opcional)

Métricas de Evaluación

Utiliza la familia de métricas ROUGE para evaluar la calidad de generación:

  • ROUGE-1: Superposición a nivel de palabra
  • ROUGE-2: Coincidencia de bigramas
  • ROUGE-L: Subsecuencia común más larga, midiendo la preservación de estructura

Cada métrica calcula tres dimensiones: Precisión, Recuperación y Puntuación F1.

Métodos de Comparación

Se diseñaron tres grupos de experimentos para comparación:

  1. Línea base Zero-shot: Uso directo de LLM sin mejora alguna
  2. Límite superior ideal: Uso de etiquetas correctas del conjunto de datos como información auxiliar
  3. Implementación completa de PAGE: Uso de clasificador entrenado como módulo auxiliar

Detalles de Implementación

  • Clasificador auxiliar: Modelo Random Forest
    • Profundidad máxima: 10
    • Muestras mínimas para división: 5
    • Número de estimadores: 100
    • Precisión: 82,35%
  • Modelo generativo: Llama 3.1-8B, implementado localmente mediante Ollama
  • División de datos: 80% entrenamiento, 20% prueba, validación cruzada de 5 pliegues

Resultados Experimentales

Resultados Principales

MétodoMétricaPrecisiónRecuperaciónPuntuación F1
Zero-ShotROUGE-10,5090,4890,485
ROUGE-20,2060,2040,199
ROUGE-L0,4130,3950,392
Muestras-DatasetROUGE-10,8520,8150,827
ROUGE-20,6530,6300,636
ROUGE-L0,8030,7700,781
PAGEROUGE-10,8490,8090,822
ROUGE-20,6480,6220,630
ROUGE-L0,7960,7610,772

Análisis de Mejora de Desempeño

Magnitud de mejora relativa al método de referencia:

  • ROUGE-1: Mejora del 65,41%
  • ROUGE-2: Mejora del 205,62%
  • ROUGE-L: Mejora del 92,79%

PAGE logra un desempeño cercano al límite superior ideal, quedando solo 2-4 puntos porcentuales por debajo, demostrando la efectividad del método.

Análisis de Casos

Ejemplo 1 (Categoría Ubicua):

  • Entrada original: "The system shall allow a customer to place an order online"
  • Salida Zero-shot: Descripción estructurada compleja (Actor, Evento, Rol, etc.)
  • Salida PAGE: "The system shall always allow a customer to place an order online"
  • Salida esperada: "The system shall allow a customer to place an order online"

Ejemplo 2 (Categoría Impulsada por eventos):

  • Entrada original: "When a driver completes a ride, the system shall allow the driver to leave a review"
  • Salida Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
  • Salida PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

Hallazgos Experimentales

  1. Papel clave del módulo auxiliar: La precisión de clasificación afecta directamente la calidad de generación final
  2. Efecto significativo del aprendizaje Few-shot: Proporcionar ejemplos relevantes mejora significativamente la estructura de generación
  3. Ventajas modulares: Permite evaluar y optimizar independientemente la contribución de cada componente
  4. Eficiencia de recursos: Evita el alto costo del reentrenamiento de grandes modelos

Trabajo Relacionado

Métodos de Mejora Generativa

  • Du et al.: Combinación de indicaciones explícitas y conocimiento semántico externo para mejorar el razonamiento textual
  • He et al.: Uso de resúmenes codificados por BERT para guiar la generación de GPT-2
  • Zeldes et al.: Técnica de Ajuste Auxiliar, combinando modelos auxiliares a nivel de logits

Generación Mejorada por Conocimiento

  • Zhang et al.: Marco IAG, utilizando modelos generativos auxiliares para inducción de conocimiento
  • Liao et al.: Generación Aumentada Despertada, activando conocimiento latente mediante tareas auxiliares

Singularidad de PAGE

En comparación con métodos existentes, las ventajas de PAGE son:

  1. No requiere modelos generativos auxiliares, reduciendo complejidad
  2. Utiliza componentes auxiliares ligeros e interpretables
  3. Diseño modular, fácil de adaptar a diferentes tareas
  4. Requisitos de recursos bajos, adecuado para aplicaciones prácticas

Conclusiones y Discusión

Conclusiones Principales

  1. Validación de efectividad: PAGE supera significativamente el método de referencia en la tarea de generación de requisitos de software
  2. Amigable con recursos: Logra mejora de desempeño mediante módulos auxiliares simples, evitando costos de reentrenamiento
  3. Ventajas arquitectónicas: El diseño modular proporciona buena interpretabilidad y adaptabilidad
  4. Valor práctico: Proporciona una solución viable para optimización de generación de texto en entornos con recursos limitados

Limitaciones

  1. Dependencia del módulo auxiliar: La calidad de generación está limitada por la precisión del módulo auxiliar
  2. Especialización de dominio: La validación actual se limita al campo de la ingeniería de requisitos
  3. Escala del conjunto de datos: El conjunto de datos utilizado en experimentos es relativamente pequeño (253 instancias)
  4. Limitaciones de métricas de evaluación: Se basa principalmente en métricas ROUGE, careciendo de evaluación humana

Direcciones Futuras

  1. Implementación del marco: Desarrollar un marco de software Python, proporcionando implementación reutilizable de PAGE
  2. Validación multidisciplinaria: Probar la efectividad del marco en más campos de aplicación
  3. Optimización del módulo auxiliar: Investigar estrategias de diseño de módulos auxiliares más eficientes
  4. Perfeccionamiento del sistema de evaluación: Introducir métricas de evaluación más completas y evaluación humana

Evaluación Profunda

Fortalezas

  1. Fuerte innovación: Propone una solución única de mejora auxiliar ligera
  2. Alto valor práctico: Resuelve problemas de limitación de recursos en aplicaciones reales
  3. Diseño razonable: La arquitectura modular facilita la comprensión, implementación y extensión
  4. Experimentos suficientes: Diseña experimentos de comparación razonables, incluyendo análisis de límite superior ideal
  5. Resultados significativos: Logra mejoras de desempeño sustanciales en múltiples métricas

Insuficiencias

  1. Rango de validación limitado: Validación solo en un dominio específico (ingeniería de requisitos)
  2. Conjunto de datos pequeño: El conjunto de datos de 253 instancias puede ser insuficiente para validar completamente la capacidad de generalización del método
  3. Comparación de línea base insuficiente: Carece de comparación directa con otros métodos de mejora de indicaciones
  4. Análisis teórico deficiente: Falta análisis teórico profundo sobre por qué el método es efectivo
  5. Ausencia de evaluación humana: Depende completamente de métricas automáticas, careciendo de evaluación de expertos

Impacto

  1. Contribución académica: Proporciona una nueva dirección de investigación para mejora de generación de texto
  2. Valor práctico: Proporciona solución práctica para optimización de generación en escenarios con recursos limitados
  3. Reproducibilidad: La descripción del método es clara, la implementación es relativamente simple
  4. Extensibilidad: El diseño del marco tiene buena extensibilidad

Escenarios de Aplicación

  1. Generación de texto en dominios especializados: Como documentación técnica, textos legales, etc., que requieren formato específico
  2. Entornos con recursos limitados: Escenarios de aplicación donde no es posible realizar ajuste fino de grandes modelos
  3. Desarrollo rápido de prototipos: Aplicaciones que requieren adaptación rápida a nuevas tareas
  4. Escenarios con altos requisitos de interpretabilidad: Aplicaciones que necesitan comprender el proceso de generación

Referencias

El artículo cita múltiples trabajos relacionados importantes, incluyendo:

  • Trabajos fundamentales de arquitectura Transformer (Vaswani et al., 2017)
  • Principales modelos de lenguaje grande (GPT, BERT, T5, Llama, etc.)
  • Especificación de sintaxis de requisitos EARS (Mavin et al., 2009)
  • Métricas de evaluación ROUGE (Lin, 2004)
  • Métodos relacionados de mejora generativa, etc.

Evaluación General: Este es un artículo de investigación que propone un método innovador. El marco PAGE proporciona nuevas perspectivas para la mejora de generación de texto. Aunque hay espacio para mejora en el rango de validación y análisis teórico, su valor práctico e innovación técnica son dignos de reconocimiento. Este método es particularmente adecuado para escenarios de aplicación que requieren adaptación rápida a tareas específicas con recursos limitados.