2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic

PAGE : Augmentation de Prompts pour l'Amélioration de la Génération de Texte

Informations Fondamentales

  • ID de l'article : 2510.13880
  • Titre : PAGE: Prompt Augmentation for text Generation Enhancement
  • Auteurs : Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentine)
  • Classification : cs.CL cs.AI
  • Institution : Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentine
  • Lien de l'article : https://arxiv.org/abs/2510.13880

Résumé

Ces dernières années, les modèles de génération de langage naturel ont démontré des performances exceptionnelles dans les tâches de génération de texte. Cependant, face à des tâches spécifiques ou à des exigences particulières, ces modèles peuvent présenter des performances insuffisantes ou nécessiter une quantité considérable de données supplémentaires pour l'ajustement. Cette recherche propose PAGE (Prompt Augmentation for text Generation Enhancement), un cadre d'amélioration de ces modèles par l'utilisation de modules auxiliaires simples. Ces modules auxiliaires sont des modèles légers, tels que des classificateurs ou des extracteurs, capables de fournir des informations d'inférence à partir du texte d'entrée. La sortie des modules auxiliaires est utilisée pour construire des entrées enrichies, améliorant ainsi la qualité et la contrôlabilité de la génération. Contrairement à d'autres méthodes d'assistance à la génération, PAGE ne nécessite pas de modèles génératifs auxiliaires, mais propose plutôt une architecture plus simple, modulaire et facilement adaptable à différentes tâches.

Contexte et Motivation de la Recherche

Problèmes Fondamentaux

  1. Performance insuffisante sur des tâches spécifiques : Bien que les grands modèles de langage (LLM) excellent dans les tâches génériques de génération de texte, ils présentent souvent des performances insuffisantes face à des tâches spécifiques à un domaine ou ayant des exigences particulières
  2. Coût élevé de l'ajustement fin : La solution traditionnelle consiste à réentraîner ou ajuster le modèle, ce qui nécessite une grande quantité de données de haute qualité et des ressources informatiques considérables
  3. Problèmes de limitations de ressources : De nombreux scénarios d'application ne peuvent pas accéder à suffisamment de données d'entraînement et de capacités informatiques

Motivation de la Recherche

  • Réduction des besoins en ressources : Fournir une méthode pour améliorer la qualité de la génération sans réentraînement à grande échelle
  • Amélioration de la contrôlabilité : Enrichir l'entrée avec des informations structurées pour rendre la génération plus contrôlable et précise
  • Conception modulaire : Créer une architecture flexible facilement adaptable à différentes tâches
  • Interprétabilité : Utiliser des modules auxiliaires simples et interprétables, facilitant la compréhension et le débogage

Contributions Fondamentales

  1. Proposition du cadre PAGE : Une architecture innovante d'augmentation de prompts améliorant la qualité de la génération de texte par des modules auxiliaires simples
  2. Conception modulaire : Contrairement à d'autres approches, PAGE ne dépend pas de modèles génératifs auxiliaires, mais utilise plutôt des composants légers tels que des classificateurs et des extracteurs
  3. Efficacité des ressources : Réduction significative des besoins en données d'entraînement et en ressources informatiques
  4. Validation pratique : Preuve de concept dans le domaine de l'ingénierie des exigences logicielles, utilisant la syntaxe EARS pour générer des exigences structurées
  5. Amélioration des performances : Améliorations significatives par rapport aux méthodes de base sur les métriques ROUGE (amélioration ROUGE-1 de 65,41%, amélioration ROUGE-2 de 205,62%)

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée : Description textuelle originale (par exemple, description d'exigences en langage naturel) Sortie : Texte structuré et de haute qualité (par exemple, expression d'exigences conforme à une syntaxe spécifique) Objectif : Améliorer la qualité de la génération par l'enrichissement de l'invite d'entrée avec des informations auxiliaires, sans réentraînement du modèle principal

Architecture du Modèle

Le cadre PAGE comprend trois composants fondamentaux :

1. Module Auxiliaire (Auxiliary Module)

  • Fonction : Effectuer une inférence sur le texte d'entrée et extraire des informations structurées
  • Types :
    • Classificateur : Assigner des étiquettes pertinentes au texte d'entrée
    • Extracteur d'entités : Identifier et classifier les entités clés du texte
    • Analyseur de sentiment : Détecter l'orientation sentimentale ou l'intention du texte
  • Caractéristiques : Léger, hautement interprétable, coût d'entraînement faible

2. Compositeur de Prompts (Prompt Composer)

  • Fonction : Combiner la sortie du module auxiliaire avec le texte original pour construire une invite augmentée
  • Implémentation : Utiliser des modèles configurables pour intégrer les informations structurées dans l'entrée
  • Sortie : Une invite contextuelle enrichie fournissant plus d'informations directrices au modèle génératif

3. Modèle Génératif (Generative Model)

  • Fonction : Générer le texte final basé sur l'invite augmentée
  • Caractéristiques : Peut utiliser n'importe quel LLM existant sans modification ni réentraînement
  • Techniques : Supporte les techniques de prompting zero-shot, one-shot et few-shot

Flux de Travail

Texte original → Module auxiliaire → Informations structurées
    ↓           ↓
    └→ Compositeur de prompts ←┘
           ↓
    Invite augmentée → Modèle génératif → Sortie finale
  1. L'utilisateur fournit l'entrée textuelle originale
  2. Le module auxiliaire traite l'entrée en parallèle, générant des informations d'inférence structurées
  3. Le compositeur de prompts combine le texte original avec les informations auxiliaires
  4. Le modèle génératif produit la sortie finale basée sur l'invite augmentée

Points d'Innovation Technique

  1. Assistance légère : Contrairement à l'utilisation de grands modèles génératifs auxiliaires, PAGE emploie des composants légers tels que des classificateurs simples
  2. Architecture modulaire : Chaque composant peut être optimisé et remplacé indépendamment, offrant une grande adaptabilité
  3. Pas de réentraînement nécessaire : Le modèle génératif principal reste inchangé, l'amélioration des performances provenant uniquement de l'augmentation des prompts
  4. Haute interprétabilité : La sortie des modules auxiliaires constitue une structure textuelle explicite, facilitant la compréhension et le débogage

Configuration Expérimentale

Ensemble de Données

  • Sources : Intégration de plusieurs ensembles de données
    • Ensemble de données PURE : Collection publique de documents d'exigences
    • Ensemble de données Software Functional Requirements
    • Exigences provenant de documents de spécification publics
  • Taille : 253 instances
  • Structure :
    • Expression d'exigences originale (sans structure syntaxique spécifique)
    • Étiquettes de catégorie EARS
    • Expression d'exigences EARS rédigée manuellement
  • Distribution des catégories : Couvre les cinq catégories EARS (Ubiquitous, Event-driven, State-driven, Unwanted, Optional)

Métriques d'Évaluation

Utilisation de la famille de métriques ROUGE pour évaluer la qualité de la génération :

  • ROUGE-1 : Chevauchement au niveau des mots
  • ROUGE-2 : Correspondance des bigrammes
  • ROUGE-L : Plus longue sous-séquence commune, mesurant la préservation de la structure

Chaque métrique calcule trois dimensions : Precision, Recall et F1-Score.

Méthodes de Comparaison

Trois groupes d'expériences conçus pour la comparaison :

  1. Ligne de base Zero-shot : Utilisation directe du LLM sans augmentation
  2. Limite supérieure idéale : Utilisation des étiquettes correctes de l'ensemble de données comme informations auxiliaires
  3. Implémentation complète de PAGE : Utilisation d'un classificateur entraîné comme module auxiliaire

Détails d'Implémentation

  • Classificateur auxiliaire : Modèle Random Forest
    • Profondeur maximale : 10
    • Nombre minimum d'échantillons pour division : 5
    • Nombre d'estimateurs : 100
    • Précision : 82,35%
  • Modèle génératif : Llama 3.1-8B, déployé localement via Ollama
  • Division des données : 80% entraînement, 20% test, validation croisée 5-fold

Résultats Expérimentaux

Résultats Principaux

MéthodeMétriquePrecisionRecallF1-Score
Zero-ShotROUGE-10,5090,4890,485
ROUGE-20,2060,2040,199
ROUGE-L0,4130,3950,392
Échantillons-DatasetROUGE-10,8520,8150,827
ROUGE-20,6530,6300,636
ROUGE-L0,8030,7700,781
PAGEROUGE-10,8490,8090,822
ROUGE-20,6480,6220,630
ROUGE-L0,7960,7610,772

Analyse des Améliorations de Performance

Ampleur des améliorations par rapport à la méthode de base :

  • ROUGE-1 : Amélioration de 65,41%
  • ROUGE-2 : Amélioration de 205,62%
  • ROUGE-L : Amélioration de 92,79%

PAGE atteint une performance proche de la limite supérieure idéale, ne la dépassant que de 2 à 4 points de pourcentage, démontrant l'efficacité de la méthode.

Analyse de Cas

Exemple 1 (Catégorie Ubiquitous) :

  • Entrée originale : "The system shall allow a customer to place an order online"
  • Sortie Zero-shot : Description structurée complexe (Actor, Event, Role, etc.)
  • Sortie PAGE : "The system shall always allow a customer to place an order online"
  • Sortie attendue : "The system shall allow a customer to place an order online"

Exemple 2 (Catégorie Event-driven) :

  • Entrée originale : "When a driver completes a ride, the system shall allow the driver to leave a review"
  • Sortie Zero-shot : "The Driver shall be enabled to submit a review after successfully completing a ride"
  • Sortie PAGE : "When a ride is completed, the Application shall enable the driver to leave a review"

Découvertes Expérimentales

  1. Rôle clé du module auxiliaire : La précision de la classification affecte directement la qualité de la génération finale
  2. Effet significatif de l'apprentissage Few-shot : Fournir des exemples pertinents améliore considérablement la structure de génération
  3. Avantages de la modularité : Permet l'évaluation et l'optimisation indépendantes de chaque composant
  4. Efficacité des ressources : Évite les coûts élevés du réentraînement des grands modèles

Travaux Connexes

Méthodes d'Amélioration de la Génération

  • Du et al. : Combinaison de prompts explicites et de connaissances sémantiques externes pour améliorer le raisonnement textuel
  • He et al. : Utilisation de résumés humains codés par BERT pour guider la génération GPT-2
  • Zeldes et al. : Technique d'Auxiliary Tuning, combinant des modèles auxiliaires au niveau des logits

Génération Enrichie par les Connaissances

  • Zhang et al. : Cadre IAG, utilisant des modèles génératifs auxiliaires pour l'induction de connaissances
  • Liao et al. : Awakening Augmented Generation, activant les connaissances latentes par des tâches auxiliaires

Unicité de PAGE

Comparé aux méthodes existantes, les avantages de PAGE résident dans :

  1. L'absence de besoin de modèles génératifs auxiliaires, réduisant la complexité
  2. L'utilisation de composants auxiliaires légers et interprétables
  3. La conception modulaire, facilement adaptable à différentes tâches
  4. Les faibles besoins en ressources, appropriés pour les applications pratiques

Conclusion et Discussion

Conclusions Principales

  1. Validation de l'efficacité : PAGE surpasse significativement les méthodes de base dans les tâches de génération d'exigences logicielles
  2. Efficacité des ressources : Amélioration des performances par des modules auxiliaires simples, évitant les coûts de réentraînement
  3. Avantages architecturaux : La conception modulaire offre une bonne interprétabilité et adaptabilité
  4. Valeur pratique : Fournit une solution viable pour l'optimisation de la génération de texte dans les environnements à ressources limitées

Limitations

  1. Dépendance du module auxiliaire : La qualité de la génération est limitée par la précision du module auxiliaire
  2. Spécialisation du domaine : La validation actuelle se limite au domaine de l'ingénierie des exigences
  3. Taille de l'ensemble de données : L'ensemble de données utilisé dans les expériences est relativement petit (253 instances)
  4. Limitations des métriques d'évaluation : Dépend principalement des métriques ROUGE, manquant d'évaluation humaine

Directions Futures

  1. Implémentation du cadre : Développer un cadre logiciel Python fournissant une implémentation réutilisable de PAGE
  2. Validation multi-domaines : Tester l'efficacité du cadre dans davantage de domaines d'application
  3. Optimisation des modules auxiliaires : Rechercher des stratégies de conception de modules auxiliaires plus efficaces
  4. Amélioration du système d'évaluation : Introduire des métriques d'évaluation plus complètes et des évaluations humaines

Évaluation Approfondie

Points Forts

  1. Innovation forte : Propose une solution d'augmentation légère et auxiliaire unique
  2. Valeur pratique élevée : Résout les problèmes de limitations de ressources dans les applications réelles
  3. Conception rationnelle : L'architecture modulaire facilite la compréhension, l'implémentation et l'extension
  4. Expérimentation suffisante : Conception d'expériences de comparaison rationnelles, incluant l'analyse de la limite supérieure idéale
  5. Résultats significatifs : Améliorations de performance substantielles sur plusieurs métriques

Insuffisances

  1. Portée de validation limitée : Validation uniquement dans un domaine spécifique (ingénierie des exigences)
  2. Ensemble de données petit : Un ensemble de 253 instances peut être insuffisant pour valider complètement la capacité de généralisation de la méthode
  3. Comparaisons de base insuffisantes : Manque de comparaison directe avec d'autres méthodes d'augmentation de prompts
  4. Manque d'analyse théorique : Absence d'explication théorique approfondie sur l'efficacité de la méthode
  5. Absence d'évaluation humaine : Dépendance complète sur les métriques automatiques, manquant d'évaluation par des experts

Impact

  1. Contribution académique : Fournit une nouvelle direction de recherche pour l'amélioration de la génération de texte
  2. Valeur pratique : Offre une solution pratique pour l'optimisation de la génération dans les scénarios à ressources limitées
  3. Reproductibilité : Description claire de la méthode, implémentation relativement simple
  4. Extensibilité : La conception du cadre possède une bonne extensibilité

Scénarios d'Application

  1. Génération de texte dans les domaines professionnels : Tels que la génération de documents techniques, de textes juridiques et autres textes nécessitant un format spécifique
  2. Environnements à ressources limitées : Scénarios d'application où l'ajustement fin des grands modèles n'est pas possible
  3. Développement rapide de prototypes : Applications nécessitant une adaptation rapide à de nouvelles tâches
  4. Scénarios exigeant une haute interprétabilité : Applications nécessitant la compréhension du processus de génération

Références Bibliographiques

L'article cite plusieurs travaux importants connexes, notamment :

  • Travaux fondamentaux sur l'architecture Transformer (Vaswani et al., 2017)
  • Principaux modèles de langage (GPT, BERT, T5, Llama, etc.)
  • Spécifications de syntaxe EARS pour les exigences (Mavin et al., 2009)
  • Métriques d'évaluation ROUGE (Lin, 2004)
  • Méthodes connexes d'amélioration de la génération, etc.

Évaluation Globale : Cet article présente une méthode innovante, le cadre PAGE offrant une nouvelle perspective pour l'amélioration de la génération de texte. Bien qu'il y ait de la place pour l'amélioration en termes de portée de validation et d'analyse théorique, sa valeur pratique et son innovation technique méritent d'être reconnues. Cette méthode est particulièrement adaptée aux scénarios d'application nécessitant une adaptation rapide à des tâches spécifiques avec des ressources limitées.