2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale

In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.

academic

PAGE : Augmentation de Prompts pour l'Amélioration de la Génération de Texte

Informations Fondamentales

ID de l'article : 2510.13880
Titre : PAGE: Prompt Augmentation for text Generation Enhancement
Auteurs : Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentine)
Classification : cs.CL cs.AI
Institution : Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentine
Lien de l'article : https://arxiv.org/abs/2510.13880

Résumé

Ces dernières années, les modèles de génération de langage naturel ont démontré des performances exceptionnelles dans les tâches de génération de texte. Cependant, face à des tâches spécifiques ou à des exigences particulières, ces modèles peuvent présenter des performances insuffisantes ou nécessiter une quantité considérable de données supplémentaires pour l'ajustement. Cette recherche propose PAGE (Prompt Augmentation for text Generation Enhancement), un cadre d'amélioration de ces modèles par l'utilisation de modules auxiliaires simples. Ces modules auxiliaires sont des modèles légers, tels que des classificateurs ou des extracteurs, capables de fournir des informations d'inférence à partir du texte d'entrée. La sortie des modules auxiliaires est utilisée pour construire des entrées enrichies, améliorant ainsi la qualité et la contrôlabilité de la génération. Contrairement à d'autres méthodes d'assistance à la génération, PAGE ne nécessite pas de modèles génératifs auxiliaires, mais propose plutôt une architecture plus simple, modulaire et facilement adaptable à différentes tâches.

Contexte et Motivation de la Recherche

Problèmes Fondamentaux

Performance insuffisante sur des tâches spécifiques : Bien que les grands modèles de langage (LLM) excellent dans les tâches génériques de génération de texte, ils présentent souvent des performances insuffisantes face à des tâches spécifiques à un domaine ou ayant des exigences particulières
Coût élevé de l'ajustement fin : La solution traditionnelle consiste à réentraîner ou ajuster le modèle, ce qui nécessite une grande quantité de données de haute qualité et des ressources informatiques considérables
Problèmes de limitations de ressources : De nombreux scénarios d'application ne peuvent pas accéder à suffisamment de données d'entraînement et de capacités informatiques

Motivation de la Recherche

Réduction des besoins en ressources : Fournir une méthode pour améliorer la qualité de la génération sans réentraînement à grande échelle
Amélioration de la contrôlabilité : Enrichir l'entrée avec des informations structurées pour rendre la génération plus contrôlable et précise
Conception modulaire : Créer une architecture flexible facilement adaptable à différentes tâches
Interprétabilité : Utiliser des modules auxiliaires simples et interprétables, facilitant la compréhension et le débogage

Contributions Fondamentales

Proposition du cadre PAGE : Une architecture innovante d'augmentation de prompts améliorant la qualité de la génération de texte par des modules auxiliaires simples
Conception modulaire : Contrairement à d'autres approches, PAGE ne dépend pas de modèles génératifs auxiliaires, mais utilise plutôt des composants légers tels que des classificateurs et des extracteurs
Efficacité des ressources : Réduction significative des besoins en données d'entraînement et en ressources informatiques
Validation pratique : Preuve de concept dans le domaine de l'ingénierie des exigences logicielles, utilisant la syntaxe EARS pour générer des exigences structurées
Amélioration des performances : Améliorations significatives par rapport aux méthodes de base sur les métriques ROUGE (amélioration ROUGE-1 de 65,41%, amélioration ROUGE-2 de 205,62%)

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée : Description textuelle originale (par exemple, description d'exigences en langage naturel) Sortie : Texte structuré et de haute qualité (par exemple, expression d'exigences conforme à une syntaxe spécifique) Objectif : Améliorer la qualité de la génération par l'enrichissement de l'invite d'entrée avec des informations auxiliaires, sans réentraînement du modèle principal

Architecture du Modèle

Le cadre PAGE comprend trois composants fondamentaux :

1. Module Auxiliaire (Auxiliary Module)

Fonction : Effectuer une inférence sur le texte d'entrée et extraire des informations structurées
Types :
- Classificateur : Assigner des étiquettes pertinentes au texte d'entrée
- Extracteur d'entités : Identifier et classifier les entités clés du texte
- Analyseur de sentiment : Détecter l'orientation sentimentale ou l'intention du texte
Caractéristiques : Léger, hautement interprétable, coût d'entraînement faible

2. Compositeur de Prompts (Prompt Composer)

Fonction : Combiner la sortie du module auxiliaire avec le texte original pour construire une invite augmentée
Implémentation : Utiliser des modèles configurables pour intégrer les informations structurées dans l'entrée
Sortie : Une invite contextuelle enrichie fournissant plus d'informations directrices au modèle génératif

3. Modèle Génératif (Generative Model)

Fonction : Générer le texte final basé sur l'invite augmentée
Caractéristiques : Peut utiliser n'importe quel LLM existant sans modification ni réentraînement
Techniques : Supporte les techniques de prompting zero-shot, one-shot et few-shot

Flux de Travail

Texte original → Module auxiliaire → Informations structurées
    ↓           ↓
    └→ Compositeur de prompts ←┘
           ↓
    Invite augmentée → Modèle génératif → Sortie finale

L'utilisateur fournit l'entrée textuelle originale
Le module auxiliaire traite l'entrée en parallèle, générant des informations d'inférence structurées
Le compositeur de prompts combine le texte original avec les informations auxiliaires
Le modèle génératif produit la sortie finale basée sur l'invite augmentée

Points d'Innovation Technique

Assistance légère : Contrairement à l'utilisation de grands modèles génératifs auxiliaires, PAGE emploie des composants légers tels que des classificateurs simples
Architecture modulaire : Chaque composant peut être optimisé et remplacé indépendamment, offrant une grande adaptabilité
Pas de réentraînement nécessaire : Le modèle génératif principal reste inchangé, l'amélioration des performances provenant uniquement de l'augmentation des prompts
Haute interprétabilité : La sortie des modules auxiliaires constitue une structure textuelle explicite, facilitant la compréhension et le débogage

Configuration Expérimentale

Ensemble de Données

Sources : Intégration de plusieurs ensembles de données
- Ensemble de données PURE : Collection publique de documents d'exigences
- Ensemble de données Software Functional Requirements
- Exigences provenant de documents de spécification publics
Taille : 253 instances
Structure :
- Expression d'exigences originale (sans structure syntaxique spécifique)
- Étiquettes de catégorie EARS
- Expression d'exigences EARS rédigée manuellement
Distribution des catégories : Couvre les cinq catégories EARS (Ubiquitous, Event-driven, State-driven, Unwanted, Optional)

Métriques d'Évaluation

Utilisation de la famille de métriques ROUGE pour évaluer la qualité de la génération :

ROUGE-1 : Chevauchement au niveau des mots
ROUGE-2 : Correspondance des bigrammes
ROUGE-L : Plus longue sous-séquence commune, mesurant la préservation de la structure

Chaque métrique calcule trois dimensions : Precision, Recall et F1-Score.

Méthodes de Comparaison

Trois groupes d'expériences conçus pour la comparaison :

Ligne de base Zero-shot : Utilisation directe du LLM sans augmentation
Limite supérieure idéale : Utilisation des étiquettes correctes de l'ensemble de données comme informations auxiliaires
Implémentation complète de PAGE : Utilisation d'un classificateur entraîné comme module auxiliaire

Détails d'Implémentation

Classificateur auxiliaire : Modèle Random Forest
- Profondeur maximale : 10
- Nombre minimum d'échantillons pour division : 5
- Nombre d'estimateurs : 100
- Précision : 82,35%
Modèle génératif : Llama 3.1-8B, déployé localement via Ollama
Division des données : 80% entraînement, 20% test, validation croisée 5-fold

Résultats Expérimentaux

Résultats Principaux

Méthode	Métrique	Precision	Recall	F1-Score
Zero-Shot	ROUGE-1	0,509	0,489	0,485
	ROUGE-2	0,206	0,204	0,199
	ROUGE-L	0,413	0,395	0,392
Échantillons-Dataset	ROUGE-1	0,852	0,815	0,827
	ROUGE-2	0,653	0,630	0,636
	ROUGE-L	0,803	0,770	0,781
PAGE	ROUGE-1	0,849	0,809	0,822
	ROUGE-2	0,648	0,622	0,630
	ROUGE-L	0,796	0,761	0,772

Analyse des Améliorations de Performance

Ampleur des améliorations par rapport à la méthode de base :

ROUGE-1 : Amélioration de 65,41%
ROUGE-2 : Amélioration de 205,62%
ROUGE-L : Amélioration de 92,79%

PAGE atteint une performance proche de la limite supérieure idéale, ne la dépassant que de 2 à 4 points de pourcentage, démontrant l'efficacité de la méthode.

Analyse de Cas

Exemple 1 (Catégorie Ubiquitous) :

Entrée originale : "The system shall allow a customer to place an order online"
Sortie Zero-shot : Description structurée complexe (Actor, Event, Role, etc.)
Sortie PAGE : "The system shall always allow a customer to place an order online"
Sortie attendue : "The system shall allow a customer to place an order online"

Exemple 2 (Catégorie Event-driven) :

Entrée originale : "When a driver completes a ride, the system shall allow the driver to leave a review"
Sortie Zero-shot : "The Driver shall be enabled to submit a review after successfully completing a ride"
Sortie PAGE : "When a ride is completed, the Application shall enable the driver to leave a review"

Découvertes Expérimentales

Rôle clé du module auxiliaire : La précision de la classification affecte directement la qualité de la génération finale
Effet significatif de l'apprentissage Few-shot : Fournir des exemples pertinents améliore considérablement la structure de génération
Avantages de la modularité : Permet l'évaluation et l'optimisation indépendantes de chaque composant
Efficacité des ressources : Évite les coûts élevés du réentraînement des grands modèles

Travaux Connexes

Méthodes d'Amélioration de la Génération

Du et al. : Combinaison de prompts explicites et de connaissances sémantiques externes pour améliorer le raisonnement textuel
He et al. : Utilisation de résumés humains codés par BERT pour guider la génération GPT-2
Zeldes et al. : Technique d'Auxiliary Tuning, combinant des modèles auxiliaires au niveau des logits

Génération Enrichie par les Connaissances

Zhang et al. : Cadre IAG, utilisant des modèles génératifs auxiliaires pour l'induction de connaissances
Liao et al. : Awakening Augmented Generation, activant les connaissances latentes par des tâches auxiliaires

Unicité de PAGE

Comparé aux méthodes existantes, les avantages de PAGE résident dans :

L'absence de besoin de modèles génératifs auxiliaires, réduisant la complexité
L'utilisation de composants auxiliaires légers et interprétables
La conception modulaire, facilement adaptable à différentes tâches
Les faibles besoins en ressources, appropriés pour les applications pratiques

Conclusion et Discussion

Conclusions Principales

Validation de l'efficacité : PAGE surpasse significativement les méthodes de base dans les tâches de génération d'exigences logicielles
Efficacité des ressources : Amélioration des performances par des modules auxiliaires simples, évitant les coûts de réentraînement
Avantages architecturaux : La conception modulaire offre une bonne interprétabilité et adaptabilité
Valeur pratique : Fournit une solution viable pour l'optimisation de la génération de texte dans les environnements à ressources limitées

Limitations

Dépendance du module auxiliaire : La qualité de la génération est limitée par la précision du module auxiliaire
Spécialisation du domaine : La validation actuelle se limite au domaine de l'ingénierie des exigences
Taille de l'ensemble de données : L'ensemble de données utilisé dans les expériences est relativement petit (253 instances)
Limitations des métriques d'évaluation : Dépend principalement des métriques ROUGE, manquant d'évaluation humaine

Directions Futures

Implémentation du cadre : Développer un cadre logiciel Python fournissant une implémentation réutilisable de PAGE
Validation multi-domaines : Tester l'efficacité du cadre dans davantage de domaines d'application
Optimisation des modules auxiliaires : Rechercher des stratégies de conception de modules auxiliaires plus efficaces
Amélioration du système d'évaluation : Introduire des métriques d'évaluation plus complètes et des évaluations humaines

Évaluation Approfondie

Points Forts

Innovation forte : Propose une solution d'augmentation légère et auxiliaire unique
Valeur pratique élevée : Résout les problèmes de limitations de ressources dans les applications réelles
Conception rationnelle : L'architecture modulaire facilite la compréhension, l'implémentation et l'extension
Expérimentation suffisante : Conception d'expériences de comparaison rationnelles, incluant l'analyse de la limite supérieure idéale
Résultats significatifs : Améliorations de performance substantielles sur plusieurs métriques

Insuffisances

Portée de validation limitée : Validation uniquement dans un domaine spécifique (ingénierie des exigences)
Ensemble de données petit : Un ensemble de 253 instances peut être insuffisant pour valider complètement la capacité de généralisation de la méthode
Comparaisons de base insuffisantes : Manque de comparaison directe avec d'autres méthodes d'augmentation de prompts
Manque d'analyse théorique : Absence d'explication théorique approfondie sur l'efficacité de la méthode
Absence d'évaluation humaine : Dépendance complète sur les métriques automatiques, manquant d'évaluation par des experts

Impact

Contribution académique : Fournit une nouvelle direction de recherche pour l'amélioration de la génération de texte
Valeur pratique : Offre une solution pratique pour l'optimisation de la génération dans les scénarios à ressources limitées
Reproductibilité : Description claire de la méthode, implémentation relativement simple
Extensibilité : La conception du cadre possède une bonne extensibilité

Scénarios d'Application

Génération de texte dans les domaines professionnels : Tels que la génération de documents techniques, de textes juridiques et autres textes nécessitant un format spécifique
Environnements à ressources limitées : Scénarios d'application où l'ajustement fin des grands modèles n'est pas possible
Développement rapide de prototypes : Applications nécessitant une adaptation rapide à de nouvelles tâches
Scénarios exigeant une haute interprétabilité : Applications nécessitant la compréhension du processus de génération

Références Bibliographiques

L'article cite plusieurs travaux importants connexes, notamment :

Travaux fondamentaux sur l'architecture Transformer (Vaswani et al., 2017)
Principaux modèles de langage (GPT, BERT, T5, Llama, etc.)
Spécifications de syntaxe EARS pour les exigences (Mavin et al., 2009)
Métriques d'évaluation ROUGE (Lin, 2004)
Méthodes connexes d'amélioration de la génération, etc.

Évaluation Globale : Cet article présente une méthode innovante, le cadre PAGE offrant une nouvelle perspective pour l'amélioration de la génération de texte. Bien qu'il y ait de la place pour l'amélioration en termes de portée de validation et d'analyse théorique, sa valeur pratique et son innovation technique méritent d'être reconnues. Cette méthode est particulièrement adaptée aux scénarios d'application nécessitant une adaptation rapide à des tâches spécifiques avec des ressources limitées.