PAGE: Prompt Augmentation for text Generation Enhancement
Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic
PAGE : Augmentation de Prompts pour l'Amélioration de la Génération de Texte
Ces dernières années, les modèles de génération de langage naturel ont démontré des performances exceptionnelles dans les tâches de génération de texte. Cependant, face à des tâches spécifiques ou à des exigences particulières, ces modèles peuvent présenter des performances insuffisantes ou nécessiter une quantité considérable de données supplémentaires pour l'ajustement. Cette recherche propose PAGE (Prompt Augmentation for text Generation Enhancement), un cadre d'amélioration de ces modèles par l'utilisation de modules auxiliaires simples. Ces modules auxiliaires sont des modèles légers, tels que des classificateurs ou des extracteurs, capables de fournir des informations d'inférence à partir du texte d'entrée. La sortie des modules auxiliaires est utilisée pour construire des entrées enrichies, améliorant ainsi la qualité et la contrôlabilité de la génération. Contrairement à d'autres méthodes d'assistance à la génération, PAGE ne nécessite pas de modèles génératifs auxiliaires, mais propose plutôt une architecture plus simple, modulaire et facilement adaptable à différentes tâches.
Performance insuffisante sur des tâches spécifiques : Bien que les grands modèles de langage (LLM) excellent dans les tâches génériques de génération de texte, ils présentent souvent des performances insuffisantes face à des tâches spécifiques à un domaine ou ayant des exigences particulières
Coût élevé de l'ajustement fin : La solution traditionnelle consiste à réentraîner ou ajuster le modèle, ce qui nécessite une grande quantité de données de haute qualité et des ressources informatiques considérables
Problèmes de limitations de ressources : De nombreux scénarios d'application ne peuvent pas accéder à suffisamment de données d'entraînement et de capacités informatiques
Proposition du cadre PAGE : Une architecture innovante d'augmentation de prompts améliorant la qualité de la génération de texte par des modules auxiliaires simples
Conception modulaire : Contrairement à d'autres approches, PAGE ne dépend pas de modèles génératifs auxiliaires, mais utilise plutôt des composants légers tels que des classificateurs et des extracteurs
Efficacité des ressources : Réduction significative des besoins en données d'entraînement et en ressources informatiques
Validation pratique : Preuve de concept dans le domaine de l'ingénierie des exigences logicielles, utilisant la syntaxe EARS pour générer des exigences structurées
Amélioration des performances : Améliorations significatives par rapport aux méthodes de base sur les métriques ROUGE (amélioration ROUGE-1 de 65,41%, amélioration ROUGE-2 de 205,62%)
Entrée : Description textuelle originale (par exemple, description d'exigences en langage naturel)
Sortie : Texte structuré et de haute qualité (par exemple, expression d'exigences conforme à une syntaxe spécifique)
Objectif : Améliorer la qualité de la génération par l'enrichissement de l'invite d'entrée avec des informations auxiliaires, sans réentraînement du modèle principal
Assistance légère : Contrairement à l'utilisation de grands modèles génératifs auxiliaires, PAGE emploie des composants légers tels que des classificateurs simples
Architecture modulaire : Chaque composant peut être optimisé et remplacé indépendamment, offrant une grande adaptabilité
Pas de réentraînement nécessaire : Le modèle génératif principal reste inchangé, l'amélioration des performances provenant uniquement de l'augmentation des prompts
Haute interprétabilité : La sortie des modules auxiliaires constitue une structure textuelle explicite, facilitant la compréhension et le débogage
Ampleur des améliorations par rapport à la méthode de base :
ROUGE-1 : Amélioration de 65,41%
ROUGE-2 : Amélioration de 205,62%
ROUGE-L : Amélioration de 92,79%
PAGE atteint une performance proche de la limite supérieure idéale, ne la dépassant que de 2 à 4 points de pourcentage, démontrant l'efficacité de la méthode.
Génération de texte dans les domaines professionnels : Tels que la génération de documents techniques, de textes juridiques et autres textes nécessitant un format spécifique
Environnements à ressources limitées : Scénarios d'application où l'ajustement fin des grands modèles n'est pas possible
Développement rapide de prototypes : Applications nécessitant une adaptation rapide à de nouvelles tâches
Scénarios exigeant une haute interprétabilité : Applications nécessitant la compréhension du processus de génération
L'article cite plusieurs travaux importants connexes, notamment :
Travaux fondamentaux sur l'architecture Transformer (Vaswani et al., 2017)
Principaux modèles de langage (GPT, BERT, T5, Llama, etc.)
Spécifications de syntaxe EARS pour les exigences (Mavin et al., 2009)
Métriques d'évaluation ROUGE (Lin, 2004)
Méthodes connexes d'amélioration de la génération, etc.
Évaluation Globale : Cet article présente une méthode innovante, le cadre PAGE offrant une nouvelle perspective pour l'amélioration de la génération de texte. Bien qu'il y ait de la place pour l'amélioration en termes de portée de validation et d'analyse théorique, sa valeur pratique et son innovation technique méritent d'être reconnues. Cette méthode est particulièrement adaptée aux scénarios d'application nécessitant une adaptation rapide à des tâches spécifiques avec des ressources limitées.