PAGE: Prompt Augmentation for text Generation Enhancement
Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic
PAGE: Prompt Augmentation for text Generation Enhancement
In den letzten Jahren haben Modelle der natürlichen Sprachgenerierung außergewöhnliche Leistungen bei Textgenerierungsaufgaben gezeigt. Wenn sie jedoch mit aufgabenspezifischen oder speziellen Anforderungen konfrontiert werden, können diese Modelle eine schlechte Leistung erbringen oder benötigen große Mengen zusätzlicher Daten zur Anpassung. Diese Forschung präsentiert PAGE (Prompt Augmentation for text Generation Enhancement), ein Framework zur Unterstützung dieser Modelle durch einfache Hilfsmodule. Diese Hilfsmodule sind leichtgewichtige Modelle wie Klassifizierer oder Extraktoren, die Inferenzinformationen aus dem Eingabetext bereitstellen können. Die Ausgabe der Hilfsmodule wird verwendet, um reichhaltige Eingaben zu konstruieren und dadurch die Qualität und Kontrollierbarkeit der Generierung zu verbessern. Im Gegensatz zu anderen Generierungshilfsmethoden benötigt PAGE keine Hilfsgenerierungsmodelle, sondern schlägt eine einfachere, modularere und leichter an verschiedene Aufgaben anpassbare Architektur vor.
Unzureichende aufgabenspezifische Leistung: Obwohl große Sprachmodelle (LLMs) bei allgemeinen Textgenerierungsaufgaben hervorragende Leistungen erbringen, schneiden sie bei aufgabenspezifischen oder speziellen Anforderungen oft schlecht ab
Hohe Kosten für Fine-Tuning: Die traditionelle Lösung besteht darin, Modelle umzuschulen oder zu verfeinern, was jedoch große Mengen hochwertiger Daten und Rechenressourcen erfordert
Ressourcenbeschränkungen: Viele Anwendungsszenarien haben keinen Zugang zu ausreichenden Trainingsdaten und Rechenkapazität
PAGE-Framework vorgestellt: Eine innovative Prompt-Anreicherungsarchitektur, die die Textgenerierungsqualität durch einfache Hilfsmodule verbessert
Modulares Design: Im Gegensatz zu anderen Methoden verlässt sich PAGE nicht auf Hilfsgenerierungsmodelle, sondern nutzt leichtgewichtige Klassifizierer und Extraktoren
Ressourcenfreundlich: Deutliche Reduzierung der Anforderungen an Trainingsdaten und Rechenressourcen
Praktische Validierung: Konzeptnachweis im Bereich Software-Anforderungstechnik mit strukturierter Anforderungsgenerierung unter Verwendung der EARS-Syntax
Leistungsverbesserung: Signifikante Verbesserungen gegenüber Baseline-Methoden bei ROUGE-Metriken (ROUGE-1 Verbesserung um 65,41%, ROUGE-2 Verbesserung um 205,62%)
Eingabe: Ursprüngliche Textbeschreibung (z.B. natürlichsprachige Anforderungsbeschreibung)
Ausgabe: Strukturierter, hochwertiger Text (z.B. Anforderungsausdrücke, die bestimmten Syntaxvorgaben entsprechen)
Ziel: Eingabeaufforderung durch Hilfsinformationen anreichern, um die Generierungsqualität zu verbessern, ohne das Hauptmodell umzuschulen
Das Papier zitiert mehrere wichtige verwandte Arbeiten, einschließlich:
Grundlagenarbeiten zur Transformer-Architektur (Vaswani et al., 2017)
Hauptsprachmodelle (GPT, BERT, T5, Llama usw.)
EARS-Anforderungssyntaxspezifikation (Mavin et al., 2009)
ROUGE-Bewertungsmetriken (Lin, 2004)
Verwandte Generierungsverstärkungsmethoden usw.
Gesamtbewertung: Dies ist ein Forschungspapier, das eine innovative Methode präsentiert. Das PAGE-Framework bietet neue Perspektiven für Textgenerierungsverstärkung. Obwohl es Raum für Verbesserungen bei Validierungsreichweite und theoretischer Analyse gibt, sind sein praktischer Wert und technische Innovativität bemerkenswert. Diese Methode ist besonders für Anwendungsszenarien geeignet, die schnelle Aufgabenanpassung mit begrenzten Ressourcen erfordern.