2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale

In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.

academic

PAGE: Augmentazione del Prompt per il Miglioramento della Generazione di Testo

Informazioni Fondamentali

ID Articolo: 2510.13880
Titolo: PAGE: Prompt Augmentation for text Generation Enhancement
Autori: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentina)
Classificazione: cs.CL cs.AI
Istituzione: Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentina
Link Articolo: https://arxiv.org/abs/2510.13880

Riassunto

Negli ultimi anni, i modelli di generazione del linguaggio naturale hanno dimostrato prestazioni eccezionali nei compiti di generazione di testo. Tuttavia, quando affrontano compiti specifici o requisiti particolari, questi modelli potrebbero avere prestazioni scadenti o richiedere grandi quantità di dati aggiuntivi per l'adattamento. Questo studio propone PAGE (Prompt Augmentation for text Generation Enhancement), un framework che assiste questi modelli utilizzando semplici moduli ausiliari. Questi moduli ausiliari sono modelli leggeri, come classificatori o estrattori, in grado di fornire informazioni deduttive dal testo di input. L'output dei moduli ausiliari viene utilizzato per costruire input arricchiti, migliorando così la qualità e la controllabilità della generazione. A differenza di altri metodi di assistenza generativa, PAGE non richiede modelli generativi ausiliari, ma propone un'architettura più semplice, modulare e facilmente adattabile a diversi compiti.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

Prestazioni insufficienti in compiti specifici: I modelli linguistici di grandi dimensioni (LLM), sebbene eccellenti nei compiti generici di generazione di testo, spesso hanno prestazioni scadenti quando affrontano compiti specifici di dominio o con requisiti particolari
Costi elevati del fine-tuning: La soluzione tradizionale è riaddestrare o eseguire il fine-tuning del modello, ma ciò richiede grandi quantità di dati di alta qualità e risorse computazionali
Problemi di limitazione delle risorse: Molti scenari applicativi non possono accedere a dati di addestramento e capacità computazionali sufficienti

Motivazione della Ricerca

Riduzione dei requisiti di risorse: Fornire un metodo per migliorare la qualità della generazione senza riaddestramenti su larga scala
Aumento della controllabilità: Migliorare l'input attraverso informazioni strutturate, rendendo la generazione più controllabile e precisa
Progettazione modulare: Creare un'architettura flessibile facilmente adattabile a diversi compiti
Interpretabilità: Utilizzare moduli ausiliari semplici e interpretabili, facilitando la comprensione e il debug

Contributi Fondamentali

Proposta del framework PAGE: Un'architettura innovativa di augmentazione del prompt che migliora la qualità della generazione di testo attraverso semplici moduli ausiliari
Progettazione modulare: A differenza di altri metodi, PAGE non dipende da modelli generativi ausiliari, ma utilizza classificatori leggeri, estrattori, ecc.
Efficienza delle risorse: Riduce significativamente la necessità di dati di addestramento e risorse computazionali
Validazione pratica: Proof-of-concept nel campo dell'ingegneria dei requisiti software, utilizzando la sintassi EARS per la generazione di requisiti strutturati
Miglioramento delle prestazioni: Miglioramento significativo rispetto ai metodi di base nelle metriche ROUGE (aumento ROUGE-1 del 65,41%, aumento ROUGE-2 del 205,62%)

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Descrizioni di testo originale (ad esempio, descrizioni di requisiti in linguaggio naturale) Output: Testo strutturato e di alta qualità (ad esempio, espressioni di requisiti conformi a specifiche regole sintattiche) Obiettivo: Migliorare l'input del prompt attraverso informazioni ausiliarie, migliorando la qualità della generazione senza riaddestrare il modello principale

Architettura del Modello

Il framework PAGE contiene tre componenti fondamentali:

1. Modulo Ausiliario (Auxiliary Module)

Funzione: Eseguire inferenza sul testo di input, estraendo informazioni strutturate
Tipi:
- Classificatore: Assegnare etichette rilevanti al testo di input
- Estrattore di entità: Identificare e classificare le entità chiave nel testo
- Analizzatore di sentimento: Rilevare l'orientamento sentimentale o l'intento del testo
Caratteristiche: Leggero, altamente interpretabile, basso costo di addestramento

2. Compositore di Prompt (Prompt Composer)

Funzione: Combinare l'output del modulo ausiliario con il testo originale, costruendo il prompt aumentato
Implementazione: Utilizzare template configurabili per integrare le informazioni strutturate nell'input
Output: Prompt ricco di contesto che fornisce al modello generativo più informazioni guida

3. Modello Generativo (Generative Model)

Funzione: Generare il testo finale basato sul prompt aumentato
Caratteristiche: Può utilizzare qualsiasi LLM esistente, senza modifiche o riaddestramenti
Tecniche: Supporta tecniche di prompting zero-shot, one-shot, few-shot, ecc.

Flusso di Lavoro

Testo originale → Modulo ausiliario → Informazioni strutturate
    ↓                    ↓
    └→ Compositore di prompt ←┘
           ↓
    Prompt aumentato → Modello generativo → Output finale

L'utente fornisce l'input di testo originale
Il modulo ausiliario elabora l'input in parallelo, generando informazioni deduttive strutturate
Il compositore di prompt combina il testo originale con le informazioni ausiliarie
Il modello generativo produce l'output finale basato sul prompt aumentato

Punti di Innovazione Tecnica

Assistenza leggera: A differenza dell'utilizzo di grandi modelli generativi ausiliari, PAGE impiega componenti leggeri come semplici classificatori
Architettura modulare: Ogni componente può essere ottimizzato e sostituito indipendentemente, con forte adattabilità
Nessun riaddestramento richiesto: Il modello generativo principale rimane invariato, migliorando le prestazioni solo attraverso l'augmentazione del prompt
Alta interpretabilità: L'output del modulo ausiliario è una struttura di testo esplicita, facilitando la comprensione e il debug

Configurazione Sperimentale

Dataset

Fonte: Integrazione di più dataset
- Dataset PURE: Collezione pubblica di documenti di requisiti
- Dataset Software Functional Requirements
- Requisiti da documenti di specifica pubblica
Scala: 253 istanze
Struttura:
- Espressioni di requisiti originali (senza struttura sintattica specifica)
- Etichette di categoria EARS
- Espressioni di requisiti EARS scritte manualmente
Distribuzione delle categorie: Copre cinque categorie EARS (Ubiquitous, Event-driven, State-driven, Unwanted, Optional)

Metriche di Valutazione

Utilizzo della famiglia di metriche ROUGE per valutare la qualità della generazione:

ROUGE-1: Sovrapposizione a livello di parola
ROUGE-2: Corrispondenza di bigrammi
ROUGE-L: Sottosequenza comune più lunga, misurando il mantenimento della struttura

Ogni metrica calcola tre dimensioni: Precisione, Recall e F1-Score.

Metodi di Confronto

Tre gruppi di esperimenti progettati per il confronto:

Baseline Zero-shot: Utilizzo diretto dell'LLM, senza alcun miglioramento
Limite superiore ideale: Utilizzo delle etichette corrette dal dataset come informazioni ausiliarie
Implementazione completa di PAGE: Utilizzo del classificatore addestrato come modulo ausiliario

Dettagli di Implementazione

Classificatore ausiliario: Modello Random Forest
- Profondità massima: 10
- Numero minimo di campioni per la divisione: 5
- Numero di stimatori: 100
- Accuratezza: 82,35%
Modello generativo: Llama 3.1-8B, distribuito localmente tramite Ollama
Divisione dei dati: 80% addestramento, 20% test, convalida incrociata a 5 fold

Risultati Sperimentali

Risultati Principali

Metodo	Metrica	Precisione	Recall	F1-Score
Zero-Shot	ROUGE-1	0.509	0.489	0.485
	ROUGE-2	0.206	0.204	0.199
	ROUGE-L	0.413	0.395	0.392
Dataset-samples	ROUGE-1	0.852	0.815	0.827
	ROUGE-2	0.653	0.630	0.636
	ROUGE-L	0.803	0.770	0.781
PAGE	ROUGE-1	0.849	0.809	0.822
	ROUGE-2	0.648	0.622	0.630
	ROUGE-L	0.796	0.761	0.772

Analisi del Miglioramento delle Prestazioni

Entità del miglioramento rispetto al metodo di base:

ROUGE-1: Miglioramento del 65,41%
ROUGE-2: Miglioramento del 205,62%
ROUGE-L: Miglioramento del 92,79%

PAGE raggiunge un risultato prossimo al limite superiore ideale, rimanendo indietro solo di 2-4 punti percentuali, dimostrando l'efficacia del metodo.

Analisi dei Casi

Esempio 1 (categoria Ubiquitous):

Input originale: "The system shall allow a customer to place an order online"
Output Zero-shot: Descrizione strutturata complessa (Actor, Event, Role, ecc.)
Output PAGE: "The system shall always allow a customer to place an order online"
Output previsto: "The system shall allow a customer to place an order online"

Esempio 2 (categoria Event-driven):

Input originale: "When a driver completes a ride, the system shall allow the driver to leave a review"
Output Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
Output PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

Risultati Sperimentali

Ruolo critico del modulo ausiliario: L'accuratezza della classificazione influisce direttamente sulla qualità della generazione finale
Effetto significativo dell'apprendimento Few-shot: Fornire esempi rilevanti migliora notevolmente la struttura della generazione
Vantaggi della modularità: Consente la valutazione e l'ottimizzazione indipendente del contributo di ogni componente
Efficienza delle risorse: Evita l'elevato costo del riaddestramento di modelli di grandi dimensioni

Lavori Correlati

Metodi di Augmentazione Generativa

Du et al.: Combinazione di prompt espliciti e conoscenza semantica esterna per migliorare il ragionamento testuale
He et al.: Utilizzo di riassunti codificati con BERT per guidare la generazione GPT-2
Zeldes et al.: Tecnica Auxiliary Tuning, combinazione di modelli ausiliari a livello di logit

Generazione Aumentata da Conoscenza

Zhang et al.: Framework IAG, utilizzo di modelli generativi ausiliari per l'induzione della conoscenza
Liao et al.: Awakening Augmented Generation, attivazione della conoscenza latente attraverso compiti ausiliari

Unicità di PAGE

Rispetto ai metodi esistenti, i vantaggi di PAGE sono:

Non richiede modelli generativi ausiliari, riducendo la complessità
Utilizza componenti ausiliari leggeri e interpretabili
Progettazione modulare, facilmente adattabile a diversi compiti
Requisiti di risorse bassi, adatto alle applicazioni pratiche

Conclusioni e Discussione

Conclusioni Principali

Validazione dell'efficacia: PAGE supera significativamente i metodi di base nel compito di generazione di requisiti software
Efficienza delle risorse: Raggiungimento del miglioramento delle prestazioni attraverso semplici moduli ausiliari, evitando i costi del riaddestramento
Vantaggi dell'architettura: La progettazione modulare fornisce buona interpretabilità e adattabilità
Valore pratico: Fornisce una soluzione praticabile per l'ottimizzazione della generazione di testo in ambienti con risorse limitate

Limitazioni

Dipendenza dal modulo ausiliario: La qualità della generazione è vincolata dall'accuratezza del modulo ausiliario
Specializzazione del dominio: La validazione attuale è limitata al campo dell'ingegneria dei requisiti
Scala del dataset: Il dataset utilizzato negli esperimenti è relativamente piccolo (253 istanze)
Limitazioni delle metriche di valutazione: Dipendenza principalmente dalle metriche ROUGE, mancanza di valutazione umana

Direzioni Future

Implementazione del framework: Sviluppo di un framework software Python, fornendo implementazioni PAGE riutilizzabili
Validazione multi-dominio: Test del framework in più campi applicativi
Ottimizzazione del modulo ausiliario: Ricerca di strategie di progettazione di moduli ausiliari più efficienti
Perfezionamento del sistema di valutazione: Introduzione di metriche di valutazione più complete e valutazione umana

Valutazione Approfondita

Punti di Forza

Forte innovazione: Propone una soluzione di augmentazione ausiliaria leggera unica
Alto valore pratico: Risolve i problemi di limitazione delle risorse nelle applicazioni reali
Progettazione ragionevole: L'architettura modulare facilita la comprensione, l'implementazione e l'estensione
Esperimenti sufficienti: Progettazione di esperimenti di confronto ragionevoli, inclusa l'analisi del limite superiore ideale
Risultati significativi: Miglioramento significativo delle prestazioni su più metriche

Insufficienze

Portata di validazione limitata: Validazione solo in un dominio specifico (ingegneria dei requisiti)
Dataset piccolo: Un dataset di 253 istanze potrebbe non essere sufficiente per validare completamente la capacità di generalizzazione del metodo
Confronto di base insufficiente: Mancanza di confronto diretto con altri metodi di augmentazione del prompt
Mancanza di analisi teorica: Mancanza di spiegazione approfondita del motivo per cui il metodo è efficace
Assenza di valutazione umana: Dipendenza completa da metriche automatiche, mancanza di valutazione da esperti

Impatto

Contributo accademico: Fornisce una nuova direzione di ricerca per l'augmentazione della generazione di testo
Valore pratico: Fornisce una soluzione pratica per l'ottimizzazione della generazione in scenari con risorse limitate
Riproducibilità: La descrizione del metodo è chiara e l'implementazione è relativamente semplice
Estensibilità: La progettazione del framework ha buona estensibilità

Scenari Applicabili

Generazione di testo in domini specializzati: Come documenti tecnici, testi legali e altri testi che richiedono formati specifici
Ambienti con risorse limitate: Scenari applicativi in cui non è possibile eseguire il fine-tuning di modelli di grandi dimensioni
Sviluppo rapido di prototipi: Applicazioni che richiedono un adattamento rapido a nuovi compiti
Scenari con elevati requisiti di interpretabilità: Scenari applicativi che richiedono la comprensione del processo di generazione

Bibliografia

L'articolo cita numerosi lavori correlati importanti, inclusi:

Lavori fondamentali sull'architettura Transformer (Vaswani et al., 2017)
Principali modelli linguistici di grandi dimensioni (GPT, BERT, T5, Llama, ecc.)
Specifica della sintassi EARS per i requisiti (Mavin et al., 2009)
Metriche di valutazione ROUGE (Lin, 2004)
Metodi correlati di augmentazione della generazione, ecc.

Valutazione Complessiva: Questo è un articolo di ricerca che propone un metodo innovativo. Il framework PAGE fornisce una nuova prospettiva per l'augmentazione della generazione di testo. Sebbene ci sia spazio per miglioramenti nella portata della validazione e nell'analisi teorica, il suo valore pratico e l'innovazione tecnica sono degni di nota. Questo metodo è particolarmente adatto a scenari applicativi che richiedono un adattamento rapido a compiti specifici e hanno risorse limitate.