2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic

PAGE: Augmentazione del Prompt per il Miglioramento della Generazione di Testo

Informazioni Fondamentali

  • ID Articolo: 2510.13880
  • Titolo: PAGE: Prompt Augmentation for text Generation Enhancement
  • Autori: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentina)
  • Classificazione: cs.CL cs.AI
  • Istituzione: Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentina
  • Link Articolo: https://arxiv.org/abs/2510.13880

Riassunto

Negli ultimi anni, i modelli di generazione del linguaggio naturale hanno dimostrato prestazioni eccezionali nei compiti di generazione di testo. Tuttavia, quando affrontano compiti specifici o requisiti particolari, questi modelli potrebbero avere prestazioni scadenti o richiedere grandi quantità di dati aggiuntivi per l'adattamento. Questo studio propone PAGE (Prompt Augmentation for text Generation Enhancement), un framework che assiste questi modelli utilizzando semplici moduli ausiliari. Questi moduli ausiliari sono modelli leggeri, come classificatori o estrattori, in grado di fornire informazioni deduttive dal testo di input. L'output dei moduli ausiliari viene utilizzato per costruire input arricchiti, migliorando così la qualità e la controllabilità della generazione. A differenza di altri metodi di assistenza generativa, PAGE non richiede modelli generativi ausiliari, ma propone un'architettura più semplice, modulare e facilmente adattabile a diversi compiti.

Contesto di Ricerca e Motivazione

Problemi Fondamentali

  1. Prestazioni insufficienti in compiti specifici: I modelli linguistici di grandi dimensioni (LLM), sebbene eccellenti nei compiti generici di generazione di testo, spesso hanno prestazioni scadenti quando affrontano compiti specifici di dominio o con requisiti particolari
  2. Costi elevati del fine-tuning: La soluzione tradizionale è riaddestrare o eseguire il fine-tuning del modello, ma ciò richiede grandi quantità di dati di alta qualità e risorse computazionali
  3. Problemi di limitazione delle risorse: Molti scenari applicativi non possono accedere a dati di addestramento e capacità computazionali sufficienti

Motivazione della Ricerca

  • Riduzione dei requisiti di risorse: Fornire un metodo per migliorare la qualità della generazione senza riaddestramenti su larga scala
  • Aumento della controllabilità: Migliorare l'input attraverso informazioni strutturate, rendendo la generazione più controllabile e precisa
  • Progettazione modulare: Creare un'architettura flessibile facilmente adattabile a diversi compiti
  • Interpretabilità: Utilizzare moduli ausiliari semplici e interpretabili, facilitando la comprensione e il debug

Contributi Fondamentali

  1. Proposta del framework PAGE: Un'architettura innovativa di augmentazione del prompt che migliora la qualità della generazione di testo attraverso semplici moduli ausiliari
  2. Progettazione modulare: A differenza di altri metodi, PAGE non dipende da modelli generativi ausiliari, ma utilizza classificatori leggeri, estrattori, ecc.
  3. Efficienza delle risorse: Riduce significativamente la necessità di dati di addestramento e risorse computazionali
  4. Validazione pratica: Proof-of-concept nel campo dell'ingegneria dei requisiti software, utilizzando la sintassi EARS per la generazione di requisiti strutturati
  5. Miglioramento delle prestazioni: Miglioramento significativo rispetto ai metodi di base nelle metriche ROUGE (aumento ROUGE-1 del 65,41%, aumento ROUGE-2 del 205,62%)

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input: Descrizioni di testo originale (ad esempio, descrizioni di requisiti in linguaggio naturale) Output: Testo strutturato e di alta qualità (ad esempio, espressioni di requisiti conformi a specifiche regole sintattiche) Obiettivo: Migliorare l'input del prompt attraverso informazioni ausiliarie, migliorando la qualità della generazione senza riaddestrare il modello principale

Architettura del Modello

Il framework PAGE contiene tre componenti fondamentali:

1. Modulo Ausiliario (Auxiliary Module)

  • Funzione: Eseguire inferenza sul testo di input, estraendo informazioni strutturate
  • Tipi:
    • Classificatore: Assegnare etichette rilevanti al testo di input
    • Estrattore di entità: Identificare e classificare le entità chiave nel testo
    • Analizzatore di sentimento: Rilevare l'orientamento sentimentale o l'intento del testo
  • Caratteristiche: Leggero, altamente interpretabile, basso costo di addestramento

2. Compositore di Prompt (Prompt Composer)

  • Funzione: Combinare l'output del modulo ausiliario con il testo originale, costruendo il prompt aumentato
  • Implementazione: Utilizzare template configurabili per integrare le informazioni strutturate nell'input
  • Output: Prompt ricco di contesto che fornisce al modello generativo più informazioni guida

3. Modello Generativo (Generative Model)

  • Funzione: Generare il testo finale basato sul prompt aumentato
  • Caratteristiche: Può utilizzare qualsiasi LLM esistente, senza modifiche o riaddestramenti
  • Tecniche: Supporta tecniche di prompting zero-shot, one-shot, few-shot, ecc.

Flusso di Lavoro

Testo originale → Modulo ausiliario → Informazioni strutturate
    ↓                    ↓
    └→ Compositore di prompt ←┘
           ↓
    Prompt aumentato → Modello generativo → Output finale
  1. L'utente fornisce l'input di testo originale
  2. Il modulo ausiliario elabora l'input in parallelo, generando informazioni deduttive strutturate
  3. Il compositore di prompt combina il testo originale con le informazioni ausiliarie
  4. Il modello generativo produce l'output finale basato sul prompt aumentato

Punti di Innovazione Tecnica

  1. Assistenza leggera: A differenza dell'utilizzo di grandi modelli generativi ausiliari, PAGE impiega componenti leggeri come semplici classificatori
  2. Architettura modulare: Ogni componente può essere ottimizzato e sostituito indipendentemente, con forte adattabilità
  3. Nessun riaddestramento richiesto: Il modello generativo principale rimane invariato, migliorando le prestazioni solo attraverso l'augmentazione del prompt
  4. Alta interpretabilità: L'output del modulo ausiliario è una struttura di testo esplicita, facilitando la comprensione e il debug

Configurazione Sperimentale

Dataset

  • Fonte: Integrazione di più dataset
    • Dataset PURE: Collezione pubblica di documenti di requisiti
    • Dataset Software Functional Requirements
    • Requisiti da documenti di specifica pubblica
  • Scala: 253 istanze
  • Struttura:
    • Espressioni di requisiti originali (senza struttura sintattica specifica)
    • Etichette di categoria EARS
    • Espressioni di requisiti EARS scritte manualmente
  • Distribuzione delle categorie: Copre cinque categorie EARS (Ubiquitous, Event-driven, State-driven, Unwanted, Optional)

Metriche di Valutazione

Utilizzo della famiglia di metriche ROUGE per valutare la qualità della generazione:

  • ROUGE-1: Sovrapposizione a livello di parola
  • ROUGE-2: Corrispondenza di bigrammi
  • ROUGE-L: Sottosequenza comune più lunga, misurando il mantenimento della struttura

Ogni metrica calcola tre dimensioni: Precisione, Recall e F1-Score.

Metodi di Confronto

Tre gruppi di esperimenti progettati per il confronto:

  1. Baseline Zero-shot: Utilizzo diretto dell'LLM, senza alcun miglioramento
  2. Limite superiore ideale: Utilizzo delle etichette corrette dal dataset come informazioni ausiliarie
  3. Implementazione completa di PAGE: Utilizzo del classificatore addestrato come modulo ausiliario

Dettagli di Implementazione

  • Classificatore ausiliario: Modello Random Forest
    • Profondità massima: 10
    • Numero minimo di campioni per la divisione: 5
    • Numero di stimatori: 100
    • Accuratezza: 82,35%
  • Modello generativo: Llama 3.1-8B, distribuito localmente tramite Ollama
  • Divisione dei dati: 80% addestramento, 20% test, convalida incrociata a 5 fold

Risultati Sperimentali

Risultati Principali

MetodoMetricaPrecisioneRecallF1-Score
Zero-ShotROUGE-10.5090.4890.485
ROUGE-20.2060.2040.199
ROUGE-L0.4130.3950.392
Dataset-samplesROUGE-10.8520.8150.827
ROUGE-20.6530.6300.636
ROUGE-L0.8030.7700.781
PAGEROUGE-10.8490.8090.822
ROUGE-20.6480.6220.630
ROUGE-L0.7960.7610.772

Analisi del Miglioramento delle Prestazioni

Entità del miglioramento rispetto al metodo di base:

  • ROUGE-1: Miglioramento del 65,41%
  • ROUGE-2: Miglioramento del 205,62%
  • ROUGE-L: Miglioramento del 92,79%

PAGE raggiunge un risultato prossimo al limite superiore ideale, rimanendo indietro solo di 2-4 punti percentuali, dimostrando l'efficacia del metodo.

Analisi dei Casi

Esempio 1 (categoria Ubiquitous):

  • Input originale: "The system shall allow a customer to place an order online"
  • Output Zero-shot: Descrizione strutturata complessa (Actor, Event, Role, ecc.)
  • Output PAGE: "The system shall always allow a customer to place an order online"
  • Output previsto: "The system shall allow a customer to place an order online"

Esempio 2 (categoria Event-driven):

  • Input originale: "When a driver completes a ride, the system shall allow the driver to leave a review"
  • Output Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
  • Output PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

Risultati Sperimentali

  1. Ruolo critico del modulo ausiliario: L'accuratezza della classificazione influisce direttamente sulla qualità della generazione finale
  2. Effetto significativo dell'apprendimento Few-shot: Fornire esempi rilevanti migliora notevolmente la struttura della generazione
  3. Vantaggi della modularità: Consente la valutazione e l'ottimizzazione indipendente del contributo di ogni componente
  4. Efficienza delle risorse: Evita l'elevato costo del riaddestramento di modelli di grandi dimensioni

Lavori Correlati

Metodi di Augmentazione Generativa

  • Du et al.: Combinazione di prompt espliciti e conoscenza semantica esterna per migliorare il ragionamento testuale
  • He et al.: Utilizzo di riassunti codificati con BERT per guidare la generazione GPT-2
  • Zeldes et al.: Tecnica Auxiliary Tuning, combinazione di modelli ausiliari a livello di logit

Generazione Aumentata da Conoscenza

  • Zhang et al.: Framework IAG, utilizzo di modelli generativi ausiliari per l'induzione della conoscenza
  • Liao et al.: Awakening Augmented Generation, attivazione della conoscenza latente attraverso compiti ausiliari

Unicità di PAGE

Rispetto ai metodi esistenti, i vantaggi di PAGE sono:

  1. Non richiede modelli generativi ausiliari, riducendo la complessità
  2. Utilizza componenti ausiliari leggeri e interpretabili
  3. Progettazione modulare, facilmente adattabile a diversi compiti
  4. Requisiti di risorse bassi, adatto alle applicazioni pratiche

Conclusioni e Discussione

Conclusioni Principali

  1. Validazione dell'efficacia: PAGE supera significativamente i metodi di base nel compito di generazione di requisiti software
  2. Efficienza delle risorse: Raggiungimento del miglioramento delle prestazioni attraverso semplici moduli ausiliari, evitando i costi del riaddestramento
  3. Vantaggi dell'architettura: La progettazione modulare fornisce buona interpretabilità e adattabilità
  4. Valore pratico: Fornisce una soluzione praticabile per l'ottimizzazione della generazione di testo in ambienti con risorse limitate

Limitazioni

  1. Dipendenza dal modulo ausiliario: La qualità della generazione è vincolata dall'accuratezza del modulo ausiliario
  2. Specializzazione del dominio: La validazione attuale è limitata al campo dell'ingegneria dei requisiti
  3. Scala del dataset: Il dataset utilizzato negli esperimenti è relativamente piccolo (253 istanze)
  4. Limitazioni delle metriche di valutazione: Dipendenza principalmente dalle metriche ROUGE, mancanza di valutazione umana

Direzioni Future

  1. Implementazione del framework: Sviluppo di un framework software Python, fornendo implementazioni PAGE riutilizzabili
  2. Validazione multi-dominio: Test del framework in più campi applicativi
  3. Ottimizzazione del modulo ausiliario: Ricerca di strategie di progettazione di moduli ausiliari più efficienti
  4. Perfezionamento del sistema di valutazione: Introduzione di metriche di valutazione più complete e valutazione umana

Valutazione Approfondita

Punti di Forza

  1. Forte innovazione: Propone una soluzione di augmentazione ausiliaria leggera unica
  2. Alto valore pratico: Risolve i problemi di limitazione delle risorse nelle applicazioni reali
  3. Progettazione ragionevole: L'architettura modulare facilita la comprensione, l'implementazione e l'estensione
  4. Esperimenti sufficienti: Progettazione di esperimenti di confronto ragionevoli, inclusa l'analisi del limite superiore ideale
  5. Risultati significativi: Miglioramento significativo delle prestazioni su più metriche

Insufficienze

  1. Portata di validazione limitata: Validazione solo in un dominio specifico (ingegneria dei requisiti)
  2. Dataset piccolo: Un dataset di 253 istanze potrebbe non essere sufficiente per validare completamente la capacità di generalizzazione del metodo
  3. Confronto di base insufficiente: Mancanza di confronto diretto con altri metodi di augmentazione del prompt
  4. Mancanza di analisi teorica: Mancanza di spiegazione approfondita del motivo per cui il metodo è efficace
  5. Assenza di valutazione umana: Dipendenza completa da metriche automatiche, mancanza di valutazione da esperti

Impatto

  1. Contributo accademico: Fornisce una nuova direzione di ricerca per l'augmentazione della generazione di testo
  2. Valore pratico: Fornisce una soluzione pratica per l'ottimizzazione della generazione in scenari con risorse limitate
  3. Riproducibilità: La descrizione del metodo è chiara e l'implementazione è relativamente semplice
  4. Estensibilità: La progettazione del framework ha buona estensibilità

Scenari Applicabili

  1. Generazione di testo in domini specializzati: Come documenti tecnici, testi legali e altri testi che richiedono formati specifici
  2. Ambienti con risorse limitate: Scenari applicativi in cui non è possibile eseguire il fine-tuning di modelli di grandi dimensioni
  3. Sviluppo rapido di prototipi: Applicazioni che richiedono un adattamento rapido a nuovi compiti
  4. Scenari con elevati requisiti di interpretabilità: Scenari applicativi che richiedono la comprensione del processo di generazione

Bibliografia

L'articolo cita numerosi lavori correlati importanti, inclusi:

  • Lavori fondamentali sull'architettura Transformer (Vaswani et al., 2017)
  • Principali modelli linguistici di grandi dimensioni (GPT, BERT, T5, Llama, ecc.)
  • Specifica della sintassi EARS per i requisiti (Mavin et al., 2009)
  • Metriche di valutazione ROUGE (Lin, 2004)
  • Metodi correlati di augmentazione della generazione, ecc.

Valutazione Complessiva: Questo è un articolo di ricerca che propone un metodo innovativo. Il framework PAGE fornisce una nuova prospettiva per l'augmentazione della generazione di testo. Sebbene ci sia spazio per miglioramenti nella portata della validazione e nell'analisi teorica, il suo valore pratico e l'innovazione tecnica sono degni di nota. Questo metodo è particolarmente adatto a scenari applicativi che richiedono un adattamento rapido a compiti specifici e hanno risorse limitate.