2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic

PAGE: Расширение подсказок для улучшения генерации текста

Основная информация

  • ID статьи: 2510.13880
  • Название: PAGE: Prompt Augmentation for text Generation Enhancement
  • Авторы: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (Universidad Tecnológica Nacional, Argentina)
  • Классификация: cs.CL cs.AI
  • Учреждение: Universidad Tecnológica Nacional, Centro de I+D de Ing. en Sistemas de Información, Santa Fe, Argentina
  • Ссылка на статью: https://arxiv.org/abs/2510.13880

Аннотация

В последние годы модели генерации естественного языка продемонстрировали превосходную производительность в задачах генерации текста. Однако при работе со специфическими задачами или особыми требованиями эти модели могут показывать неудовлетворительные результаты или требовать больших объёмов дополнительных данных для настройки. В данном исследовании предлагается PAGE (Prompt Augmentation for text Generation Enhancement) — фреймворк, который помогает этим моделям с помощью простых вспомогательных модулей. Эти вспомогательные модули представляют собой лёгкие модели, такие как классификаторы или экстракторы, которые могут предоставлять информацию для логического вывода из входного текста. Выходные данные вспомогательных модулей используются для построения обогащённого входа, что повышает качество и управляемость генерации. В отличие от других методов вспомогательной генерации, PAGE не требует вспомогательных генеративных моделей, а предлагает более простую, модульную и легко адаптируемую архитектуру для различных задач.

Исследовательский контекст и мотивация

Основные проблемы

  1. Недостаточная производительность на специфических задачах: Хотя большие языковые модели (LLM) показывают отличные результаты в общих задачах генерации текста, они часто работают неудовлетворительно при работе со специализированными областями или задачами со специальными требованиями
  2. Высокие затраты на тонкую настройку: Традиционное решение — переобучение или тонкая настройка модели, но это требует больших объёмов высококачественных данных и вычислительных ресурсов
  3. Проблемы с ограничениями ресурсов: Многие сценарии применения не могут получить достаточно данных для обучения и вычислительной мощности

Исследовательская мотивация

  • Снижение требований к ресурсам: Предоставить метод улучшения качества генерации без масштабного переобучения
  • Повышение управляемости: Через структурированную информацию обогатить входные данные, сделав генерацию более управляемой и точной
  • Модульный дизайн: Создать гибкую архитектуру, легко адаптируемую к различным задачам
  • Интерпретируемость: Использовать простые, интерпретируемые вспомогательные модули для удобства понимания и отладки

Основные вклады

  1. Предложение фреймворка PAGE: Инновационная архитектура расширения подсказок, которая улучшает качество генерации текста через простые вспомогательные модули
  2. Модульный дизайн: В отличие от других методов, PAGE не зависит от вспомогательных генеративных моделей, а использует лёгкие классификаторы, экстракторы и т.д.
  3. Дружественность к ресурсам: Значительно снижает требования к данным обучения и вычислительным ресурсам
  4. Практическая верификация: Концептуальная демонстрация в области инженерии программных требований с использованием синтаксиса EARS для генерации структурированных требований
  5. Улучшение производительности: Значительное улучшение по сравнению с базовыми методами по метрикам ROUGE (улучшение ROUGE-1 на 65,41%, ROUGE-2 на 205,62%)

Подробное описание метода

Определение задачи

Входные данные: Исходное текстовое описание (например, описание требований на естественном языке) Выходные данные: Структурированный, высокого качества текст (например, выражение требований, соответствующее определённым синтаксическим нормам) Цель: Через обогащение входной подсказки вспомогательной информацией улучшить качество генерации без переобучения основной модели

Архитектура модели

Фреймворк PAGE содержит три основных компонента:

1. Вспомогательный модуль (Auxiliary Module)

  • Функция: Логический вывод над входным текстом, извлечение структурированной информации
  • Типы:
    • Классификатор: Присвоение соответствующих меток входному тексту
    • Экстрактор сущностей: Идентификация и классификация ключевых сущностей в тексте
    • Анализатор тональности: Обнаружение эмоциональной окраски текста или намерения
  • Характеристики: Лёгкий вес, высокая интерпретируемость, низкие затраты на обучение

2. Компоновщик подсказок (Prompt Composer)

  • Функция: Объединение выходных данных вспомогательного модуля с исходным текстом для построения расширенной подсказки
  • Реализация: Использование настраиваемых шаблонов для интеграции структурированной информации во входные данные
  • Выходные данные: Обогащённая контекстом подсказка, предоставляющая больше указаний для генеративной модели

3. Генеративная модель (Generative Model)

  • Функция: Генерация финального текста на основе расширенной подсказки
  • Характеристики: Может использоваться любая существующая LLM без модификации или переобучения
  • Технология: Поддерживает zero-shot, one-shot, few-shot и другие техники подсказок

Рабочий процесс

Исходный текст → Вспомогательный модуль → Структурированная информация
    ↓                    ↓
    └→ Компоновщик подсказок ←┘
           ↓
    Расширенная подсказка → Генеративная модель → Финальный выход
  1. Пользователь предоставляет исходный текстовый ввод
  2. Вспомогательный модуль параллельно обрабатывает ввод, генерируя структурированную информацию для логического вывода
  3. Компоновщик подсказок объединяет исходный текст со вспомогательной информацией
  4. Генеративная модель производит финальный выход на основе расширенной подсказки

Технические инновации

  1. Лёгкое вспомогательное обеспечение: В отличие от использования больших вспомогательных генеративных моделей, PAGE использует простые компоненты, такие как классификаторы
  2. Модульная архитектура: Каждый компонент может быть независимо оптимизирован и заменён, обеспечивая высокую адаптивность
  3. Без переобучения: Основная генеративная модель остаётся неизменной, производительность улучшается только через расширение подсказок
  4. Высокая интерпретируемость: Выходные данные вспомогательного модуля представляют собой явную текстовую структуру, удобную для понимания и отладки

Экспериментальная установка

Наборы данных

  • Источники: Интеграция нескольких наборов данных
    • Набор данных PURE: Открытая коллекция документов требований
    • Набор данных Software Functional Requirements
    • Требования из открытых документов спецификаций
  • Масштаб: 253 экземпляра
  • Структура:
    • Исходное выражение требования (без специфической синтаксической структуры)
    • Метки категорий EARS
    • Вручную написанные выражения требований в синтаксисе EARS
  • Распределение категорий: Охватывает пять категорий EARS (Ubiquitous, Event-driven, State-driven, Unwanted, Optional)

Метрики оценки

Использование семейства метрик ROUGE для оценки качества генерации:

  • ROUGE-1: Перекрытие на уровне слов
  • ROUGE-2: Совпадение двусловных комбинаций
  • ROUGE-L: Самая длинная общая подпоследовательность, измеряющая сохранение структуры

Каждая метрика вычисляет три измерения: Precision, Recall и F1-Score.

Методы сравнения

Разработаны три группы экспериментов для сравнения:

  1. Базовый уровень Zero-shot: Прямое использование LLM без каких-либо улучшений
  2. Идеальная верхняя граница: Использование правильных меток из набора данных в качестве вспомогательной информации
  3. Полная реализация PAGE: Использование обученного классификатора в качестве вспомогательного модуля

Детали реализации

  • Вспомогательный классификатор: Модель Random Forest
    • Максимальная глубина: 10
    • Минимальное количество образцов для разделения: 5
    • Количество оценивающих устройств: 100
    • Точность: 82,35%
  • Генеративная модель: Llama 3.1-8B, развёрнута локально через Ollama
  • Разделение данных: 80% для обучения, 20% для тестирования, 5-кратная перекрёстная валидация

Результаты экспериментов

Основные результаты

МетодМетрикаPrecisionRecallF1-Score
Zero-ShotROUGE-10.5090.4890.485
ROUGE-20.2060.2040.199
ROUGE-L0.4130.3950.392
Dataset-samplesROUGE-10.8520.8150.827
ROUGE-20.6530.6300.636
ROUGE-L0.8030.7700.781
PAGEROUGE-10.8490.8090.822
ROUGE-20.6480.6220.630
ROUGE-L0.7960.7610.772

Анализ улучшения производительности

Величина улучшения относительно базового метода:

  • ROUGE-1: Улучшение на 65,41%
  • ROUGE-2: Улучшение на 205,62%
  • ROUGE-L: Улучшение на 92,79%

PAGE достигает результатов, близких к идеальной верхней границе, отставая только на 2-4 процентных пункта, что доказывает эффективность метода.

Анализ примеров

Пример 1 (категория Ubiquitous):

  • Исходный ввод: "The system shall allow a customer to place an order online"
  • Выход Zero-shot: Сложное структурированное описание (Actor, Event, Role и т.д.)
  • Выход PAGE: "The system shall always allow a customer to place an order online"
  • Ожидаемый выход: "The system shall allow a customer to place an order online"

Пример 2 (категория Event-driven):

  • Исходный ввод: "When a driver completes a ride, the system shall allow the driver to leave a review"
  • Выход Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
  • Выход PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

Экспериментальные выводы

  1. Ключевая роль вспомогательного модуля: Точность классификации напрямую влияет на качество финальной генерации
  2. Значительный эффект few-shot обучения: Предоставление соответствующих примеров значительно улучшает структуру генерации
  3. Преимущества модульности: Возможность независимой оценки и оптимизации вклада каждого компонента
  4. Эффективность ресурсов: Избежание высоких затрат на переобучение больших моделей

Связанные работы

Методы расширения генерации

  • Du et al.: Объединение явных подсказок и внешних семантических знаний для улучшения логического вывода текста
  • He et al.: Использование резюме, закодированного BERT, для направления генерации GPT-2
  • Zeldes et al.: Техника Auxiliary Tuning, объединяющая вспомогательные модели на уровне logits

Генерация, обогащённая знаниями

  • Zhang et al.: Фреймворк IAG, использующий вспомогательные генеративные модели для индукции знаний
  • Liao et al.: Awakening Augmented Generation, активирующая скрытые знания через вспомогательные задачи

Уникальность PAGE

По сравнению с существующими методами, преимущества PAGE заключаются в:

  1. Отсутствие необходимости в вспомогательных генеративных моделях, снижение сложности
  2. Использование лёгких, интерпретируемых вспомогательных компонентов
  3. Модульный дизайн, легко адаптируемый к различным задачам
  4. Низкие требования к ресурсам, подходит для практического применения

Заключение и обсуждение

Основные выводы

  1. Верификация эффективности: PAGE значительно превосходит базовые методы в задаче генерации требований программного обеспечения
  2. Дружественность к ресурсам: Достижение улучшения производительности через простые вспомогательные модули, избежание затрат на переобучение
  3. Преимущества архитектуры: Модульный дизайн обеспечивает хорошую интерпретируемость и адаптивность
  4. Практическая ценность: Предоставление жизнеспособного решения для оптимизации генерации текста в условиях ограниченных ресурсов

Ограничения

  1. Зависимость от вспомогательного модуля: Качество генерации ограничено точностью вспомогательного модуля
  2. Специализация на конкретной области: Текущая верификация ограничена областью инженерии требований
  3. Размер набора данных: Набор данных из 253 экземпляров может быть недостаточным для полной верификации способности метода к обобщению
  4. Ограничения метрик оценки: Основная опора на метрики ROUGE, отсутствие человеческой оценки

Будущие направления

  1. Реализация фреймворка: Разработка Python фреймворка, предоставляющего переиспользуемую реализацию PAGE
  2. Верификация в нескольких областях: Тестирование эффективности фреймворка в большем количестве областей применения
  3. Оптимизация вспомогательного модуля: Исследование более эффективных стратегий проектирования вспомогательных модулей
  4. Совершенствование системы оценки: Введение более комплексных метрик оценки и человеческой оценки

Глубокая оценка

Преимущества

  1. Высокая инновационность: Предложено уникальное решение лёгкого вспомогательного расширения
  2. Высокая практическая ценность: Решение проблемы ограничения ресурсов в практическом применении
  3. Разумный дизайн: Модульная архитектура удобна для понимания, реализации и расширения
  4. Достаточные эксперименты: Разработаны разумные сравнительные эксперименты, включая анализ идеальной верхней границы
  5. Значительные результаты: Значительное улучшение производительности по нескольким метрикам

Недостатки

  1. Ограниченный диапазон верификации: Верификация проведена только в одной специфической области (инженерия требований)
  2. Небольшой размер набора данных: Набор данных из 253 экземпляров может быть недостаточным
  3. Недостаточное сравнение с базовыми методами: Отсутствие прямого сравнения с другими методами расширения подсказок
  4. Отсутствие теоретического анализа: Недостаток глубокого теоретического объяснения причин эффективности метода
  5. Отсутствие человеческой оценки: Полная опора на автоматические метрики, отсутствие оценки экспертами

Влияние

  1. Академический вклад: Предоставление нового направления исследований для расширения генерации текста
  2. Практическая ценность: Предоставление практического решения для оптимизации генерации в условиях ограниченных ресурсов
  3. Воспроизводимость: Чёткое описание метода, относительно простая реализация
  4. Расширяемость: Архитектура фреймворка обладает хорошей расширяемостью

Применимые сценарии

  1. Генерация текста в специализированных областях: Такие как технические документы, юридические тексты и другие требующие специфического формата тексты
  2. Среды с ограниченными ресурсами: Сценарии применения, где невозможно проводить тонкую настройку больших моделей
  3. Быстрая разработка прототипов: Приложения, требующие быстрой адаптации к новым задачам
  4. Сценарии с высокими требованиями к интерпретируемости: Приложения, требующие понимания процесса генерации

Библиография

Статья ссылается на множество важных связанных работ, включая:

  • Фундаментальные работы по архитектуре Transformer (Vaswani et al., 2017)
  • Основные большие языковые модели (GPT, BERT, T5, Llama и т.д.)
  • Спецификацию синтаксиса требований EARS (Mavin et al., 2009)
  • Метрики оценки ROUGE (Lin, 2004)
  • Связанные методы расширения генерации и другие

Общая оценка: Это исследовательская статья, предлагающая инновационный метод. Фреймворк PAGE предоставляет новую идею для расширения генерации текста. Хотя в диапазоне верификации и теоретическом анализе есть место для улучшения, его практическая ценность и техническая инновационность заслуживают признания. Этот метод особенно подходит для сценариев применения, требующих быстрой адаптации к специфическим задачам при ограниченных ресурсах.