PAGE: Prompt Augmentation for text Generation Enhancement
Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
academic
PAGE: Расширение подсказок для улучшения генерации текста
В последние годы модели генерации естественного языка продемонстрировали превосходную производительность в задачах генерации текста. Однако при работе со специфическими задачами или особыми требованиями эти модели могут показывать неудовлетворительные результаты или требовать больших объёмов дополнительных данных для настройки. В данном исследовании предлагается PAGE (Prompt Augmentation for text Generation Enhancement) — фреймворк, который помогает этим моделям с помощью простых вспомогательных модулей. Эти вспомогательные модули представляют собой лёгкие модели, такие как классификаторы или экстракторы, которые могут предоставлять информацию для логического вывода из входного текста. Выходные данные вспомогательных модулей используются для построения обогащённого входа, что повышает качество и управляемость генерации. В отличие от других методов вспомогательной генерации, PAGE не требует вспомогательных генеративных моделей, а предлагает более простую, модульную и легко адаптируемую архитектуру для различных задач.
Недостаточная производительность на специфических задачах: Хотя большие языковые модели (LLM) показывают отличные результаты в общих задачах генерации текста, они часто работают неудовлетворительно при работе со специализированными областями или задачами со специальными требованиями
Высокие затраты на тонкую настройку: Традиционное решение — переобучение или тонкая настройка модели, но это требует больших объёмов высококачественных данных и вычислительных ресурсов
Проблемы с ограничениями ресурсов: Многие сценарии применения не могут получить достаточно данных для обучения и вычислительной мощности
Предложение фреймворка PAGE: Инновационная архитектура расширения подсказок, которая улучшает качество генерации текста через простые вспомогательные модули
Модульный дизайн: В отличие от других методов, PAGE не зависит от вспомогательных генеративных моделей, а использует лёгкие классификаторы, экстракторы и т.д.
Дружественность к ресурсам: Значительно снижает требования к данным обучения и вычислительным ресурсам
Практическая верификация: Концептуальная демонстрация в области инженерии программных требований с использованием синтаксиса EARS для генерации структурированных требований
Улучшение производительности: Значительное улучшение по сравнению с базовыми методами по метрикам ROUGE (улучшение ROUGE-1 на 65,41%, ROUGE-2 на 205,62%)
Входные данные: Исходное текстовое описание (например, описание требований на естественном языке)
Выходные данные: Структурированный, высокого качества текст (например, выражение требований, соответствующее определённым синтаксическим нормам)
Цель: Через обогащение входной подсказки вспомогательной информацией улучшить качество генерации без переобучения основной модели
Лёгкое вспомогательное обеспечение: В отличие от использования больших вспомогательных генеративных моделей, PAGE использует простые компоненты, такие как классификаторы
Модульная архитектура: Каждый компонент может быть независимо оптимизирован и заменён, обеспечивая высокую адаптивность
Без переобучения: Основная генеративная модель остаётся неизменной, производительность улучшается только через расширение подсказок
Высокая интерпретируемость: Выходные данные вспомогательного модуля представляют собой явную текстовую структуру, удобную для понимания и отладки
Статья ссылается на множество важных связанных работ, включая:
Фундаментальные работы по архитектуре Transformer (Vaswani et al., 2017)
Основные большие языковые модели (GPT, BERT, T5, Llama и т.д.)
Спецификацию синтаксиса требований EARS (Mavin et al., 2009)
Метрики оценки ROUGE (Lin, 2004)
Связанные методы расширения генерации и другие
Общая оценка: Это исследовательская статья, предлагающая инновационный метод. Фреймворк PAGE предоставляет новую идею для расширения генерации текста. Хотя в диапазоне верификации и теоретическом анализе есть место для улучшения, его практическая ценность и техническая инновационность заслуживают признания. Этот метод особенно подходит для сценариев применения, требующих быстрой адаптации к специфическим задачам при ограниченных ресурсах.