PAGE: Prompt Augmentation for text Generation Enhancement
Pacchiotti, Ballejos, Ale
In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.
हाल के वर्षों में, प्राकृतिक भाषा निर्माण मॉडल पाठ निर्माण कार्यों में उत्कृष्ट प्रदर्शन प्रदर्शित कर रहे हैं। हालांकि, विशिष्ट कार्यों या विशेष आवश्यकताओं का सामना करते समय, ये मॉडल खराब प्रदर्शन कर सकते हैं या समायोजन के लिए बड़ी मात्रा में अतिरिक्त डेटा की आवश्यकता हो सकती है। यह अनुसंधान PAGE (Prompt Augmentation for text Generation Enhancement) प्रस्तावित करता है, जो सरल सहायक मॉड्यूल का उपयोग करके इन मॉडलों को सहायता देने के लिए एक ढांचा है। ये सहायक मॉड्यूल हल्के वजन वाले मॉडल हैं, जैसे वर्गीकरण या निष्कर्षण, जो इनपुट पाठ से तर्क संबंधी जानकारी प्रदान कर सकते हैं। सहायक मॉड्यूल के आउटपुट का उपयोग समृद्ध इनपुट बनाने के लिए किया जाता है, जिससे निर्मित पाठ की गुणवत्ता और नियंत्रणीयता में सुधार होता है। अन्य निर्माण सहायता विधियों के विपरीत, PAGE को सहायक निर्माण मॉडल की आवश्यकता नहीं है, बल्कि एक सरल, मॉड्यूलर और विभिन्न कार्यों के अनुकूल आसान वास्तुकला प्रस्तावित करता है।
विशिष्ट कार्य प्रदर्शन अपर्याप्त: बड़े भाषा मॉडल (LLM) सामान्य पाठ निर्माण कार्यों में उत्कृष्ट हैं, लेकिन विशिष्ट डोमेन या विशेष आवश्यकताओं वाले कार्यों का सामना करते समय अक्सर खराब प्रदर्शन करते हैं
सूक्ष्म-समायोजन की उच्च लागत: पारंपरिक समाधान मॉडल को पुनः प्रशिक्षित या सूक्ष्म-समायोजित करना है, लेकिन इसके लिए बड़ी मात्रा में उच्च-गुणवत्ता वाले डेटा और कम्प्यूटेशनल संसाधनों की आवश्यकता है
संसाधन सीमा समस्या: कई अनुप्रयोग परिदृश्य पर्याप्त प्रशिक्षण डेटा और कम्प्यूटेशनल क्षमता प्राप्त नहीं कर सकते हैं
इनपुट: मूल पाठ विवरण (जैसे प्राकृतिक भाषा आवश्यकता विवरण)
आउटपुट: संरचित, उच्च-गुणवत्ता वाला पाठ (जैसे विशिष्ट व्याकरण मानदंडों के अनुरूप आवश्यकता अभिव्यक्ति)
लक्ष्य: मुख्य मॉडल को पुनः प्रशिक्षित किए बिना सहायक जानकारी के साथ इनपुट संकेत को बढ़ाकर निर्माण गुणवत्ता में सुधार करना
पेपर कई महत्वपूर्ण संबंधित कार्यों का हवाला देता है, जिनमें शामिल हैं:
Transformer आर्किटेक्चर के मूल कार्य (Vaswani et al., 2017)
प्रमुख बड़े भाषा मॉडल (GPT, BERT, T5, Llama आदि)
EARS आवश्यकता व्याकरण विनिर्देश (Mavin et al., 2009)
ROUGE मूल्यांकन मेट्रिक्स (Lin, 2004)
संबंधित निर्माण वर्धन विधियां आदि
समग्र मूल्यांकन: यह एक नवीन विधि प्रस्तावित करने वाला एक अनुसंधान पेपर है, PAGE ढांचा पाठ निर्माण वर्धन के लिए नई सोच प्रदान करता है। हालांकि सत्यापन सीमा और सैद्धांतिक विश्लेषण के संदर्भ में सुधार की गुंजाइश है, लेकिन इसकी व्यावहारिक मूल्य और तकनीकी नवाचार की सराहना की जाती है। यह विधि विशेष रूप से विशिष्ट कार्यों के लिए तीव्र अनुकूलन और संसाधन-सीमित अनुप्रयोग परिदृश्यों की आवश्यकता वाले अनुप्रयोगों के लिए उपयुक्त है।