2025-11-17T04:37:13.070704

PAGE: Prompt Augmentation for text Generation Enhancement

Pacchiotti, Ballejos, Ale

In recent years, natural language generative models have shown outstanding performance in text generation tasks. However, when facing specific tasks or particular requirements, they may exhibit poor performance or require adjustments that demand large amounts of additional data. This work introduces PAGE (Prompt Augmentation for text Generation Enhancement), a framework designed to assist these models through the use of simple auxiliary modules. These modules, lightweight models such as classifiers or extractors, provide inferences from the input text. The output of these auxiliaries is then used to construct an enriched input that improves the quality and controllability of the generation. Unlike other generation-assistance approaches, PAGE does not require auxiliary generative models; instead, it proposes a simpler, modular architecture that is easy to adapt to different tasks. This paper presents the proposal, its components and architecture, and reports a proof of concept in the domain of requirements engineering, where an auxiliary module with a classifier is used to improve the quality of software requirements generation.

academic

PAGE: تعزيز الإنتاج النصي من خلال تعزيز المحفزات

المعلومات الأساسية

معرّف الورقة: 2510.13880
العنوان: PAGE: Prompt Augmentation for text Generation Enhancement
المؤلفون: Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale (جامعة التكنولوجيا الوطنية، الأرجنتين)
التصنيف: cs.CL cs.AI
المؤسسة: جامعة التكنولوجيا الوطنية، مركز البحث والتطوير في هندسة أنظمة المعلومات، سانتا فيه، الأرجنتين
رابط الورقة: https://arxiv.org/abs/2510.13880

الملخص

أظهرت نماذج توليد اللغة الطبيعية في السنوات الأخيرة أداءً متفوقاً في مهام توليد النصوص. ومع ذلك، عند مواجهة مهام محددة أو احتياجات خاصة، قد تؤدي هذه النماذج أداءً ضعيفاً أو تتطلب كميات كبيرة من البيانات الإضافية للتكيف. تقترح هذه الدراسة PAGE (تعزيز المحفزات لتحسين توليد النصوص)، وهو إطار عمل يساعد هذه النماذج من خلال استخدام وحدات مساعدة بسيطة. هذه الوحدات المساعدة عبارة عن نماذج خفيفة الوزن، مثل المصنفات أو المستخلصات، التي يمكنها توفير معلومات استدلالية من نص الإدخال. يتم استخدام مخرجات الوحدات المساعدة لبناء مدخلات غنية، مما يحسن جودة وقابلية التحكم في الإنتاج. بخلاف طرق المساعدة الأخرى في التوليد، لا يتطلب PAGE نموذج توليد مساعد، بل يقترح بدلاً من ذلك معمارية أبسط وموديولية وسهلة التكيف مع مهام مختلفة.

السياق البحثي والدافع

المشاكل الأساسية

الأداء غير الكافي في المهام المحددة: على الرغم من أن نماذج اللغة الكبيرة (LLM) تؤدي بشكل ممتاز في مهام توليد النصوص العامة، إلا أنها غالباً ما تؤدي أداءً ضعيفاً عند مواجهة مهام محددة في مجالات معينة أو ذات متطلبات خاصة
تكاليف الضبط الدقيق العالية: الحل التقليدي هو إعادة تدريب أو ضبط النموذج بدقة، لكن هذا يتطلب كميات كبيرة من البيانات عالية الجودة وموارد حسابية
مشاكل القيود على الموارد: لا يمكن للعديد من سيناريوهات التطبيق الحصول على بيانات تدريب وقوة حسابية كافية

الدافع البحثي

تقليل متطلبات الموارد: توفير طريقة لتحسين جودة التوليد دون الحاجة إلى إعادة تدريب واسعة النطاق
تحسين القابلية للتحكم: من خلال تعزيز الإدخال بمعلومات منظمة، جعل التوليد أكثر قابلية للتحكم والدقة
التصميم الموديولي: إنشاء معمارية مرنة سهلة التكيف مع مهام مختلفة
القابلية للتفسير: استخدام وحدات مساعدة بسيطة وقابلة للتفسير، مما يسهل الفهم والتصحيح

المساهمات الأساسية

اقتراح إطار عمل PAGE: معمارية تعزيز محفزات مبتكرة تحسن جودة توليد النصوص من خلال وحدات مساعدة بسيطة
التصميم الموديولي: بخلاف الطرق الأخرى، لا يعتمد PAGE على نماذج توليد مساعدة، بل يستخدم مصنفات خفيفة الوزن ومستخلصات وغيرها
الملاءمة للموارد: يقلل بشكل كبير من الحاجة إلى بيانات التدريب والموارد الحسابية
التحقق العملي: إجراء إثبات المفهوم في مجال هندسة المتطلبات البرمجية، باستخدام بناء جملة EARS لتوليد متطلبات منظمة
تحسين الأداء: تحقيق تحسينات كبيرة مقارنة بطرق الأساس على مقاييس ROUGE (تحسن ROUGE-1 بنسبة 65.41%، وتحسن ROUGE-2 بنسبة 205.62%)

شرح الطريقة

تعريف المهمة

الإدخال: وصف النص الأصلي (مثل وصف المتطلبات باللغة الطبيعية) الإخراج: نص منظم وعالي الجودة (مثل تعبير المتطلبات الذي يتوافق مع قواعد نحوية محددة) الهدف: تحسين محفز الإدخال من خلال معلومات مساعدة، لتحسين جودة التوليد دون إعادة تدريب النموذج الرئيسي

معمارية النموذج

يتضمن إطار عمل PAGE ثلاثة مكونات أساسية:

1. الوحدة المساعدة (Auxiliary Module)

الوظيفة: إجراء استدلال على نص الإدخال واستخراج معلومات منظمة
الأنواع:
- المصنفات: تعيين تسميات ذات صلة لنص الإدخال
- مستخلصات الكيانات: تحديد وتصنيف الكيانات الرئيسية في النص
- محللات المشاعر: الكشف عن الاتجاه العاطفي أو النية في النص
الخصائص: خفيفة الوزن وعالية القابلية للتفسير وتكاليف التدريب منخفضة

2. منشئ المحفزات (Prompt Composer)

الوظيفة: دمج مخرجات الوحدة المساعدة مع النص الأصلي لبناء محفز معزز
التنفيذ: استخدام قوالب قابلة للتكوين لدمج المعلومات المنظمة في الإدخال
الإخراج: محفز سياق غني يوفر معلومات إرشادية أكثر لنموذج التوليد

3. نموذج التوليد (Generative Model)

الوظيفة: توليد النص النهائي بناءً على المحفز المعزز
الخصائص: يمكن استخدام أي نموذج لغة كبير موجود دون تعديل أو إعادة تدريب
التقنيات: دعم تقنيات المحفزات zero-shot و one-shot و few-shot

سير العمل

النص الأصلي → الوحدة المساعدة → معلومات منظمة
    ↓           ↓
    └→ منشئ المحفزات ←┘
           ↓
    محفز معزز → نموذج التوليد → الإخراج النهائي

يوفر المستخدم إدخال النص الأصلي
تعالج الوحدة المساعدة الإدخال بالتوازي، وتولد معلومات استدلالية منظمة
يدمج منشئ المحفزات النص الأصلي مع المعلومات المساعدة
ينتج نموذج التوليد الإخراج النهائي بناءً على المحفز المعزز

نقاط الابتكار التقني

المساعدة الخفيفة الوزن: بدلاً من استخدام نماذج توليد مساعدة كبيرة، يستخدم PAGE مكونات خفيفة الوزن مثل المصنفات البسيطة
المعمارية الموديولية: يمكن تحسين واستبدال كل مكون بشكل مستقل، مع قابلية تكيف قوية
عدم الحاجة إلى إعادة التدريب: يبقى نموذج التوليد الرئيسي دون تغيير، مع تحسين الأداء فقط من خلال تعزيز المحفزات
قابلية تفسير عالية: مخرجات الوحدة المساعدة عبارة عن بنية نصية واضحة، مما يسهل الفهم والتصحيح

إعداد التجارب

مجموعات البيانات

المصدر: دمج مجموعات بيانات متعددة
- مجموعة بيانات PURE: مجموعة وثائق المتطلبات العامة
- مجموعة بيانات متطلبات البرامج الوظيفية
- المتطلبات من الوثائق المواصفات العامة
الحجم: 253 مثالاً
البنية:
- تعبيرات المتطلبات الأصلية (بدون بنية نحوية محددة)
- تسميات فئات EARS
- تعبيرات متطلبات بناء جملة EARS المكتوبة يدويًا
توزيع الفئات: يغطي الفئات الخمس من EARS (Ubiquitous و Event-driven و State-driven و Unwanted و Optional)

مقاييس التقييم

استخدام عائلة مقاييس ROUGE لتقييم جودة التوليد:

ROUGE-1: درجة التداخل على مستوى الكلمات
ROUGE-2: درجة مطابقة المجموعات الثنائية
ROUGE-L: أطول متتالية مشتركة، تقيس درجة الحفاظ على البنية

يحسب كل مقياس ثلاثة أبعاد: الدقة والاستدعاء ودرجة F1.

طرق المقارنة

تم تصميم ثلاث مجموعات تجارب للمقارنة:

خط الأساس Zero-shot: استخدام نموذج اللغة الكبير مباشرة دون أي تعزيز
الحد الأعلى المثالي: استخدام التسميات الصحيحة من مجموعة البيانات كمعلومات مساعدة
تنفيذ PAGE الكامل: استخدام المصنف المدرب كوحدة مساعدة

تفاصيل التنفيذ

المصنف المساعد: نموذج Random Forest
- الحد الأقصى للعمق: 10
- الحد الأدنى لعدد العينات للتقسيم: 5
- عدد المقدرات: 100
- الدقة: 82.35%
نموذج التوليد: Llama 3.1-8B، مع النشر المحلي عبر Ollama
تقسيم البيانات: 80% للتدريب، 20% للاختبار، التحقق المتقاطع بـ 5 طيات

نتائج التجارب

النتائج الرئيسية

الطريقة	المقياس	الدقة	الاستدعاء	درجة F1
Zero-Shot	ROUGE-1	0.509	0.489	0.485
	ROUGE-2	0.206	0.204	0.199
	ROUGE-L	0.413	0.395	0.392
عينات مجموعة البيانات	ROUGE-1	0.852	0.815	0.827
	ROUGE-2	0.653	0.630	0.636
	ROUGE-L	0.803	0.770	0.781
PAGE	ROUGE-1	0.849	0.809	0.822
	ROUGE-2	0.648	0.622	0.630
	ROUGE-L	0.796	0.761	0.772

تحليل تحسن الأداء

مقدار التحسن النسبي مقارنة بطريقة الأساس:

ROUGE-1: تحسن بنسبة 65.41%
ROUGE-2: تحسن بنسبة 205.62%
ROUGE-L: تحسن بنسبة 92.79%

يحقق PAGE الحد الأعلى المثالي تقريباً، متخلفاً فقط بـ 2-4 نقاط مئوية، مما يثبت فعالية الطريقة.

تحليل الحالات

المثال 1 (فئة Ubiquitous):

الإدخال الأصلي: "The system shall allow a customer to place an order online"
إخراج Zero-shot: وصف منظم معقد (الممثل والحدث والدور وغيرها)
إخراج PAGE: "The system shall always allow a customer to place an order online"
الإخراج المتوقع: "The system shall allow a customer to place an order online"

المثال 2 (فئة Event-driven):

الإدخال الأصلي: "When a driver completes a ride, the system shall allow the driver to leave a review"
إخراج Zero-shot: "The Driver shall be enabled to submit a review after successfully completing a ride"
إخراج PAGE: "When a ride is completed, the Application shall enable the driver to leave a review"

النتائج التجريبية

الدور الحاسم للوحدة المساعدة: تؤثر دقة التصنيف بشكل مباشر على جودة التوليد النهائي
تأثير التعلم من عدد قليل من الأمثلة: توفير أمثلة ذات صلة يحسن بشكل كبير من بنية التوليد
مزايا التصميم الموديولي: يمكن تقييم وتحسين مساهمة كل مكون بشكل مستقل
الكفاءة في استخدام الموارد: تجنب التكاليف العالية لإعادة تدريب النماذج الكبيرة

الأعمال ذات الصلة

طرق تعزيز التوليد

Du et al.: دمج المحفزات الصريحة والمعرفة الدلالية الخارجية لتحسين استدلال النصوص
He et al.: استخدام الملخصات المشفرة بـ BERT لتوجيه توليد GPT-2
Zeldes et al.: تقنية Auxiliary Tuning، دمج النماذج المساعدة على مستوى logits

توليد معزز بالمعرفة

Zhang et al.: إطار عمل IAG، استخدام نماذج توليد مساعدة لاستقراء المعرفة
Liao et al.: Awakening Augmented Generation، تفعيل المعرفة الكامنة من خلال المهام المساعدة

تفرد PAGE

مقارنة بالطرق الموجودة، تتمتع PAGE بالمزايا التالية:

عدم الحاجة إلى نماذج توليد مساعدة، مما يقلل التعقيد
استخدام مكونات مساعدة خفيفة الوزن وقابلة للتفسير
التصميم الموديولي، سهل التكيف مع مهام مختلفة
متطلبات موارد منخفضة، مناسبة للتطبيقات العملية

الخلاصة والنقاش

الاستنتاجات الرئيسية

التحقق من الفعالية: تتفوق PAGE بشكل كبير على طرق الأساس في مهام توليد متطلبات البرامج
الملاءمة للموارد: تحقيق تحسن الأداء من خلال وحدات مساعدة بسيطة، مما يتجنب تكاليف إعادة التدريب
مزايا المعمارية: يوفر التصميم الموديولي قابلية تفسير وتكيف جيدة
القيمة العملية: توفير حل قابل للتطبيق لتحسين توليد النصوص في بيئات محدودة الموارد

القيود

الاعتماد على الوحدة المساعدة: تتأثر جودة التوليد بدقة الوحدة المساعدة
التخصص في المجال: يقتصر التحقق الحالي على مجال هندسة المتطلبات
حجم مجموعة البيانات: قد تكون مجموعة البيانات المستخدمة في التجارب (253 مثالاً) صغيرة نسبياً
قيود مقاييس التقييم: الاعتماد الأساسي على مقاييس ROUGE، مع نقص التقييم البشري

الاتجاهات المستقبلية

تطوير الإطار: تطوير إطار عمل برمجي بلغة Python يوفر تنفيذاً قابلاً لإعادة الاستخدام لـ PAGE
التحقق متعدد المجالات: اختبار فعالية الإطار في مجالات تطبيق أكثر
تحسين الوحدات المساعدة: البحث عن استراتيجيات تصميم وحدات مساعدة أكثر كفاءة
تحسين نظام التقييم: إدراج مقاييس تقييم أكثر شمولاً والتقييم البشري

التقييم المتعمق

المزايا

ابتكار قوي: اقتراح حل مساعدة تعزيز خفيف الوزن فريد
قيمة عملية عالية: حل مشاكل القيود على الموارد في التطبيقات الفعلية
تصميم معقول: معمارية موديولية تسهل الفهم والتنفيذ والتوسع
تجارب كافية: تصميم تجارب مقارنة معقولة، بما في ذلك تحليل الحد الأعلى المثالي
نتائج ملحوظة: تحقيق تحسينات أداء كبيرة على مقاييس متعددة

أوجه القصور

نطاق التحقق محدود: التحقق فقط في مجال محدد واحد (هندسة المتطلبات)
مجموعة بيانات صغيرة: قد تكون مجموعة البيانات المكونة من 253 مثالاً غير كافية للتحقق الكامل من قابلية التعميم
مقارنة الخطوط الأساسية غير كافية: نقص المقارنة المباشرة مع طرق تعزيز المحفزات الأخرى
نقص التحليل النظري: افتقار إلى تحليل نظري عميق لسبب فعالية هذه الطريقة
غياب التقييم البشري: الاعتماد الكامل على المقاييس الآلية، مع نقص التقييم من قبل الخبراء

التأثير

المساهمة الأكاديمية: توفير اتجاه بحثي جديد لتعزيز توليد النصوص
القيمة العملية: توفير حل عملي لتحسين التوليد في السيناريوهات محدودة الموارد
القابلية للتكرار: وصف الطريقة واضح، والتنفيذ نسبياً بسيط
القابلية للتوسع: تصميم الإطار يتمتع بقابلية توسع جيدة

السيناريوهات المناسبة

توليد النصوص في المجالات المتخصصة: مثل الوثائق التقنية والنصوص القانونية وغيرها التي تتطلب تنسيقات محددة
البيئات محدودة الموارد: سيناريوهات التطبيق التي لا يمكن إجراء ضبط دقيق لنماذج كبيرة فيها
تطوير النماذج الأولية السريعة: التطبيقات التي تحتاج إلى التكيف السريع مع مهام جديدة
السيناريوهات التي تتطلب قابلية تفسير عالية: تطبيقات تحتاج إلى فهم عملية التوليد

المراجع

تستشهد الورقة بأعمال مهمة متعددة ذات صلة، بما في ذلك:

الأعمال الأساسية لمعمارية Transformer (Vaswani et al., 2017)
نماذج اللغة الكبيرة الرئيسية (GPT و BERT و T5 و Llama وغيرها)
مواصفات بناء جملة EARS للمتطلبات (Mavin et al., 2009)
مقاييس التقييم ROUGE (Lin, 2004)
طرق تعزيز التوليد ذات الصلة وغيرها

التقييم الشامل: هذه ورقة بحثية تقترح طريقة مبتكرة، حيث يوفر إطار عمل PAGE منظوراً جديداً لتعزيز توليد النصوص. على الرغم من وجود مجال للتحسين في نطاق التحقق والتحليل النظري، إلا أن قيمتها العملية والابتكار التقني جديران بالتقدير. هذه الطريقة مناسبة بشكل خاص لسيناريوهات التطبيق التي تتطلب التكيف السريع مع مهام محددة وتعاني من قيود الموارد.