أظهرت نماذج توليد اللغة الطبيعية في السنوات الأخيرة أداءً متفوقاً في مهام توليد النصوص. ومع ذلك، عند مواجهة مهام محددة أو احتياجات خاصة، قد تؤدي هذه النماذج أداءً ضعيفاً أو تتطلب كميات كبيرة من البيانات الإضافية للتكيف. تقترح هذه الدراسة PAGE (تعزيز المحفزات لتحسين توليد النصوص)، وهو إطار عمل يساعد هذه النماذج من خلال استخدام وحدات مساعدة بسيطة. هذه الوحدات المساعدة عبارة عن نماذج خفيفة الوزن، مثل المصنفات أو المستخلصات، التي يمكنها توفير معلومات استدلالية من نص الإدخال. يتم استخدام مخرجات الوحدات المساعدة لبناء مدخلات غنية، مما يحسن جودة وقابلية التحكم في الإنتاج. بخلاف طرق المساعدة الأخرى في التوليد، لا يتطلب PAGE نموذج توليد مساعد، بل يقترح بدلاً من ذلك معمارية أبسط وموديولية وسهلة التكيف مع مهام مختلفة.
الإدخال: وصف النص الأصلي (مثل وصف المتطلبات باللغة الطبيعية) الإخراج: نص منظم وعالي الجودة (مثل تعبير المتطلبات الذي يتوافق مع قواعد نحوية محددة) الهدف: تحسين محفز الإدخال من خلال معلومات مساعدة، لتحسين جودة التوليد دون إعادة تدريب النموذج الرئيسي
يتضمن إطار عمل PAGE ثلاثة مكونات أساسية:
النص الأصلي → الوحدة المساعدة → معلومات منظمة
↓ ↓
└→ منشئ المحفزات ←┘
↓
محفز معزز → نموذج التوليد → الإخراج النهائي
استخدام عائلة مقاييس ROUGE لتقييم جودة التوليد:
يحسب كل مقياس ثلاثة أبعاد: الدقة والاستدعاء ودرجة F1.
تم تصميم ثلاث مجموعات تجارب للمقارنة:
| الطريقة | المقياس | الدقة | الاستدعاء | درجة F1 |
|---|---|---|---|---|
| Zero-Shot | ROUGE-1 | 0.509 | 0.489 | 0.485 |
| ROUGE-2 | 0.206 | 0.204 | 0.199 | |
| ROUGE-L | 0.413 | 0.395 | 0.392 | |
| عينات مجموعة البيانات | ROUGE-1 | 0.852 | 0.815 | 0.827 |
| ROUGE-2 | 0.653 | 0.630 | 0.636 | |
| ROUGE-L | 0.803 | 0.770 | 0.781 | |
| PAGE | ROUGE-1 | 0.849 | 0.809 | 0.822 |
| ROUGE-2 | 0.648 | 0.622 | 0.630 | |
| ROUGE-L | 0.796 | 0.761 | 0.772 |
مقدار التحسن النسبي مقارنة بطريقة الأساس:
يحقق PAGE الحد الأعلى المثالي تقريباً، متخلفاً فقط بـ 2-4 نقاط مئوية، مما يثبت فعالية الطريقة.
المثال 1 (فئة Ubiquitous):
المثال 2 (فئة Event-driven):
مقارنة بالطرق الموجودة، تتمتع PAGE بالمزايا التالية:
تستشهد الورقة بأعمال مهمة متعددة ذات صلة، بما في ذلك:
التقييم الشامل: هذه ورقة بحثية تقترح طريقة مبتكرة، حيث يوفر إطار عمل PAGE منظوراً جديداً لتعزيز توليد النصوص. على الرغم من وجود مجال للتحسين في نطاق التحقق والتحليل النظري، إلا أن قيمتها العملية والابتكار التقني جديران بالتقدير. هذه الطريقة مناسبة بشكل خاص لسيناريوهات التطبيق التي تتطلب التكيف السريع مع مهام محددة وتعاني من قيود الموارد.