Unlocking the Potential of Diffusion Language Models through Template Infilling
Lee, Kim, Kwak
Diffusion Language Models (DLMs) have emerged as a promising alternative to Autoregressive Language Models, yet their inference strategies remain limited to prefix-based prompting inherited from the autoregressive paradigm. In this paper, we propose Template Infilling (TI), a tailored conditioning methodology for DLMs' generation process. Unlike conventional prefix prompting, TI first generates a structural template for the target response, then fills in the masked segments. To enhance the flexibility of this structural control, we introduce Dynamic Segment Allocation (DSA), which adaptively adjusts segment lengths based on generation confidence. We demonstrate the effectiveness of our approach on mathematical reasoning and code generation benchmarks, achieving consistent improvements of 17.01$\%$p over baseline. Furthermore, we show that TI provides additional advantages in multi-token generation settings, enabling effective speedup while maintaining generation quality.
academic
فتح إمكانات نماذج اللغة الانتشارية من خلال ملء القوالب
ظهرت نماذج اللغة الانتشارية (DLMs) كبديل واعد للنماذج اللغوية الانحدارية الذاتية، لكن استراتيجيات الاستدلال بها تقتصر على التلميح القائم على البادئة الموروث من النموذج الانحداري الذاتي. تقترح هذه الورقة ملء القوالب (TI)، وهي طريقة تكييف مخصصة لعملية توليد DLMs. بخلاف التلميح بالبادئة التقليدي، يقوم TI أولاً بإنشاء قالب هيكلي للاستجابة المستهدفة، ثم ملء المقاطع المقنعة. لتعزيز مرونة هذا التحكم الهيكلي، يقدم المؤلفون تخصيص المقاطع الديناميكي (DSA)، الذي يعدل طول المقطع بشكل تكيفي بناءً على ثقة التوليد. في معايير الاستدلال الرياضي وتوليد الأكواد، حققت الطريقة تحسناً في الاتساق بنسبة 17.01% مقارنة بخط الأساس. علاوة على ذلك، يوفر TI مزايا إضافية في إعدادات توليد متعددة الرموز، مما يحقق تسريعاً فعالاً مع الحفاظ على جودة التوليد.
تولد نماذج اللغة الانتشارية (DLMs) النصوص من خلال عملية إزالة الضوضاء التكرارية، وهي تختلف بشكل أساسي عن نموذج التوليد من اليسار إلى اليمين في نماذج اللغة الانحدارية الذاتية (ALMs). تتمتع DLMs بالقدرة على التوليد الشرطي لأي مجموعة من المواضع، مع القدرة على نمذجة السياق ثنائي الاتجاه.
توفر قدرة التوليد الشرطي ثنائي الاتجاه في DLMs إمكانيات جديدة لتوليد النصوص، لكن طرق التقييم والتطبيق الحالية لا تستفيد بالكامل من هذه الميزة. يعتقد المؤلفون بضرورة تصميم طرق تكييف جديدة مخصصة لخصائص DLMs.
باستخدام قدرة التوليد الشرطي ثنائي الاتجاه في DLMs، وبناءً على سياق الإدخال، توجيه عملية التوليد من خلال قالب منظم لإنتاج استجابة مستهدفة عالية الجودة.
تستشهد الورقة بعدة أعمال ذات صلة مهمة، بما في ذلك:
أساس نماذج الانتشار: Ho et al. (2020) - نماذج الاحتمالية الانتشارية لإزالة الضوضاء
تطور DLMs: Austin et al. (2021) - D3PM، Lou et al. (2023) - SEDD، Nie et al. (2025) - LLaDA
تلميح نماذج اللغة: Brown et al. (2020) - GPT-3، Wei et al. (2022) - Chain-of-Thought
معايير التقييم: Cobbe et al. (2021) - GSM8K، Chen et al. (2021) - HumanEval
التقييم الشامل: هذه ورقة بحثية عالية الجودة تقترح طريقة تكييف مبتكرة لنماذج اللغة الانتشارية. على الرغم من وجود بعض القيود في نطاق التقييم والتحليل النظري، فإن الفكرة الأساسية جديدة، والنتائج التجريبية مقنعة، وتوفر مساهمة قيمة لبحث وتطبيق DLMs. من المتوقع أن يدفع هذا العمل تطور نماذج اللغة الانتشارية من مجرد تحسين الكفاءة نحو الاستفادة الكاملة من الإمكانيات.