Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic
إعادة استخدام الطرق عبر الأسئلة في نماذج اللغة الكبيرة: من التنبؤ على مستوى الكلمات إلى التفكير المنطقي الرشيد على المستوى المنطقي
تم تطبيق نماذج اللغة الكبيرة (LLMs) على نطاق واسع للمساعدة في حل مختلف المشاكل. اقترحت الأعمال السابقة تمثيل الطرق كأزواج من الأسئلة والحلول المقابلة لها لتحقيق إعادة استخدام الطرق. ومع ذلك، تتطلب الطرق الموجودة عادة تشابهاً عالياً بين الأسئلة. تعمل هذه الورقة على توسيع نطاق إعادة استخدام الطرق للتعامل مع الأسئلة ذات التشابه المنخفض أو التشابه الضمني. بالنسبة للأسئلة المتشابهة بالمعنى العام-الخاص، يقترح المؤلفون فصل الأسئلة والحلول أولاً بدلاً من إدخال الأزواج مباشرة في نموذج اللغة الكبيرة. ثم توجيه نموذج اللغة الكبيرة لتكييف الحل مع السؤال الجديد ذي الصلة، مما يركز على نقل الحل بدلاً من تحديد المشكلة. بالإضافة إلى ذلك، يمتد الأسلوب إلى الأسئلة التي تشترك فقط في ميزات جزئية أو خصائص مخفية. تُظهر التحقيقات التجريبية أن طريقة توسيع النطاق هذه تحسّن احتمالية تصفية الحلول القابلة لإعادة الاستخدام، مما يحسّن فعالية إعادة استخدام الطرق عبر الأسئلة.
تركز نماذج اللغة الكبيرة التقليدية بشكل أساسي على التدريب على مستوى الكلمات، من خلال التنبؤ بالرمز التالي أو ملء الرموز المفقودة. يعكس أسلوب التدريب هذا بشكل أساسي التزامن الإحصائي بدلاً من التفكير المنطقي على مستوى أعلى، وهو أشبه بالحدس أو مطابقة الأنماط بدلاً من اتخاذ القرارات الرشيدة.
قيود التفكير على مستوى الكلمات: تواجه نماذج اللغة الكبيرة القائمة على Transformer صعوبات في التفكير على مستوى الطريقة، وتميل إلى تفضيل الطرق التي تظهر بشكل متكرر في بيانات التدريب، حتى لو لم تكن مثالية.
قيود إعادة استخدام الطرق: تتطلب أطر عمل إعادة استخدام الطرق الموجودة تشابهاً عالياً بين الأسئلة، مما يحد من نطاق تطبيقها.
الحاجة إلى نقل المعرفة عبر المجالات: يمكن للبشر تطبيق حل مشكلة واحدة بالقياس على مشكلة جديدة تبدو غير ذات صلة، لكن نماذج اللغة الكبيرة الحالية تفتقر إلى هذه القدرة على إعادة استخدام الطرق عبر الأسئلة.
بالنظر إلى سؤال هدف Qt، في غياب حل مباشر، ابحث عن حلول قابلة لإعادة الاستخدام من مكتبة الطرق الموجودة، حتى لو كانت المشاكل الأصلية لهذه الطرق ذات تشابه منخفض مع السؤال الهدف أو لديها علاقات ضمنية.
استقرار إعادة الاستخدام العلائقية: تُظهر إعادة الاستخدام العلائقية المعتمدة على الاتصالات الهيكلية أداءً أكثر استقراراً من إعادة الاستخدام القائمة على الميزات المعتمدة على التداخل الجزئي.
تأثير الفصل الصريح: يكون توجيه نموذج اللغة الكبيرة لإنشاء أزواج السؤال-الحل أكثر فعالية من توفير المواد مباشرة.
الدلالة الإحصائية: يكون الفصل الإحصائي لإعادة الاستخدام العلائقية أقوى (قيمة t 9.23 مقابل 4.80)، مما يشير إلى نتائج أكثر موثوقية.
تتعلم نماذج اللغة الكبيرة التقليدية التوزيع P(wt+1|w1,w2,...,wt) على مستوى الرمز، وتلتقط بشكل أساسي أنماط التزامن الإحصائي. يحقق هذا الإطار إعادة استخدام التعيين على المستوى المنطقي من خلال تمثيل الطريقة M=(Q,S):
نجح إطار عمل إعادة استخدام الطرق عبر الأسئلة في توسيع نطاق تطبيق نماذج اللغة الكبيرة، مما يمكّنها من التعامل مع المشاكل ذات التشابه المنخفض.
تُظهر إعادة الاستخدام العلائقية استقراراً أكبر عند التعامل مع التبعيات العام-الخاص، وتوفر إعادة الاستخدام القائمة على الميزات آلية تكميلية للتعامل مع التداخل الضمني.
تحسّن استراتيجية فصل السؤال-الحل المنظمة بشكل ملحوظ فعالية إعادة استخدام الطريقة.
Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.
التقييم الشامل: تقترح هذه الورقة إطار عمل مبتكراً لإعادة استخدام الطرق عبر الأسئلة، وتوسع بنجاح قدرة نماذج اللغة الكبيرة على التطبيق في سيناريوهات التشابه المنخفض. على الرغم من وجود مجال للتحسين في نطاق التجربة وبعض التفاصيل التقنية، فإن مساهماتها النظرية وقيمتها العملية تجعلها عملاً مهماً في مجال أبحاث التفكير في نماذج اللغة الكبيرة.