Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic
Reutilización de Métodos entre Preguntas en Modelos de Lenguaje Grande: De la Predicción a Nivel de Palabra al Razonamiento Lógico Racional en Capa Lógica
Los modelos de lenguaje grande (LLMs) se han aplicado ampliamente para asistir en la resolución de diversos problemas. Trabajos anteriores propusieron representar métodos como pares de problemas y sus soluciones correspondientes para lograr la reutilización de métodos. Sin embargo, los métodos existentes generalmente requieren una alta similitud entre problemas. Este artículo expande el alcance de la reutilización de métodos para manejar problemas con similitud baja o similitud implícita. Para problemas similares en sentido general-específico, los autores proponen primero separar los problemas y las soluciones, en lugar de introducir directamente los pares emparejados en el LLM. Luego guían al LLM para adaptar la solución a nuevos problemas relacionados, enfocándose en la transferencia de soluciones en lugar de la identificación de problemas. Además, el método se extiende a problemas que comparten solo características parciales u ocultas. La validación experimental demuestra que este método de expansión de alcance mejora la probabilidad de seleccionar soluciones reutilizables, mejorando así la efectividad de la reutilización de métodos entre preguntas.
Los modelos de lenguaje grande tradicionales se entrenan principalmente a nivel de palabra, prediciendo el siguiente token o rellenando tokens faltantes. Este enfoque de entrenamiento refleja principalmente la coocurrencia estadística, no el razonamiento lógico de alto nivel, asemejándose más a la intuición o coincidencia de patrones que a la toma de decisiones racional.
Limitaciones del razonamiento a nivel de palabra: Los LLMs basados en transformadores actuales tienen dificultades en el razonamiento a nivel de método, tendiendo a favorecer métodos que aparecen frecuentemente en los datos de entrenamiento, incluso si estos no son óptimos.
Limitaciones de la reutilización de métodos: Los marcos de reutilización de métodos existentes requieren alta similitud entre problemas, limitando su rango de aplicación.
Necesidad de transferencia de conocimiento entre dominios: Los humanos pueden aplicar analógicamente la solución de un problema a nuevos problemas aparentemente no relacionados, pero los LLMs actuales carecen de esta capacidad de reutilización de métodos entre preguntas.
Cómo permitir que los LJMs reutilicen efectivamente soluciones existentes incluso cuando la similitud entre problemas es baja o no existe una asociación evidente.
Expansión del alcance de reutilización de métodos: Extender la reutilización de métodos desde casos de alta similitud hasta mapeos general-específico y relaciones ocultas basadas en características.
Propuesta de modelo de reutilización de métodos entre preguntas:
Reutilización relacional: manejo de relaciones general-específico y paralelas
Reutilización basada en características: soporte para coincidencia parcial de características e identificación de características ocultas
Introducción del concepto "Método de Métodos" (Method of Methods, MoM): proporciona un enfoque de alto nivel para verificar, mejorar y elevar la efectividad del método actual aplicado.
Marco teórico: elevación de la predicción a nivel de palabra al razonamiento en capa lógica, logrando aplicación racional en lugar de puramente estadística de soluciones.
Dado un problema objetivo Qt, en ausencia de una solución directa, encontrar soluciones reutilizables de una biblioteca de métodos existentes, incluso si los problemas originales de estos métodos tienen baja similitud con el problema objetivo o relaciones implícitas.
El método global Gi = (Qgi, Sgi) posee amplia aplicabilidad y puede servir como mejora de programa universal para aumentar la confiabilidad y consistencia de la ejecución del método.
Estrategia de separación problema-solución: en lugar de introducir directamente pares problema-solución en el LJM, primero separar y luego guiar al LJM para la transferencia de soluciones.
Identificación de similitud multinivel:
Coincidencia de características explícitas
Inferencia de características ocultas
Reutilización de plantillas de método integral
Mecanismo de verificación jerárquica: mediante la función Valid asegurar la validez lógica de la solución en nuevo contexto.
Los experimentos utilizan dos tipos de escenarios de prueba:
Prueba de reutilización relacional: problema de determinación de frescura de plátanos, reutilizando método general de frescura de frutas
Prueba de reutilización basada en características: problema de reinicio de tiempo de uso de disco duro, reutilizando experiencia de procesamiento de archivos MP3
Mayor estabilidad de reutilización relacional: la reutilización relacional basada en conexiones estructurales funciona más estable que la reutilización basada en características basada en superposición parcial.
Efectividad de separación explícita: indicar explícitamente al LJM generar pares problema-solución es más efectivo que proporcionar material directamente.
Significancia estadística: la separación estadística de reutilización relacional es más fuerte (valor t 9.23 vs 4.80), indicando efectos más confiables.
Los LJMs tradicionales aprenden distribuciones P(wt+1|w1,w2,...,wt) a nivel de token, capturando principalmente patrones de coocurrencia estadística. Este marco logra reutilización en capa lógica mediante la representación de método M=(Q,S), implementando mapeo de reutilización lógica:
El marco de reutilización de métodos entre preguntas expande exitosamente el rango de aplicación de LJM, permitiéndole manejar problemas con similitud baja.
La reutilización relacional muestra mayor estabilidad al manejar dependencias general-específico, mientras que la reutilización basada en características proporciona mecanismo complementario para manejar superposición implícita.
La estrategia estructurada de separación problema-solución mejora significativamente la efectividad de la reutilización de métodos.
Efectividad limitada de reutilización basada en características: en comparación con reutilización relacional, la mejora de reutilización basada en características es menor.
Dependencia del mecanismo de verificación: la implementación de la función Valid puede afectar la efectividad de reutilización.
Complejidad computacional: el cálculo de similitud en espacio de características a gran escala puede ser relativamente lento.
Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.
Evaluación General: Este artículo propone un marco innovador de reutilización de métodos entre preguntas, expandiendo exitosamente la capacidad de aplicación de LJM en escenarios de baja similitud. Aunque hay espacio para mejora en escala experimental y ciertos detalles técnicos, sus contribuciones teóricas y valor práctico lo convierten en un trabajo importante en el campo de investigación de razonamiento en LJM.