2025-11-16T01:40:12.068255

Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning

Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic

Reutilización de Métodos entre Preguntas en Modelos de Lenguaje Grande: De la Predicción a Nivel de Palabra al Razonamiento Lógico Racional en Capa Lógica

Información Básica

  • ID del Artículo: 2509.05660
  • Título: Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
  • Autor: Hong Su (Facultad de Ciencias de la Computación, Universidad de Información de Chengdu)
  • Clasificación: cs.CL (Lingüística Computacional)
  • Revista de Publicación: Journal of LaTeX Class Files, Vol. 14, No. 8, Agosto 2015
  • Enlace del Artículo: https://arxiv.org/abs/2509.05660v2

Resumen

Los modelos de lenguaje grande (LLMs) se han aplicado ampliamente para asistir en la resolución de diversos problemas. Trabajos anteriores propusieron representar métodos como pares de problemas y sus soluciones correspondientes para lograr la reutilización de métodos. Sin embargo, los métodos existentes generalmente requieren una alta similitud entre problemas. Este artículo expande el alcance de la reutilización de métodos para manejar problemas con similitud baja o similitud implícita. Para problemas similares en sentido general-específico, los autores proponen primero separar los problemas y las soluciones, en lugar de introducir directamente los pares emparejados en el LLM. Luego guían al LLM para adaptar la solución a nuevos problemas relacionados, enfocándose en la transferencia de soluciones en lugar de la identificación de problemas. Además, el método se extiende a problemas que comparten solo características parciales u ocultas. La validación experimental demuestra que este método de expansión de alcance mejora la probabilidad de seleccionar soluciones reutilizables, mejorando así la efectividad de la reutilización de métodos entre preguntas.

Antecedentes de Investigación y Motivación

Definición del Problema

Los modelos de lenguaje grande tradicionales se entrenan principalmente a nivel de palabra, prediciendo el siguiente token o rellenando tokens faltantes. Este enfoque de entrenamiento refleja principalmente la coocurrencia estadística, no el razonamiento lógico de alto nivel, asemejándose más a la intuición o coincidencia de patrones que a la toma de decisiones racional.

Motivación de la Investigación

  1. Limitaciones del razonamiento a nivel de palabra: Los LLMs basados en transformadores actuales tienen dificultades en el razonamiento a nivel de método, tendiendo a favorecer métodos que aparecen frecuentemente en los datos de entrenamiento, incluso si estos no son óptimos.
  2. Limitaciones de la reutilización de métodos: Los marcos de reutilización de métodos existentes requieren alta similitud entre problemas, limitando su rango de aplicación.
  3. Necesidad de transferencia de conocimiento entre dominios: Los humanos pueden aplicar analógicamente la solución de un problema a nuevos problemas aparentemente no relacionados, pero los LLMs actuales carecen de esta capacidad de reutilización de métodos entre preguntas.

Desafíos Centrales

Cómo permitir que los LJMs reutilicen efectivamente soluciones existentes incluso cuando la similitud entre problemas es baja o no existe una asociación evidente.

Contribuciones Principales

  1. Expansión del alcance de reutilización de métodos: Extender la reutilización de métodos desde casos de alta similitud hasta mapeos general-específico y relaciones ocultas basadas en características.
  2. Propuesta de modelo de reutilización de métodos entre preguntas:
    • Reutilización relacional: manejo de relaciones general-específico y paralelas
    • Reutilización basada en características: soporte para coincidencia parcial de características e identificación de características ocultas
  3. Introducción del concepto "Método de Métodos" (Method of Methods, MoM): proporciona un enfoque de alto nivel para verificar, mejorar y elevar la efectividad del método actual aplicado.
  4. Marco teórico: elevación de la predicción a nivel de palabra al razonamiento en capa lógica, logrando aplicación racional en lugar de puramente estadística de soluciones.

Explicación Detallada del Método

Definición de Tarea

Dado un problema objetivo Qt, en ausencia de una solución directa, encontrar soluciones reutilizables de una biblioteca de métodos existentes, incluso si los problemas originales de estos métodos tienen baja similitud con el problema objetivo o relaciones implícitas.

Arquitectura del Modelo

1. Reutilización de Métodos Relacional

Método General-Específico: Si dos métodos Ma y Mb resuelven conjuntos de problemas Qma y Qmb respectivamente, y satisfacen:

Qma ⊃ Qmb  (1)

entonces Ma es más general que Mb, permitiendo reutilización vertical.

Métodos Paralelos: Dos métodos son paralelos si y solo si sus conjuntos de problemas son subconjuntos disjuntos de una categoría más amplia:

Qma ∩ Qmb = ∅, Qma ⊂ Qg, Qmb ⊂ Qg  (2)

2. Reutilización de Métodos Basada en Características

Definición del Espacio de Características: Para un problema Q, sus características se definen como:

F(Q) ⊆ F, F(Q) = Fmeas(Q) ∪ Ftext(Q)  (3)

donde Fmeas(Q) son atributos numéricos explícitos y Ftext(Q) son características extraídas del texto mediante un codificador de aprendizaje h(·).

Similitud de Características:

Simfeat(Qa, Qb) = S(F(Qa), F(Qb))  (5)

Condición de Reutilización:

Reusefeat(Qb; Sa) = {
    1, if Simfeat(Qa, Qb) ≥ τ and Valid(Sa, Qb) = 1
    0, otherwise
}  (6)

3. Método Global

El método global Gi = (Qgi, Sgi) posee amplia aplicabilidad y puede servir como mejora de programa universal para aumentar la confiabilidad y consistencia de la ejecución del método.

4. Método de Métodos (MoM)

MoM se organiza jerárquicamente por profundidad:

  • M(0): métodos directos, Q ↦ S
  • M(1): métodos de primer orden, M(0) ↦ M(0)'
  • M(i+1): métodos de orden (i+1), M(i) ↦ M(i)'

Puntos de Innovación Técnica

  1. Estrategia de separación problema-solución: en lugar de introducir directamente pares problema-solución en el LJM, primero separar y luego guiar al LJM para la transferencia de soluciones.
  2. Identificación de similitud multinivel:
    • Coincidencia de características explícitas
    • Inferencia de características ocultas
    • Reutilización de plantillas de método integral
  3. Mecanismo de verificación jerárquica: mediante la función Valid asegurar la validez lógica de la solución en nuevo contexto.

Configuración Experimental

Conjuntos de Datos

Los experimentos utilizan dos tipos de escenarios de prueba:

  1. Prueba de reutilización relacional: problema de determinación de frescura de plátanos, reutilizando método general de frescura de frutas
  2. Prueba de reutilización basada en características: problema de reinicio de tiempo de uso de disco duro, reutilizando experiencia de procesamiento de archivos MP3

Métricas de Evaluación

  • Similitud de coseno: medir el grado de alineación entre la solución generada y el método objetivo
  • Prueba de significancia estadística: usar prueba t de muestras independientes para evaluar diferencias entre métodos

Métodos de Comparación

  1. RelaMethod vs CompareRela: evaluar efectividad de reutilización relacional
  2. featureMethd vs compareMP3Method: evaluar efectividad de reutilización basada en características

Detalles de Implementación

  • 20 rondas de prueba para cada método
  • Usar prueba t de Welch para análisis estadístico
  • Comparar solo segmentos de texto relacionados con el método objetivo para reducir ruido

Resultados Experimentales

Resultados Principales

Experimento de Reutilización Relacional:

  • Similitud promedio de RelaMethod: 0.4835 (desviación estándar: 0.0801)
  • Similitud promedio de CompareRela: 0.2820 (desviación estándar: 0.0558)
  • Valor t: 9.23, valor p: 8.98×10^-11 (p < 0.05)
  • Conclusión: RelaMethod es significativamente superior al método base

Experimento de Reutilización Basada en Características:

  • Similitud promedio de featureMethd: 0.2945 (desviación estándar: 0.0698)
  • Similitud promedio de compareMP3Method: 0.3983 (desviación estándar: 0.0670)
  • Valor t: -4.80, valor p: 2.52×10^-5 (p < 0.05)
  • Conclusión: existe diferencia significativa entre ambos métodos

Análisis Comparativo

Comparación de MétodosDiferencia PromedioSimilitud PromedioRatio RelativoTipo de Reutilización
RelaMethod vs CompareRela0.20150.351057.4%Reutilización Dependiente
featureMethd vs compareMP3Method0.10380.072614.3%Asociación Parcial

Hallazgos Experimentales

  1. Mayor estabilidad de reutilización relacional: la reutilización relacional basada en conexiones estructurales funciona más estable que la reutilización basada en características basada en superposición parcial.
  2. Efectividad de separación explícita: indicar explícitamente al LJM generar pares problema-solución es más efectivo que proporcionar material directamente.
  3. Significancia estadística: la separación estadística de reutilización relacional es más fuerte (valor t 9.23 vs 4.80), indicando efectos más confiables.

Análisis Teórico

Reutilización en Capa Lógica

Los LJMs tradicionales aprenden distribuciones P(wt+1|w1,w2,...,wt) a nivel de token, capturando principalmente patrones de coocurrencia estadística. Este marco logra reutilización en capa lógica mediante la representación de método M=(Q,S), implementando mapeo de reutilización lógica:

R: (Qa, Sa) → (Qb, Sa)  (15)

Reutilización Racional

A diferencia de la selección basada en probabilidad de token, la reutilización de métodos se basa en aplicabilidad lógica:

Preuse(Ss|Qt) ∝ Simlogic(Qt, Qs) · I[Ss valid]  (19)

asegurando que la reutilización se base en transferibilidad lógica en lugar de frecuencia estadística.

Trabajo Relacionado

Investigación de Razonamiento en LJM

  • Indicaciones de cadena de pensamiento: mejorar el desempeño del razonamiento generando pasos intermedios
  • Autoconsistencia: mejorar robustez mediante muestreo de múltiples rutas
  • Árbol/Gráfico de Pensamiento: extensión a estructuras de búsqueda más complejas

Representación y Reutilización de Métodos

  • IA Simbólica: descomposición de conocimiento en componentes reutilizables
  • Síntesis de Programas: reutilización de operadores abstractos para resolver nuevas tareas
  • Razonamiento Basado en Casos (CBR): resolución de nuevos problemas mediante analogía

Aprendizaje por Transferencia y Metarrazonamiento

  • Modelos Preentrenados: capacidades de transferencia de tareas de T5, GPT-4, etc.
  • Indicaciones Aumentadas por Recuperación: guiar razonamiento mediante recuperación de ejemplos similares
  • Mecanismos de Reflexión: mejora iterativa mediante retroalimentación autorreflexiva

Conclusiones y Discusión

Conclusiones Principales

  1. El marco de reutilización de métodos entre preguntas expande exitosamente el rango de aplicación de LJM, permitiéndole manejar problemas con similitud baja.
  2. La reutilización relacional muestra mayor estabilidad al manejar dependencias general-específico, mientras que la reutilización basada en características proporciona mecanismo complementario para manejar superposición implícita.
  3. La estrategia estructurada de separación problema-solución mejora significativamente la efectividad de la reutilización de métodos.

Limitaciones

  1. Efectividad limitada de reutilización basada en características: en comparación con reutilización relacional, la mejora de reutilización basada en características es menor.
  2. Dependencia del mecanismo de verificación: la implementación de la función Valid puede afectar la efectividad de reutilización.
  3. Complejidad computacional: el cálculo de similitud en espacio de características a gran escala puede ser relativamente lento.

Direcciones Futuras

  1. Mejorar métodos de extracción de características y cálculo de similitud
  2. Desarrollar mecanismos de verificación más inteligentes
  3. Extender a escenarios de resolución de problemas multietapa más complejos

Evaluación Profunda

Fortalezas

  1. Fuerte innovación: primera solución sistemática del problema de reutilización de métodos para problemas de baja similitud en LJM
  2. Base teórica sólida: proporciona marco teórico desde predicción a nivel de palabra hasta razonamiento en capa lógica
  3. Diseño experimental razonable: validación de efectividad del método mediante casos concretos
  4. Alto valor práctico: proporciona nuevas perspectivas para aplicación práctica de LJM

Insuficiencias

  1. Escala experimental limitada: validación en solo dos escenarios específicos, falta de experimentos a gran escala
  2. Definición de características vaga: construcción del espacio de características carece de orientación sistemática
  3. Eficiencia computacional no evaluada: no se analiza el costo computacional y escalabilidad del método
  4. Métodos de comparación únicos: falta comparación con otros métodos avanzados

Impacto

  1. Contribución teórica: proporciona nueva perspectiva teórica para mejorar capacidad de razonamiento de LJM
  2. Valor práctico: aplicable a escenarios reales que requieren transferencia de conocimiento entre dominios
  3. Inspirador: proporciona direcciones valiosas para investigación posterior

Escenarios Aplicables

  1. Transferencia de conocimiento: aplicación de soluciones de un dominio a otro
  2. Resolución de problemas innovadores: búsqueda de soluciones analógicas ante problemas completamente nuevos
  3. Asistencia educativa: ayudar a estudiantes a comprender conexiones internas entre diferentes problemas
  4. Sistemas expertos: construcción de sistemas inteligentes capaces de aplicar flexiblemente conocimiento existente

Referencias

  1. Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
  2. Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
  3. Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
  4. Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.

Evaluación General: Este artículo propone un marco innovador de reutilización de métodos entre preguntas, expandiendo exitosamente la capacidad de aplicación de LJM en escenarios de baja similitud. Aunque hay espacio para mejora en escala experimental y ciertos detalles técnicos, sus contribuciones teóricas y valor práctico lo convierten en un trabajo importante en el campo de investigación de razonamiento en LJM.