Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic
Réutilisation de Méthodes Transversales dans les Grands Modèles de Langage : De la Prédiction au Niveau des Mots au Raisonnement Logique Rationnel au Niveau Logique
Les grands modèles de langage (LLMs) ont été largement appliqués pour faciliter la résolution de divers problèmes. Les travaux antérieurs ont proposé de représenter les méthodes comme des paires de problèmes et de leurs solutions correspondantes pour réaliser la réutilisation de méthodes. Cependant, les méthodes existantes exigent généralement une similitude élevée entre les problèmes. Cet article élargit la portée de la réutilisation de méthodes pour traiter les problèmes ayant une similitude faible ou une similitude implicite. Pour les problèmes similaires au sens général-spécifique, les auteurs proposent d'abord de séparer les problèmes et les solutions, plutôt que de les fournir directement au LLM sous forme appariée. Ensuite, ils guident le LLM pour adapter la solution aux nouveaux problèmes connexes, en le concentrant sur le transfert de solution plutôt que sur l'identification de problèmes. De plus, la méthode s'étend aux problèmes ne partageant que des caractéristiques partielles ou des propriétés cachées. Les validations expérimentales montrent que cette approche d'élargissement de portée augmente la probabilité de sélectionner des solutions réutilisables, améliorant ainsi l'efficacité de la réutilisation de méthodes transversales.
Les modèles de langage traditionnels sont principalement entraînés au niveau des mots, en prédisant le token suivant ou en remplissant les tokens manquants. Ce mode d'entraînement reflète principalement la co-occurrence statistique plutôt que le raisonnement logique de haut niveau, ressemblant davantage à l'intuition ou à la reconnaissance de motifs qu'à une prise de décision rationnelle.
Limitations du raisonnement au niveau des mots : Les LLMs actuels basés sur Transformer rencontrent des difficultés dans le raisonnement au niveau des méthodes, tendant à favoriser les méthodes fréquemment présentes dans les données d'entraînement, même si elles ne sont pas optimales.
Limitations de la réutilisation de méthodes : Les cadres existants de réutilisation de méthodes exigent une similitude élevée entre les problèmes, limitant leur portée d'application.
Besoin de transfert de connaissances transdomaines : Les humains peuvent appliquer analogiquement la solution d'un problème à de nouveaux problèmes apparemment sans rapport, mais les LLMs actuels manquent de cette capacité de réutilisation de méthodes transversales.
Comment permettre aux LLMs de réutiliser efficacement les solutions existantes même lorsque la similitude entre les problèmes est faible ou qu'il n'existe pas d'association évidente.
Élargissement de la portée de la réutilisation de méthodes : Extension de la réutilisation de méthodes des cas de haute similitude aux mappages général-spécifique et aux relations cachées basées sur les caractéristiques.
Proposition d'un modèle de réutilisation de méthodes transversales :
Réutilisation relationnelle : traitement des relations général-spécifique et parallèles
Réutilisation basée sur les caractéristiques : support de l'appariement partiel de caractéristiques et de l'identification de propriétés cachées
Introduction du concept « Méthode des Méthodes » (Method of Methods, MoM) : Fourniture de méthodes de haut niveau pour vérifier, améliorer et renforcer l'efficacité des méthodes actuellement appliquées.
Cadre théorique : Élévation de la prédiction au niveau des mots au raisonnement au niveau logique, réalisant une application rationnelle plutôt que purement statistique des solutions.
Étant donné un problème cible Qt, en l'absence de solution directe, trouver des solutions réutilisables dans une bibliothèque de méthodes existantes, même si les problèmes originaux de ces méthodes ont une similitude faible avec le problème cible ou entretiennent des relations implicites.
Méthode Général-Spécifique :
Si deux méthodes Ma et Mb résolvent respectivement les ensembles de problèmes Qma et Qmb, et si :
Qma ⊃ Qmb (1)
alors Ma est plus générale que Mb, permettant une réutilisation verticale.
Méthodes Parallèles :
Deux méthodes sont parallèles si et seulement si leurs ensembles de problèmes sont des sous-ensembles disjoints d'une catégorie plus large :
Une méthode globale Gi = (Qgi, Sgi) possède une applicabilité large et peut servir d'amélioration de programme générique pour augmenter la fiabilité et la cohérence de l'exécution des méthodes.
Stratégie de Séparation Problème-Solution : Plutôt que de fournir directement les paires problème-solution au LLM, séparer d'abord puis guider le LLM pour le transfert de solution.
Identification de Similitude Multiniveaux :
Appariement de caractéristiques explicites
Inférence de propriétés cachées
Réutilisation de modèles de méthodes globales
Mécanisme de Validation Hiérarchisée : Assurer via la fonction Valid la validité logique de la solution dans le nouveau contexte.
Les expériences utilisent deux catégories de scénarios de test :
Tests de Réutilisation Relationnelle : Problème de jugement de fraîcheur de bananes, réutilisant la méthode générale de fraîcheur des fruits
Tests de Réutilisation Basée sur les Caractéristiques : Problème de réinitialisation du temps d'utilisation du disque dur, réutilisant l'expérience de traitement de fichiers MP3
Stabilité Supérieure de la Réutilisation Relationnelle : La réutilisation relationnelle basée sur des connexions structurelles montre une performance plus stable que la réutilisation basée sur les caractéristiques fondée sur un chevauchement partiel.
Efficacité de la Séparation Explicite : Guider explicitement le LLM pour générer des paires problème-solution s'avère plus efficace que de fournir directement le matériel.
Significativité Statistique : La séparation statistique de la réutilisation relationnelle est plus forte (valeur t 9,23 vs 4,80), indiquant une efficacité plus fiable.
Les LLMs traditionnels apprennent au niveau des tokens la distribution P(wt+1|w1,w2,...,wt), capturant principalement les motifs de co-occurrence statistique. Ce cadre réalise la réutilisation au niveau logique via la représentation des méthodes M=(Q,S) :
Le cadre de réutilisation de méthodes transversales élargit avec succès la portée d'application des LLMs, leur permettant de traiter les problèmes ayant une similitude faible.
La réutilisation relationnelle montre une performance plus stable dans le traitement des dépendances général-spécifique, tandis que la réutilisation basée sur les caractéristiques fournit un mécanisme supplémentaire pour traiter les chevauchements implicites.
La stratégie structurée de séparation problème-solution améliore significativement l'efficacité de la réutilisation de méthodes.
Efficacité Limitée de la Réutilisation Basée sur les Caractéristiques : Comparée à la réutilisation relationnelle, l'amélioration de la réutilisation basée sur les caractéristiques est plus modeste.
Dépendance du Mécanisme de Validation : L'implémentation de la fonction Valid peut affecter l'efficacité de la réutilisation.
Complexité Computationnelle : Le calcul de similarité dans les espaces de caractéristiques à grande échelle peut être chronophage.
Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.
Évaluation Globale : Cet article propose un cadre innovant de réutilisation de méthodes transversales, élargissant avec succès la capacité d'application des LLMs dans des scénarios de faible similitude. Bien qu'il existe encore une marge d'amélioration en termes d'échelle expérimentale et de certains détails techniques, ses contributions théoriques et sa valeur pratique en font un travail important dans le domaine de la recherche sur le raisonnement des LLMs.