2025-11-16T01:40:12.068255

Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning

Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic

Réutilisation de Méthodes Transversales dans les Grands Modèles de Langage : De la Prédiction au Niveau des Mots au Raisonnement Logique Rationnel au Niveau Logique

Informations Fondamentales

  • ID de l'article : 2509.05660
  • Titre : Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
  • Auteur : Hong Su (Faculté d'Informatique, Université d'Ingénierie de l'Information de Chengdu)
  • Classification : cs.CL (Linguistique Computationnelle)
  • Journal de Publication : Journal of LaTeX Class Files, Vol. 14, No. 8, Août 2015
  • Lien de l'article : https://arxiv.org/abs/2509.05660v2

Résumé

Les grands modèles de langage (LLMs) ont été largement appliqués pour faciliter la résolution de divers problèmes. Les travaux antérieurs ont proposé de représenter les méthodes comme des paires de problèmes et de leurs solutions correspondantes pour réaliser la réutilisation de méthodes. Cependant, les méthodes existantes exigent généralement une similitude élevée entre les problèmes. Cet article élargit la portée de la réutilisation de méthodes pour traiter les problèmes ayant une similitude faible ou une similitude implicite. Pour les problèmes similaires au sens général-spécifique, les auteurs proposent d'abord de séparer les problèmes et les solutions, plutôt que de les fournir directement au LLM sous forme appariée. Ensuite, ils guident le LLM pour adapter la solution aux nouveaux problèmes connexes, en le concentrant sur le transfert de solution plutôt que sur l'identification de problèmes. De plus, la méthode s'étend aux problèmes ne partageant que des caractéristiques partielles ou des propriétés cachées. Les validations expérimentales montrent que cette approche d'élargissement de portée augmente la probabilité de sélectionner des solutions réutilisables, améliorant ainsi l'efficacité de la réutilisation de méthodes transversales.

Contexte de Recherche et Motivation

Définition du Problème

Les modèles de langage traditionnels sont principalement entraînés au niveau des mots, en prédisant le token suivant ou en remplissant les tokens manquants. Ce mode d'entraînement reflète principalement la co-occurrence statistique plutôt que le raisonnement logique de haut niveau, ressemblant davantage à l'intuition ou à la reconnaissance de motifs qu'à une prise de décision rationnelle.

Motivation de la Recherche

  1. Limitations du raisonnement au niveau des mots : Les LLMs actuels basés sur Transformer rencontrent des difficultés dans le raisonnement au niveau des méthodes, tendant à favoriser les méthodes fréquemment présentes dans les données d'entraînement, même si elles ne sont pas optimales.
  2. Limitations de la réutilisation de méthodes : Les cadres existants de réutilisation de méthodes exigent une similitude élevée entre les problèmes, limitant leur portée d'application.
  3. Besoin de transfert de connaissances transdomaines : Les humains peuvent appliquer analogiquement la solution d'un problème à de nouveaux problèmes apparemment sans rapport, mais les LLMs actuels manquent de cette capacité de réutilisation de méthodes transversales.

Défis Fondamentaux

Comment permettre aux LLMs de réutiliser efficacement les solutions existantes même lorsque la similitude entre les problèmes est faible ou qu'il n'existe pas d'association évidente.

Contributions Principales

  1. Élargissement de la portée de la réutilisation de méthodes : Extension de la réutilisation de méthodes des cas de haute similitude aux mappages général-spécifique et aux relations cachées basées sur les caractéristiques.
  2. Proposition d'un modèle de réutilisation de méthodes transversales :
    • Réutilisation relationnelle : traitement des relations général-spécifique et parallèles
    • Réutilisation basée sur les caractéristiques : support de l'appariement partiel de caractéristiques et de l'identification de propriétés cachées
  3. Introduction du concept « Méthode des Méthodes » (Method of Methods, MoM) : Fourniture de méthodes de haut niveau pour vérifier, améliorer et renforcer l'efficacité des méthodes actuellement appliquées.
  4. Cadre théorique : Élévation de la prédiction au niveau des mots au raisonnement au niveau logique, réalisant une application rationnelle plutôt que purement statistique des solutions.

Détails de la Méthode

Définition de la Tâche

Étant donné un problème cible Qt, en l'absence de solution directe, trouver des solutions réutilisables dans une bibliothèque de méthodes existantes, même si les problèmes originaux de ces méthodes ont une similitude faible avec le problème cible ou entretiennent des relations implicites.

Architecture du Modèle

1. Réutilisation de Méthodes Relationnelles

Méthode Général-Spécifique : Si deux méthodes Ma et Mb résolvent respectivement les ensembles de problèmes Qma et Qmb, et si :

Qma ⊃ Qmb  (1)

alors Ma est plus générale que Mb, permettant une réutilisation verticale.

Méthodes Parallèles : Deux méthodes sont parallèles si et seulement si leurs ensembles de problèmes sont des sous-ensembles disjoints d'une catégorie plus large :

Qma ∩ Qmb = ∅, Qma ⊂ Qg, Qmb ⊂ Qg  (2)

2. Réutilisation Basée sur les Caractéristiques

Définition de l'Espace des Caractéristiques : Pour un problème Q, ses caractéristiques sont définies comme :

F(Q) ⊆ F, F(Q) = Fmeas(Q) ∪ Ftext(Q)  (3)

où Fmeas(Q) sont les attributs numériques explicites et Ftext(Q) sont les caractéristiques extraites du texte via un encodeur appris h(·).

Similarité des Caractéristiques :

Simfeat(Qa, Qb) = S(F(Qa), F(Qb))  (5)

Condition de Réutilisation :

Reusefeat(Qb; Sa) = {
    1, si Simfeat(Qa, Qb) ≥ τ et Valid(Sa, Qb) = 1
    0, sinon
}  (6)

3. Méthode Globale

Une méthode globale Gi = (Qgi, Sgi) possède une applicabilité large et peut servir d'amélioration de programme générique pour augmenter la fiabilité et la cohérence de l'exécution des méthodes.

4. Méthode des Méthodes (MoM)

MoM est organisée hiérarchiquement par profondeur :

  • M(0) : méthodes directes, Q ↦ S
  • M(1) : méthodes de premier ordre, M(0) ↦ M(0)'
  • M(i+1) : méthodes de (i+1)-ième ordre, M(i) ↦ M(i)'

Points d'Innovation Technique

  1. Stratégie de Séparation Problème-Solution : Plutôt que de fournir directement les paires problème-solution au LLM, séparer d'abord puis guider le LLM pour le transfert de solution.
  2. Identification de Similitude Multiniveaux :
    • Appariement de caractéristiques explicites
    • Inférence de propriétés cachées
    • Réutilisation de modèles de méthodes globales
  3. Mécanisme de Validation Hiérarchisée : Assurer via la fonction Valid la validité logique de la solution dans le nouveau contexte.

Configuration Expérimentale

Ensemble de Données

Les expériences utilisent deux catégories de scénarios de test :

  1. Tests de Réutilisation Relationnelle : Problème de jugement de fraîcheur de bananes, réutilisant la méthode générale de fraîcheur des fruits
  2. Tests de Réutilisation Basée sur les Caractéristiques : Problème de réinitialisation du temps d'utilisation du disque dur, réutilisant l'expérience de traitement de fichiers MP3

Métriques d'Évaluation

  • Similarité Cosinus : Mesure du degré d'alignement entre la solution générée et la méthode cible
  • Test de Significativité Statistique : Utilisation du test t sur échantillons indépendants pour évaluer les différences entre méthodes

Méthodes de Comparaison

  1. RelaMethod vs CompareRela : Évaluation de l'efficacité de la réutilisation relationnelle
  2. featureMethd vs compareMP3Method : Évaluation de l'efficacité de la réutilisation basée sur les caractéristiques

Détails d'Implémentation

  • 20 essais pour chaque méthode
  • Utilisation du test t de Welch pour l'analyse statistique
  • Comparaison uniquement des segments de texte pertinents pour la méthode cible afin de réduire le bruit

Résultats Expérimentaux

Résultats Principaux

Expérience de Réutilisation Relationnelle :

  • Similarité moyenne de RelaMethod : 0,4835 (écart-type : 0,0801)
  • Similarité moyenne de CompareRela : 0,2820 (écart-type : 0,0558)
  • Valeur t : 9,23, valeur p : 8,98×10^-11 (p < 0,05)
  • Conclusion : RelaMethod surpasse significativement la méthode de référence

Expérience de Réutilisation Basée sur les Caractéristiques :

  • Similarité moyenne de featureMethd : 0,2945 (écart-type : 0,0698)
  • Similarité moyenne de compareMP3Method : 0,3983 (écart-type : 0,0670)
  • Valeur t : -4,80, valeur p : 2,52×10^-5 (p < 0,05)
  • Conclusion : Différence significative entre les deux méthodes

Analyse Comparative

Comparaison de MéthodesDifférence MoyenneSimilarité MoyenneRatio RelatifType de Réutilisation
RelaMethod vs CompareRela0,20150,351057,4%Réutilisation Dépendante
featureMethd vs compareMP3Method0,10380,072614,3%Association Partielle

Découvertes Expérimentales

  1. Stabilité Supérieure de la Réutilisation Relationnelle : La réutilisation relationnelle basée sur des connexions structurelles montre une performance plus stable que la réutilisation basée sur les caractéristiques fondée sur un chevauchement partiel.
  2. Efficacité de la Séparation Explicite : Guider explicitement le LLM pour générer des paires problème-solution s'avère plus efficace que de fournir directement le matériel.
  3. Significativité Statistique : La séparation statistique de la réutilisation relationnelle est plus forte (valeur t 9,23 vs 4,80), indiquant une efficacité plus fiable.

Analyse Théorique

Réutilisation au Niveau Logique

Les LLMs traditionnels apprennent au niveau des tokens la distribution P(wt+1|w1,w2,...,wt), capturant principalement les motifs de co-occurrence statistique. Ce cadre réalise la réutilisation au niveau logique via la représentation des méthodes M=(Q,S) :

R: (Qa, Sa) → (Qb, Sa)  (15)

Réutilisation Rationnelle

Contrairement à la sélection basée sur les probabilités de tokens, la réutilisation de méthodes est fondée sur l'applicabilité logique :

Preuse(Ss|Qt) ∝ Simlogic(Qt, Qs) · I[Ss valide]  (19)

Assurant que la réutilisation est basée sur la transférabilité logique plutôt que sur la fréquence statistique.

Travaux Connexes

Recherche sur le Raisonnement des LLMs

  • Incitation par Chaîne de Pensée : Amélioration de la performance de raisonnement via la génération d'étapes intermédiaires
  • Auto-Cohérence : Amélioration de la robustesse via l'échantillonnage multi-chemins
  • Arbre/Graphe de Pensée : Extension à des structures de recherche plus complexes

Représentation et Réutilisation de Méthodes

  • IA Symbolique : Décomposition des connaissances en composants réutilisables
  • Synthèse de Programmes : Réutilisation d'opérateurs abstraits pour résoudre de nouvelles tâches
  • Raisonnement par Cas (CBR) : Résolution de nouveaux problèmes via l'analogie

Apprentissage par Transfert et Méta-Raisonnement

  • Modèles Pré-entraînés : Capacités de transfert de tâches de T5, GPT-4, etc.
  • Incitation Augmentée par Récupération : Guidage du raisonnement via la récupération d'exemples similaires
  • Mécanismes de Réflexion : Amélioration itérative via l'auto-rétroaction

Conclusion et Discussion

Conclusions Principales

  1. Le cadre de réutilisation de méthodes transversales élargit avec succès la portée d'application des LLMs, leur permettant de traiter les problèmes ayant une similitude faible.
  2. La réutilisation relationnelle montre une performance plus stable dans le traitement des dépendances général-spécifique, tandis que la réutilisation basée sur les caractéristiques fournit un mécanisme supplémentaire pour traiter les chevauchements implicites.
  3. La stratégie structurée de séparation problème-solution améliore significativement l'efficacité de la réutilisation de méthodes.

Limitations

  1. Efficacité Limitée de la Réutilisation Basée sur les Caractéristiques : Comparée à la réutilisation relationnelle, l'amélioration de la réutilisation basée sur les caractéristiques est plus modeste.
  2. Dépendance du Mécanisme de Validation : L'implémentation de la fonction Valid peut affecter l'efficacité de la réutilisation.
  3. Complexité Computationnelle : Le calcul de similarité dans les espaces de caractéristiques à grande échelle peut être chronophage.

Directions Futures

  1. Amélioration des méthodes d'extraction de caractéristiques et de calcul de similarité
  2. Développement de mécanismes de validation plus intelligents
  3. Extension à des scénarios de résolution de problèmes multi-étapes plus complexes

Évaluation Approfondie

Points Forts

  1. Innovation Forte : Première résolution systématique du problème de réutilisation de méthodes pour les problèmes de faible similitude dans les LLMs
  2. Fondations Théoriques Solides : Fourniture d'un cadre théorique allant de la prédiction au niveau des mots au raisonnement au niveau logique
  3. Conception Expérimentale Appropriée : Validation de l'efficacité de la méthode via des cas concrets
  4. Valeur Pratique Élevée : Offre de nouvelles perspectives pour l'application pratique des LLMs

Insuffisances

  1. Portée Expérimentale Limitée : Validation uniquement dans deux scénarios spécifiques, manque d'expériences à grande échelle
  2. Définition Floue des Caractéristiques : Construction de l'espace des caractéristiques manquant de guidance systématique
  3. Efficacité Computationnelle Non Évaluée : Absence d'analyse des coûts computationnels et de la scalabilité de la méthode
  4. Comparaisons Limitées : Manque de comparaisons avec d'autres méthodes avancées

Impact

  1. Contribution Théorique : Fourniture d'une nouvelle perspective théorique pour l'amélioration des capacités de raisonnement des LLMs
  2. Valeur Pratique : Applicabilité à des scénarios réels nécessitant un transfert de connaissances transdomaines
  3. Caractère Inspirant : Fourniture de directions de recherche précieuses pour les travaux ultérieurs

Scénarios d'Application

  1. Transfert de Connaissances : Application de solutions d'un domaine à un autre
  2. Résolution de Problèmes Innovants : Recherche de solutions analogues face à des problèmes entièrement nouveaux
  3. Assistance Éducative : Aide aux apprenants pour comprendre les connexions internes entre différents problèmes
  4. Systèmes Experts : Construction de systèmes intelligents capables d'appliquer flexiblement les connaissances existantes

Références

  1. Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
  2. Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
  3. Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
  4. Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.

Évaluation Globale : Cet article propose un cadre innovant de réutilisation de méthodes transversales, élargissant avec succès la capacité d'application des LLMs dans des scénarios de faible similitude. Bien qu'il existe encore une marge d'amélioration en termes d'échelle expérimentale et de certains détails techniques, ses contributions théoriques et sa valeur pratique en font un travail important dans le domaine de la recherche sur le raisonnement des LLMs.