Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic
Riutilizzo di Metodi tra Domande nei Modelli Linguistici di Grandi Dimensioni: Dalla Predizione a Livello di Parola al Ragionamento Razionale a Livello Logico
I modelli linguistici di grandi dimensioni (LLM) sono stati ampiamente applicati per assistere nella risoluzione di vari problemi. Lavori precedenti hanno proposto di rappresentare i metodi come coppie di domande e relative soluzioni per realizzare il riutilizzo dei metodi. Tuttavia, i metodi esistenti generalmente richiedono un'elevata somiglianza tra le domande. Questo articolo estende l'ambito del riutilizzo dei metodi per affrontare problemi con somiglianza inferiore o somiglianza implicita. Per i problemi simili nel senso generale-specifico, gli autori propongono di separare prima le domande e le soluzioni, piuttosto che inserire direttamente le coppie nell'LLM. Successivamente, guidano l'LLM ad adattare la soluzione ai nuovi problemi correlati, concentrandosi sul trasferimento della soluzione piuttosto che sull'identificazione del problema. Inoltre, il metodo si estende ai problemi che condividono solo caratteristiche parziali o proprietà nascoste. La verifica sperimentale dimostra che questo metodo di estensione dell'ambito aumenta la probabilità di selezionare soluzioni riutilizzabili, migliorando così l'efficacia del riutilizzo dei metodi tra domande.
I modelli linguistici di grandi dimensioni tradizionali vengono principalmente addestrati a livello di parola, imparando attraverso la predizione del token successivo o il riempimento di token mancanti. Questo approccio di addestramento riflette principalmente la co-occorrenza statistica, piuttosto che il ragionamento logico di alto livello, assomigliando più all'intuizione o al riconoscimento di modelli che a una decisione razionale.
Limitazioni del ragionamento a livello di parola: Gli attuali LLM basati su transformer incontrano difficoltà nel ragionamento a livello di metodo, tendendo a preferire i metodi che compaiono frequentemente nei dati di addestramento, anche se questi non sono ottimali.
Limitazioni del riutilizzo dei metodi: I framework di riutilizzo dei metodi esistenti richiedono un'elevata somiglianza tra le domande, limitando il loro ambito di applicazione.
Necessità di trasferimento di conoscenze tra domini: Gli esseri umani sono in grado di applicare analogicamente la soluzione di un problema a nuovi problemi apparentemente non correlati, ma gli LLM attuali mancano di questa capacità di riutilizzo dei metodi tra domande.
Come consentire agli LLM di riutilizzare efficacemente le soluzioni esistenti anche quando la somiglianza tra i problemi è bassa o non vi è alcuna associazione evidente.
Estensione dell'ambito del riutilizzo dei metodi: Estensione del riutilizzo dei metodi da casi ad alta somiglianza a mappature generale-specifiche e relazioni nascoste basate su caratteristiche.
Proposta di un modello di riutilizzo dei metodi tra domande:
Riutilizzo relazionale: gestione di relazioni generale-specifiche e parallele
Riutilizzo basato su caratteristiche: supporto per corrispondenza di caratteristiche parziali e identificazione di proprietà nascoste
Introduzione del concetto di "Metodo dei Metodi" (Method of Methods, MoM): Fornisce metodi di alto livello per verificare, migliorare e potenziare l'efficacia dei metodi attualmente applicati.
Framework teorico: Elevamento dalla predizione a livello di parola al ragionamento a livello logico, realizzando l'applicazione razionale piuttosto che puramente statistica delle soluzioni.
Data una domanda target Qt, in assenza di una soluzione diretta, trovare soluzioni riutilizzabili dalla libreria di metodi esistente, anche se i problemi originali di questi metodi hanno una somiglianza inferiore con la domanda target o presentano relazioni implicite.
Definizione dello Spazio delle Caratteristiche:
Per un problema Q, le sue caratteristiche sono definite come:
F(Q) ⊆ F, F(Q) = Fmeas(Q) ∪ Ftext(Q) (3)
dove Fmeas(Q) sono gli attributi numerici espliciti e Ftext(Q) sono le caratteristiche estratte dal testo attraverso un codificatore di apprendimento h(·).
Somiglianza delle Caratteristiche:
Simfeat(Qa, Qb) = S(F(Qa), F(Qb)) (5)
Condizioni di Riutilizzo:
Reusefeat(Qb; Sa) = {
1, if Simfeat(Qa, Qb) ≥ τ and Valid(Sa, Qb) = 1
0, otherwise
} (6)
Il metodo globale Gi = (Qgi, Sgi) possiede un'ampia applicabilità e può fungere da potenziamento di programma generico per migliorare l'affidabilità e la coerenza dell'esecuzione dei metodi.
Strategia di Separazione Domanda-Soluzione: Invece di inserire direttamente le coppie domanda-soluzione nell'LLM, separare prima e poi guidare l'LLM nel trasferimento della soluzione.
Identificazione di Somiglianza Multilivello:
Corrispondenza di caratteristiche esplicite
Inferenza di proprietà nascoste
Riutilizzo di template di metodi generali
Meccanismo di Verifica Gerarchica: Attraverso la funzione Valid, garantire la validità logica della soluzione nel nuovo contesto.
Gli esperimenti utilizzano due categorie di scenari di test:
Test di Riutilizzo Relazionale: Problema di giudizio della freschezza delle banane, riutilizzo del metodo generale di freschezza della frutta
Test di Riutilizzo Basato su Caratteristiche: Problema di ripristino del tempo di utilizzo del disco rigido, riutilizzo dell'esperienza di elaborazione dei file MP3
Riutilizzo Relazionale più Stabile: Il riutilizzo relazionale basato su connessioni strutturali mostra prestazioni più stabili rispetto al riutilizzo basato su caratteristiche basato su sovrapposizioni parziali.
Effetto della Separazione Esplicita: Indicare esplicitamente all'LLM di generare coppie domanda-soluzione è più efficace rispetto a fornire direttamente il materiale.
Significatività Statistica: La separazione statistica del riutilizzo relazionale è più forte (valore t 9,23 vs 4,80), indicando risultati più affidabili.
Gli LLM tradizionali apprendono la distribuzione P(wt+1|w1,w2,...,wt) a livello di token, catturando principalmente modelli di co-occorrenza statistica. Questo framework realizza il riutilizzo a livello logico attraverso la rappresentazione del metodo M=(Q,S):
Il framework di riutilizzo dei metodi tra domande estende con successo l'ambito di applicazione degli LLM, consentendo loro di affrontare problemi con somiglianza inferiore.
Il riutilizzo relazionale mostra prestazioni più stabili nel trattamento delle dipendenze generale-specifiche, mentre il riutilizzo basato su caratteristiche fornisce un meccanismo complementare per gestire sovrapposizioni implicite.
La strategia strutturata di separazione domanda-soluzione aumenta significativamente l'efficacia del riutilizzo dei metodi.
Efficacia Limitata del Riutilizzo Basato su Caratteristiche: Rispetto al riutilizzo relazionale, il miglioramento del riutilizzo basato su caratteristiche è più modesto.
Dipendenza dal Meccanismo di Verifica: L'implementazione della funzione Valid potrebbe influenzare l'efficacia del riutilizzo.
Complessità Computazionale: Il calcolo della somiglianza in spazi di caratteristiche su larga scala potrebbe essere dispendioso in termini di tempo.
Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.
Valutazione Complessiva: Questo articolo propone un framework innovativo di riutilizzo dei metodi tra domande, estendendo con successo la capacità di applicazione degli LLM in scenari a bassa somiglianza. Sebbene vi sia spazio per miglioramenti nella scala sperimentale e in alcuni dettagli tecnici, il suo contributo teorico e il valore pratico lo rendono un lavoro importante nel campo della ricerca sul ragionamento degli LLM.