2025-11-16T01:40:12.068255

Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning

Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.

academic

Riutilizzo di Metodi tra Domande nei Modelli Linguistici di Grandi Dimensioni: Dalla Predizione a Livello di Parola al Ragionamento Razionale a Livello Logico

Informazioni Fondamentali

ID Articolo: 2509.05660
Titolo: Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Autore: Hong Su (Facoltà di Informatica, Università di Informatica di Chengdu)
Classificazione: cs.CL (Linguistica Computazionale)
Rivista di Pubblicazione: Journal of LaTeX Class Files, Vol. 14, No. 8, Agosto 2015
Link Articolo: https://arxiv.org/abs/2509.05660v2

Riassunto

I modelli linguistici di grandi dimensioni (LLM) sono stati ampiamente applicati per assistere nella risoluzione di vari problemi. Lavori precedenti hanno proposto di rappresentare i metodi come coppie di domande e relative soluzioni per realizzare il riutilizzo dei metodi. Tuttavia, i metodi esistenti generalmente richiedono un'elevata somiglianza tra le domande. Questo articolo estende l'ambito del riutilizzo dei metodi per affrontare problemi con somiglianza inferiore o somiglianza implicita. Per i problemi simili nel senso generale-specifico, gli autori propongono di separare prima le domande e le soluzioni, piuttosto che inserire direttamente le coppie nell'LLM. Successivamente, guidano l'LLM ad adattare la soluzione ai nuovi problemi correlati, concentrandosi sul trasferimento della soluzione piuttosto che sull'identificazione del problema. Inoltre, il metodo si estende ai problemi che condividono solo caratteristiche parziali o proprietà nascoste. La verifica sperimentale dimostra che questo metodo di estensione dell'ambito aumenta la probabilità di selezionare soluzioni riutilizzabili, migliorando così l'efficacia del riutilizzo dei metodi tra domande.

Contesto di Ricerca e Motivazione

Definizione del Problema

I modelli linguistici di grandi dimensioni tradizionali vengono principalmente addestrati a livello di parola, imparando attraverso la predizione del token successivo o il riempimento di token mancanti. Questo approccio di addestramento riflette principalmente la co-occorrenza statistica, piuttosto che il ragionamento logico di alto livello, assomigliando più all'intuizione o al riconoscimento di modelli che a una decisione razionale.

Motivazione della Ricerca

Limitazioni del ragionamento a livello di parola: Gli attuali LLM basati su transformer incontrano difficoltà nel ragionamento a livello di metodo, tendendo a preferire i metodi che compaiono frequentemente nei dati di addestramento, anche se questi non sono ottimali.
Limitazioni del riutilizzo dei metodi: I framework di riutilizzo dei metodi esistenti richiedono un'elevata somiglianza tra le domande, limitando il loro ambito di applicazione.
Necessità di trasferimento di conoscenze tra domini: Gli esseri umani sono in grado di applicare analogicamente la soluzione di un problema a nuovi problemi apparentemente non correlati, ma gli LLM attuali mancano di questa capacità di riutilizzo dei metodi tra domande.

Sfide Fondamentali

Come consentire agli LLM di riutilizzare efficacemente le soluzioni esistenti anche quando la somiglianza tra i problemi è bassa o non vi è alcuna associazione evidente.

Contributi Principali

Estensione dell'ambito del riutilizzo dei metodi: Estensione del riutilizzo dei metodi da casi ad alta somiglianza a mappature generale-specifiche e relazioni nascoste basate su caratteristiche.
Proposta di un modello di riutilizzo dei metodi tra domande:
- Riutilizzo relazionale: gestione di relazioni generale-specifiche e parallele
- Riutilizzo basato su caratteristiche: supporto per corrispondenza di caratteristiche parziali e identificazione di proprietà nascoste
Introduzione del concetto di "Metodo dei Metodi" (Method of Methods, MoM): Fornisce metodi di alto livello per verificare, migliorare e potenziare l'efficacia dei metodi attualmente applicati.
Framework teorico: Elevamento dalla predizione a livello di parola al ragionamento a livello logico, realizzando l'applicazione razionale piuttosto che puramente statistica delle soluzioni.

Spiegazione Dettagliata del Metodo

Definizione del Compito

Data una domanda target Qt, in assenza di una soluzione diretta, trovare soluzioni riutilizzabili dalla libreria di metodi esistente, anche se i problemi originali di questi metodi hanno una somiglianza inferiore con la domanda target o presentano relazioni implicite.

Architettura del Modello

1. Riutilizzo dei Metodi Relazionali

Metodo Generale-Specifico: Se due metodi Ma e Mb risolvono rispettivamente gli insiemi di problemi Qma e Qmb, e soddisfano:

Qma ⊃ Qmb  (1)

allora Ma è più generale di Mb e può essere sottoposto a riutilizzo verticale.

Metodi Paralleli: Due metodi sono paralleli se e solo se i loro insiemi di problemi sono sottoinsiemi disgiunti della stessa categoria più ampia:

Qma ∩ Qmb = ∅, Qma ⊂ Qg, Qmb ⊂ Qg  (2)

2. Riutilizzo Basato su Caratteristiche

Definizione dello Spazio delle Caratteristiche: Per un problema Q, le sue caratteristiche sono definite come:

F(Q) ⊆ F, F(Q) = Fmeas(Q) ∪ Ftext(Q)  (3)

dove Fmeas(Q) sono gli attributi numerici espliciti e Ftext(Q) sono le caratteristiche estratte dal testo attraverso un codificatore di apprendimento h(·).

Somiglianza delle Caratteristiche:

Simfeat(Qa, Qb) = S(F(Qa), F(Qb))  (5)

Condizioni di Riutilizzo:

Reusefeat(Qb; Sa) = {
    1, if Simfeat(Qa, Qb) ≥ τ and Valid(Sa, Qb) = 1
    0, otherwise
}  (6)

3. Metodo Globale

Il metodo globale Gi = (Qgi, Sgi) possiede un'ampia applicabilità e può fungere da potenziamento di programma generico per migliorare l'affidabilità e la coerenza dell'esecuzione dei metodi.

4. Metodo dei Metodi (MoM)

MoM è organizzato gerarchicamente per profondità:

M(0): metodi diretti, Q ↦ S
M(1): metodi di primo ordine, M(0) ↦ M(0)'
M(i+1): metodi di ordine (i+1), M(i) ↦ M(i)'

Punti di Innovazione Tecnica

Strategia di Separazione Domanda-Soluzione: Invece di inserire direttamente le coppie domanda-soluzione nell'LLM, separare prima e poi guidare l'LLM nel trasferimento della soluzione.
Identificazione di Somiglianza Multilivello:
- Corrispondenza di caratteristiche esplicite
- Inferenza di proprietà nascoste
- Riutilizzo di template di metodi generali
Meccanismo di Verifica Gerarchica: Attraverso la funzione Valid, garantire la validità logica della soluzione nel nuovo contesto.

Configurazione Sperimentale

Dataset

Gli esperimenti utilizzano due categorie di scenari di test:

Test di Riutilizzo Relazionale: Problema di giudizio della freschezza delle banane, riutilizzo del metodo generale di freschezza della frutta
Test di Riutilizzo Basato su Caratteristiche: Problema di ripristino del tempo di utilizzo del disco rigido, riutilizzo dell'esperienza di elaborazione dei file MP3

Metriche di Valutazione

Somiglianza del Coseno: Misura il grado di allineamento tra la soluzione generata e il metodo target
Test di Significatività Statistica: Utilizzo del test t per campioni indipendenti per valutare le differenze tra i metodi

Metodi di Confronto

RelaMethod vs CompareRela: Valutazione dell'efficacia del riutilizzo relazionale
featureMethd vs compareMP3Method: Valutazione dell'efficacia del riutilizzo basato su caratteristiche

Dettagli di Implementazione

20 round di test per ogni metodo
Utilizzo del test t di Welch per l'analisi statistica
Confronto solo dei segmenti di testo correlati al metodo target per ridurre il rumore

Risultati Sperimentali

Risultati Principali

Esperimento di Riutilizzo Relazionale:

Somiglianza media RelaMethod: 0,4835 (deviazione standard: 0,0801)
Somiglianza media CompareRela: 0,2820 (deviazione standard: 0,0558)
Valore t: 9,23, valore p: 8,98×10^-11 (p < 0,05)
Conclusione: RelaMethod è significativamente superiore al metodo baseline

Esperimento di Riutilizzo Basato su Caratteristiche:

Somiglianza media featureMethd: 0,2945 (deviazione standard: 0,0698)
Somiglianza media compareMP3Method: 0,3983 (deviazione standard: 0,0670)
Valore t: -4,80, valore p: 2,52×10^-5 (p < 0,05)
Conclusione: Esiste una differenza significativa tra i due metodi

Analisi Comparativa

Confronto Metodi	Differenza Media	Somiglianza Media	Rapporto Relativo	Tipo di Riutilizzo
RelaMethod vs CompareRela	0,2015	0,3510	57,4%	Riutilizzo Dipendente
featureMethd vs compareMP3Method	0,1038	0,0726	14,3%	Associazione Parziale

Scoperte Sperimentali

Riutilizzo Relazionale più Stabile: Il riutilizzo relazionale basato su connessioni strutturali mostra prestazioni più stabili rispetto al riutilizzo basato su caratteristiche basato su sovrapposizioni parziali.
Effetto della Separazione Esplicita: Indicare esplicitamente all'LLM di generare coppie domanda-soluzione è più efficace rispetto a fornire direttamente il materiale.
Significatività Statistica: La separazione statistica del riutilizzo relazionale è più forte (valore t 9,23 vs 4,80), indicando risultati più affidabili.

Analisi Teorica

Riutilizzo a Livello Logico

Gli LLM tradizionali apprendono la distribuzione P(wt+1|w1,w2,...,wt) a livello di token, catturando principalmente modelli di co-occorrenza statistica. Questo framework realizza il riutilizzo a livello logico attraverso la rappresentazione del metodo M=(Q,S):

R: (Qa, Sa) → (Qb, Sa)  (15)

Riutilizzo Razionale

A differenza della selezione basata sulla probabilità dei token, il riutilizzo dei metodi si basa sull'applicabilità logica:

Preuse(Ss|Qt) ∝ Simlogic(Qt, Qs) · I[Ss valid]  (19)

Garantendo che il riutilizzo sia basato sulla trasferibilità logica piuttosto che sulla frequenza statistica.

Lavori Correlati

Ricerca sul Ragionamento degli LLM

Prompting a Catena di Pensiero: Miglioramento delle prestazioni di ragionamento attraverso la generazione di passaggi intermedi
Auto-Coerenza: Aumento della robustezza attraverso il campionamento multi-percorso
Albero/Grafo di Pensiero: Estensione a strutture di ricerca più complesse

Rappresentazione e Riutilizzo dei Metodi

IA Simbolica: Decomposizione della conoscenza in componenti riutilizzabili
Sintesi di Programmi: Riutilizzo di operatori astratti per risolvere nuovi compiti
Ragionamento Basato su Casi (CBR): Risoluzione di nuovi problemi attraverso l'analogia

Apprendimento per Trasferimento e Meta-Ragionamento

Modelli Pre-Addestrati: Capacità di trasferimento tra compiti di T5, GPT-4 e altri
Prompting Aumentato da Recupero: Guida del ragionamento attraverso il recupero di esempi simili
Meccanismi di Riflessione: Miglioramento iterativo attraverso feedback auto-generato

Conclusioni e Discussione

Conclusioni Principali

Il framework di riutilizzo dei metodi tra domande estende con successo l'ambito di applicazione degli LLM, consentendo loro di affrontare problemi con somiglianza inferiore.
Il riutilizzo relazionale mostra prestazioni più stabili nel trattamento delle dipendenze generale-specifiche, mentre il riutilizzo basato su caratteristiche fornisce un meccanismo complementare per gestire sovrapposizioni implicite.
La strategia strutturata di separazione domanda-soluzione aumenta significativamente l'efficacia del riutilizzo dei metodi.

Limitazioni

Efficacia Limitata del Riutilizzo Basato su Caratteristiche: Rispetto al riutilizzo relazionale, il miglioramento del riutilizzo basato su caratteristiche è più modesto.
Dipendenza dal Meccanismo di Verifica: L'implementazione della funzione Valid potrebbe influenzare l'efficacia del riutilizzo.
Complessità Computazionale: Il calcolo della somiglianza in spazi di caratteristiche su larga scala potrebbe essere dispendioso in termini di tempo.

Direzioni Future

Miglioramento dei metodi di estrazione delle caratteristiche e calcolo della somiglianza
Sviluppo di meccanismi di verifica più intelligenti
Estensione a scenari di risoluzione di problemi multi-step più complessi

Valutazione Approfondita

Punti di Forza

Forte Innovatività: Primo affrontamento sistematico del problema del riutilizzo dei metodi per problemi a bassa somiglianza negli LLM
Fondamenti Teorici Solidi: Fornisce un framework teorico che va dalla predizione a livello di parola al ragionamento a livello logico
Design Sperimentale Ragionevole: Verifica dell'efficacia del metodo attraverso casi concreti
Alto Valore Pratico: Fornisce nuove prospettive per l'applicazione pratica degli LLM

Insufficienze

Scala Sperimentale Limitata: Verifica condotta solo in due scenari specifici, mancanza di esperimenti su larga scala
Definizione di Caratteristiche Vaga: La costruzione dello spazio delle caratteristiche manca di guida sistematica
Efficienza Computazionale Non Valutata: Mancanza di analisi dei costi computazionali e della scalabilità del metodo
Metodi di Confronto Singoli: Mancanza di confronti con altri metodi avanzati

Impatto

Contributo Teorico: Fornisce una nuova prospettiva teorica per il miglioramento delle capacità di ragionamento degli LLM
Valore Pratico: Applicabile a scenari reali che richiedono trasferimento di conoscenze tra domini
Carattere Ispiratore: Fornisce direzioni preziose per la ricerca successiva

Scenari Applicabili

Trasferimento di Conoscenze: Applicazione di soluzioni da un dominio a un altro
Risoluzione di Problemi Innovativi: Ricerca di soluzioni analogiche quando si affrontano problemi completamente nuovi
Assistenza Educativa: Aiuto agli studenti nel comprendere le connessioni intrinseche tra diversi problemi
Sistemi Esperti: Costruzione di sistemi intelligenti in grado di applicare flessibilmente le conoscenze esistenti

Bibliografia

Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.

Valutazione Complessiva: Questo articolo propone un framework innovativo di riutilizzo dei metodi tra domande, estendendo con successo la capacità di applicazione degli LLM in scenari a bassa somiglianza. Sebbene vi sia spazio per miglioramenti nella scala sperimentale e in alcuni dettagli tecnici, il suo contributo teorico e il valore pratico lo rendono un lavoro importante nel campo della ricerca sul ragionamento degli LLM.