2025-11-16T01:40:12.068255

Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning

Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic

Riutilizzo di Metodi tra Domande nei Modelli Linguistici di Grandi Dimensioni: Dalla Predizione a Livello di Parola al Ragionamento Razionale a Livello Logico

Informazioni Fondamentali

  • ID Articolo: 2509.05660
  • Titolo: Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
  • Autore: Hong Su (Facoltà di Informatica, Università di Informatica di Chengdu)
  • Classificazione: cs.CL (Linguistica Computazionale)
  • Rivista di Pubblicazione: Journal of LaTeX Class Files, Vol. 14, No. 8, Agosto 2015
  • Link Articolo: https://arxiv.org/abs/2509.05660v2

Riassunto

I modelli linguistici di grandi dimensioni (LLM) sono stati ampiamente applicati per assistere nella risoluzione di vari problemi. Lavori precedenti hanno proposto di rappresentare i metodi come coppie di domande e relative soluzioni per realizzare il riutilizzo dei metodi. Tuttavia, i metodi esistenti generalmente richiedono un'elevata somiglianza tra le domande. Questo articolo estende l'ambito del riutilizzo dei metodi per affrontare problemi con somiglianza inferiore o somiglianza implicita. Per i problemi simili nel senso generale-specifico, gli autori propongono di separare prima le domande e le soluzioni, piuttosto che inserire direttamente le coppie nell'LLM. Successivamente, guidano l'LLM ad adattare la soluzione ai nuovi problemi correlati, concentrandosi sul trasferimento della soluzione piuttosto che sull'identificazione del problema. Inoltre, il metodo si estende ai problemi che condividono solo caratteristiche parziali o proprietà nascoste. La verifica sperimentale dimostra che questo metodo di estensione dell'ambito aumenta la probabilità di selezionare soluzioni riutilizzabili, migliorando così l'efficacia del riutilizzo dei metodi tra domande.

Contesto di Ricerca e Motivazione

Definizione del Problema

I modelli linguistici di grandi dimensioni tradizionali vengono principalmente addestrati a livello di parola, imparando attraverso la predizione del token successivo o il riempimento di token mancanti. Questo approccio di addestramento riflette principalmente la co-occorrenza statistica, piuttosto che il ragionamento logico di alto livello, assomigliando più all'intuizione o al riconoscimento di modelli che a una decisione razionale.

Motivazione della Ricerca

  1. Limitazioni del ragionamento a livello di parola: Gli attuali LLM basati su transformer incontrano difficoltà nel ragionamento a livello di metodo, tendendo a preferire i metodi che compaiono frequentemente nei dati di addestramento, anche se questi non sono ottimali.
  2. Limitazioni del riutilizzo dei metodi: I framework di riutilizzo dei metodi esistenti richiedono un'elevata somiglianza tra le domande, limitando il loro ambito di applicazione.
  3. Necessità di trasferimento di conoscenze tra domini: Gli esseri umani sono in grado di applicare analogicamente la soluzione di un problema a nuovi problemi apparentemente non correlati, ma gli LLM attuali mancano di questa capacità di riutilizzo dei metodi tra domande.

Sfide Fondamentali

Come consentire agli LLM di riutilizzare efficacemente le soluzioni esistenti anche quando la somiglianza tra i problemi è bassa o non vi è alcuna associazione evidente.

Contributi Principali

  1. Estensione dell'ambito del riutilizzo dei metodi: Estensione del riutilizzo dei metodi da casi ad alta somiglianza a mappature generale-specifiche e relazioni nascoste basate su caratteristiche.
  2. Proposta di un modello di riutilizzo dei metodi tra domande:
    • Riutilizzo relazionale: gestione di relazioni generale-specifiche e parallele
    • Riutilizzo basato su caratteristiche: supporto per corrispondenza di caratteristiche parziali e identificazione di proprietà nascoste
  3. Introduzione del concetto di "Metodo dei Metodi" (Method of Methods, MoM): Fornisce metodi di alto livello per verificare, migliorare e potenziare l'efficacia dei metodi attualmente applicati.
  4. Framework teorico: Elevamento dalla predizione a livello di parola al ragionamento a livello logico, realizzando l'applicazione razionale piuttosto che puramente statistica delle soluzioni.

Spiegazione Dettagliata del Metodo

Definizione del Compito

Data una domanda target Qt, in assenza di una soluzione diretta, trovare soluzioni riutilizzabili dalla libreria di metodi esistente, anche se i problemi originali di questi metodi hanno una somiglianza inferiore con la domanda target o presentano relazioni implicite.

Architettura del Modello

1. Riutilizzo dei Metodi Relazionali

Metodo Generale-Specifico: Se due metodi Ma e Mb risolvono rispettivamente gli insiemi di problemi Qma e Qmb, e soddisfano:

Qma ⊃ Qmb  (1)

allora Ma è più generale di Mb e può essere sottoposto a riutilizzo verticale.

Metodi Paralleli: Due metodi sono paralleli se e solo se i loro insiemi di problemi sono sottoinsiemi disgiunti della stessa categoria più ampia:

Qma ∩ Qmb = ∅, Qma ⊂ Qg, Qmb ⊂ Qg  (2)

2. Riutilizzo Basato su Caratteristiche

Definizione dello Spazio delle Caratteristiche: Per un problema Q, le sue caratteristiche sono definite come:

F(Q) ⊆ F, F(Q) = Fmeas(Q) ∪ Ftext(Q)  (3)

dove Fmeas(Q) sono gli attributi numerici espliciti e Ftext(Q) sono le caratteristiche estratte dal testo attraverso un codificatore di apprendimento h(·).

Somiglianza delle Caratteristiche:

Simfeat(Qa, Qb) = S(F(Qa), F(Qb))  (5)

Condizioni di Riutilizzo:

Reusefeat(Qb; Sa) = {
    1, if Simfeat(Qa, Qb) ≥ τ and Valid(Sa, Qb) = 1
    0, otherwise
}  (6)

3. Metodo Globale

Il metodo globale Gi = (Qgi, Sgi) possiede un'ampia applicabilità e può fungere da potenziamento di programma generico per migliorare l'affidabilità e la coerenza dell'esecuzione dei metodi.

4. Metodo dei Metodi (MoM)

MoM è organizzato gerarchicamente per profondità:

  • M(0): metodi diretti, Q ↦ S
  • M(1): metodi di primo ordine, M(0) ↦ M(0)'
  • M(i+1): metodi di ordine (i+1), M(i) ↦ M(i)'

Punti di Innovazione Tecnica

  1. Strategia di Separazione Domanda-Soluzione: Invece di inserire direttamente le coppie domanda-soluzione nell'LLM, separare prima e poi guidare l'LLM nel trasferimento della soluzione.
  2. Identificazione di Somiglianza Multilivello:
    • Corrispondenza di caratteristiche esplicite
    • Inferenza di proprietà nascoste
    • Riutilizzo di template di metodi generali
  3. Meccanismo di Verifica Gerarchica: Attraverso la funzione Valid, garantire la validità logica della soluzione nel nuovo contesto.

Configurazione Sperimentale

Dataset

Gli esperimenti utilizzano due categorie di scenari di test:

  1. Test di Riutilizzo Relazionale: Problema di giudizio della freschezza delle banane, riutilizzo del metodo generale di freschezza della frutta
  2. Test di Riutilizzo Basato su Caratteristiche: Problema di ripristino del tempo di utilizzo del disco rigido, riutilizzo dell'esperienza di elaborazione dei file MP3

Metriche di Valutazione

  • Somiglianza del Coseno: Misura il grado di allineamento tra la soluzione generata e il metodo target
  • Test di Significatività Statistica: Utilizzo del test t per campioni indipendenti per valutare le differenze tra i metodi

Metodi di Confronto

  1. RelaMethod vs CompareRela: Valutazione dell'efficacia del riutilizzo relazionale
  2. featureMethd vs compareMP3Method: Valutazione dell'efficacia del riutilizzo basato su caratteristiche

Dettagli di Implementazione

  • 20 round di test per ogni metodo
  • Utilizzo del test t di Welch per l'analisi statistica
  • Confronto solo dei segmenti di testo correlati al metodo target per ridurre il rumore

Risultati Sperimentali

Risultati Principali

Esperimento di Riutilizzo Relazionale:

  • Somiglianza media RelaMethod: 0,4835 (deviazione standard: 0,0801)
  • Somiglianza media CompareRela: 0,2820 (deviazione standard: 0,0558)
  • Valore t: 9,23, valore p: 8,98×10^-11 (p < 0,05)
  • Conclusione: RelaMethod è significativamente superiore al metodo baseline

Esperimento di Riutilizzo Basato su Caratteristiche:

  • Somiglianza media featureMethd: 0,2945 (deviazione standard: 0,0698)
  • Somiglianza media compareMP3Method: 0,3983 (deviazione standard: 0,0670)
  • Valore t: -4,80, valore p: 2,52×10^-5 (p < 0,05)
  • Conclusione: Esiste una differenza significativa tra i due metodi

Analisi Comparativa

Confronto MetodiDifferenza MediaSomiglianza MediaRapporto RelativoTipo di Riutilizzo
RelaMethod vs CompareRela0,20150,351057,4%Riutilizzo Dipendente
featureMethd vs compareMP3Method0,10380,072614,3%Associazione Parziale

Scoperte Sperimentali

  1. Riutilizzo Relazionale più Stabile: Il riutilizzo relazionale basato su connessioni strutturali mostra prestazioni più stabili rispetto al riutilizzo basato su caratteristiche basato su sovrapposizioni parziali.
  2. Effetto della Separazione Esplicita: Indicare esplicitamente all'LLM di generare coppie domanda-soluzione è più efficace rispetto a fornire direttamente il materiale.
  3. Significatività Statistica: La separazione statistica del riutilizzo relazionale è più forte (valore t 9,23 vs 4,80), indicando risultati più affidabili.

Analisi Teorica

Riutilizzo a Livello Logico

Gli LLM tradizionali apprendono la distribuzione P(wt+1|w1,w2,...,wt) a livello di token, catturando principalmente modelli di co-occorrenza statistica. Questo framework realizza il riutilizzo a livello logico attraverso la rappresentazione del metodo M=(Q,S):

R: (Qa, Sa) → (Qb, Sa)  (15)

Riutilizzo Razionale

A differenza della selezione basata sulla probabilità dei token, il riutilizzo dei metodi si basa sull'applicabilità logica:

Preuse(Ss|Qt) ∝ Simlogic(Qt, Qs) · I[Ss valid]  (19)

Garantendo che il riutilizzo sia basato sulla trasferibilità logica piuttosto che sulla frequenza statistica.

Lavori Correlati

Ricerca sul Ragionamento degli LLM

  • Prompting a Catena di Pensiero: Miglioramento delle prestazioni di ragionamento attraverso la generazione di passaggi intermedi
  • Auto-Coerenza: Aumento della robustezza attraverso il campionamento multi-percorso
  • Albero/Grafo di Pensiero: Estensione a strutture di ricerca più complesse

Rappresentazione e Riutilizzo dei Metodi

  • IA Simbolica: Decomposizione della conoscenza in componenti riutilizzabili
  • Sintesi di Programmi: Riutilizzo di operatori astratti per risolvere nuovi compiti
  • Ragionamento Basato su Casi (CBR): Risoluzione di nuovi problemi attraverso l'analogia

Apprendimento per Trasferimento e Meta-Ragionamento

  • Modelli Pre-Addestrati: Capacità di trasferimento tra compiti di T5, GPT-4 e altri
  • Prompting Aumentato da Recupero: Guida del ragionamento attraverso il recupero di esempi simili
  • Meccanismi di Riflessione: Miglioramento iterativo attraverso feedback auto-generato

Conclusioni e Discussione

Conclusioni Principali

  1. Il framework di riutilizzo dei metodi tra domande estende con successo l'ambito di applicazione degli LLM, consentendo loro di affrontare problemi con somiglianza inferiore.
  2. Il riutilizzo relazionale mostra prestazioni più stabili nel trattamento delle dipendenze generale-specifiche, mentre il riutilizzo basato su caratteristiche fornisce un meccanismo complementare per gestire sovrapposizioni implicite.
  3. La strategia strutturata di separazione domanda-soluzione aumenta significativamente l'efficacia del riutilizzo dei metodi.

Limitazioni

  1. Efficacia Limitata del Riutilizzo Basato su Caratteristiche: Rispetto al riutilizzo relazionale, il miglioramento del riutilizzo basato su caratteristiche è più modesto.
  2. Dipendenza dal Meccanismo di Verifica: L'implementazione della funzione Valid potrebbe influenzare l'efficacia del riutilizzo.
  3. Complessità Computazionale: Il calcolo della somiglianza in spazi di caratteristiche su larga scala potrebbe essere dispendioso in termini di tempo.

Direzioni Future

  1. Miglioramento dei metodi di estrazione delle caratteristiche e calcolo della somiglianza
  2. Sviluppo di meccanismi di verifica più intelligenti
  3. Estensione a scenari di risoluzione di problemi multi-step più complessi

Valutazione Approfondita

Punti di Forza

  1. Forte Innovatività: Primo affrontamento sistematico del problema del riutilizzo dei metodi per problemi a bassa somiglianza negli LLM
  2. Fondamenti Teorici Solidi: Fornisce un framework teorico che va dalla predizione a livello di parola al ragionamento a livello logico
  3. Design Sperimentale Ragionevole: Verifica dell'efficacia del metodo attraverso casi concreti
  4. Alto Valore Pratico: Fornisce nuove prospettive per l'applicazione pratica degli LLM

Insufficienze

  1. Scala Sperimentale Limitata: Verifica condotta solo in due scenari specifici, mancanza di esperimenti su larga scala
  2. Definizione di Caratteristiche Vaga: La costruzione dello spazio delle caratteristiche manca di guida sistematica
  3. Efficienza Computazionale Non Valutata: Mancanza di analisi dei costi computazionali e della scalabilità del metodo
  4. Metodi di Confronto Singoli: Mancanza di confronti con altri metodi avanzati

Impatto

  1. Contributo Teorico: Fornisce una nuova prospettiva teorica per il miglioramento delle capacità di ragionamento degli LLM
  2. Valore Pratico: Applicabile a scenari reali che richiedono trasferimento di conoscenze tra domini
  3. Carattere Ispiratore: Fornisce direzioni preziose per la ricerca successiva

Scenari Applicabili

  1. Trasferimento di Conoscenze: Applicazione di soluzioni da un dominio a un altro
  2. Risoluzione di Problemi Innovativi: Ricerca di soluzioni analogiche quando si affrontano problemi completamente nuovi
  3. Assistenza Educativa: Aiuto agli studenti nel comprendere le connessioni intrinseche tra diversi problemi
  4. Sistemi Esperti: Costruzione di sistemi intelligenti in grado di applicare flessibilmente le conoscenze esistenti

Bibliografia

  1. Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
  2. Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
  3. Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
  4. Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.

Valutazione Complessiva: Questo articolo propone un framework innovativo di riutilizzo dei metodi tra domande, estendendo con successo la capacità di applicazione degli LLM in scenari a bassa somiglianza. Sebbene vi sia spazio per miglioramenti nella scala sperimentale e in alcuni dettagli tecnici, il suo contributo teorico e il valore pratico lo rendono un lavoro importante nel campo della ricerca sul ragionamento degli LLM.