A typical approach developers follow to influence an LLM's behavior in an application is through careful manipulation of the prompt, such as by adding or modifying instructions. However, merely adding more instructions provides little assurance that they will actually be followed. We introduce Instruction Boosting as a post-generation method to increase the reliability of LLM prompt instructions. We show that Instruction Boosting improves the instruction following rate by up to 7 points for two instructions and up to 4 points for ten instructions. To demonstrate these results we introduce SCALEDIF, a benchmark with a scaled instruction volume of up to ten instructions per data sample. We also present an analysis of the commonly observed trend that performance degrades as more instructions are added. We show that an important factor contributing to this trend is the degree of tension and conflict that arises as the number of instructions is increased. We contribute a quantitative conflict scoring tool that explains the observed performance trends and provides feedback to developers on the impact that additional prompt instructions have on a model's performance.
academic
Potenziamento del Seguimento delle Istruzioni su Larga Scala
Gli sviluppatori influenzano tipicamente il comportamento dei modelli linguistici di grandi dimensioni (LLM) attraverso la progettazione accurata dei prompt, ad esempio aggiungendo o modificando istruzioni. Tuttavia, l'aggiunta di più istruzioni non garantisce che vengano effettivamente seguite. Questo articolo propone il Potenziamento delle Istruzioni (Instruction Boosting) come metodo post-generativo per aumentare l'affidabilità delle istruzioni nei prompt degli LLM. La ricerca dimostra che il potenziamento delle istruzioni può aumentare il tasso di seguimento delle istruzioni fino a 7 punti percentuali con due istruzioni e fino a 4 punti percentuali con dieci istruzioni. Per convalidare questi risultati, gli autori introducono il benchmark SCALEDIF, contenente fino a dieci istruzioni per ogni campione di dati. L'articolo analizza inoltre il trend comune di degradazione delle prestazioni all'aumentare del numero di istruzioni, evidenziando come fattori importanti siano il grado di tensione e conflitto generati dall'aumento del numero di istruzioni.
Inaffidabilità del Seguimento delle Istruzioni: Le istruzioni nei prompt aggiunte dagli sviluppatori non possono garantire di essere effettivamente seguite dagli LLM
Problema di Scalabilità delle Istruzioni: All'aumentare del numero di istruzioni, il tasso di seguimento delle istruzioni (IF rate) degli LLM diminuisce significativamente
Conflitti tra Istruzioni: Più istruzioni possono generare tensione o persino contraddizioni dirette, rendendo difficile soddisfare simultaneamente tutte le istruzioni
Proposta del Metodo di Potenziamento delle Istruzioni: Un metodo post-generativo al momento del test che migliora il tasso di seguimento delle istruzioni correggendo e perfezionando la risposta iniziale
Costruzione del Dataset SCALEDIF: Estensione del dataset IFEval con un benchmark di seguimento delle istruzioni su larga scala contenente fino a 10 istruzioni per campione
Strumento di Valutazione Quantitativa dei Conflitti: Sviluppo di un meccanismo quantitativo di valutazione dei conflitti tra istruzioni che spiega i trend di prestazione e fornisce feedback agli sviluppatori
Concetto di Conflitto Soft: Formalizzazione del concetto di "conflitto soft" tra istruzioni e analisi del suo impatto sulle prestazioni
Dato un query Q, un insieme di istruzioni I={I₁, I₂, ..., Iₙ} e una risposta iniziale R dell'LLM, l'obiettivo del potenziamento delle istruzioni è generare una risposta corretta R' che segua più istruzioni.
Ottimizzazione Post-Generativa: Basata sull'osservazione che "correggere risposte subottimali è più facile che generare direttamente risposte perfette"
Progettazione Multi-Strategia: Fornisce scelte di strategie con diversi compromessi costo-prestazione
Quantificazione dei Conflitti Soft: Identificazione empirica dei conflitti soft tra istruzioni attraverso metodi di auto-gioco
Efficacia del Potenziamento delle Istruzioni: Miglioramento coerente del tasso di seguimento delle istruzioni su vari modelli
I Conflitti Soft Sono un Fattore Chiave: Il conflitto tra istruzioni è una ragione importante della difficoltà nel seguimento di istruzioni su larga scala
La Riscrittura Supera la Rigenerazione: La correzione di risposte esistenti è più efficace della generazione da zero
La Valutazione dei Conflitti Ha Valore Predittivo: Può servire come strumento di feedback per gli sviluppatori
Limitazioni dei Conflitti a Coppie: La valutazione dei conflitti attuale considera solo conflitti tra coppie di istruzioni, non coprendo interazioni complesse multi-istruzione
Accuratezza del Rilevatore: Il rilevatore LLM-as-a-judge ha un'accuratezza di soli il 73%, limitando l'effetto del potenziamento
Costo Computazionale: Le strategie di potenziamento richiedono costi di inferenza aggiuntivi
Rischio di Deviazione dal Compito: Il processo di potenziamento potrebbe causare la deviazione della risposta dal query originale
L'articolo cita lavori importanti nei campi della valutazione del seguimento delle istruzioni, dell'auto-correzione e del ragionamento chain-of-thought, fornendo una base teorica solida per la ricerca. Le referenze chiave includono il benchmark IFEval, i metodi di auto-correzione e i lavori recenti sulla valutazione del seguimento delle istruzioni.