开发者通常通过精心设计提示词来影响大语言模型(LLM)的行为,比如添加或修改指令。然而,仅仅添加更多指令并不能保证它们会被遵循。本文提出了指令增强(Instruction Boosting)作为一种后生成方法来提高LLM提示指令的可靠性。研究表明,指令增强在两个指令时可将指令遵循率提升多达7个百分点,在十个指令时提升多达4个百分点。为验证这些结果,作者引入了SCALEDIF基准测试,包含每个数据样本最多十条指令。论文还分析了随着指令数量增加性能下降的常见趋势,表明导致这一趋势的重要因素是指令数量增加时产生的紧张和冲突程度。
给定一个查询Q、一组指令集合I={I₁, I₂, ..., Iₙ}和LLM的初始响应R,指令增强的目标是生成一个修正后的响应R',使得R'遵循更多的指令。
1. Detect+Repair
2. Best-of-N
3. Best-of-N Oracle
4. Map Reduce
使用Algorithm 1确保指令参数采样时避免硬冲突:
使用公式计算样本s的冲突评分:
cs = Σ(i,j)∈p(s)×p(s),i≠j cij / |p(s)|
其中cij是指令i和j之间的冲突计数。
论文引用了指令遵循评估、自我纠正、思维链推理等相关领域的重要工作,为研究提供了坚实的理论基础。关键参考文献包括IFEval基准、自我纠正方法、以及最新的指令遵循评估工作。