Cross-Question Method Reuse in Large Language Models: From Word-Level Prediction to Rational Logical-Layer Reasoning
Su
Large language models (LLMs) have been widely applied to assist in finding solutions for diverse questions. Prior work has proposed representing a method as a pair of a question and its corresponding solution, enabling method reuse. However, existing approaches typically require the questions to be highly similar. In this paper, we extend the scope of method reuse to address questions with low similarity or with hidden similarities that are not explicitly observable. For questions that are similar in a general-specific sense (i.e., broader or narrower in scope), we propose to first separate the question and solution, rather than directly feeding the pair to the LLM. The LLM is then guided to adapt the solution to new but related questions, allowing it to focus on solution transfer rather than question recognition. Furthermore, we extend this approach to cases where questions only share partial features or hidden characteristics. This enables cross-question method reuse beyond conventional similarity constraints. Experimental verification shows that our scope-extension approach increases the probability of filtering out reusable solutions, thereby improving the effectiveness of cross-question method reuse.
academic
Переиспользование методов между вопросами в больших языковых моделях: От предсказания на уровне слов к рациональному логическому рассуждению
Большие языковые модели (LLMs) широко применяются для решения различных задач. Предыдущие работы предложили представлять методы как пары вопросов и соответствующих решений для достижения переиспользования методов. Однако существующие подходы обычно требуют высокой степени сходства между вопросами. В данной статье расширяется область переиспользования методов для обработки вопросов с низким сходством или скрытым сходством. Для вопросов, сходных в смысле общего-частного, авторы предлагают сначала разделить вопросы и решения, вместо того чтобы напрямую передавать их в LLM. Затем они направляют LLM на адаптацию решения к новой связанной задаче, сосредоточивая внимание на передаче решения, а не на идентификации проблемы. Кроме того, метод расширяется на вопросы, которые имеют только частичные общие черты или скрытые свойства. Экспериментальная проверка показывает, что расширенный метод повышает вероятность выбора переиспользуемых решений, тем самым улучшая эффективность переиспользования методов между вопросами.
Традиционные большие языковые модели в основном обучаются на уровне слов, изучая предсказание следующего токена или заполнение пропущенных токенов. Такой способ обучения в основном отражает статистическую сопряженность, а не высокоуровневое логическое рассуждение, больше похож на интуицию или сопоставление шаблонов, чем на рациональное принятие решений.
Ограничения словоуровневого рассуждения: Современные трансформер-ориентированные LLMs испытывают трудности с методоуровневым рассуждением и склонны отдавать предпочтение методам, часто встречающимся в обучающих данных, даже если они не оптимальны.
Ограничения переиспользования методов: Существующие фреймворки переиспользования методов требуют высокой степени сходства между вопросами, что ограничивает их применимость.
Необходимость передачи знаний между областями: Люди могут аналогично применять решение одной задачи к новым, казалось бы, не связанным задачам, но существующие LLMs не обладают такой способностью переиспользования методов между вопросами.
Как сделать так, чтобы LLMs могли эффективно переиспользовать существующие решения даже когда сходство между вопросами низко или отсутствует явная связь.
Расширение области переиспользования методов: Расширение переиспользования методов от случаев высокого сходства к отображениям общего-частного и скрытым отношениям на основе признаков.
Предложение модели переиспользования методов между вопросами:
Реляционное переиспользование: обработка отношений общего-частного и параллельных отношений
Переиспользование на основе признаков: поддержка частичного совпадения признаков и идентификации скрытых свойств
Введение концепции "Метода методов" (Method of Methods, MoM): Предоставление высокоуровневого метода для проверки, улучшения и повышения эффективности текущего применяемого метода.
Теоретический фреймворк: Переход от словоуровневого предсказания к логическому уровню рассуждения, реализация рационального, а не чисто статистического применения решений.
Для целевого вопроса Qt, в отсутствие прямого решения, найти переиспользуемые решения из существующей библиотеки методов, даже если исходные вопросы этих методов имеют низкое сходство с целевым вопросом или имеют скрытые отношения.
Метод общего-частного:
Если два метода Ma и Mb решают наборы вопросов Qma и Qmb соответственно, и выполняется условие:
Qma ⊃ Qmb (1)
то Ma более общий, чем Mb, и может быть выполнено вертикальное переиспользование.
Параллельные методы:
Два метода параллельны тогда и только тогда, когда их наборы вопросов являются непересекающимися подмножествами одной более широкой категории:
Глобальные методы Gi = (Qgi, Sgi) имеют широкую применимость и могут служить универсальным программным улучшением для повышения надежности и согласованности выполнения методов.
Стратегия разделения вопроса и решения: Вместо прямой передачи пары вопрос-решение в LLM сначала разделить их, а затем направить LLM на передачу решения.
Многоуровневая идентификация сходства:
Совпадение явных признаков
Вывод скрытых свойств
Переиспользование общего шаблона метода
Многоуровневый механизм проверки: Функция Valid обеспечивает логическую валидность решения в новом контексте.
Большая стабильность реляционного переиспользования: Реляционное переиспользование, основанное на структурных связях, показывает более стабильные результаты, чем переиспользование на основе признаков, основанное на частичном перекрытии.
Эффект явного разделения: Явное указание LLM генерировать пару вопрос-решение более эффективно, чем прямое предоставление материала.
Статистическая значимость: Статистическое разделение реляционного переиспользования сильнее (t-значение 9,23 vs 4,80), что указывает на более надежные результаты.
Традиционные LLMs изучают распределение на уровне токенов P(wt+1|w1,w2,...,wt), в основном захватывая статистические шаблоны сопряженности. Данный фреймворк реализует отображение переиспользования на логическом уровне через представление метода M=(Q,S):
Фреймворк переиспользования методов между вопросами успешно расширяет область применения LLM, позволяя ей обрабатывать вопросы с низким сходством.
Реляционное переиспользование показывает большую стабильность при обработке зависимостей общего-частного, в то время как переиспользование на основе признаков предоставляет дополнительный механизм для обработки скрытого перекрытия.
Структурированная стратегия разделения вопроса и решения значительно повышает эффективность переиспользования методов.
Ограниченная эффективность переиспользования на основе признаков: По сравнению с реляционным переиспользованием, улучшение переиспользования на основе признаков относительно небольшое.
Зависимость от механизма проверки: Реализация функции Valid может влиять на эффективность переиспользования.
Вычислительная сложность: Расчет сходства в больших пространствах признаков может быть трудоемким.
Wei, J. et al. "Chain-of-thought prompting elicits reasoning in large language models." NeurIPS 2022.
Wang, X. et al. "Self-consistency improves chain of thought reasoning in language models." arXiv 2022.
Yao, S. et al. "Tree of thoughts: Deliberate problem solving with large language models." NeurIPS 2023.
Su, H. "Method-based reasoning for large language models: Extraction, reuse, and continuous improvement." arXiv 2025.
Общая оценка: В данной статье предложен инновационный фреймворк переиспользования методов между вопросами, который успешно расширяет способность LLM применяться в сценариях с низким сходством. Хотя в масштабе экспериментов и некоторых технических деталях есть место для улучшения, его теоретический вклад и практическая ценность делают его важной работой в области исследований рассуждений LLM.