Query rewriting is a fundamental technique in information retrieval (IR). It typically employs the retrieval result as relevance feedback to refine the query and thereby addresses the vocabulary mismatch between user queries and relevant documents. Traditional pseudo-relevance feedback (PRF) and its vector-based extension (VPRF) improve retrieval performance by leveraging top-retrieved documents as relevance feedback. However, they are constructed based on two major hypotheses: the relevance assumption (top documents are relevant) and the model assumption (rewriting methods need to be designed specifically for particular model architectures). While recent large language models (LLMs)-based generative relevance feedback (GRF) enables model-free query reformulation, it either suffers from severe LLM hallucination or, again, relies on the relevance assumption to guarantee the effectiveness of rewriting quality. To overcome these limitations, we introduce an assumption-relaxed framework: \textit{Generalized Pseudo Relevance Feedback} (GPRF), which performs model-free, natural language rewriting based on retrieved documents, not only eliminating the model assumption but also reducing dependence on the relevance assumption. Specifically, we design a utility-oriented training pipeline with reinforcement learning to ensure robustness against noisy feedback. Extensive experiments across multiple benchmarks and retrievers demonstrate that GPRF consistently outperforms strong baselines, establishing it as an effective and generalizable framework for query rewriting.
Переписывание запросов является фундаментальной техникой в информационном поиске, которая улучшает запросы путём использования результатов поиска в качестве обратной связи релевантности, решая проблему лексического несоответствия между запросами пользователей и релевантными документами. Традиционная псевдорелевантная обратная связь (PRF) и её векторные расширения (VPRF) полагаются на две основные предположения: предположение релевантности (считающее топ-документы релевантными) и предположение модели (требующее, чтобы методы переписывания были разработаны для конкретной архитектуры модели). Хотя генеративная обратная связь на основе больших языковых моделей (LLM) достигла модель-независимого переконструирования запросов, она либо страдает от серьёзных проблем галлюцинаций LLM, либо всё ещё полагается на предположение релевантности. Для преодоления этих ограничений в данной работе предлагается фреймворк ослабления предположений — обобщённая псевдорелевантная обратная связь (GPRF), которая посредством переписывания на естественном языке на основе извлечённых документов одновременно устраняет предположение модели и снижает зависимость от предположения релевантности. Конкретно, разработан процесс обучения, ориентированный на полезность и основанный на обучении с подкреплением, обеспечивающий робастность к шумной обратной связи. Обширные эксперименты на множественных эталонных наборах данных и поисковых системах демонстрируют, что GPRF постоянно превосходит сильные базовые методы.
Системы информационного поиска сталкиваются с проблемой лексического несоответствия: пользователи обычно выражают информационные потребности, используя общие, неточные термины, в то время как релевантные документы могут использовать более формальную, специализированную или новую терминологию. Эта семантическая пропасть приводит к неудовлетворительным результатам поиска.
Переписывание запросов является ключевой техникой для улучшения результатов поиска, применяемой в веб-поиске, электронной коммерции, открытых вопросно-ответных системах и других сценариях
Эффективное переписывание запросов может значительно улучшить пользовательский опыт и производительность системы
Критически важно как для разреженного поиска (например, BM25), так и для плотного поиска (например, dense retrieval)
Предположение релевантности: предполагается, что все топ-k извлечённые документы релевантны, однако реальные системы поиска несовершенны, и топ-результаты часто содержат шум и нерелевантную информацию
Предположение модели: методы тесно связаны с внутренними представлениями конкретного поисковика (весами терминов или плотными вложениями), что затрудняет передачу между моделями
Проблемы методов на основе LLM (GRF):
Хотя операции на естественном языке смягчают предположение модели, остаются две проблемы:
Проблема галлюцинаций: LLM легко генерирует плавный, но фактически неправильный или семантически нерелевантный контент
Всё ещё полагается на предположение релевантности: предполагается, что сгенерированные расширения верно отражают намерение пользователя
Требуется фреймворк переписывания запросов, который одновременно может использовать доказательства поиска для снижения галлюцинаций, обладает робастностью к шумной обратной связи и не зависит от конкретной архитектуры модели.
Систематический анализ: систематический анализ существующих методов переписывания запросов (PRF и GRF), чётко определяющий две основные проблемы — предположение релевантности и предположение модели
Предложение фреймворка GPRF: фреймворк обобщённой псевдорелевантной обратной связи с ослаблением предположений, эффективно интегрирующий преимущества PRF и GRF:
Устранение предположения модели: достижение модель-независимости посредством переписывания на естественном языке
Ослабление предположения релевантности: повышение робастности к шумной обратной связи посредством обучения, ориентированного на полезность
Разработка процесса обучения, ориентированного на полезность: включающего трёхэтапный pipeline обучения:
Отбор с отклонением, дополненный поиском (Retrieval-augmented Rejection Sampling)
Холодный старт с контролируемой тонкой настройкой (Cold-start SFT)
Обучение с подкреплением (RL with GRPO)
Обширная экспериментальная верификация: доказательство эффективности и способности к обобщению GPRF на множественных эталонных наборах данных (внутри и вне домена) и различных поисковых системах (BM25, E5, BGE)
Набор топ-k извлечённых документов Dq(k)={d1,d2,...,dk}
Выходные данные:
Переписанный запрос q′, используемый для последующего поиска с целью улучшения результатов поиска
Цель: сгенерированный переписанный запрос должен максимизировать полезность поиска (например, NDCG@10) при одновременной робастности к шуму в документах обратной связи
Сравнение с традиционными PRF/VPRF и GRF показано на рисунке 1:
Процесс генерации GPRF:
q' ~ LLM_θ(I, q, D^(k)_q)
где:
I: шаблон инструкции (Prompt)
q: исходный запрос
D^(k)_q: топ-k документов обратной связи
LLM_θ: параметризованная большая языковая модель
Унифицированный дизайн Prompt (таблица 1):
Пожалуйста, переписать пользовательский запрос на основе нескольких релевантных
абзацев (которые могут содержать шум или ошибки). Переписанный запрос должен
сохранять исходное значение, одновременно интегрируя как можно больше информации,
чтобы поисковая система могла более эффективно извлекать релевантные абзацы.
Релевантные абзацы:
Абзац 1: {passage 1}
Абзац 2: {passage 2}
...
Пользовательский запрос: {question}
Переписанный запрос:
Интеграция с системой поиска:
Для разреженного поиска (BM25): конкатенация нескольких переписанных запросов с исходным запросом
Для плотного поиска (E5/BGE): использование стратегии VPRF для агрегирования вложений переписанных запросов
Устранение предположения модели: посредством переписывания на естественном языке, не привязанного к конкретному пространству вложений
Ослабление предположения релевантности: посредством обучения, ориентированного на полезность, обучение извлечению полезных сигналов из шумной обратной связи
Синергия поиска и генерации:
Использование извлечённых документов для снижения галлюцинаций LLM (по сравнению с чистым GRF)
Преодоление ограничений пространства представления посредством генеративного переписывания (по сравнению с PRF/VPRF)
Сквозная оптимизация полезности:
Прямая оптимизация по целевому показателю производительности поиска
Выравнивание поведения модели с фактическими целями задачи посредством RL
Унифицированный дизайн Prompt:
Единственный Prompt применим ко всем задачам и наборам данных
Отсутствие необходимости в сложной инженерии Prompt для различных доменов
GPRF является высококачественной исследовательской работой, вносящей существенный вклад в область переписывания запросов:
Основные преимущества:
Точное определение проблемы, предложенная перспектива "ослабления предположений" обладает теоретической глубиной
Разумный дизайн метода, комбинация переписывания на естественном языке + обучение, ориентированное на полезность, эффективна
Полная экспериментальная верификация, доказательство эффективности и обобщаемости метода на множественных измерениях
Основная ценность:
Предоставляет новую исследовательскую парадигму для переписывания запросов
Доказывает, что LLM в задачах IR посредством надлежащего обучения может преодолеть проблемы галлюцинаций и шума
Способность кроссмодельной передачи обеспечивает гибкость для практического развёртывания
Пространство для улучшения:
Анализ эффективности и масштабируемости требует усиления
Теоретический анализ может быть более глубоким
Обсуждение случаев отказа и граничных условий недостаточно
В целом, это работа, достойная публикации на ведущих конференциях, имеющая важное справочное значение как для области информационного поиска, так и для применения LLM. Рекомендуется обратить внимание на прогресс в последующих работах в отношении оптимизации эффективности и углубления теоретического анализа.