Augmenting Compliance-Guaranteed Customer Service Chatbots: Context-Aware Knowledge Expansion with Large Language Models
Hong, Zhang, Jiang et al.
Retrieval-based chatbots leverage human-verified Q\&A knowledge to deliver accurate, verifiable responses, making them ideal for customer-centric applications where compliance with regulatory and operational standards is critical. To effectively handle diverse customer inquiries, augmenting the knowledge base with "similar questions" that retain semantic meaning while incorporating varied expressions is a cost-effective strategy. In this paper, we introduce the Similar Question Generation (SQG) task for LLM training and inference, proposing context-aware approaches to enable comprehensive semantic exploration and enhanced alignment with source question-answer relationships. We formulate optimization techniques for constructing in-context prompts and selecting an optimal subset of similar questions to expand chatbot knowledge under budget constraints. Both quantitative and human evaluations validate the effectiveness of these methods, achieving a 92% user satisfaction rate in a deployed chatbot system, reflecting an 18% improvement over the unaugmented baseline. These findings highlight the practical benefits of SQG and emphasize the potential of LLMs, not as direct chatbot interfaces, but in supporting non-generative systems for hallucination-free, compliance-guaranteed applications.
academic
Расширение чат-ботов обслуживания клиентов с гарантией соответствия: расширение знаний с учетом контекста с использованием больших языковых моделей
Чат-боты на основе поиска используют проверенные человеком базы знаний вопросов и ответов для предоставления точных и проверяемых ответов, что делает их идеальными для приложений обслуживания клиентов, требующих соответствия нормативным и операционным стандартам. Для эффективной обработки разнообразных запросов клиентов расширение базы знаний путем генерации "похожих вопросов", которые сохраняют семантическую согласованность, но имеют разнообразные формулировки, является экономически эффективной стратегией. В данной работе представлена задача генерации похожих вопросов (SQG) для обучения и вывода больших языковых моделей, предложен контекстно-ориентированный подход для обеспечения комплексного семантического исследования и улучшения согласованности с исходной парой вопрос-ответ. Исследование разработало методы оптимизации для построения контекстных подсказок и выбора оптимального подмножества похожих вопросов в условиях бюджетных ограничений. Количественная и экспертная оценка подтвердили эффективность этих методов, достигнув 92% удовлетворенности пользователей в развернутой системе чат-бота, что на 18% выше, чем у неулучшенного базового варианта.
Основная проблема: традиционные чат-боты обслуживания клиентов на основе поиска сталкиваются с проблемами несовпадения при обработке запросов клиентов с разнообразными формулировками, что приводит к плохому пользовательскому опыту
Важность применения: в высокорегулируемых отраслях, таких как финансы и здравоохранение, генеративные большие языковые модели подвержены галлюцинациям и не могут удовлетворить требования соответствия
Ограничения существующих методов:
Ручное краудсорсинг дорогостоящий и имеет ограниченное разнообразие
Методы на основе правил (например, SimBERT, RoFormer-Sim) не учитывают контекст
Стандартные методы последовательность-в-последовательность затрудняют создание разнообразных вопросов
Данное исследование направлено на использование возможностей генерации больших языковых моделей для расширения базы знаний чат-ботов на основе поиска, а не на их прямое использование в качестве интерфейса диалога, обеспечивая при этом соответствие требованиям и повышая производительность сопоставления запросов.
Первое определение задачи SQG: сформулирована задача генерации похожих вопросов для расширения чат-ботов обслуживания на основе поиска, предложена контекстно-ориентированная парадигма генерации один-ко-многим
Оптимизационная структура: предложены методы оптимизации в условиях бюджетных ограничений для выбора примеров подсказок и подмножеств похожих вопросов, облегчающие расширение базы знаний
Значительное улучшение производительности: эксперименты показывают относительное улучшение качественной оценки более чем на 120%, общее улучшение разнообразия на 4,74%, улучшение удовлетворенности пользователей на 18%
Проверка практического развертывания: метод развернут и проверен в реальной системе обслуживания клиентов банка
Генерация похожих вопросов (SQG) направлена на создание набора разнообразных, но семантически согласованных вопросов для конкретного ответа в базе знаний. Ключевые требования включают:
Семантическая согласованность: сохранение исходного намерения и значения
Синтаксическое разнообразие: вариации в формулировке и структуре
Авторегрессивное руководство контекстом: использование авторегрессивной природы LLM, где ранее сгенерированные вопросы служат контекстом для последующей генерации
Генерация с учетом намерения: расширение пространства семантического исследования путем введения исходного ответа
Оптимизация с бюджетными ограничениями: предоставление гибкого механизма управления ресурсами, адаптированного к различным сценариям развертывания
Значительный эффект усиления намерения: коэффициент приемлемости метода с усилением намерения достигает 84% при экспертной оценке, что на 121,64% выше, чем у базовых методов
Эффект масштаба: с увеличением количества сгенерированных вопросов предложенный метод сохраняет стабильную точность, в то время как базовые методы значительно снижаются
Эффект практического развертывания: в реальном банковском приложении достигнута 92% удовлетворенность пользователей, что на 18% выше, чем у неулучшенного базового варианта
По сравнению с существующими работами, данная статья впервые систематически применяет большие языковые модели к расширению базы знаний чат-ботов на основе поиска, предлагая специализированные цели обучения и оптимизационную структуру.
Недостаточный теоретический анализ: отсутствует глубокое теоретическое объяснение того, почему парадигма один-ко-многим более эффективна
Ограничения набора данных: проверка в основном на китайском языке в финансовом секторе, кроссязычная и кроссдоменная обобщаемость недостаточно проверена
Анализ вычислительных затрат: отсутствует подробный анализ вычислительных затрат на обучение и вывод
Статья ссылается на множество важных связанных работ, включая:
Методы увеличения данных: Wei et al. (2022), Liu et al. (2023)
Чат-боты на основе поиска: Wu et al. (2018), Singh et al. (2018)
Применение больших языковых моделей: Vaswani et al. (2017), Cheng et al. (2023)
Методы оценки: Zhang et al. (2020), Li et al. (2016)
Общая оценка: это высококачественная прикладная исследовательская работа, которая достигла хорошего баланса между теоретической инновацией и практической ценностью. Дизайн метода рационален, экспериментальная проверка полна, а проверка развертывания в реальной коммерческой среде особенно повышает убедительность работы. Имеет важное справочное значение для сценариев применения AI, требующих гарантии соответствия.