Augmenting Compliance-Guaranteed Customer Service Chatbots: Context-Aware Knowledge Expansion with Large Language Models
Hong, Zhang, Jiang et al.
Retrieval-based chatbots leverage human-verified Q\&A knowledge to deliver accurate, verifiable responses, making them ideal for customer-centric applications where compliance with regulatory and operational standards is critical. To effectively handle diverse customer inquiries, augmenting the knowledge base with "similar questions" that retain semantic meaning while incorporating varied expressions is a cost-effective strategy. In this paper, we introduce the Similar Question Generation (SQG) task for LLM training and inference, proposing context-aware approaches to enable comprehensive semantic exploration and enhanced alignment with source question-answer relationships. We formulate optimization techniques for constructing in-context prompts and selecting an optimal subset of similar questions to expand chatbot knowledge under budget constraints. Both quantitative and human evaluations validate the effectiveness of these methods, achieving a 92% user satisfaction rate in a deployed chatbot system, reflecting an 18% improvement over the unaugmented baseline. These findings highlight the practical benefits of SQG and emphasize the potential of LLMs, not as direct chatbot interfaces, but in supporting non-generative systems for hallucination-free, compliance-guaranteed applications.
academic
अनुपालन-गारंटीकृत ग्राहक सेवा चैटबॉट्स को बढ़ाना: बड़े भाषा मॉडल के साथ संदर्भ-जागरूक ज्ञान विस्तार
पुनर्प्राप्ति-आधारित चैटबॉट मानव-सत्यापित प्रश्नोत्तर ज्ञान आधार का उपयोग करके सटीक, सत्यापन योग्य उत्तर प्रदान करते हैं, जो उन्हें नियामक और परिचालन मानकों का पालन करने की आवश्यकता वाली ग्राहक सेवा अनुप्रयोगों के लिए अत्यधिक उपयुक्त बनाता है। विविध ग्राहक प्रश्नों को प्रभावी ढंग से संभालने के लिए, "समान प्रश्न" उत्पन्न करके ज्ञान आधार का विस्तार करना जो शब्दार्थ संगति बनाए रखते हैं लेकिन अभिव्यक्ति में विविध हों, एक लागत-प्रभावी रणनीति है। यह पेपर बड़े भाषा मॉडल (LLM) प्रशिक्षण और अनुमान के लिए समान प्रश्न उत्पादन (SQG) कार्य प्रस्तुत करता है, व्यापक शब्दार्थ अन्वेषण और स्रोत प्रश्नोत्तर संबंधों के साथ संरेखण को बढ़ाने के लिए संदर्भ-जागरूक दृष्टिकोण प्रस्तावित करता है। अनुसंधान बजट बाधाओं के तहत संदर्भ संकेत बनाने और इष्टतम समान प्रश्न उपसमुच्चय चुनने के लिए अनुकूलन तकनीकें तैयार करता है। मात्रात्मक और मानव मूल्यांकन इन विधियों की प्रभावशीलता को सत्यापित करते हैं, तैनात चैटबॉट सिस्टम में 92% उपयोगकर्ता संतुष्टि दर प्राप्त करते हैं, जो बिना विस्तारित आधारभूत से 18% की वृद्धि है।
मुख्य समस्या: पारंपरिक पुनर्प्राप्ति-आधारित ग्राहक सेवा चैटबॉट विविध अभिव्यक्ति वाले ग्राहक प्रश्नों से मेल खाने में विफल होते हैं, जिससे उपयोगकर्ता अनुभव खराब होता है
अनुप्रयोग परिदृश्य महत्व: वित्त, स्वास्थ्य सेवा जैसे अत्यधिक विनियमित उद्योगों में, जनरेटिव LLM भ्रम उत्पन्न करते हैं और अनुपालन आवश्यकताओं को पूरा नहीं कर सकते
मौजूदा विधियों की सीमाएं:
मानव क्राउडसोर्सिंग महंगी है और सीमित विविधता प्रदान करती है
नियम-आधारित विधियां (जैसे SimBERT, RoFormer-Sim) संदर्भ-जागरूकता की कमी करती हैं
मानक अनुक्रम-से-अनुक्रम विधियां विविध प्रश्न उत्पन्न करने में कठिनाई करती हैं
यह अनुसंधान LLM की जनरेटिव क्षमता का उपयोग पुनर्प्राप्ति-आधारित चैटबॉट के लिए ज्ञान आधार विस्तारित करने के लिए करना चाहता है, न कि इसे सीधे संवाद इंटरफेस के रूप में उपयोग करने के लिए, जिससे अनुपालन सुनिश्चित करते हुए प्रश्न मिलान प्रदर्शन में सुधार हो।
पहली बार SQG कार्य परिभाषित: पुनर्प्राप्ति-आधारित सेवा चैटबॉट वृद्धि के लिए समान प्रश्न उत्पादन कार्य तैयार किया, संदर्भ-जागरूक एक-से-अनेक जनरेशन प्रतिमान प्रस्तावित किया
अनुकूलन ढांचा: बजट बाधाओं के तहत संकेत उदाहरण और समान प्रश्न उपसमुच्चय चुनने के लिए अनुकूलन तकनीकें प्रस्तावित कीं, ज्ञान आधार विस्तार को सुविधाजनक बनाते हैं
महत्वपूर्ण प्रदर्शन सुधार: प्रयोग गुणात्मक मूल्यांकन में 120% से अधिक सापेक्ष सुधार, कुल विविधता में 4.74% सुधार, उपयोगकर्ता संतुष्टि में 18% सुधार दिखाते हैं
वास्तविक तैनाती सत्यापन: वास्तविक बैंकिंग ग्राहक सेवा प्रणाली में तैनात और विधि की प्रभावशीलता सत्यापित की
समान प्रश्न उत्पादन (SQG) ज्ञान आधार में विशिष्ट उत्तर के लिए विविध लेकिन शब्दार्थ रूप से सुसंगत प्रश्नों का समुच्चय बनाना है। मुख्य आवश्यकताएं शामिल हैं:
शब्दार्थ सुसंगतता: मूल इरादे और अर्थ को बनाए रखना
वाक्य रचना विविधता: शब्दावली और संरचना में भिन्नता
स्वचालित प्रतिगमन संदर्भ मार्गदर्शन: LLM की स्वचालित प्रतिगमन विशेषता का उपयोग करके, पहले उत्पन्न प्रश्नों को बाद की जनरेशन के संदर्भ के रूप में उपयोग करना
इरादा-जागरूक जनरेशन: स्रोत उत्तर प्रस्तुत करके शब्दार्थ अन्वेषण स्थान का विस्तार करना
बजट-बाधित अनुकूलन: लचीली संसाधन प्रबंधन तंत्र प्रदान करना, विभिन्न तैनाती परिदृश्यों के अनुकूल
मौजूदा कार्य की तुलना में, यह पेपर पहली बार पुनर्प्राप्ति-आधारित चैटबॉट के ज्ञान आधार वृद्धि के लिए LLM को व्यवस्थित रूप से लागू करता है, विशेष प्रशिक्षण उद्देश्य और अनुकूलन ढांचा प्रस्तावित करता है।
पेपर कई महत्वपूर्ण संबंधित कार्यों का उद्धरण करता है, जिनमें शामिल हैं:
डेटा वर्धन विधियां: Wei et al. (2022), Liu et al. (2023)
पुनर्प्राप्ति-आधारित चैटबॉट: Wu et al. (2018), Singh et al. (2018)
बड़े भाषा मॉडल अनुप्रयोग: Vaswani et al. (2017), Cheng et al. (2023)
मूल्यांकन विधियां: Zhang et al. (2020), Li et al. (2016)
समग्र मूल्यांकन: यह एक उच्च-गुणवत्ता वाला अनुप्रयोग अनुसंधान पेपर है जो सैद्धांतिक नवाचार और व्यावहारिक मूल्य के बीच अच्छा संतुलन प्राप्त करता है। विधि डिजाइन तर्कसंगत है, प्रयोगात्मक सत्यापन व्यापक है, विशेष रूप से वास्तविक व्यावसायिक वातावरण में तैनाती सत्यापन पेपर की विश्वसनीयता को बढ़ाता है। अनुपालन गारंटी की आवश्यकता वाले AI अनुप्रयोग परिदृश्यों के लिए महत्वपूर्ण संदर्भ मूल्य है।