Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
- पेपर ID: 2510.11558
- शीर्षक: LLM-आधारित एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण: बाज़ार-नेतृत्वकारी एजेंटिक AI उत्पादों का तुलनात्मक अध्ययन
- लेखक: अदित्य श्रीवास्तव (द गवर्नर्स एकेडमी), कोमल गुप्ता (द नॉर्थकैप विश्वविद्यालय)
- वर्गीकरण: cs.AI
- प्रकाशन वर्ष: 2024
- पेपर लिंक: https://arxiv.org/abs/2510.11558
यह अनुसंधान एंटरप्राइज़-स्तरीय बड़े भाषा मॉडल (LLM) सहायक प्रणालियों में शून्य डेटा प्रतिधारण नीति पर केंद्रित है, विशेष रूप से स्वास्थ्यसेवा और वित्त जैसे कड़ाई से विनियमित उद्योगों में डेटा शासन, अनुपालन और व्यावसायिक गोपनीयता आवश्यकताओं के लिए। एंटरप्राइज़ AI सहायकों के व्यापक तैनाती के साथ, निजी डेटा की सुरक्षा और अनुपालन सुनिश्चित करना प्राथमिकता बन गई है। यह पेपर Salesforce AgentForce और Microsoft Copilot दोनों बाज़ार-नेतृत्वकारी उत्पादों के गहन विश्लेषण के माध्यम से शून्य डेटा प्रतिधारण नीति के तकनीकी आर्किटेक्चर, अनुपालन और उपयोगिता व्यापार-बंद की खोज करता है।
यह अनुसंधान हल करने के लिए मूल समस्या है: एंटरप्राइज़-स्तरीय LLM अनुप्रयोगों में वास्तविक शून्य डेटा प्रतिधारण कैसे प्राप्त किया जाए, साथ ही कार्यात्मकता, अनुपालन और उपयोगिता आवश्यकताओं को संतुलित करते हुए।
- नियामक अनुपालन: GDPR अनुच्छेद 5, HIPAA और SOC 2 जैसे विनियम डेटा न्यूनीकरण प्रसंस्करण की आवश्यकता करते हैं
- उद्योग संवेदनशीलता: स्वास्थ्यसेवा और वित्तीय उद्योग डेटा उल्लंघन के कठोर दंड के कारण गोपनीयता सुरक्षा को अनिवार्य बनाते हैं
- एंटरप्राइज़ अपनाना: 2023 के बाद से, LLM प्रदाता एंटरप्राइज़-स्तरीय कार्यक्षमता पर जोर देने लगे हैं, शून्य-प्रतिधारण विशेषता मुख्य विभेदकारी कारक बन गई है
- नियामक विकास: EU AI अधिनियम जैसे उभरते विनियमों के लिए अनुपालन AI समाधानों की मांग बढ़ रही है
- मुख्यधारा के एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण कार्यान्वयन का व्यवस्थित तुलनात्मक विश्लेषण अभाव
- आर्किटेक्चर डिज़ाइन, नीति प्रतिबद्धताओं और व्यावहारिक व्यापार-बंद का व्यापक मूल्यांकन अपर्याप्त
- तकनीकी कार्यान्वयन और अनुपालन आवश्यकताओं के बीच मानचित्रण संबंध अस्पष्ट
EU AI अधिनियम जैसे विनियमों के निरंतर विकास के साथ, इन प्रणालियों को समझना अनुपालन AI समाधान चाहने वाले एंटरप्राइज़ों के लिए महत्वपूर्ण है।
- शून्य डेटा प्रतिधारण का गणितीय मॉडल परिभाषित किया: प्रतिधारण जोखिम R(S) की मात्रात्मक परिभाषा प्रस्तावित की, जो प्रणाली सुरक्षा का मूल्यांकन करने के लिए सैद्धांतिक आधार प्रदान करता है
- तुलनात्मक विश्लेषण ढांचा निर्मित किया: आर्किटेक्चर, अनुपालन, सुरक्षा और उपयोगिता के चार आयामों को शामिल करने वाली मूल्यांकन प्रणाली स्थापित की
- दो प्रमुख प्लेटफॉर्मों का गहन विश्लेषण: Salesforce AgentForce और Microsoft Copilot के तकनीकी कार्यान्वयन अंतर का विस्तृत विश्लेषण
- उद्योग परिदृश्य प्रदान किया: Anthropic, Google, DeepSeek और अन्य LLM प्रदाताओं की शून्य डेटा प्रतिधारण नीतियों का विस्तारित विश्लेषण
- व्यावहारिक तैनाती व्यापार-बंद की पहचान की: बहु-मोड़ संवाद, विलंबता और पारिस्थितिकी तंत्र निर्भरता पर स्टेटलेस प्रसंस्करण के प्रभाव को स्पष्ट किया
शून्य डेटा प्रतिधारण के लिए आवश्यक है कि उपयोगकर्ता डेटा इंटरैक्शन के बाद कोई निशान न छोड़े। यह पेपर सिस्टम S के प्रतिधारण जोखिम R(S) को डेटा के लॉग, कैश या स्टोरेज में प्रसंस्करण के बाद बने रहने की संभावना के रूप में परिभाषित करता है। आदर्श स्थिति R(S) = 0 स्टेटलेस अनुमान के माध्यम से प्राप्त होती है, जहां प्रत्येक अनुरोध स्वतंत्र रूप से संसाधित होता है, कोई भी संदर्भ क्लाइंट पर प्रबंधित होता है।
अनुसंधान चार-आयामी मूल्यांकन विधि का उपयोग करता है:
- आर्किटेक्चर आयाम: डेटा प्रवाह पथ और प्रतिधारण बिंदु विश्लेषण
- नीति आयाम: अनुबंध शून्य-प्रतिधारण दायित्व समीक्षा
- सुरक्षा आयाम: फ़िल्टरिंग तंत्र और एन्क्रिप्शन उपाय
- उपयोगिता आयाम: शून्य-प्रतिधारण का कार्यक्षमता पर प्रभाव
- व्यवस्थित तुलना विधि: मुख्यधारा के एंटरप्राइज़ AI सहायकों का शून्य डेटा प्रतिधारण का पहला व्यापक तकनीकी तुलना
- जोखिम परिमाणीकरण मॉडल: प्रतिधारण जोखिम की गणितीय परिभाषा और मूल्यांकन विधि प्रदान करता है
- अंत-से-अंत विश्लेषण: डेटा इनपुट से आउटपुट तक संपूर्ण जीवन चक्र ट्रैकिंग
- मुख्य प्लेटफॉर्म: Salesforce AgentForce, Microsoft Copilot
- विस्तारित विश्लेषण: Anthropic Claude, Google Gemini, DeepSeek
- मॉडल होस्टिंग विधि
- विश्वास तंत्र कार्यान्वयन
- डेटा प्रतिधारण नीति
- अनुपालन प्रमाणीकरण
- उपयोगिता व्यापार-बंद
आधिकारिक दस्तावेज़, तकनीकी आर्किटेक्चर विवरण और नीति फ़ाइलों के डिज़ाइन-उन्मुख विश्लेषण के आधार पर, डेटा पथ को ट्रैक करना और GDPR, HIPAA और SOC 2 अनुपालन की जांच करना।
- Einstein Trust Layer: गोपनीयता और अनुपालन सुरक्षा के लिए मूल मध्य परत
- गतिशील ग्राउंडिंग: उपयोगकर्ता अनुमतियों के आधार पर वास्तविक समय CRM डेटा पुनर्प्राप्ति
- डेटा मास्किंग: नियमित अभिव्यक्ति और मेटाडेटा-संचालित पहचान का उपयोग करके संवेदनशील जानकारी को प्रतिस्थापित करना
- स्टेटलेस प्रसंस्करण: LLM प्रदाता के साथ शून्य-प्रतिधारण समझौता
- सुरक्षा तंत्र:
- TLS ट्रांज़िट एन्क्रिप्शन, AES-256 स्थिर एन्क्रिप्शन
- इंजेक्शन हमलों के खिलाफ प्रॉम्प्ट रक्षा
- विषाक्तता पहचान और सामग्री फ़िल्टरिंग
- प्रदर्शन प्रभाव: Trust Layer ओवरहेड 200-500ms विलंबता का कारण बनता है
- Azure OpenAI एकीकरण:
- मॉडल Azure के भीतर होस्ट किया गया, OpenAI बुनियादी ढांचे के बजाय
- एंटरप्राइज़ डेटा सुरक्षा मोड डिफ़ॉल्ट रूप से सक्षम
- किरायेदार सीमा के भीतर अलग-थलग प्रसंस्करण
- सुरक्षा विशेषताएं:
- दोहरी एन्क्रिप्शन (Azure कुंजी + ग्राहक-प्रबंधित कुंजी)
- निजी अंतिम बिंदु क्षेत्रीय संचालन को प्रतिबंधित करते हैं
- वास्तविक समय सामग्री फ़िल्टरिंग, कोई लॉग प्रतिधारण नहीं
- प्रदर्शन प्रभाव: ग्राउंडिंग विलंबता 100-300ms
| आयाम | Salesforce AgentForce | Microsoft Copilot |
|---|
| मॉडल होस्टिंग | तृतीय-पक्ष LLM API कॉल | Azure-होस्ट किया गया OpenAI मॉडल |
| विश्वास तंत्र | Einstein Trust Layer | Graph और Azure एकीकरण |
| डेटा प्रतिधारण | अनुबंध शून्य-प्रतिधारण | Azure नीति शून्य-प्रतिधारण |
| अनुपालन | CRM अनुमतियां, HIPAA BAA | Azure प्रमाणीकरण, GDPR, HIPAA BAA |
| व्यापार-बंद | विलंबता, CRM निर्भरता | ग्राउंडिंग विलंबता, Azure निर्भरता |
- Anthropic: एंटरप्राइज़ शून्य-प्रतिधारण मोड प्रदान करता है, 30 दिन के बाद गैर-ZDR डेटा स्वचालित रूप से हटा दिया जाता है
- Google Gemini: कॉन्फ़िगर करने योग्य शून्य-प्रतिधारण, डिफ़ॉल्ट 24 घंटे कैश को अक्षम करने की आवश्यकता है
- DeepSeek: शून्य डेटा प्रतिधारण प्रदान नहीं करता, डेटा चीन सर्वर पर संग्रहीत है, अंतर्राष्ट्रीय अनुपालन आवश्यकताओं को पूरा नहीं करता है
- LLM गोपनीयता सुरक्षा: Yao et al. (2024) ने गोपनीयता और साइबर सुरक्षा के संदर्भ में LLM के दोहरे प्रभाव का विश्लेषण किया
- गोपनीयता खतरे विश्लेषण: Yan et al. (2024) ने निष्क्रिय गोपनीयता उल्लंघन और सक्रिय गोपनीयता हमलों को अलग किया
- सुरक्षा सुरक्षा तंत्र: Zhang et al. (2024) ने विभिन्न कमजोरियों के खिलाफ व्यापक रक्षा तंत्र प्रस्तावित किए
मौजूदा कार्य की तुलना में, यह पेपर पहली बार मुख्यधारा के एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण का व्यवस्थित तकनीकी तुलना और व्यावहारिक तैनाती विश्लेषण प्रदान करता है।
- तकनीकी व्यवहार्यता: Salesforce AgentForce और Microsoft Copilot दोनों ने सफलतापूर्वक शून्य डेटा प्रतिधारण लागू किया है
- आर्किटेक्चर अंतर: AgentForce का Trust Layer CRM-संचालित वर्कफ़्लो के लिए उपयुक्त है, Copilot का Azure एकीकरण Microsoft पारिस्थितिकी तंत्र के लिए अधिक उपयुक्त है
- व्यापार-बंद मौजूद है: स्टेटलेस डिज़ाइन बहु-मोड़ संवाद स्मृति सीमा और विलंबता वृद्धि का कारण बनता है
- उद्योग प्रवृत्ति: शून्य डेटा प्रतिधारण एंटरप्राइज़ AI के लिए मानक अपेक्षा बन रहा है
- विश्लेषण विधि: डिज़ाइन दस्तावेज़ों के आधार पर विश्लेषण, अनुभवजन्य परीक्षण सत्यापन की कमी
- कवरेज रेंज: मुख्य रूप से दो प्लेटफॉर्मों पर केंद्रित, अन्य समाधानों का विश्लेषण सीमित
- गतिशीलता: तकनीक और नीति तेजी से विकसित हो रहे हैं, विश्लेषण परिणामों की समयोपयोगिता सीमित है
- तकनीकी नवाचार: सरल, सुसंगत नीतियों और अप्रत्याशित डेटा प्रतिधारण के लिए मजबूत सुरक्षा की आवश्यकता है
- मानकीकरण: वैश्विक मानक संरेखण और एंटरप्राइज़ सुरक्षित अपनाने का समर्थन करने के लिए कॉन्फ़िगरेशन को सरल बनाना
- सहयोग तंत्र: तकनीकी आपूर्तिकर्ता, नियामक निकाय और एंटरप्राइज़ हितधारकों को सहयोग करने की आवश्यकता है
- उच्च व्यावहारिक मूल्य: एंटरप्राइज़ों को अनुपालन AI समाधान चुनने के लिए व्यावहारिक मार्गदर्शन प्रदान करता है
- व्यापक विश्लेषण: तकनीकी आर्किटेक्चर, अनुपालन, सुरक्षा और उपयोगिता के कई आयामों को शामिल करता है
- मजबूत समयोपयोगिता: वर्तमान सबसे लोकप्रिय एंटरप्राइज़ AI सहायक उत्पादों पर ध्यान केंद्रित करता है
- स्पष्ट संरचना: तार्किक स्तर स्पष्ट है, समझने और लागू करने में आसान है
- अनुभवजन्य सत्यापन की कमी: मुख्य रूप से दस्तावेज़ विश्लेषण पर निर्भर, वास्तविक परीक्षण डेटा की कमी
- अपर्याप्त मात्रात्मक विश्लेषण: हालांकि R(S) मॉडल प्रस्तावित किया गया है, लेकिन विशिष्ट मात्रात्मक मूल्यांकन की कमी है
- सीमित तकनीकी गहराई: कुछ तकनीकी विवरणों का विश्लेषण अभी भी पर्याप्त गहरा नहीं है
- गतिशील ट्रैकिंग अभाव: तकनीक और नीति के तेजी से विकास पर विचार नहीं किया गया है
- शैक्षणिक योगदान: एंटरप्राइज़ AI गोपनीयता सुरक्षा अनुसंधान के लिए नया विश्लेषण ढांचा प्रदान करता है
- व्यावहारिक मार्गदर्शन: एंटरप्राइज़ IT निर्णय निर्माताओं और अनुपालन अधिकारियों के लिए महत्वपूर्ण संदर्भ प्रदान करता है
- नीति प्रभाव: भविष्य की AI शासन नीति निर्माण को प्रभावित कर सकता है
विशेष रूप से उपयुक्त:
- कड़ाई से विनियमित उद्योग (स्वास्थ्यसेवा, वित्त)
- एंटरप्राइज़ AI समाधान चुनने वाले संगठन
- AI शासन और अनुपालन नीति निर्माता
- एंटरप्राइज़ AI उत्पाद विकास टीमें
- Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
- Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
- Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
- Salesforce. (2024). Trusted AI and Agents Impact Report.
- Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.
यह पेपर एंटरप्राइज़-स्तरीय AI अनुप्रयोगों में डेटा गोपनीयता सुरक्षा के लिए महत्वपूर्ण तकनीकी विश्लेषण और व्यावहारिक मार्गदर्शन प्रदान करता है, वर्तमान AI के तेजी से विकास और विनियमन के कड़े होने की पृष्ठभूमि में महत्वपूर्ण व्यावहारिक महत्व है। हालांकि अनुभवजन्य सत्यापन और मात्रात्मक विश्लेषण के संदर्भ में सुधार की गुंजाइश है, लेकिन इसकी व्यवस्थित तुलनात्मक विश्लेषण ढांचा और व्यावहारिक तैनाती सुझाव इसे इस क्षेत्र का एक महत्वपूर्ण संदर्भ दस्तावेज़ बनाते हैं।