2025-11-18T16:46:20.871497

Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products

Gupta, Shrivastava
Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
academic

LLM-आधारित एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण: बाज़ार-नेतृत्वकारी एजेंटिक AI उत्पादों का तुलनात्मक अध्ययन

मूल जानकारी

  • पेपर ID: 2510.11558
  • शीर्षक: LLM-आधारित एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण: बाज़ार-नेतृत्वकारी एजेंटिक AI उत्पादों का तुलनात्मक अध्ययन
  • लेखक: अदित्य श्रीवास्तव (द गवर्नर्स एकेडमी), कोमल गुप्ता (द नॉर्थकैप विश्वविद्यालय)
  • वर्गीकरण: cs.AI
  • प्रकाशन वर्ष: 2024
  • पेपर लिंक: https://arxiv.org/abs/2510.11558

सारांश

यह अनुसंधान एंटरप्राइज़-स्तरीय बड़े भाषा मॉडल (LLM) सहायक प्रणालियों में शून्य डेटा प्रतिधारण नीति पर केंद्रित है, विशेष रूप से स्वास्थ्यसेवा और वित्त जैसे कड़ाई से विनियमित उद्योगों में डेटा शासन, अनुपालन और व्यावसायिक गोपनीयता आवश्यकताओं के लिए। एंटरप्राइज़ AI सहायकों के व्यापक तैनाती के साथ, निजी डेटा की सुरक्षा और अनुपालन सुनिश्चित करना प्राथमिकता बन गई है। यह पेपर Salesforce AgentForce और Microsoft Copilot दोनों बाज़ार-नेतृत्वकारी उत्पादों के गहन विश्लेषण के माध्यम से शून्य डेटा प्रतिधारण नीति के तकनीकी आर्किटेक्चर, अनुपालन और उपयोगिता व्यापार-बंद की खोज करता है।

अनुसंधान पृष्ठभूमि और प्रेरणा

1. मूल समस्या

यह अनुसंधान हल करने के लिए मूल समस्या है: एंटरप्राइज़-स्तरीय LLM अनुप्रयोगों में वास्तविक शून्य डेटा प्रतिधारण कैसे प्राप्त किया जाए, साथ ही कार्यात्मकता, अनुपालन और उपयोगिता आवश्यकताओं को संतुलित करते हुए।

2. समस्या की महत्ता

  • नियामक अनुपालन: GDPR अनुच्छेद 5, HIPAA और SOC 2 जैसे विनियम डेटा न्यूनीकरण प्रसंस्करण की आवश्यकता करते हैं
  • उद्योग संवेदनशीलता: स्वास्थ्यसेवा और वित्तीय उद्योग डेटा उल्लंघन के कठोर दंड के कारण गोपनीयता सुरक्षा को अनिवार्य बनाते हैं
  • एंटरप्राइज़ अपनाना: 2023 के बाद से, LLM प्रदाता एंटरप्राइज़-स्तरीय कार्यक्षमता पर जोर देने लगे हैं, शून्य-प्रतिधारण विशेषता मुख्य विभेदकारी कारक बन गई है
  • नियामक विकास: EU AI अधिनियम जैसे उभरते विनियमों के लिए अनुपालन AI समाधानों की मांग बढ़ रही है

3. मौजूदा विधियों की सीमाएं

  • मुख्यधारा के एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण कार्यान्वयन का व्यवस्थित तुलनात्मक विश्लेषण अभाव
  • आर्किटेक्चर डिज़ाइन, नीति प्रतिबद्धताओं और व्यावहारिक व्यापार-बंद का व्यापक मूल्यांकन अपर्याप्त
  • तकनीकी कार्यान्वयन और अनुपालन आवश्यकताओं के बीच मानचित्रण संबंध अस्पष्ट

4. अनुसंधान प्रेरणा

EU AI अधिनियम जैसे विनियमों के निरंतर विकास के साथ, इन प्रणालियों को समझना अनुपालन AI समाधान चाहने वाले एंटरप्राइज़ों के लिए महत्वपूर्ण है।

मूल योगदान

  1. शून्य डेटा प्रतिधारण का गणितीय मॉडल परिभाषित किया: प्रतिधारण जोखिम R(S) की मात्रात्मक परिभाषा प्रस्तावित की, जो प्रणाली सुरक्षा का मूल्यांकन करने के लिए सैद्धांतिक आधार प्रदान करता है
  2. तुलनात्मक विश्लेषण ढांचा निर्मित किया: आर्किटेक्चर, अनुपालन, सुरक्षा और उपयोगिता के चार आयामों को शामिल करने वाली मूल्यांकन प्रणाली स्थापित की
  3. दो प्रमुख प्लेटफॉर्मों का गहन विश्लेषण: Salesforce AgentForce और Microsoft Copilot के तकनीकी कार्यान्वयन अंतर का विस्तृत विश्लेषण
  4. उद्योग परिदृश्य प्रदान किया: Anthropic, Google, DeepSeek और अन्य LLM प्रदाताओं की शून्य डेटा प्रतिधारण नीतियों का विस्तारित विश्लेषण
  5. व्यावहारिक तैनाती व्यापार-बंद की पहचान की: बहु-मोड़ संवाद, विलंबता और पारिस्थितिकी तंत्र निर्भरता पर स्टेटलेस प्रसंस्करण के प्रभाव को स्पष्ट किया

विधि विवरण

कार्य परिभाषा

शून्य डेटा प्रतिधारण के लिए आवश्यक है कि उपयोगकर्ता डेटा इंटरैक्शन के बाद कोई निशान न छोड़े। यह पेपर सिस्टम S के प्रतिधारण जोखिम R(S) को डेटा के लॉग, कैश या स्टोरेज में प्रसंस्करण के बाद बने रहने की संभावना के रूप में परिभाषित करता है। आदर्श स्थिति R(S) = 0 स्टेटलेस अनुमान के माध्यम से प्राप्त होती है, जहां प्रत्येक अनुरोध स्वतंत्र रूप से संसाधित होता है, कोई भी संदर्भ क्लाइंट पर प्रबंधित होता है।

मूल्यांकन ढांचा

अनुसंधान चार-आयामी मूल्यांकन विधि का उपयोग करता है:

  • आर्किटेक्चर आयाम: डेटा प्रवाह पथ और प्रतिधारण बिंदु विश्लेषण
  • नीति आयाम: अनुबंध शून्य-प्रतिधारण दायित्व समीक्षा
  • सुरक्षा आयाम: फ़िल्टरिंग तंत्र और एन्क्रिप्शन उपाय
  • उपयोगिता आयाम: शून्य-प्रतिधारण का कार्यक्षमता पर प्रभाव

तकनीकी नवाचार बिंदु

  1. व्यवस्थित तुलना विधि: मुख्यधारा के एंटरप्राइज़ AI सहायकों का शून्य डेटा प्रतिधारण का पहला व्यापक तकनीकी तुलना
  2. जोखिम परिमाणीकरण मॉडल: प्रतिधारण जोखिम की गणितीय परिभाषा और मूल्यांकन विधि प्रदान करता है
  3. अंत-से-अंत विश्लेषण: डेटा इनपुट से आउटपुट तक संपूर्ण जीवन चक्र ट्रैकिंग

प्रायोगिक सेटअप

विश्लेषण के विषय

  • मुख्य प्लेटफॉर्म: Salesforce AgentForce, Microsoft Copilot
  • विस्तारित विश्लेषण: Anthropic Claude, Google Gemini, DeepSeek

मूल्यांकन आयाम

  • मॉडल होस्टिंग विधि
  • विश्वास तंत्र कार्यान्वयन
  • डेटा प्रतिधारण नीति
  • अनुपालन प्रमाणीकरण
  • उपयोगिता व्यापार-बंद

विश्लेषण विधि

आधिकारिक दस्तावेज़, तकनीकी आर्किटेक्चर विवरण और नीति फ़ाइलों के डिज़ाइन-उन्मुख विश्लेषण के आधार पर, डेटा पथ को ट्रैक करना और GDPR, HIPAA और SOC 2 अनुपालन की जांच करना।

प्रायोगिक परिणाम

मुख्य निष्कर्ष

Salesforce AgentForce तकनीकी आर्किटेक्चर

  1. Einstein Trust Layer: गोपनीयता और अनुपालन सुरक्षा के लिए मूल मध्य परत
    • गतिशील ग्राउंडिंग: उपयोगकर्ता अनुमतियों के आधार पर वास्तविक समय CRM डेटा पुनर्प्राप्ति
    • डेटा मास्किंग: नियमित अभिव्यक्ति और मेटाडेटा-संचालित पहचान का उपयोग करके संवेदनशील जानकारी को प्रतिस्थापित करना
    • स्टेटलेस प्रसंस्करण: LLM प्रदाता के साथ शून्य-प्रतिधारण समझौता
  2. सुरक्षा तंत्र:
    • TLS ट्रांज़िट एन्क्रिप्शन, AES-256 स्थिर एन्क्रिप्शन
    • इंजेक्शन हमलों के खिलाफ प्रॉम्प्ट रक्षा
    • विषाक्तता पहचान और सामग्री फ़िल्टरिंग
  3. प्रदर्शन प्रभाव: Trust Layer ओवरहेड 200-500ms विलंबता का कारण बनता है

Microsoft Copilot तकनीकी आर्किटेक्चर

  1. Azure OpenAI एकीकरण:
    • मॉडल Azure के भीतर होस्ट किया गया, OpenAI बुनियादी ढांचे के बजाय
    • एंटरप्राइज़ डेटा सुरक्षा मोड डिफ़ॉल्ट रूप से सक्षम
    • किरायेदार सीमा के भीतर अलग-थलग प्रसंस्करण
  2. सुरक्षा विशेषताएं:
    • दोहरी एन्क्रिप्शन (Azure कुंजी + ग्राहक-प्रबंधित कुंजी)
    • निजी अंतिम बिंदु क्षेत्रीय संचालन को प्रतिबंधित करते हैं
    • वास्तविक समय सामग्री फ़िल्टरिंग, कोई लॉग प्रतिधारण नहीं
  3. प्रदर्शन प्रभाव: ग्राउंडिंग विलंबता 100-300ms

तुलनात्मक विश्लेषण परिणाम

आयामSalesforce AgentForceMicrosoft Copilot
मॉडल होस्टिंगतृतीय-पक्ष LLM API कॉलAzure-होस्ट किया गया OpenAI मॉडल
विश्वास तंत्रEinstein Trust LayerGraph और Azure एकीकरण
डेटा प्रतिधारणअनुबंध शून्य-प्रतिधारणAzure नीति शून्य-प्रतिधारण
अनुपालनCRM अनुमतियां, HIPAA BAAAzure प्रमाणीकरण, GDPR, HIPAA BAA
व्यापार-बंदविलंबता, CRM निर्भरताग्राउंडिंग विलंबता, Azure निर्भरता

अन्य प्रदाता विश्लेषण

  • Anthropic: एंटरप्राइज़ शून्य-प्रतिधारण मोड प्रदान करता है, 30 दिन के बाद गैर-ZDR डेटा स्वचालित रूप से हटा दिया जाता है
  • Google Gemini: कॉन्फ़िगर करने योग्य शून्य-प्रतिधारण, डिफ़ॉल्ट 24 घंटे कैश को अक्षम करने की आवश्यकता है
  • DeepSeek: शून्य डेटा प्रतिधारण प्रदान नहीं करता, डेटा चीन सर्वर पर संग्रहीत है, अंतर्राष्ट्रीय अनुपालन आवश्यकताओं को पूरा नहीं करता है

संबंधित कार्य

मुख्य अनुसंधान दिशाएं

  1. LLM गोपनीयता सुरक्षा: Yao et al. (2024) ने गोपनीयता और साइबर सुरक्षा के संदर्भ में LLM के दोहरे प्रभाव का विश्लेषण किया
  2. गोपनीयता खतरे विश्लेषण: Yan et al. (2024) ने निष्क्रिय गोपनीयता उल्लंघन और सक्रिय गोपनीयता हमलों को अलग किया
  3. सुरक्षा सुरक्षा तंत्र: Zhang et al. (2024) ने विभिन्न कमजोरियों के खिलाफ व्यापक रक्षा तंत्र प्रस्तावित किए

इस पेपर के लाभ

मौजूदा कार्य की तुलना में, यह पेपर पहली बार मुख्यधारा के एंटरप्राइज़ AI सहायकों में शून्य डेटा प्रतिधारण का व्यवस्थित तकनीकी तुलना और व्यावहारिक तैनाती विश्लेषण प्रदान करता है।

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. तकनीकी व्यवहार्यता: Salesforce AgentForce और Microsoft Copilot दोनों ने सफलतापूर्वक शून्य डेटा प्रतिधारण लागू किया है
  2. आर्किटेक्चर अंतर: AgentForce का Trust Layer CRM-संचालित वर्कफ़्लो के लिए उपयुक्त है, Copilot का Azure एकीकरण Microsoft पारिस्थितिकी तंत्र के लिए अधिक उपयुक्त है
  3. व्यापार-बंद मौजूद है: स्टेटलेस डिज़ाइन बहु-मोड़ संवाद स्मृति सीमा और विलंबता वृद्धि का कारण बनता है
  4. उद्योग प्रवृत्ति: शून्य डेटा प्रतिधारण एंटरप्राइज़ AI के लिए मानक अपेक्षा बन रहा है

सीमाएं

  1. विश्लेषण विधि: डिज़ाइन दस्तावेज़ों के आधार पर विश्लेषण, अनुभवजन्य परीक्षण सत्यापन की कमी
  2. कवरेज रेंज: मुख्य रूप से दो प्लेटफॉर्मों पर केंद्रित, अन्य समाधानों का विश्लेषण सीमित
  3. गतिशीलता: तकनीक और नीति तेजी से विकसित हो रहे हैं, विश्लेषण परिणामों की समयोपयोगिता सीमित है

भविष्य की दिशाएं

  1. तकनीकी नवाचार: सरल, सुसंगत नीतियों और अप्रत्याशित डेटा प्रतिधारण के लिए मजबूत सुरक्षा की आवश्यकता है
  2. मानकीकरण: वैश्विक मानक संरेखण और एंटरप्राइज़ सुरक्षित अपनाने का समर्थन करने के लिए कॉन्फ़िगरेशन को सरल बनाना
  3. सहयोग तंत्र: तकनीकी आपूर्तिकर्ता, नियामक निकाय और एंटरप्राइज़ हितधारकों को सहयोग करने की आवश्यकता है

गहन मूल्यांकन

शक्तियां

  1. उच्च व्यावहारिक मूल्य: एंटरप्राइज़ों को अनुपालन AI समाधान चुनने के लिए व्यावहारिक मार्गदर्शन प्रदान करता है
  2. व्यापक विश्लेषण: तकनीकी आर्किटेक्चर, अनुपालन, सुरक्षा और उपयोगिता के कई आयामों को शामिल करता है
  3. मजबूत समयोपयोगिता: वर्तमान सबसे लोकप्रिय एंटरप्राइज़ AI सहायक उत्पादों पर ध्यान केंद्रित करता है
  4. स्पष्ट संरचना: तार्किक स्तर स्पष्ट है, समझने और लागू करने में आसान है

कमियां

  1. अनुभवजन्य सत्यापन की कमी: मुख्य रूप से दस्तावेज़ विश्लेषण पर निर्भर, वास्तविक परीक्षण डेटा की कमी
  2. अपर्याप्त मात्रात्मक विश्लेषण: हालांकि R(S) मॉडल प्रस्तावित किया गया है, लेकिन विशिष्ट मात्रात्मक मूल्यांकन की कमी है
  3. सीमित तकनीकी गहराई: कुछ तकनीकी विवरणों का विश्लेषण अभी भी पर्याप्त गहरा नहीं है
  4. गतिशील ट्रैकिंग अभाव: तकनीक और नीति के तेजी से विकास पर विचार नहीं किया गया है

प्रभाव

  1. शैक्षणिक योगदान: एंटरप्राइज़ AI गोपनीयता सुरक्षा अनुसंधान के लिए नया विश्लेषण ढांचा प्रदान करता है
  2. व्यावहारिक मार्गदर्शन: एंटरप्राइज़ IT निर्णय निर्माताओं और अनुपालन अधिकारियों के लिए महत्वपूर्ण संदर्भ प्रदान करता है
  3. नीति प्रभाव: भविष्य की AI शासन नीति निर्माण को प्रभावित कर सकता है

लागू परिदृश्य

विशेष रूप से उपयुक्त:

  • कड़ाई से विनियमित उद्योग (स्वास्थ्यसेवा, वित्त)
  • एंटरप्राइज़ AI समाधान चुनने वाले संगठन
  • AI शासन और अनुपालन नीति निर्माता
  • एंटरप्राइज़ AI उत्पाद विकास टीमें

संदर्भ

  1. Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
  2. Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
  3. Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
  4. Salesforce. (2024). Trusted AI and Agents Impact Report.
  5. Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.

यह पेपर एंटरप्राइज़-स्तरीय AI अनुप्रयोगों में डेटा गोपनीयता सुरक्षा के लिए महत्वपूर्ण तकनीकी विश्लेषण और व्यावहारिक मार्गदर्शन प्रदान करता है, वर्तमान AI के तेजी से विकास और विनियमन के कड़े होने की पृष्ठभूमि में महत्वपूर्ण व्यावहारिक महत्व है। हालांकि अनुभवजन्य सत्यापन और मात्रात्मक विश्लेषण के संदर्भ में सुधार की गुंजाइश है, लेकिन इसकी व्यवस्थित तुलनात्मक विश्लेषण ढांचा और व्यावहारिक तैनाती सुझाव इसे इस क्षेत्र का एक महत्वपूर्ण संदर्भ दस्तावेज़ बनाते हैं।