2025-11-18T16:46:20.871497

Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products

Gupta, Shrivastava

Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.

academic

عدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية القائمة على نماذج اللغة الكبيرة: دراسة مقارنة لمنتجات الذكاء الاصطناعي الوكيل الرائدة في السوق

المعلومات الأساسية

معرّف الورقة البحثية: 2510.11558
العنوان: عدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية القائمة على نماذج اللغة الكبيرة: دراسة مقارنة لمنتجات الذكاء الاصطناعي الوكيل الرائدة في السوق
المؤلفون: أديتيا شريفاستافا (أكاديمية الحاكم)، كومال جوبتا (جامعة نورثكاب)
التصنيف: cs.AI
تاريخ النشر: 2024
رابط الورقة البحثية: https://arxiv.org/abs/2510.11558

الملخص

تركز هذه الدراسة على سياسات عدم الاحتفاظ بالبيانات في أنظمة المساعدات المؤسسية القائمة على نماذج اللغة الكبيرة (LLM)، وخاصة متطلبات حوكمة البيانات والامتثال والخصوصية التجارية في الصناعات الخاضعة للتنظيم الصارم مثل الرعاية الصحية والخدمات المالية. مع الانتشار الواسع لمساعدات الذكاء الاصطناعي المؤسسية، أصبح حماية البيانات الخاصة وضمان الامتثال أولويات حتمية. تستكشف هذه الورقة البحثية من خلال تحليل متعمق لمنتجي السوق الرائدين - Salesforce AgentForce و Microsoft Copilot - المعمارية التقنية لسياسات عدم الاحتفاظ بالبيانات والمقارنات بين الامتثال والقابلية للاستخدام.

خلفية البحث والدافع

1. المشكلة الأساسية

تتمحور المشكلة الأساسية التي تعالجها هذه الدراسة حول: كيفية تحقيق عدم احتفاظ حقيقي بالبيانات في تطبيقات نماذج اللغة الكبيرة على المستوى المؤسسي، مع الموازنة بين متطلبات الوظائف والامتثال والقابلية للاستخدام.

2. أهمية المشكلة

الامتثال التنظيمي: تتطلب اللوائح مثل المادة 5 من اللائحة العامة لحماية البيانات (GDPR) وقانون HIPAA و SOC 2 تقليل معالجة البيانات
حساسية الصناعة: تفرض صناعات الرعاية الصحية والخدمات المالية عقوبات صارمة على انتهاكات البيانات، مما يجعل حماية الخصوصية ضرورة حتمية
الاعتماد المؤسسي: منذ عام 2023، بدأ مزودو نماذج اللغة الكبيرة بالتركيز على الميزات على المستوى المؤسسي، حيث أصبحت ميزة عدم الاحتفاظ عاملاً تمييزياً رئيسياً
تطور التنظيم: تفرض اللوائح الناشئة مثل قانون الاتحاد الأوروبي للذكاء الاصطناعي طلباً متزايداً على حلول الذكاء الاصطناعي المتوافقة

3. قيود الأساليب الموجودة

غياب التحليل المقارن المنهجي لتنفيذ عدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة
عدم كفاية التقييم الشامل للتصميم المعماري والالتزامات السياسية والمقارنات العملية
عدم وضوح العلاقة بين التنفيذ التقني والمتطلبات الامتثالية

4. دافع البحث

مع استمرار تطور اللوائح مثل قانون الاتحاد الأوروبي للذكاء الاصطناعي، يعتبر فهم هذه الأنظمة حاسماً للمؤسسات التي تسعى إلى حلول ذكاء اصطناعي متوافقة.

المساهمات الأساسية

تعريف نموذج رياضي لعدم الاحتفاظ بالبيانات: تقديم تعريف كمي لمخاطر الاحتفاظ R(S)، مما يوفر أساساً نظرياً لتقييم أمان النظام
بناء إطار عمل للتحليل المقارن: إنشاء نظام تقييم يغطي أربعة أبعاد: المعمارية والامتثال والأمان والقابلية للاستخدام
تحليل متعمق لمنصتين رائدتين: تحليل تفصيلي للاختلافات التقنية بين Salesforce AgentForce و Microsoft Copilot
توفير رؤية شاملة للصناعة: توسيع التحليل ليشمل سياسات عدم الاحتفاظ بالبيانات لدى مزودي نماذج اللغة الكبيرة الآخرين مثل Anthropic و Google و DeepSeek
تحديد المقارنات الفعلية للنشر: توضيح تأثير المعالجة عديمة الحالة على المحادثات متعددة الأدوار والكمون والاعتماديات البيئية

شرح المنهجية

تعريف المهمة

يتطلب عدم الاحتفاظ بالبيانات عدم ترك أي أثر لبيانات المستخدم بعد التفاعل. تعرّف هذه الورقة مخاطر الاحتفاظ R(S) للنظام S بأنها احتمالية استمرار البيانات في السجلات أو الذاكرة المؤقتة أو التخزين بعد المعالجة. يتحقق الحالة المثالية R(S) = 0 من خلال الاستدلال عديم الحالة، حيث تتم معالجة كل طلب بشكل مستقل وتُدار أي سياقات على جانب العميل.

إطار التقييم

يستخدم البحث منهجية تقييم رباعية الأبعاد:

البعد المعماري: تحليل مسارات تدفق البيانات ونقاط الاحتفاظ
البعد السياسي: مراجعة التزامات عدم الاحتفاظ بالعقود
البعد الأمني: آليات التصفية والتشفير
بعد القابلية للاستخدام: تأثير عدم الاحتفاظ على الوظائف

نقاط الابتكار التقني

منهجية المقارنة المنهجية: أول مقارنة تقنية شاملة لعدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة
نموذج تحديد المخاطر الكمي: توفير تعريف رياضي وطريقة تقييم لمخاطر الاحتفاظ
التحليل من النهاية إلى النهاية: تتبع دورة حياة البيانات الكاملة من الإدخال إلى الإخراج

إعداد التجارب

أهداف التحليل

المنصات الرئيسية: Salesforce AgentForce و Microsoft Copilot
التحليل الموسع: Anthropic Claude و Google Gemini و DeepSeek

أبعاد التقييم

طريقة استضافة النموذج
تنفيذ آليات الثقة
سياسات الاحتفاظ بالبيانات
شهادات الامتثال
مقارنات القابلية للاستخدام

منهجية التحليل

تحليل موجه بالتصميم بناءً على الوثائق الرسمية وشروحات المعمارية التقنية وملفات السياسات، مع تتبع مسارات البيانات والتحقق من الامتثال لـ GDPR و HIPAA و SOC 2.

نتائج التجارب

النتائج الرئيسية

المعمارية التقنية لـ Salesforce AgentForce

طبقة Einstein Trust: الطبقة الوسيطة الأساسية التي تضمن الخصوصية والامتثال
- التأسيس الديناميكي: استرجاع بيانات CRM في الوقت الفعلي بناءً على أذونات المستخدم
- إخفاء البيانات: استخدام التعبيرات النمطية والكشف المدفوع بالبيانات الوصفية لاستبدال المعلومات الحساسة
- المعالجة عديمة الحالة: بروتوكول عدم الاحتفاظ مع مزودي نماذج اللغة الكبيرة
آليات الأمان:
- تشفير النقل TLS وتشفير AES-256 في حالة السكون
- الدفاع عن المطالبات ضد هجمات الحقن
- الكشف عن السمية وتصفية المحتوى
تأثير الأداء: يؤدي حمل طبقة الثقة إلى تأخير 200-500 ميلي ثانية

المعمارية التقنية لـ Microsoft Copilot

تكامل Azure OpenAI:
- استضافة النموذج داخل Azure وليس على بنية OpenAI الأساسية
- تفعيل وضع حماية البيانات المؤسسية بشكل افتراضي
- المعالجة المعزولة ضمن حدود المستأجر
ميزات الأمان:
- التشفير المزدوج (مفتاح Azure + مفتاح مُدار من العميل)
- نقاط النهاية الخاصة تقيد العمليات الإقليمية
- تصفية المحتوى في الوقت الفعلي وعدم الاحتفاظ بالسجلات
تأثير الأداء: تأخير التأسيس 100-300 ميلي ثانية

نتائج التحليل المقارن

البعد	Salesforce AgentForce	Microsoft Copilot
استضافة النموذج	استدعاءات API لنموذج طرف ثالث	نموذج OpenAI مستضاف على Azure
آلية الثقة	طبقة Einstein Trust	تكامل Graph و Azure
الاحتفاظ بالبيانات	عدم احتفاظ بالعقد	عدم احتفاظ بسياسة Azure
الامتثال	أذونات CRM و HIPAA BAA	شهادات Azure و GDPR و HIPAA BAA
المقارنات	الكمون والاعتماد على CRM	تأخير التأسيس والاعتماد على Azure

تحليل مزودي الخدمات الآخرين

Anthropic: توفير وضع عدم احتفاظ مؤسسي، حذف تلقائي للبيانات غير ZDR بعد 30 يوماً
Google Gemini: عدم احتفاظ قابل للتكوين، يتطلب تعطيل الذاكرة المؤقتة الافتراضية لمدة 24 ساعة
DeepSeek: عدم توفير عدم احتفاظ بالبيانات، تخزين البيانات على خوادم صينية، عدم الامتثال للمتطلبات الدولية

الأعمال ذات الصلة

الاتجاهات البحثية الرئيسية

أمان وخصوصية نماذج اللغة الكبيرة: حلل Yao et al. (2024) التأثيرات المزدوجة لنماذج اللغة الكبيرة على الخصوصية والأمن السيبراني
تحليل تهديدات الخصوصية: ميّز Yan et al. (2024) بين تسريب الخصوصية السلبي والهجمات النشطة على الخصوصية
آليات الحماية الأمنية: اقترح Zhang et al. (2024) آليات دفاع شاملة ضد جميع أنواع الثغرات

مزايا هذه الورقة

بالمقارنة مع الأعمال الموجودة، توفر هذه الورقة للمرة الأولى مقارنة تقنية منهجية وتحليل نشر فعلي لعدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة.

الخلاصة والمناقشة

الاستنتاجات الرئيسية

الجدوى التقنية: نجح كل من Salesforce AgentForce و Microsoft Copilot في تنفيذ عدم الاحتفاظ بالبيانات
الاختلافات المعمارية: تناسب طبقة Trust Layer من AgentForce سير العمل المدفوع بـ CRM، بينما يناسب تكامل Azure من Copilot النظام البيئي لـ Microsoft بشكل أفضل
وجود المقارنات: يؤدي التصميم عديم الحالة إلى قيود على ذاكرة المحادثات متعددة الأدوار وزيادة الكمون
اتجاهات الصناعة: أصبح عدم الاحتفاظ بالبيانات توقعاً معيارياً للذكاء الاصطناعي المؤسسي

القيود

منهجية التحليل: التحليل بناءً على وثائق التصميم، يفتقر إلى التحقق التجريبي
نطاق التغطية: التركيز الأساسي على منصتين، تحليل محدود للحلول الأخرى
الديناميكية: التطور السريع للتكنولوجيا والسياسات يؤثر على الصلاحية الزمنية للنتائج

الاتجاهات المستقبلية

الابتكار التقني: الحاجة إلى سياسات أبسط وأكثر اتساقاً وضمانات أقوى ضد الاحتفاظ غير المقصود بالبيانات
التوحيد القياسي: توافق المعايير العالمية وتبسيط التكوين لدعم الاعتماد الآمن من قبل المؤسسات
آليات التعاون: الحاجة إلى تعاون بين مزودي التكنولوجيا والهيئات التنظيمية وأصحاب المصلحة المؤسسيين

التقييم المتعمق

المزايا

قيمة عملية عالية: توفير إرشادات عملية للمؤسسات في اختيار حلول ذكاء اصطناعي متوافقة
تحليل شامل: يغطي الأبعاد المعمارية والامتثال والأمان والقابلية للاستخدام
قوة الصلاحية الزمنية: التركيز على منتجات الذكاء الاصطناعي المؤسسية الأكثر شيوعاً حالياً
وضوح الهيكل: تسلسل منطقي واضح يسهل الفهم والتطبيق

أوجه القصور

نقص التحقق التجريبي: يعتمد بشكل أساسي على تحليل الوثائق، يفتقر إلى بيانات الاختبار الفعلية
عدم كفاية التحليل الكمي: على الرغم من تقديم نموذج R(S)، يفتقر إلى التقييم الكمي المحدد
عمق تقني محدود: التحليل لبعض التفاصيل التقنية ليس عميقاً بما يكفي
غياب التتبع الديناميكي: عدم الأخذ في الاعتبار التطور السريع للتكنولوجيا والسياسات على نتائج التحليل

التأثير

المساهمة الأكاديمية: توفير إطار عمل تحليلي جديد لبحث حماية الخصوصية في الذكاء الاصطناعي المؤسسي
الإرشادات العملية: توفير مرجع مهم لمتخذي القرارات في تكنولوجيا المعلومات والمسؤولين عن الامتثال
التأثير على السياسات: قد يؤثر على صياغة سياسات حوكمة الذكاء الاصطناعي المستقبلية

السيناريوهات المناسبة

مناسبة بشكل خاص لـ:

الصناعات الخاضعة للتنظيم الصارم (الرعاية الصحية والخدمات المالية)
المؤسسات التي تحتاج إلى اختيار حلول ذكاء اصطناعي مؤسسية
صانعو سياسات حوكمة الذكاء الاصطناعي والامتثال
فرق تطوير منتجات الذكاء الاصطناعي المؤسسية

المراجع

Yao, Y. et al. (2024). دراسة استقصائية عن أمان وخصوصية نماذج اللغة الكبيرة (LLM): الجيد والسيء والقبيح.
Yan, B. et al. (2024). حول حماية خصوصية البيانات لنماذج اللغة الكبيرة (LLMs) وعملاء نماذج اللغة الكبيرة: مراجعة الأدبيات.
Zhang, R. et al. (2024). حول أمان وأمن وخصوصية نماذج اللغة الكبيرة: دراسة استقصائية.
Salesforce. (2024). تقرير تأثير الذكاء الاصطناعي الموثوق والعملاء.
Microsoft. (2024). البيانات والخصوصية والأمان لخدمة Azure OpenAI.

توفر هذه الورقة البحثية تحليلاً تقنياً مهماً وإرشادات عملية لحماية خصوصية البيانات في تطبيقات الذكاء الاصطناعي على المستوى المؤسسي. في سياق التطور السريع للذكاء الاصطناعي والتشديد المستمر للتنظيم، تتمتع بأهمية واقعية كبيرة. على الرغم من وجود مجال للتحسن في التحقق التجريبي والتحليل الكمي، فإن إطار عمل المقارنة المنهجي والتوصيات العملية للنشر تجعلها مرجعاً مهماً في هذا المجال.