Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
- معرّف الورقة البحثية: 2510.11558
- العنوان: عدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية القائمة على نماذج اللغة الكبيرة: دراسة مقارنة لمنتجات الذكاء الاصطناعي الوكيل الرائدة في السوق
- المؤلفون: أديتيا شريفاستافا (أكاديمية الحاكم)، كومال جوبتا (جامعة نورثكاب)
- التصنيف: cs.AI
- تاريخ النشر: 2024
- رابط الورقة البحثية: https://arxiv.org/abs/2510.11558
تركز هذه الدراسة على سياسات عدم الاحتفاظ بالبيانات في أنظمة المساعدات المؤسسية القائمة على نماذج اللغة الكبيرة (LLM)، وخاصة متطلبات حوكمة البيانات والامتثال والخصوصية التجارية في الصناعات الخاضعة للتنظيم الصارم مثل الرعاية الصحية والخدمات المالية. مع الانتشار الواسع لمساعدات الذكاء الاصطناعي المؤسسية، أصبح حماية البيانات الخاصة وضمان الامتثال أولويات حتمية. تستكشف هذه الورقة البحثية من خلال تحليل متعمق لمنتجي السوق الرائدين - Salesforce AgentForce و Microsoft Copilot - المعمارية التقنية لسياسات عدم الاحتفاظ بالبيانات والمقارنات بين الامتثال والقابلية للاستخدام.
تتمحور المشكلة الأساسية التي تعالجها هذه الدراسة حول: كيفية تحقيق عدم احتفاظ حقيقي بالبيانات في تطبيقات نماذج اللغة الكبيرة على المستوى المؤسسي، مع الموازنة بين متطلبات الوظائف والامتثال والقابلية للاستخدام.
- الامتثال التنظيمي: تتطلب اللوائح مثل المادة 5 من اللائحة العامة لحماية البيانات (GDPR) وقانون HIPAA و SOC 2 تقليل معالجة البيانات
- حساسية الصناعة: تفرض صناعات الرعاية الصحية والخدمات المالية عقوبات صارمة على انتهاكات البيانات، مما يجعل حماية الخصوصية ضرورة حتمية
- الاعتماد المؤسسي: منذ عام 2023، بدأ مزودو نماذج اللغة الكبيرة بالتركيز على الميزات على المستوى المؤسسي، حيث أصبحت ميزة عدم الاحتفاظ عاملاً تمييزياً رئيسياً
- تطور التنظيم: تفرض اللوائح الناشئة مثل قانون الاتحاد الأوروبي للذكاء الاصطناعي طلباً متزايداً على حلول الذكاء الاصطناعي المتوافقة
- غياب التحليل المقارن المنهجي لتنفيذ عدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة
- عدم كفاية التقييم الشامل للتصميم المعماري والالتزامات السياسية والمقارنات العملية
- عدم وضوح العلاقة بين التنفيذ التقني والمتطلبات الامتثالية
مع استمرار تطور اللوائح مثل قانون الاتحاد الأوروبي للذكاء الاصطناعي، يعتبر فهم هذه الأنظمة حاسماً للمؤسسات التي تسعى إلى حلول ذكاء اصطناعي متوافقة.
- تعريف نموذج رياضي لعدم الاحتفاظ بالبيانات: تقديم تعريف كمي لمخاطر الاحتفاظ R(S)، مما يوفر أساساً نظرياً لتقييم أمان النظام
- بناء إطار عمل للتحليل المقارن: إنشاء نظام تقييم يغطي أربعة أبعاد: المعمارية والامتثال والأمان والقابلية للاستخدام
- تحليل متعمق لمنصتين رائدتين: تحليل تفصيلي للاختلافات التقنية بين Salesforce AgentForce و Microsoft Copilot
- توفير رؤية شاملة للصناعة: توسيع التحليل ليشمل سياسات عدم الاحتفاظ بالبيانات لدى مزودي نماذج اللغة الكبيرة الآخرين مثل Anthropic و Google و DeepSeek
- تحديد المقارنات الفعلية للنشر: توضيح تأثير المعالجة عديمة الحالة على المحادثات متعددة الأدوار والكمون والاعتماديات البيئية
يتطلب عدم الاحتفاظ بالبيانات عدم ترك أي أثر لبيانات المستخدم بعد التفاعل. تعرّف هذه الورقة مخاطر الاحتفاظ R(S) للنظام S بأنها احتمالية استمرار البيانات في السجلات أو الذاكرة المؤقتة أو التخزين بعد المعالجة. يتحقق الحالة المثالية R(S) = 0 من خلال الاستدلال عديم الحالة، حيث تتم معالجة كل طلب بشكل مستقل وتُدار أي سياقات على جانب العميل.
يستخدم البحث منهجية تقييم رباعية الأبعاد:
- البعد المعماري: تحليل مسارات تدفق البيانات ونقاط الاحتفاظ
- البعد السياسي: مراجعة التزامات عدم الاحتفاظ بالعقود
- البعد الأمني: آليات التصفية والتشفير
- بعد القابلية للاستخدام: تأثير عدم الاحتفاظ على الوظائف
- منهجية المقارنة المنهجية: أول مقارنة تقنية شاملة لعدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة
- نموذج تحديد المخاطر الكمي: توفير تعريف رياضي وطريقة تقييم لمخاطر الاحتفاظ
- التحليل من النهاية إلى النهاية: تتبع دورة حياة البيانات الكاملة من الإدخال إلى الإخراج
- المنصات الرئيسية: Salesforce AgentForce و Microsoft Copilot
- التحليل الموسع: Anthropic Claude و Google Gemini و DeepSeek
- طريقة استضافة النموذج
- تنفيذ آليات الثقة
- سياسات الاحتفاظ بالبيانات
- شهادات الامتثال
- مقارنات القابلية للاستخدام
تحليل موجه بالتصميم بناءً على الوثائق الرسمية وشروحات المعمارية التقنية وملفات السياسات، مع تتبع مسارات البيانات والتحقق من الامتثال لـ GDPR و HIPAA و SOC 2.
- طبقة Einstein Trust: الطبقة الوسيطة الأساسية التي تضمن الخصوصية والامتثال
- التأسيس الديناميكي: استرجاع بيانات CRM في الوقت الفعلي بناءً على أذونات المستخدم
- إخفاء البيانات: استخدام التعبيرات النمطية والكشف المدفوع بالبيانات الوصفية لاستبدال المعلومات الحساسة
- المعالجة عديمة الحالة: بروتوكول عدم الاحتفاظ مع مزودي نماذج اللغة الكبيرة
- آليات الأمان:
- تشفير النقل TLS وتشفير AES-256 في حالة السكون
- الدفاع عن المطالبات ضد هجمات الحقن
- الكشف عن السمية وتصفية المحتوى
- تأثير الأداء: يؤدي حمل طبقة الثقة إلى تأخير 200-500 ميلي ثانية
- تكامل Azure OpenAI:
- استضافة النموذج داخل Azure وليس على بنية OpenAI الأساسية
- تفعيل وضع حماية البيانات المؤسسية بشكل افتراضي
- المعالجة المعزولة ضمن حدود المستأجر
- ميزات الأمان:
- التشفير المزدوج (مفتاح Azure + مفتاح مُدار من العميل)
- نقاط النهاية الخاصة تقيد العمليات الإقليمية
- تصفية المحتوى في الوقت الفعلي وعدم الاحتفاظ بالسجلات
- تأثير الأداء: تأخير التأسيس 100-300 ميلي ثانية
| البعد | Salesforce AgentForce | Microsoft Copilot |
|---|
| استضافة النموذج | استدعاءات API لنموذج طرف ثالث | نموذج OpenAI مستضاف على Azure |
| آلية الثقة | طبقة Einstein Trust | تكامل Graph و Azure |
| الاحتفاظ بالبيانات | عدم احتفاظ بالعقد | عدم احتفاظ بسياسة Azure |
| الامتثال | أذونات CRM و HIPAA BAA | شهادات Azure و GDPR و HIPAA BAA |
| المقارنات | الكمون والاعتماد على CRM | تأخير التأسيس والاعتماد على Azure |
- Anthropic: توفير وضع عدم احتفاظ مؤسسي، حذف تلقائي للبيانات غير ZDR بعد 30 يوماً
- Google Gemini: عدم احتفاظ قابل للتكوين، يتطلب تعطيل الذاكرة المؤقتة الافتراضية لمدة 24 ساعة
- DeepSeek: عدم توفير عدم احتفاظ بالبيانات، تخزين البيانات على خوادم صينية، عدم الامتثال للمتطلبات الدولية
- أمان وخصوصية نماذج اللغة الكبيرة: حلل Yao et al. (2024) التأثيرات المزدوجة لنماذج اللغة الكبيرة على الخصوصية والأمن السيبراني
- تحليل تهديدات الخصوصية: ميّز Yan et al. (2024) بين تسريب الخصوصية السلبي والهجمات النشطة على الخصوصية
- آليات الحماية الأمنية: اقترح Zhang et al. (2024) آليات دفاع شاملة ضد جميع أنواع الثغرات
بالمقارنة مع الأعمال الموجودة، توفر هذه الورقة للمرة الأولى مقارنة تقنية منهجية وتحليل نشر فعلي لعدم الاحتفاظ بالبيانات في مساعدات الذكاء الاصطناعي المؤسسية السائدة.
- الجدوى التقنية: نجح كل من Salesforce AgentForce و Microsoft Copilot في تنفيذ عدم الاحتفاظ بالبيانات
- الاختلافات المعمارية: تناسب طبقة Trust Layer من AgentForce سير العمل المدفوع بـ CRM، بينما يناسب تكامل Azure من Copilot النظام البيئي لـ Microsoft بشكل أفضل
- وجود المقارنات: يؤدي التصميم عديم الحالة إلى قيود على ذاكرة المحادثات متعددة الأدوار وزيادة الكمون
- اتجاهات الصناعة: أصبح عدم الاحتفاظ بالبيانات توقعاً معيارياً للذكاء الاصطناعي المؤسسي
- منهجية التحليل: التحليل بناءً على وثائق التصميم، يفتقر إلى التحقق التجريبي
- نطاق التغطية: التركيز الأساسي على منصتين، تحليل محدود للحلول الأخرى
- الديناميكية: التطور السريع للتكنولوجيا والسياسات يؤثر على الصلاحية الزمنية للنتائج
- الابتكار التقني: الحاجة إلى سياسات أبسط وأكثر اتساقاً وضمانات أقوى ضد الاحتفاظ غير المقصود بالبيانات
- التوحيد القياسي: توافق المعايير العالمية وتبسيط التكوين لدعم الاعتماد الآمن من قبل المؤسسات
- آليات التعاون: الحاجة إلى تعاون بين مزودي التكنولوجيا والهيئات التنظيمية وأصحاب المصلحة المؤسسيين
- قيمة عملية عالية: توفير إرشادات عملية للمؤسسات في اختيار حلول ذكاء اصطناعي متوافقة
- تحليل شامل: يغطي الأبعاد المعمارية والامتثال والأمان والقابلية للاستخدام
- قوة الصلاحية الزمنية: التركيز على منتجات الذكاء الاصطناعي المؤسسية الأكثر شيوعاً حالياً
- وضوح الهيكل: تسلسل منطقي واضح يسهل الفهم والتطبيق
- نقص التحقق التجريبي: يعتمد بشكل أساسي على تحليل الوثائق، يفتقر إلى بيانات الاختبار الفعلية
- عدم كفاية التحليل الكمي: على الرغم من تقديم نموذج R(S)، يفتقر إلى التقييم الكمي المحدد
- عمق تقني محدود: التحليل لبعض التفاصيل التقنية ليس عميقاً بما يكفي
- غياب التتبع الديناميكي: عدم الأخذ في الاعتبار التطور السريع للتكنولوجيا والسياسات على نتائج التحليل
- المساهمة الأكاديمية: توفير إطار عمل تحليلي جديد لبحث حماية الخصوصية في الذكاء الاصطناعي المؤسسي
- الإرشادات العملية: توفير مرجع مهم لمتخذي القرارات في تكنولوجيا المعلومات والمسؤولين عن الامتثال
- التأثير على السياسات: قد يؤثر على صياغة سياسات حوكمة الذكاء الاصطناعي المستقبلية
مناسبة بشكل خاص لـ:
- الصناعات الخاضعة للتنظيم الصارم (الرعاية الصحية والخدمات المالية)
- المؤسسات التي تحتاج إلى اختيار حلول ذكاء اصطناعي مؤسسية
- صانعو سياسات حوكمة الذكاء الاصطناعي والامتثال
- فرق تطوير منتجات الذكاء الاصطناعي المؤسسية
- Yao, Y. et al. (2024). دراسة استقصائية عن أمان وخصوصية نماذج اللغة الكبيرة (LLM): الجيد والسيء والقبيح.
- Yan, B. et al. (2024). حول حماية خصوصية البيانات لنماذج اللغة الكبيرة (LLMs) وعملاء نماذج اللغة الكبيرة: مراجعة الأدبيات.
- Zhang, R. et al. (2024). حول أمان وأمن وخصوصية نماذج اللغة الكبيرة: دراسة استقصائية.
- Salesforce. (2024). تقرير تأثير الذكاء الاصطناعي الموثوق والعملاء.
- Microsoft. (2024). البيانات والخصوصية والأمان لخدمة Azure OpenAI.
توفر هذه الورقة البحثية تحليلاً تقنياً مهماً وإرشادات عملية لحماية خصوصية البيانات في تطبيقات الذكاء الاصطناعي على المستوى المؤسسي. في سياق التطور السريع للذكاء الاصطناعي والتشديد المستمر للتنظيم، تتمتع بأهمية واقعية كبيرة. على الرغم من وجود مجال للتحسن في التحقق التجريبي والتحليل الكمي، فإن إطار عمل المقارنة المنهجي والتوصيات العملية للنشر تجعلها مرجعاً مهماً في هذا المجال.