Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
- ID статьи: 2510.11558
- Название: Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products
- Авторы: Адитья Шривастава (The Governor's Academy), Комал Гупта (The Northcap University)
- Категория: cs.AI
- Дата публикации: 2024
- Ссылка на статью: https://arxiv.org/abs/2510.11558
Данное исследование сосредоточено на политике нулевого сохранения данных в корпоративных системах, поддерживаемых большими языковыми моделями (LLM), особенно в отношении требований управления данными, соответствия нормативным требованиям и конфиденциальности бизнеса в строго регулируемых отраслях, таких как здравоохранение и финансы. С широким развертыванием корпоративных ассистентов ИИ защита приватных данных и обеспечение соответствия нормативным требованиям стали приоритетом. В статье проводится углубленный анализ двух ведущих на рынке продуктов — Salesforce AgentForce и Microsoft Copilot — для изучения технической архитектуры, соответствия нормативным требованиям и компромиссов в области удобства использования политики нулевого сохранения данных.
Центральный вопрос, который решает данное исследование: как реализовать истинное нулевое сохранение данных в корпоративных приложениях LLM, одновременно балансируя требования функциональности, соответствия нормативным требованиям и удобства использования.
- Нормативное соответствие: Статья 5 GDPR, HIPAA и SOC 2 требуют минимизации обработки данных
- Чувствительность отрасли: Суровые штрафы за утечки данных в здравоохранении и финансовом секторе делают защиту конфиденциальности критической необходимостью
- Корпоративное внедрение: С 2023 года поставщики LLM начали подчеркивать корпоративные функции, причем функция нулевого сохранения стала ключевым дифференциатором
- Эволюция нормативной базы: Новые нормативные акты, такие как Закон об ИИ ЕС, создают растущий спрос на решения ИИ, соответствующие нормативным требованиям
- Отсутствие систематического сравнительного анализа реализации нулевого сохранения данных в основных корпоративных ассистентах ИИ
- Недостаточная комплексная оценка архитектурного проектирования, политических обязательств и практических компромиссов
- Неясное соответствие между технической реализацией и требованиями соответствия нормативным требованиям
С продолжающейся эволюцией нормативных актов, таких как EU AI Act, понимание этих систем критически важно для предприятий, ищущих решения ИИ, соответствующие нормативным требованиям.
- Определена математическая модель нулевого сохранения данных: предложено количественное определение риска сохранения R(S), обеспечивающее теоретическую основу для оценки безопасности системы
- Построена сравнительная аналитическая база: установлена система оценки, охватывающая четыре измерения: архитектуру, соответствие нормативным требованиям, безопасность и удобство использования
- Глубокий анализ двух ведущих платформ: детальный анализ различий в технической реализации Salesforce AgentForce и Microsoft Copilot
- Предоставлен обзор отрасли: расширенный анализ политики нулевого сохранения данных других поставщиков LLM, включая Anthropic, Google и DeepSeek
- Выявлены практические компромиссы развертывания: четко определено влияние безгосударственной обработки на многоходовые диалоги, задержку и зависимость от экосистемы
Нулевое сохранение данных требует, чтобы данные пользователя не оставляли никаких следов после взаимодействия. В статье риск сохранения R(S) системы S определяется как вероятность того, что данные продолжают существовать в журналах, кэше или хранилище после обработки. Идеальное состояние R(S) = 0 достигается посредством безгосударственного вывода, при котором каждый запрос обрабатывается независимо, а любой контекст управляется на стороне клиента.
Исследование применяет четырехмерный метод оценки:
- Архитектурное измерение: анализ пути потока данных и точек сохранения
- Политическое измерение: проверка договорных обязательств нулевого сохранения
- Измерение безопасности: механизмы фильтрации и меры шифрования
- Измерение удобства использования: влияние нулевого сохранения на функциональность
- Систематический метод сравнения: первое комплексное техническое сравнение нулевого сохранения данных в основных корпоративных ассистентах ИИ
- Модель количественной оценки риска: обеспечивает математическое определение и методы оценки риска сохранения
- Сквозной анализ: полное отслеживание жизненного цикла данных от ввода к выводу
- Основные платформы: Salesforce AgentForce, Microsoft Copilot
- Расширенный анализ: Anthropic Claude, Google Gemini, DeepSeek
- Способ размещения модели
- Реализация механизма доверия
- Политика сохранения данных
- Сертификация соответствия нормативным требованиям
- Компромиссы в области удобства использования
Анализ, ориентированный на проектирование, основанный на официальной документации, описаниях технической архитектуры и политических документах, с отслеживанием пути данных и проверкой соответствия GDPR, HIPAA и SOC 2.
- Einstein Trust Layer: центральный промежуточный слой, обеспечивающий конфиденциальность и соответствие нормативным требованиям
- Динамическое заземление: получение данных CRM в реальном времени на основе разрешений пользователя
- Маскирование данных: замена конфиденциальной информации с использованием регулярных выражений и обнаружения, управляемого метаданными
- Безгосударственная обработка: протокол нулевого сохранения с поставщиком LLM
- Механизмы безопасности:
- Шифрование передачи TLS, шифрование в покое AES-256
- Защита от подсказок против атак инъекций
- Обнаружение токсичности и фильтрация контента
- Влияние на производительность: затраты Trust Layer приводят к задержке 200-500 мс
- Интеграция Azure OpenAI:
- Модель размещена внутри Azure, а не в инфраструктуре OpenAI
- Режим защиты корпоративных данных включен по умолчанию
- Обработка в изоляции в границах арендатора
- Функции безопасности:
- Двойное шифрование (ключ Azure + управляемый клиентом ключ)
- Частные конечные точки ограничивают региональные операции
- Фильтрация контента в реальном времени, без сохранения журналов
- Влияние на производительность: задержка заземления 100-300 мс
| Измерение | Salesforce AgentForce | Microsoft Copilot |
|---|
| Размещение модели | Вызовы API LLM третьей стороны | Модель OpenAI, размещенная в Azure |
| Механизм доверия | Einstein Trust Layer | Интеграция Graph и Azure |
| Сохранение данных | Договорное нулевое сохранение | Политика Azure нулевого сохранения |
| Соответствие нормативным требованиям | Разрешения CRM, HIPAA BAA | Сертификация Azure, GDPR, HIPAA BAA |
| Компромиссы | Задержка, зависимость от CRM | Задержка заземления, зависимость от Azure |
- Anthropic: предоставляет режим нулевого сохранения для предприятий, автоматическое удаление данных, не относящихся к ZDR, через 30 дней
- Google Gemini: настраиваемое нулевое сохранение, требует отключения кэширования по умолчанию на 24 часа
- DeepSeek: не предоставляет нулевое сохранение данных, данные хранятся на серверах в Китае, не соответствует международным требованиям соответствия нормативным требованиям
- Безопасность и конфиденциальность LLM: Yao et al. (2024) анализируют двойственный эффект LLM на конфиденциальность и кибербезопасность
- Анализ угроз конфиденциальности: Yan et al. (2024) различают пассивные утечки конфиденциальности и активные атаки на конфиденциальность
- Механизмы защиты безопасности: Zhang et al. (2024) предлагают комплексные механизмы защиты от различных уязвимостей
По сравнению с существующими работами, данная статья впервые предоставляет систематическое техническое сравнение и анализ практического развертывания нулевого сохранения данных в основных корпоративных ассистентах ИИ.
- Техническая осуществимость: Salesforce AgentForce и Microsoft Copilot успешно реализуют нулевое сохранение данных
- Архитектурные различия: Trust Layer AgentForce подходит для рабочих процессов, управляемых CRM, интеграция Copilot с Azure лучше подходит для экосистемы Microsoft
- Существуют компромиссы: безгосударственное проектирование приводит к ограничениям памяти многоходовых диалогов и увеличению задержки
- Тенденция отрасли: нулевое сохранение данных становится стандартным ожиданием для корпоративного ИИ
- Методология анализа: анализ на основе документов проектирования, отсутствие эмпирической проверки тестирования
- Охват: в основном сосредоточено на двух платформах, ограниченный анализ других решений
- Динамичность: быстрая эволюция технологии и политики ограничивает актуальность результатов анализа
- Технологические инновации: необходимы более простые и последовательные политики и более сильные гарантии защиты от непредвиденного сохранения данных
- Стандартизация: глобальное согласование стандартов и упрощение конфигурации для поддержки безопасного внедрения на предприятиях
- Механизмы сотрудничества: необходимо сотрудничество между поставщиками технологий, органами регулирования и заинтересованными сторонами предприятия
- Высокая практическая ценность: предоставляет практическое руководство для предприятий при выборе решений ИИ, соответствующих нормативным требованиям
- Комплексный анализ: охватывает несколько измерений, включая техническую архитектуру, соответствие нормативным требованиям, безопасность и удобство использования
- Сильная актуальность: сосредоточено на наиболее популярных в настоящее время продуктах корпоративных ассистентов ИИ
- Четкая структура: логические уровни ясны, легко понять и применить
- Отсутствие эмпирической проверки: в основном опирается на анализ документов, отсутствуют данные фактического тестирования
- Недостаточный количественный анализ: хотя предложена модель R(S), отсутствует конкретная количественная оценка
- Ограниченная техническая глубина: анализ некоторых технических деталей недостаточно глубок
- Отсутствие динамического отслеживания: не учитывает быструю эволюцию технологии и политики на результаты анализа
- Академический вклад: предоставляет новую аналитическую базу для исследований защиты конфиденциальности корпоративного ИИ
- Практическое руководство: предоставляет важный справочный материал для лиц, принимающих решения в области ИТ предприятий, и специалистов по соответствию нормативным требованиям
- Влияние на политику: может повлиять на разработку будущей политики управления ИИ
Особенно применимо для:
- Строго регулируемых отраслей (здравоохранение, финансы)
- Организаций, нуждающихся в выборе решений корпоративного ИИ
- Разработчиков политики управления ИИ и соответствия нормативным требованиям
- Команд разработки продуктов корпоративного ИИ
- Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
- Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
- Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
- Salesforce. (2024). Trusted AI and Agents Impact Report.
- Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.
Данная статья предоставляет важный технический анализ и практическое руководство по защите конфиденциальности данных в корпоративных приложениях ИИ, имеющие значительную практическую ценность в контексте быстрого развития ИИ и ужесточения нормативного регулирования. Хотя в области эмпирической проверки и количественного анализа есть место для улучшения, систематическая сравнительная аналитическая база и практические рекомендации по развертыванию делают эту работу важным справочным материалом в данной области.