2025-11-18T16:46:20.871497

Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products

Gupta, Shrivastava
Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
academic

Нулевое сохранение данных в корпоративных ассистентах на основе LLM: сравнительное исследование ведущих на рынке продуктов агентного ИИ

Основная информация

  • ID статьи: 2510.11558
  • Название: Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products
  • Авторы: Адитья Шривастава (The Governor's Academy), Комал Гупта (The Northcap University)
  • Категория: cs.AI
  • Дата публикации: 2024
  • Ссылка на статью: https://arxiv.org/abs/2510.11558

Аннотация

Данное исследование сосредоточено на политике нулевого сохранения данных в корпоративных системах, поддерживаемых большими языковыми моделями (LLM), особенно в отношении требований управления данными, соответствия нормативным требованиям и конфиденциальности бизнеса в строго регулируемых отраслях, таких как здравоохранение и финансы. С широким развертыванием корпоративных ассистентов ИИ защита приватных данных и обеспечение соответствия нормативным требованиям стали приоритетом. В статье проводится углубленный анализ двух ведущих на рынке продуктов — Salesforce AgentForce и Microsoft Copilot — для изучения технической архитектуры, соответствия нормативным требованиям и компромиссов в области удобства использования политики нулевого сохранения данных.

Исследовательский контекст и мотивация

1. Основная проблема

Центральный вопрос, который решает данное исследование: как реализовать истинное нулевое сохранение данных в корпоративных приложениях LLM, одновременно балансируя требования функциональности, соответствия нормативным требованиям и удобства использования.

2. Важность проблемы

  • Нормативное соответствие: Статья 5 GDPR, HIPAA и SOC 2 требуют минимизации обработки данных
  • Чувствительность отрасли: Суровые штрафы за утечки данных в здравоохранении и финансовом секторе делают защиту конфиденциальности критической необходимостью
  • Корпоративное внедрение: С 2023 года поставщики LLM начали подчеркивать корпоративные функции, причем функция нулевого сохранения стала ключевым дифференциатором
  • Эволюция нормативной базы: Новые нормативные акты, такие как Закон об ИИ ЕС, создают растущий спрос на решения ИИ, соответствующие нормативным требованиям

3. Ограничения существующих подходов

  • Отсутствие систематического сравнительного анализа реализации нулевого сохранения данных в основных корпоративных ассистентах ИИ
  • Недостаточная комплексная оценка архитектурного проектирования, политических обязательств и практических компромиссов
  • Неясное соответствие между технической реализацией и требованиями соответствия нормативным требованиям

4. Исследовательская мотивация

С продолжающейся эволюцией нормативных актов, таких как EU AI Act, понимание этих систем критически важно для предприятий, ищущих решения ИИ, соответствующие нормативным требованиям.

Основные вклады

  1. Определена математическая модель нулевого сохранения данных: предложено количественное определение риска сохранения R(S), обеспечивающее теоретическую основу для оценки безопасности системы
  2. Построена сравнительная аналитическая база: установлена система оценки, охватывающая четыре измерения: архитектуру, соответствие нормативным требованиям, безопасность и удобство использования
  3. Глубокий анализ двух ведущих платформ: детальный анализ различий в технической реализации Salesforce AgentForce и Microsoft Copilot
  4. Предоставлен обзор отрасли: расширенный анализ политики нулевого сохранения данных других поставщиков LLM, включая Anthropic, Google и DeepSeek
  5. Выявлены практические компромиссы развертывания: четко определено влияние безгосударственной обработки на многоходовые диалоги, задержку и зависимость от экосистемы

Подробное описание методологии

Определение задачи

Нулевое сохранение данных требует, чтобы данные пользователя не оставляли никаких следов после взаимодействия. В статье риск сохранения R(S) системы S определяется как вероятность того, что данные продолжают существовать в журналах, кэше или хранилище после обработки. Идеальное состояние R(S) = 0 достигается посредством безгосударственного вывода, при котором каждый запрос обрабатывается независимо, а любой контекст управляется на стороне клиента.

Оценочная база

Исследование применяет четырехмерный метод оценки:

  • Архитектурное измерение: анализ пути потока данных и точек сохранения
  • Политическое измерение: проверка договорных обязательств нулевого сохранения
  • Измерение безопасности: механизмы фильтрации и меры шифрования
  • Измерение удобства использования: влияние нулевого сохранения на функциональность

Технические инновации

  1. Систематический метод сравнения: первое комплексное техническое сравнение нулевого сохранения данных в основных корпоративных ассистентах ИИ
  2. Модель количественной оценки риска: обеспечивает математическое определение и методы оценки риска сохранения
  3. Сквозной анализ: полное отслеживание жизненного цикла данных от ввода к выводу

Экспериментальная установка

Объекты анализа

  • Основные платформы: Salesforce AgentForce, Microsoft Copilot
  • Расширенный анализ: Anthropic Claude, Google Gemini, DeepSeek

Измерения оценки

  • Способ размещения модели
  • Реализация механизма доверия
  • Политика сохранения данных
  • Сертификация соответствия нормативным требованиям
  • Компромиссы в области удобства использования

Методология анализа

Анализ, ориентированный на проектирование, основанный на официальной документации, описаниях технической архитектуры и политических документах, с отслеживанием пути данных и проверкой соответствия GDPR, HIPAA и SOC 2.

Результаты экспериментов

Основные выводы

Техническая архитектура Salesforce AgentForce

  1. Einstein Trust Layer: центральный промежуточный слой, обеспечивающий конфиденциальность и соответствие нормативным требованиям
    • Динамическое заземление: получение данных CRM в реальном времени на основе разрешений пользователя
    • Маскирование данных: замена конфиденциальной информации с использованием регулярных выражений и обнаружения, управляемого метаданными
    • Безгосударственная обработка: протокол нулевого сохранения с поставщиком LLM
  2. Механизмы безопасности:
    • Шифрование передачи TLS, шифрование в покое AES-256
    • Защита от подсказок против атак инъекций
    • Обнаружение токсичности и фильтрация контента
  3. Влияние на производительность: затраты Trust Layer приводят к задержке 200-500 мс

Техническая архитектура Microsoft Copilot

  1. Интеграция Azure OpenAI:
    • Модель размещена внутри Azure, а не в инфраструктуре OpenAI
    • Режим защиты корпоративных данных включен по умолчанию
    • Обработка в изоляции в границах арендатора
  2. Функции безопасности:
    • Двойное шифрование (ключ Azure + управляемый клиентом ключ)
    • Частные конечные точки ограничивают региональные операции
    • Фильтрация контента в реальном времени, без сохранения журналов
  3. Влияние на производительность: задержка заземления 100-300 мс

Результаты сравнительного анализа

ИзмерениеSalesforce AgentForceMicrosoft Copilot
Размещение моделиВызовы API LLM третьей стороныМодель OpenAI, размещенная в Azure
Механизм доверияEinstein Trust LayerИнтеграция Graph и Azure
Сохранение данныхДоговорное нулевое сохранениеПолитика Azure нулевого сохранения
Соответствие нормативным требованиямРазрешения CRM, HIPAA BAAСертификация Azure, GDPR, HIPAA BAA
КомпромиссыЗадержка, зависимость от CRMЗадержка заземления, зависимость от Azure

Анализ других поставщиков

  • Anthropic: предоставляет режим нулевого сохранения для предприятий, автоматическое удаление данных, не относящихся к ZDR, через 30 дней
  • Google Gemini: настраиваемое нулевое сохранение, требует отключения кэширования по умолчанию на 24 часа
  • DeepSeek: не предоставляет нулевое сохранение данных, данные хранятся на серверах в Китае, не соответствует международным требованиям соответствия нормативным требованиям

Связанные работы

Основные направления исследований

  1. Безопасность и конфиденциальность LLM: Yao et al. (2024) анализируют двойственный эффект LLM на конфиденциальность и кибербезопасность
  2. Анализ угроз конфиденциальности: Yan et al. (2024) различают пассивные утечки конфиденциальности и активные атаки на конфиденциальность
  3. Механизмы защиты безопасности: Zhang et al. (2024) предлагают комплексные механизмы защиты от различных уязвимостей

Преимущества данной работы

По сравнению с существующими работами, данная статья впервые предоставляет систематическое техническое сравнение и анализ практического развертывания нулевого сохранения данных в основных корпоративных ассистентах ИИ.

Заключение и обсуждение

Основные выводы

  1. Техническая осуществимость: Salesforce AgentForce и Microsoft Copilot успешно реализуют нулевое сохранение данных
  2. Архитектурные различия: Trust Layer AgentForce подходит для рабочих процессов, управляемых CRM, интеграция Copilot с Azure лучше подходит для экосистемы Microsoft
  3. Существуют компромиссы: безгосударственное проектирование приводит к ограничениям памяти многоходовых диалогов и увеличению задержки
  4. Тенденция отрасли: нулевое сохранение данных становится стандартным ожиданием для корпоративного ИИ

Ограничения

  1. Методология анализа: анализ на основе документов проектирования, отсутствие эмпирической проверки тестирования
  2. Охват: в основном сосредоточено на двух платформах, ограниченный анализ других решений
  3. Динамичность: быстрая эволюция технологии и политики ограничивает актуальность результатов анализа

Будущие направления

  1. Технологические инновации: необходимы более простые и последовательные политики и более сильные гарантии защиты от непредвиденного сохранения данных
  2. Стандартизация: глобальное согласование стандартов и упрощение конфигурации для поддержки безопасного внедрения на предприятиях
  3. Механизмы сотрудничества: необходимо сотрудничество между поставщиками технологий, органами регулирования и заинтересованными сторонами предприятия

Глубокая оценка

Преимущества

  1. Высокая практическая ценность: предоставляет практическое руководство для предприятий при выборе решений ИИ, соответствующих нормативным требованиям
  2. Комплексный анализ: охватывает несколько измерений, включая техническую архитектуру, соответствие нормативным требованиям, безопасность и удобство использования
  3. Сильная актуальность: сосредоточено на наиболее популярных в настоящее время продуктах корпоративных ассистентов ИИ
  4. Четкая структура: логические уровни ясны, легко понять и применить

Недостатки

  1. Отсутствие эмпирической проверки: в основном опирается на анализ документов, отсутствуют данные фактического тестирования
  2. Недостаточный количественный анализ: хотя предложена модель R(S), отсутствует конкретная количественная оценка
  3. Ограниченная техническая глубина: анализ некоторых технических деталей недостаточно глубок
  4. Отсутствие динамического отслеживания: не учитывает быструю эволюцию технологии и политики на результаты анализа

Влияние

  1. Академический вклад: предоставляет новую аналитическую базу для исследований защиты конфиденциальности корпоративного ИИ
  2. Практическое руководство: предоставляет важный справочный материал для лиц, принимающих решения в области ИТ предприятий, и специалистов по соответствию нормативным требованиям
  3. Влияние на политику: может повлиять на разработку будущей политики управления ИИ

Применимые сценарии

Особенно применимо для:

  • Строго регулируемых отраслей (здравоохранение, финансы)
  • Организаций, нуждающихся в выборе решений корпоративного ИИ
  • Разработчиков политики управления ИИ и соответствия нормативным требованиям
  • Команд разработки продуктов корпоративного ИИ

Библиография

  1. Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
  2. Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
  3. Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
  4. Salesforce. (2024). Trusted AI and Agents Impact Report.
  5. Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.

Данная статья предоставляет важный технический анализ и практическое руководство по защите конфиденциальности данных в корпоративных приложениях ИИ, имеющие значительную практическую ценность в контексте быстрого развития ИИ и ужесточения нормативного регулирования. Хотя в области эмпирической проверки и количественного анализа есть место для улучшения, систематическая сравнительная аналитическая база и практические рекомендации по развертыванию делают эту работу важным справочным материалом в данной области.