2025-11-18T16:46:20.871497

Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products

Gupta, Shrivastava
Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
academic

LLMベースのエンタープライズAIアシスタントにおけるゼロデータ保持:市場主導的エージェンティックAI製品の比較研究

基本情報

  • 論文ID: 2510.11558
  • タイトル: Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products
  • 著者: Aditya Shrivastava (The Governor's Academy)、Komal Gupta (The Northcap University)
  • 分類: cs.AI
  • 発表年: 2024年
  • 論文リンク: https://arxiv.org/abs/2510.11558

要約

本研究は、エンタープライズレベルの大規模言語モデル(LLM)支援システムにおけるゼロデータ保持ポリシーに焦点を当てており、特に医療およ び金融などの厳格に規制された業界のデータガバナンス、コンプライアンス、およびビジネスプライバシー要件を対象としています。エンタープライズAIアシスタントの広範な展開に伴い、プライベートデータの保護とコンプライアンスの確保が優先事項となっています。本論文は、市場をリードするSalesforce AgentForceとMicrosoft Copilotの2つの製品の詳細な分析を通じて、ゼロデータ保持ポリシーの技術アーキテクチャ、コンプライアンス、および利用可能性のトレードオフについて検討しています。

研究背景と動機

1. 核心的な問題

本研究が解決しようとする核心的な問題は、機能性、コンプライアンス、および利用可能性の要件のバランスを取りながら、エンタープライズレベルのLLMアプリケーションで真のゼロデータ保持をどのように実現するかです。

2. 問題の重要性

  • 規制コンプライアンス: GDPR第5条、HIPAA、SOC 2などの規制は、データの最小化処理を要求しています
  • 業界の機密性: 医療およ び金融業界におけるデータ漏洩に対する厳しい罰則により、プライバシー保護が必須要件となっています
  • エンタープライズ採用: 2023年以降、LLMプロバイダーはエンタープライズレベルの機能を強調し始め、ゼロ保持機能が重要な差別化要因となっています
  • 規制の進化: EU AI法などの新興規制により、コンプライアント なAIソリューションの需要が増加しています

3. 既存アプローチの限界

  • 主流エンタープライズAIアシスタントのゼロデータ保持実装に関する体系的な比較分析が不足しています
  • アーキテクチャ設計、ポリシーコミットメント、および実際のトレードオフの包括的な評価が不十分です
  • 技術実装と規制要件間のマッピング関係が明確ではありません

4. 研究の動機

EU AI法などの規制が継続的に進化する中で、これらのシステムを理解することは、コンプライアント なAIソリューションを求める企業にとって重要です。

核心的な貢献

  1. ゼロデータ保持の数学モデルの定義: 保持リスクR(S)の定量的定義を提案し、システムセキュリティ評価の理論的基礎を提供しています
  2. 比較分析フレームワークの構築: アーキテクチャ、コンプライアンス、セキュリティ、および利用可能性の4つの次元を含む評価体系を確立しています
  3. 2つの主流プラットフォームの詳細分析: Salesforce AgentForceとMicrosoft Copilotの技術実装の違いを詳細に分析しています
  4. 業界全体の展望の提供: Anthropic、Google、DeepSeekなど他のLLMプロバイダーのゼロデータ保持戦略の拡張分析を行っています
  5. 実際の展開トレードオフの特定: ステートレス処理が多ターン対話、レイテンシ、およびエコシステム依存性に与える影響を明確にしています

方法論の詳細

タスク定義

ゼロデータ保持は、ユーザーデータがインタラクション後に痕跡を残さないことを要求しています。本論文は、システムSの保持リスクR(S)を、ログ、キャッシュ、またはストレージ内で処理後にデータが存続する可能性として定義しています。理想的な状態R(S) = 0はステートレス推論を通じて実現され、各リクエストは独立して処理され、すべてのコンテキストはクライアント側で管理されます。

評価フレームワーク

研究は4次元の評価方法を採用しています:

  • アーキテクチャ次元: データフロー経路と保持ポイント分析
  • ポリシー次元: 契約上のゼロ保持義務のレビュー
  • セキュリティ次元: フィルタリング機構と暗号化措置
  • 利用可能性次元: ゼロ保持が機能に与える影響

技術的革新点

  1. 体系的な比較方法: 主流エンタープライズAIアシスタントのゼロデータ保持に関する初の包括的な技術比較
  2. リスク定量化モデル: 保持リスクの数学的定義と評価方法を提供しています
  3. エンドツーエンド分析: データ入力から出力までの完全なライフサイクル追跡

実験設定

分析対象

  • 主要プラットフォーム: Salesforce AgentForce、Microsoft Copilot
  • 拡張分析: Anthropic Claude、Google Gemini、DeepSeek

評価次元

  • モデルホスティング方式
  • トラストメカニズムの実装
  • データ保持ポリシー
  • コンプライアンス認証
  • 利用可能性のトレードオフ

分析方法

公式ドキュメント、技術アーキテクチャ説明、およびポリシー文書に基づく設計指向分析、データパスの追跡、およびGDPR、HIPAA、SOC 2コンプライアンスの検査。

実験結果

主要な発見

Salesforce AgentForceの技術アーキテクチャ

  1. Einstein Trust Layer: プライバシーとコンプライアンスを保証するコア中間層
    • 動的グラウンディング: ユーザー権限に基づくリアルタイムCRMデータ検索
    • データマスキング: 正規表現とメタデータ駆動検出による機密情報の置換
    • ステートレス処理: LLMプロバイダーとのゼロ保持プロトコル
  2. セキュリティ機構:
    • TLS転送暗号化、AES-256静止暗号化
    • インジェクション攻撃に対するプロンプト防御
    • 毒性検出とコンテンツフィルタリング
  3. パフォーマンスへの影響: Trust Layerのオーバーヘッドにより200~500msのレイテンシが発生

Microsoft Copilotの技術アーキテクチャ

  1. Azure OpenAI統合:
    • モデルはOpenAIインフラストラクチャではなくAzure内部でホストされています
    • エンタープライズデータ保護モードがデフォルトで有効化されています
    • テナント境界内での分離処理
  2. セキュリティ機能:
    • 二重暗号化(Azureキー+顧客管理キー)
    • プライベートエンドポイントによる地域操作の制限
    • リアルタイムコンテンツフィルタリング、ログ保持なし
  3. パフォーマンスへの影響: グラウンディングレイテンシ100~300ms

比較分析結果

次元Salesforce AgentForceMicrosoft Copilot
モデルホスティングサードパーティLLM API呼び出しAzureホスト型OpenAIモデル
トラストメカニズムEinstein Trust LayerGraphおよびAzure統合
データ保持契約上のゼロ保持Azureポリシーゼロ保持
コンプライアンスCRM権限、HIPAA BAAAzure認証、GDPR、HIPAA BAA
トレードオフレイテンシ、CRM依存グラウンディングレイテンシ、Azure依存

その他のプロバイダー分析

  • Anthropic: エンタープライズゼロ保持モード提供、30日後に非ZDRデータを自動削除
  • Google Gemini: 設定可能なゼロ保持、デフォルト24時間キャッシュを無効化する必要あり
  • DeepSeek: ゼロデータ保持を提供していない、データは中国サーバーに保存、国際的なコンプライアンス要件を満たしていない

関連研究

主要な研究方向

  1. LLMプライバシーセキュリティ: Yao et al. (2024)はLLMのプライバシーおよびサイバーセキュリティにおける二重効果を分析しています
  2. プライバシー脅威分析: Yan et al. (2024)は受動的プライバシー漏洩と能動的プライバシー攻撃を区別しています
  3. セキュリティ防御メカニズム: Zhang et al. (2024)は各種脆弱性に対する包括的な防御メカニズムを提案しています

本論文の優位性

既存研究と比較して、本論文は主流エンタープライズAIアシスタントのゼロデータ保持に関する初の体系的な技術比較と実際の展開分析を提供しています。

結論と考察

主要な結論

  1. 技術的実現可能性: Salesforce AgentForceとMicrosoft Copilotはいずれもゼロデータ保持を成功裏に実装しています
  2. アーキテクチャの相違: AgentForceのTrust LayerはCRM駆動ワークフローに適しており、CopilotのAzure統合はMicrosoftエコシステムにより適しています
  3. トレードオフの存在: ステートレス設計により、多ターン対話メモリの制限とレイテンシの増加が生じます
  4. 業界トレンド: ゼロデータ保持はエンタープライズAIの標準的な期待となりつつあります

限界

  1. 分析方法: 設計ドキュメントに基づく分析であり、実証的検証が不足しています
  2. カバレッジ範囲: 主に2つのプラットフォームに焦点を当てており、他のソリューションの分析は限定的です
  3. 動的性: 技術とポリシーの急速な進化により、分析結果の時効性が制限されます

今後の方向性

  1. 技術革新: より単純で一貫したポリシーと、より強力な予期しないデータ保持保障が必要です
  2. 標準化: グローバル標準の調整と設定の簡素化により、エンタープライズセキュア採用をサポートします
  3. 協力メカニズム: 技術ベンダー、規制当局、およびエンタープライズ利害関係者間の協力が必要です

深度評価

利点

  1. 実用的価値が高い: エンタープライズがコンプライアント なAIソリューションを選択する際の実用的なガイダンスを提供しています
  2. 分析が包括的: 技術アーキテクチャ、コンプライアンス、セキュリティ、および利用可能性の複数の次元をカバーしています
  3. 時効性が強い: 現在最もホットなエンタープライズAIアシスタント製品に注目しています
  4. 構造が明確: 論理階層が明確で、理解と応用が容易です

不足点

  1. 実証的検証の欠如: 主にドキュメント分析に依存しており、実際のテストデータが不足しています
  2. 定量分析の不足: R(S)モデルが提案されていますが、具体的な定量評価が不足しています
  3. 技術的深さの限界: 特定の技術詳細の分析がまだ十分ではありません
  4. 動的追跡の欠落: 技術とポリシーの急速な進化が分析結果に与える影響を考慮していません

影響力

  1. 学術的貢献: エンタープライズAIプライバシー保護研究に新しい分析フレームワークを提供しています
  2. 実践的ガイダンス: エンタープライズIT意思決定者とコンプライアンス責任者に重要な参考情報を提供しています
  3. ポリシーへの影響: 将来のAIガバナンスポリシー策定に影響を与える可能性があります

適用シーン

特に以下に適しています:

  • 厳格に規制された業界(医療、金融)
  • エンタープライズAIソリューションを選択する必要のある組織
  • AIガバナンスとコンプライアンスポリシー策定者
  • エンタープライズAI製品開発チーム

参考文献

  1. Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
  2. Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
  3. Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
  4. Salesforce. (2024). Trusted AI and Agents Impact Report.
  5. Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.

本論文は、エンタープライズレベルのAIアプリケーションにおけるデータプライバシー保護に対する重要な技術分析と実践的ガイダンスを提供しており、現在のAIの急速な発展と規制の厳格化が進む背景の下で、重要な現実的意義を持っています。実証的検証と定量分析の面でまだ改善の余地がありますが、その体系的な比較分析フレームワークと実用的な展開提案により、本論文は当該分野の重要な参考文献となっています。