2025-11-18T16:46:20.871497

Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products

Gupta, Shrivastava

Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.

academic

Retención Cero de Datos en Asistentes de IA Empresarial Basados en LLM: Un Estudio Comparativo de Productos de IA Agéntica Líderes en el Mercado

Información Básica

ID del Artículo: 2510.11558
Título: Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products
Autores: Aditya Shrivastava (The Governor's Academy), Komal Gupta (The Northcap University)
Clasificación: cs.AI
Fecha de Publicación: 2024
Enlace del Artículo: https://arxiv.org/abs/2510.11558

Resumen

Esta investigación se enfoca en las políticas de retención cero de datos en sistemas de asistentes de inteligencia artificial basados en modelos de lenguaje grande (LLM) a nivel empresarial, particularmente dirigida a los requisitos de gobernanza de datos, cumplimiento normativo y privacidad empresarial en industrias estrictamente reguladas como la atención médica y las finanzas. Con el despliegue generalizado de asistentes de IA empresarial, la protección de datos privados y la garantía de cumplimiento se han convertido en prioridades. Este artículo explora la arquitectura técnica, el cumplimiento normativo y los compromisos de usabilidad de las políticas de retención cero mediante un análisis profundo de dos productos líderes en el mercado: Salesforce AgentForce y Microsoft Copilot.

Antecedentes de Investigación y Motivación

1. Problema Central

El problema central que esta investigación aborda es: ¿Cómo implementar una verdadera retención cero de datos en aplicaciones LLM a nivel empresarial, mientras se equilibran los requisitos de funcionalidad, cumplimiento normativo y usabilidad?

2. Importancia del Problema

Cumplimiento Regulatorio: Regulaciones como el Artículo 5 del GDPR, HIPAA y SOC 2 requieren minimización del procesamiento de datos
Sensibilidad Sectorial: Las industrias de atención médica y finanzas enfrentan sanciones severas por filtraciones de datos, lo que hace que la protección de privacidad sea una necesidad crítica
Adopción Empresarial: Desde 2023, los proveedores de LLM han comenzado a enfatizar funcionalidades a nivel empresarial, siendo la característica de retención cero un factor de diferenciación clave
Evolución Regulatoria: Nuevas regulaciones como la Ley de IA de la Unión Europea generan una demanda creciente de soluciones de IA conformes

3. Limitaciones de Métodos Existentes

Falta de análisis comparativo sistemático de la implementación de retención cero en asistentes de IA empresarial convencionales
Evaluación insuficiente de la arquitectura de diseño, compromisos políticos y compensaciones prácticas
Mapeo poco claro entre la implementación técnica y los requisitos de cumplimiento

4. Motivación de la Investigación

Con la evolución continua de regulaciones como la Ley de IA de la UE, comprender estos sistemas es crucial para empresas que buscan soluciones de IA conformes.

Contribuciones Principales

Definición de un Modelo Matemático de Retención Cero: Propone una definición cuantificada del riesgo de retención R(S), proporcionando una base teórica para evaluar la seguridad del sistema
Construcción de un Marco de Análisis Comparativo: Establece un sistema de evaluación que abarca cuatro dimensiones: arquitectura, cumplimiento normativo, seguridad y usabilidad
Análisis Profundo de Dos Plataformas Principales: Analiza en detalle las diferencias de implementación técnica entre Salesforce AgentForce y Microsoft Copilot
Proporciona una Panorámica Sectorial: Amplía el análisis a otras estrategias de retención cero de proveedores de LLM como Anthropic, Google y DeepSeek
Identifica Compromisos de Despliegue Real: Clarifica el impacto del procesamiento sin estado en conversaciones multitumo, latencia y dependencias del ecosistema

Explicación Detallada de la Metodología

Definición de Tareas

La retención cero de datos requiere que los datos del usuario no dejen rastro alguno después de la interacción. Este artículo define el riesgo de retención R(S) de un sistema S como la probabilidad de que los datos persistan en registros, cachés o almacenamiento después del procesamiento. El estado ideal R(S) = 0 se logra mediante razonamiento sin estado, donde cada solicitud se procesa de forma independiente y cualquier contexto se gestiona en el cliente.

Marco de Evaluación

La investigación utiliza un método de evaluación de cuatro dimensiones:

Dimensión Arquitectónica: Análisis de rutas de flujo de datos y puntos de retención
Dimensión Política: Revisión de obligaciones contractuales de retención cero
Dimensión de Seguridad: Mecanismos de filtrado y medidas de cifrado
Dimensión de Usabilidad: Impacto de la retención cero en la funcionalidad

Puntos de Innovación Técnica

Método de Comparación Sistemática: Primera comparación técnica integral de retención cero en asistentes de IA empresarial convencionales
Modelo de Cuantificación de Riesgos: Proporciona una definición matemática y método de evaluación del riesgo de retención
Análisis de Extremo a Extremo: Seguimiento del ciclo de vida completo desde la entrada de datos hasta la salida

Configuración Experimental

Objetos de Análisis

Plataformas Principales: Salesforce AgentForce, Microsoft Copilot
Análisis Extendido: Anthropic Claude, Google Gemini, DeepSeek

Dimensiones de Evaluación

Modo de alojamiento del modelo
Implementación de mecanismos de confianza
Estrategia de retención de datos
Certificaciones de cumplimiento
Compromisos de usabilidad

Método de Análisis

Análisis orientado al diseño basado en documentación oficial, descripciones de arquitectura técnica y archivos de políticas, rastreando rutas de datos y verificando cumplimiento con GDPR, HIPAA y SOC 2.

Resultados Experimentales

Hallazgos Principales

Arquitectura Técnica de Salesforce AgentForce

Einstein Trust Layer: Capa intermedia central que garantiza privacidad y cumplimiento
- Fundamentación Dinámica: Recuperación de datos CRM en tiempo real basada en permisos de usuario
- Enmascaramiento de Datos: Detección y sustitución de información sensible mediante expresiones regulares y metadatos
- Procesamiento Sin Estado: Protocolo de retención cero con proveedores de LLM
Mecanismos de Seguridad:
- Cifrado de transporte TLS, cifrado estático AES-256
- Defensa de solicitudes contra ataques de inyección
- Detección de toxicidad y filtrado de contenido
Impacto en el Rendimiento: La sobrecarga de Trust Layer causa latencia de 200-500ms

Arquitectura Técnica de Microsoft Copilot

Integración de Azure OpenAI:
- Modelo alojado internamente en Azure, no en infraestructura de OpenAI
- Modo de protección de datos empresarial habilitado por defecto
- Procesamiento aislado dentro de límites de inquilino
Características de Seguridad:
- Cifrado dual (clave de Azure + clave administrada por cliente)
- Puntos finales privados que restringen operaciones regionales
- Filtrado de contenido en tiempo real, sin retención de registros
Impacto en el Rendimiento: Latencia de fundamentación de 100-300ms

Resultados del Análisis Comparativo

Dimensión	Salesforce AgentForce	Microsoft Copilot
Alojamiento del Modelo	Llamadas API de LLM de terceros	Modelo OpenAI alojado en Azure
Mecanismo de Confianza	Einstein Trust Layer	Integración de Graph y Azure
Retención de Datos	Retención cero contractual	Retención cero por política de Azure
Cumplimiento	Permisos CRM, BAA HIPAA	Certificaciones de Azure, GDPR, BAA HIPAA
Compromisos	Latencia, dependencia de CRM	Latencia de fundamentación, dependencia de Azure

Análisis de Otros Proveedores

Anthropic: Proporciona modo de retención cero empresarial, eliminación automática de datos no-ZDR después de 30 días
Google Gemini: Retención cero configurable, requiere desactivar caché predeterminado de 24 horas
DeepSeek: No proporciona retención cero de datos, datos almacenados en servidores chinos, no cumple con requisitos de cumplimiento internacional

Trabajo Relacionado

Principales Direcciones de Investigación

Seguridad y Privacidad de LLM: Yao et al. (2024) analiza los efectos duales de LLM en privacidad y ciberseguridad
Análisis de Amenazas a la Privacidad: Yan et al. (2024) distingue entre filtraciones de privacidad pasivas y ataques de privacidad activos
Mecanismos de Protección de Seguridad: Zhang et al. (2024) propone mecanismos de defensa integral contra diversos tipos de vulnerabilidades

Ventajas de Este Artículo

En comparación con trabajos existentes, este artículo proporciona por primera vez una comparación técnica sistemática de retención cero en asistentes de IA empresarial convencionales y análisis de despliegue práctico.

Conclusiones y Discusión

Conclusiones Principales

Viabilidad Técnica: Tanto Salesforce AgentForce como Microsoft Copilot han implementado exitosamente retención cero de datos
Diferencias Arquitectónicas: El Einstein Trust Layer de AgentForce es adecuado para flujos de trabajo impulsados por CRM, mientras que la integración de Azure de Copilot se adapta mejor al ecosistema de Microsoft
Existencia de Compromisos: El diseño sin estado genera limitaciones en la memoria de conversaciones multitumo e incremento de latencia
Tendencia Sectorial: La retención cero de datos se está convirtiendo en una expectativa estándar de la IA empresarial

Limitaciones

Método de Análisis: Análisis basado en documentos de diseño, carece de verificación mediante pruebas empíricas
Alcance de Cobertura: Se enfoca principalmente en dos plataformas, análisis limitado de otras soluciones
Naturaleza Dinámica: La rápida evolución de tecnología y políticas limita la vigencia temporal de los resultados del análisis

Direcciones Futuras

Innovación Técnica: Se necesitan políticas más simples y consistentes, así como garantías más sólidas contra retención de datos inesperada
Estandarización: Alineación de estándares globales y simplificación de configuración para apoyar la adopción segura empresarial
Mecanismos de Colaboración: Necesidad de cooperación entre proveedores de tecnología, organismos reguladores y partes interesadas empresariales

Evaluación Profunda

Fortalezas

Alto Valor Práctico: Proporciona orientación práctica para que las empresas seleccionen soluciones de IA conformes
Análisis Integral: Abarca múltiples dimensiones incluyendo arquitectura técnica, cumplimiento normativo, seguridad y usabilidad
Fuerte Actualidad: Se enfoca en productos de asistentes de IA empresarial más populares actualmente
Estructura Clara: Jerarquía lógica clara, fácil de entender y aplicar

Insuficiencias

Falta de Verificación Empírica: Se basa principalmente en análisis de documentación, carece de datos de pruebas reales
Análisis Cuantitativo Insuficiente: Aunque propone el modelo R(S), carece de evaluación cuantitativa específica
Profundidad Técnica Limitada: El análisis de ciertos detalles técnicos aún no es lo suficientemente profundo
Falta de Seguimiento Dinámico: No considera el impacto de la rápida evolución de tecnología y políticas en los resultados del análisis

Impacto

Contribución Académica: Proporciona un nuevo marco de análisis para la investigación de protección de privacidad en IA empresarial
Orientación Práctica: Proporciona referencias importantes para tomadores de decisiones de TI empresarial y oficiales de cumplimiento
Impacto en Políticas: Puede influir en la formulación de futuras políticas de gobernanza de IA

Escenarios Aplicables

Particularmente aplicable a:

Industrias bajo regulación estricta (atención médica, finanzas)
Organizaciones que necesitan seleccionar soluciones de IA empresarial
Formuladores de políticas de gobernanza y cumplimiento de IA
Equipos de desarrollo de productos de IA empresarial

Referencias

Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
Salesforce. (2024). Trusted AI and Agents Impact Report.
Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.

Este artículo proporciona un análisis técnico importante y orientación práctica para la protección de privacidad de datos en aplicaciones de IA a nivel empresarial. En el contexto actual de rápido desarrollo de IA y regulación cada vez más estricta, posee un significado práctico importante. Aunque hay espacio para mejora en verificación empírica y análisis cuantitativo, su marco de análisis comparativo sistemático y recomendaciones de despliegue prácticas lo convierten en una referencia importante en este campo.