Governance of data, compliance, and business privacy matters, particularly for healthcare and finance businesses. Since the recent emergence of AI enterprise AI assistants enhancing business productivity, safeguarding private data and compliance is now a priority. With the implementation of AI assistants across the enterprise, the zero data retention can be achieved by implementing zero data retention policies by Large Language Model businesses like Open AI and Anthropic and Meta. In this work, we explore zero data retention policies for the Enterprise apps of large language models (LLMs). Our key contribution is defining the architectural, compliance, and usability trade-offs of such systems in parallel. In this research work, we examine the development of commercial AI assistants with two industry leaders and market titans in this arena - Salesforce and Microsoft. Both of these companies used distinct technical architecture to support zero data retention policies. Salesforce AgentForce and Microsoft Copilot are among the leading AI assistants providing much-needed push to business productivity in customer care. The purpose of this paper is to analyze the technical architecture and deployment of zero data retention policy by consuming applications as well as big language models service providers like Open Ai, Anthropic, and Meta.
- ID del Artículo: 2510.11558
- Título: Zero Data Retention in LLM-based Enterprise AI Assistants: A Comparative Study of Market Leading Agentic AI Products
- Autores: Aditya Shrivastava (The Governor's Academy), Komal Gupta (The Northcap University)
- Clasificación: cs.AI
- Fecha de Publicación: 2024
- Enlace del Artículo: https://arxiv.org/abs/2510.11558
Esta investigación se enfoca en las políticas de retención cero de datos en sistemas de asistentes de inteligencia artificial basados en modelos de lenguaje grande (LLM) a nivel empresarial, particularmente dirigida a los requisitos de gobernanza de datos, cumplimiento normativo y privacidad empresarial en industrias estrictamente reguladas como la atención médica y las finanzas. Con el despliegue generalizado de asistentes de IA empresarial, la protección de datos privados y la garantía de cumplimiento se han convertido en prioridades. Este artículo explora la arquitectura técnica, el cumplimiento normativo y los compromisos de usabilidad de las políticas de retención cero mediante un análisis profundo de dos productos líderes en el mercado: Salesforce AgentForce y Microsoft Copilot.
El problema central que esta investigación aborda es: ¿Cómo implementar una verdadera retención cero de datos en aplicaciones LLM a nivel empresarial, mientras se equilibran los requisitos de funcionalidad, cumplimiento normativo y usabilidad?
- Cumplimiento Regulatorio: Regulaciones como el Artículo 5 del GDPR, HIPAA y SOC 2 requieren minimización del procesamiento de datos
- Sensibilidad Sectorial: Las industrias de atención médica y finanzas enfrentan sanciones severas por filtraciones de datos, lo que hace que la protección de privacidad sea una necesidad crítica
- Adopción Empresarial: Desde 2023, los proveedores de LLM han comenzado a enfatizar funcionalidades a nivel empresarial, siendo la característica de retención cero un factor de diferenciación clave
- Evolución Regulatoria: Nuevas regulaciones como la Ley de IA de la Unión Europea generan una demanda creciente de soluciones de IA conformes
- Falta de análisis comparativo sistemático de la implementación de retención cero en asistentes de IA empresarial convencionales
- Evaluación insuficiente de la arquitectura de diseño, compromisos políticos y compensaciones prácticas
- Mapeo poco claro entre la implementación técnica y los requisitos de cumplimiento
Con la evolución continua de regulaciones como la Ley de IA de la UE, comprender estos sistemas es crucial para empresas que buscan soluciones de IA conformes.
- Definición de un Modelo Matemático de Retención Cero: Propone una definición cuantificada del riesgo de retención R(S), proporcionando una base teórica para evaluar la seguridad del sistema
- Construcción de un Marco de Análisis Comparativo: Establece un sistema de evaluación que abarca cuatro dimensiones: arquitectura, cumplimiento normativo, seguridad y usabilidad
- Análisis Profundo de Dos Plataformas Principales: Analiza en detalle las diferencias de implementación técnica entre Salesforce AgentForce y Microsoft Copilot
- Proporciona una Panorámica Sectorial: Amplía el análisis a otras estrategias de retención cero de proveedores de LLM como Anthropic, Google y DeepSeek
- Identifica Compromisos de Despliegue Real: Clarifica el impacto del procesamiento sin estado en conversaciones multitumo, latencia y dependencias del ecosistema
La retención cero de datos requiere que los datos del usuario no dejen rastro alguno después de la interacción. Este artículo define el riesgo de retención R(S) de un sistema S como la probabilidad de que los datos persistan en registros, cachés o almacenamiento después del procesamiento. El estado ideal R(S) = 0 se logra mediante razonamiento sin estado, donde cada solicitud se procesa de forma independiente y cualquier contexto se gestiona en el cliente.
La investigación utiliza un método de evaluación de cuatro dimensiones:
- Dimensión Arquitectónica: Análisis de rutas de flujo de datos y puntos de retención
- Dimensión Política: Revisión de obligaciones contractuales de retención cero
- Dimensión de Seguridad: Mecanismos de filtrado y medidas de cifrado
- Dimensión de Usabilidad: Impacto de la retención cero en la funcionalidad
- Método de Comparación Sistemática: Primera comparación técnica integral de retención cero en asistentes de IA empresarial convencionales
- Modelo de Cuantificación de Riesgos: Proporciona una definición matemática y método de evaluación del riesgo de retención
- Análisis de Extremo a Extremo: Seguimiento del ciclo de vida completo desde la entrada de datos hasta la salida
- Plataformas Principales: Salesforce AgentForce, Microsoft Copilot
- Análisis Extendido: Anthropic Claude, Google Gemini, DeepSeek
- Modo de alojamiento del modelo
- Implementación de mecanismos de confianza
- Estrategia de retención de datos
- Certificaciones de cumplimiento
- Compromisos de usabilidad
Análisis orientado al diseño basado en documentación oficial, descripciones de arquitectura técnica y archivos de políticas, rastreando rutas de datos y verificando cumplimiento con GDPR, HIPAA y SOC 2.
- Einstein Trust Layer: Capa intermedia central que garantiza privacidad y cumplimiento
- Fundamentación Dinámica: Recuperación de datos CRM en tiempo real basada en permisos de usuario
- Enmascaramiento de Datos: Detección y sustitución de información sensible mediante expresiones regulares y metadatos
- Procesamiento Sin Estado: Protocolo de retención cero con proveedores de LLM
- Mecanismos de Seguridad:
- Cifrado de transporte TLS, cifrado estático AES-256
- Defensa de solicitudes contra ataques de inyección
- Detección de toxicidad y filtrado de contenido
- Impacto en el Rendimiento: La sobrecarga de Trust Layer causa latencia de 200-500ms
- Integración de Azure OpenAI:
- Modelo alojado internamente en Azure, no en infraestructura de OpenAI
- Modo de protección de datos empresarial habilitado por defecto
- Procesamiento aislado dentro de límites de inquilino
- Características de Seguridad:
- Cifrado dual (clave de Azure + clave administrada por cliente)
- Puntos finales privados que restringen operaciones regionales
- Filtrado de contenido en tiempo real, sin retención de registros
- Impacto en el Rendimiento: Latencia de fundamentación de 100-300ms
| Dimensión | Salesforce AgentForce | Microsoft Copilot |
|---|
| Alojamiento del Modelo | Llamadas API de LLM de terceros | Modelo OpenAI alojado en Azure |
| Mecanismo de Confianza | Einstein Trust Layer | Integración de Graph y Azure |
| Retención de Datos | Retención cero contractual | Retención cero por política de Azure |
| Cumplimiento | Permisos CRM, BAA HIPAA | Certificaciones de Azure, GDPR, BAA HIPAA |
| Compromisos | Latencia, dependencia de CRM | Latencia de fundamentación, dependencia de Azure |
- Anthropic: Proporciona modo de retención cero empresarial, eliminación automática de datos no-ZDR después de 30 días
- Google Gemini: Retención cero configurable, requiere desactivar caché predeterminado de 24 horas
- DeepSeek: No proporciona retención cero de datos, datos almacenados en servidores chinos, no cumple con requisitos de cumplimiento internacional
- Seguridad y Privacidad de LLM: Yao et al. (2024) analiza los efectos duales de LLM en privacidad y ciberseguridad
- Análisis de Amenazas a la Privacidad: Yan et al. (2024) distingue entre filtraciones de privacidad pasivas y ataques de privacidad activos
- Mecanismos de Protección de Seguridad: Zhang et al. (2024) propone mecanismos de defensa integral contra diversos tipos de vulnerabilidades
En comparación con trabajos existentes, este artículo proporciona por primera vez una comparación técnica sistemática de retención cero en asistentes de IA empresarial convencionales y análisis de despliegue práctico.
- Viabilidad Técnica: Tanto Salesforce AgentForce como Microsoft Copilot han implementado exitosamente retención cero de datos
- Diferencias Arquitectónicas: El Einstein Trust Layer de AgentForce es adecuado para flujos de trabajo impulsados por CRM, mientras que la integración de Azure de Copilot se adapta mejor al ecosistema de Microsoft
- Existencia de Compromisos: El diseño sin estado genera limitaciones en la memoria de conversaciones multitumo e incremento de latencia
- Tendencia Sectorial: La retención cero de datos se está convirtiendo en una expectativa estándar de la IA empresarial
- Método de Análisis: Análisis basado en documentos de diseño, carece de verificación mediante pruebas empíricas
- Alcance de Cobertura: Se enfoca principalmente en dos plataformas, análisis limitado de otras soluciones
- Naturaleza Dinámica: La rápida evolución de tecnología y políticas limita la vigencia temporal de los resultados del análisis
- Innovación Técnica: Se necesitan políticas más simples y consistentes, así como garantías más sólidas contra retención de datos inesperada
- Estandarización: Alineación de estándares globales y simplificación de configuración para apoyar la adopción segura empresarial
- Mecanismos de Colaboración: Necesidad de cooperación entre proveedores de tecnología, organismos reguladores y partes interesadas empresariales
- Alto Valor Práctico: Proporciona orientación práctica para que las empresas seleccionen soluciones de IA conformes
- Análisis Integral: Abarca múltiples dimensiones incluyendo arquitectura técnica, cumplimiento normativo, seguridad y usabilidad
- Fuerte Actualidad: Se enfoca en productos de asistentes de IA empresarial más populares actualmente
- Estructura Clara: Jerarquía lógica clara, fácil de entender y aplicar
- Falta de Verificación Empírica: Se basa principalmente en análisis de documentación, carece de datos de pruebas reales
- Análisis Cuantitativo Insuficiente: Aunque propone el modelo R(S), carece de evaluación cuantitativa específica
- Profundidad Técnica Limitada: El análisis de ciertos detalles técnicos aún no es lo suficientemente profundo
- Falta de Seguimiento Dinámico: No considera el impacto de la rápida evolución de tecnología y políticas en los resultados del análisis
- Contribución Académica: Proporciona un nuevo marco de análisis para la investigación de protección de privacidad en IA empresarial
- Orientación Práctica: Proporciona referencias importantes para tomadores de decisiones de TI empresarial y oficiales de cumplimiento
- Impacto en Políticas: Puede influir en la formulación de futuras políticas de gobernanza de IA
Particularmente aplicable a:
- Industrias bajo regulación estricta (atención médica, finanzas)
- Organizaciones que necesitan seleccionar soluciones de IA empresarial
- Formuladores de políticas de gobernanza y cumplimiento de IA
- Equipos de desarrollo de productos de IA empresarial
- Yao, Y. et al. (2024). A Survey on Large Language Model (LLM) Security and Privacy: The Good, The Bad, and The Ugly.
- Yan, B. et al. (2024). On Protecting the Data Privacy of Large Language Models (LLMs) and LLM Agents: A Literature Review.
- Zhang, R. et al. (2024). On Large Language Models Safety, Security, and Privacy: A Survey.
- Salesforce. (2024). Trusted AI and Agents Impact Report.
- Microsoft. (2024). Data, privacy, and security for Azure OpenAI Service.
Este artículo proporciona un análisis técnico importante y orientación práctica para la protección de privacidad de datos en aplicaciones de IA a nivel empresarial. En el contexto actual de rápido desarrollo de IA y regulación cada vez más estricta, posee un significado práctico importante. Aunque hay espacio para mejora en verificación empírica y análisis cuantitativo, su marco de análisis comparativo sistemático y recomendaciones de despliegue prácticas lo convierten en una referencia importante en este campo.