We quantify the impact of Generative Artificial Intelligence (GenAI) on firm productivity through a series of large-scale randomized field experiments involving millions of users and products at a leading cross-border online retail platform. Over six months in 2023-2024, GenAI-based enhancements were integrated into seven consumer-facing business workflows. We find that GenAI adoption significantly increases sales, with treatment effects ranging from 0\% to 16.3\%, depending on GenAI's marginal contribution relative to existing firm practices. Because inputs and prices were held constant across experimental arms, these gains map directly into total factor productivity improvements. Across the four GenAI applications with positive effects, the implied annual incremental value is approximately \$5 per consumer-an economically meaningful impact given the retailer's scale and the early stage of GenAI adoption. The primary mechanism operates through higher conversion rates, consistent with GenAI reducing frictions in the marketplace and improving consumer experience. We also document substantial heterogeneity: smaller and newer sellers, as well as less experienced consumers, exhibit disproportionately larger gains. Our findings provide novel, large-scale causal evidence on the productivity effects of GenAI in online retail, highlighting both its immediate value and broader potential.
- ID del Artículo: 2510.12049
- Título: Generative AI and Firm Productivity: Field Experiments in Online Retail
- Autores: Lu Fang, Zhe Yuan, Kaifu Zhang, Dante Donati, Miklos Sarvary
- Clasificación: econ.GN cs.AI q-fin.EC
- Fecha de Publicación: 10 de octubre de 2025 (Versión preliminar)
- Enlace del Artículo: https://arxiv.org/abs/2510.12049
Este estudio cuantifica el impacto de la inteligencia artificial generativa (GenAI) en la productividad empresarial mediante un experimento de campo aleatorizado a gran escala realizado en una plataforma líder de comercio electrónico transfronterizo. Durante un período de seis meses en 2023-2024, las funcionalidades mejoradas con GenAI se integraron en siete flujos de trabajo empresariales orientados al consumidor. El estudio encontró que la adopción de GenAI aumentó significativamente las ventas, con efectos de tratamiento que oscilan entre 0% y 16.3%, dependiendo de la contribución marginal de GenAI en relación con las prácticas empresariales existentes. Dado que los insumos y precios se mantuvieron constantes entre los grupos experimentales, estas ganancias se asignan directamente a mejoras en la productividad total de factores. En cuatro aplicaciones de GenAI con efectos positivos, el valor incremental anual implícito es aproximadamente de 5 dólares por consumidor, lo que representa un impacto económicamente significativo considerando la escala del minorista y la etapa inicial de adopción de GenAI.
Aunque la rápida difusión de herramientas GenAI ha generado un amplio interés en su potencial para transformar la productividad en diversas industrias, actualmente existe una falta de evidencia empírica sobre los beneficios medibles de GenAI en la productividad empresarial a nivel de ingresos. La investigación existente se centra principalmente en la eficiencia de tareas a nivel individual, lo que dificulta la detección de ganancias de productividad a nivel empresarial.
- Necesidad Práctica: Los inversores y profesionales de la industria tienen preocupaciones sobre si las inversiones masivas en IA pueden traducirse en retornos comerciales sostenibles
- Vacío Teórico: La literatura existente se enfoca principalmente en ganancias de eficiencia del lado de la oferta, careciendo de evidencia sobre la creación de valor del lado de la demanda
- Desafíos Metodológicos: Se requieren datos de ingresos detallados y entornos de identificación causal, que rara vez están disponibles en la práctica
- Restricciones de Implementación: Las limitaciones de experiencia técnica y los requisitos de inversión complementaria pueden retrasar la implementación
- Limitaciones de Alcance: La mayoría de las aplicaciones de GenAI aún se encuentran en fase piloto, enfocándose en tareas definidas de manera estrecha
- Dificultades de Identificación: Falta de datos de ingresos detallados y configuraciones de identificación causal necesarias para análisis empíricos rigurosos
- Proporcionar Evidencia a Gran Escala del Mundo Real: Por primera vez, proporciona evidencia del impacto causal de GenAI en la productividad empresarial a través de experimentos de campo aleatorios que involucran millones de usuarios y productos
- Revelar Mecanismos de Creación de Valor del Lado de la Demanda: Demuestra que GenAI crea ganancias de productividad al reducir fricciones de mercado y mejorar la experiencia del consumidor, no solo mediante la reducción de costos de insumos
- Descubrir Efectos Heterogéneos: Los vendedores más pequeños y nuevos, así como los consumidores con menos experiencia, obtienen mayores beneficios de GenAI
- Cuantificar el Impacto Económico: Estima que cuatro aplicaciones de GenAI con efectos positivos crean aproximadamente 5 dólares de valor incremental anual por consumidor
Basado en la función de producción Cobb-Douglas del modelo de crecimiento Solow estándar:
Y=AKαL1−α,0<α<1
Donde Y es la producción, K es el stock de capital, L es el insumo laboral, y A es la productividad total de factores (PTF).
Bajo la condición de que el capital y el insumo laboral permanecen constantes:
dlnK=0,dlnL=0⇒dlnY=dlnA
- Chatbot de Servicio Preventa: Servicio al cliente GenAI 24/7 vs respuestas automáticas preprogramadas
- Optimización de Consultas de Búsqueda: Comprensión semántica GenAI y optimización de consultas vs traducción básica
- Generación de Descripciones de Productos: Descripciones estructuradas generadas por GenAI vs descripciones manuales
- Mensajes de Notificación de Marketing: Mensajes personalizados generados por GenAI vs mensajes estandarizados
- Optimización de Títulos de Anuncios de Google: Títulos de anuncios optimizados por GenAI vs títulos originales
- Manejo de Disputas de Devoluciones: Agentes GenAI vs procesamiento manual
- Traducción de Chat en Tiempo Real: Asistencia de traducción en tiempo real GenAI vs sin soporte de traducción
- Nivel de Aleatorización: Nivel de consumidor (6 experimentos) y nivel de producto (1 experimento)
- Tamaño de Muestra: Que van desde 30,000 hasta 13.7 millones de participantes
- Período Experimental: Septiembre de 2023 a junio de 2024
- Tasa de Superposición: Superposición de consumidores entre experimentos inferior al 1%
Especificación de regresión básica:
yi=β×Treati+αc(i)+εi
Donde yi es la variable de resultado, Treati es la variable indicadora del grupo de tratamiento, y αc(i) son efectos fijos de cohorte.
En colaboración con una plataforma de comercio electrónico transfronterizo líder mundial, se obtuvieron:
- Datos de transacciones a nivel de consumidor (gastos, conversiones, clics)
- Datos de características de vendedores (ventas anuales, años de operación, número de subcuentas)
- Datos de características de productos (concentración de categorías, precio, volumen de ventas)
- Datos demográficos de consumidores e historial de compras
- Métricas Principales: Volumen de ventas (dólares), tasa de conversión
- Métricas Auxiliares: Vistas de productos, clics, número de pedidos, valor promedio del carrito de compras
- Métricas de Mecanismo: Tasa de clics, tasa de clic a pedido
Las estadísticas descriptivas de variables clave para cada experimento muestran:
- Tasa de conversión: entre 0.004-0.09
- Volumen de ventas promedio: 0.045-2.24 dólares
- Vistas de productos: 5-313
- Clics en productos: 0.22-8.23
- Chatbot de Servicio Preventa: Crecimiento del 16.3% (p<0.01)
- Optimización de Consultas de Búsqueda: Crecimiento del 2.93% (p<0.05)
- Generación de Descripciones de Productos: Crecimiento del 2.05% (p<0.05)
- Mensajes de Notificación de Marketing: Crecimiento del 1.6% (no significativo)
- Títulos de Anuncios de Google: -4.5% (no significativo)
- Manejo de Disputas de Devoluciones: Mejora del 15% en tasa de éxito
- Traducción de Chat en Tiempo Real: Mejora del 5.2% en satisfacción del consumidor
Todas las tasas de conversión de flujos de trabajo efectivos mejoraron significativamente:
- Chatbot de servicio preventa: Aumento del 21.7%
- Optimización de consultas de búsqueda: Aumento del 1.15%
- Generación de descripciones de productos: Aumento del 1.27%
- Mensajes de notificación de marketing: Aumento del 3.0%
El valor promedio del carrito de compras no mostró cambios significativos en todos los flujos de trabajo, lo que indica que GenAI impulsa el crecimiento principalmente mediante la expansión del mercado (aumentando el número de consumidores que se convierten) en lugar de aumentar el gasto de los compradores existentes.
Los vendedores más pequeños obtienen mayores beneficios:
- Vendedores con ventas anuales más bajas: Crecimiento de ventas del 3.68% vs vendedores grandes 2.18%
- Vendedores con años de operación más cortos: 3.19% vs 2.28%
- Vendedores con menos subcuentas: 3.48% vs 0.97%
Los consumidores con menos experiencia se benefician más:
- Tiempo de registro más corto: Crecimiento de ventas del 22.4% vs consumidores experimentados 13.7%
- Días de inicio de sesión menos frecuentes: 18.5% vs 15.0%
- Consumo anterior más bajo: 25.9% vs 8.6%
Los resultados varían según el flujo de trabajo específico:
- Optimización de Búsqueda: Categorías de baja concentración, productos de cola larga, productos de alto precio se benefician más
- Descripción de Productos: Categorías de alta concentración, productos de alto precio se benefician más
- Servicio Preventa: Productos de cola larga se benefician más notablemente
Basado en cuatro aplicaciones de GenAI con efectos positivos, el valor incremental anualizado es aproximadamente de 4.6-5.0 dólares por consumidor, representando el 5.5-6% del crecimiento de ingresos de usuarios de comercio electrónico global en 2023-2024.
La investigación existente se enfoca principalmente en:
- Mejora de productividad individual (programación, escritura, servicio al cliente, etc.)
- Ganancias de eficiencia del lado de la oferta (tiempo de finalización de tareas, cantidad de finalizaciones)
- Medición de efectos en entornos de laboratorio
Este estudio llena el vacío de investigación en creación de valor del lado de la demanda a nivel empresarial.
Las tecnologías relacionadas incluyen:
- Sistemas de reputación y reseñas que mitigan la asimetría de información
- Búsqueda personalizada impulsada por IA y recomendaciones
- Publicidad dirigida que mejora la eficiencia de coincidencia
Este estudio amplía esta literatura, demostrando cómo GenAI reduce aún más múltiples tipos de fricciones de mercado.
- GenAI Puede Producir Mejoras de Productividad Medibles: Se observan crecimientos de ventas significativos en múltiples flujos de trabajo empresariales
- Mecanismo de Creación de Valor del Lado de la Demanda: Se logran ganancias de productividad mediante la reducción de fricciones de mercado y la mejora de la experiencia del consumidor
- Efectos de Heterogeneidad Significativos: Los vendedores pequeños y consumidores con menos experiencia obtienen mayores beneficios
- Significancia Económica Sustancial: Incluso en la etapa inicial de adopción, se produce un valor incremental considerable
- Efectos a Corto Plazo: El período experimental es relativamente corto (semanas a meses), careciendo de datos sobre impactos a largo plazo
- Sesgo en la Selección de Flujos de Trabajo: Los siete flujos de trabajo se seleccionaron basándose en criterio administrativo, no de manera sistemática
- Supuesto de Insumos de Capital Laboral: Cambios potenciales en insumos de factores en el futuro
- Validez Externa: Experimento en una sola plataforma, sin considerar respuestas estratégicas de competidores
- Investigación de Efectos a Largo Plazo: Impacto del comportamiento de adaptación de consumidores y optimización del modelo de plataforma
- Aplicaciones Más Amplias: Otros procesos empresariales como logística, gestión de inventario, fijación de precios dinámicos
- Efectos de Equilibrio General: Dinámicas competitivas después de la adopción generalizada en la industria
- Ajustes del Lado de Costos: Sustitución laboral y adaptación de estructura organizacional
- Rigor Metodológico: Los experimentos de campo aleatorios a gran escala proporcionan una identificación causal sólida
- Significancia Práctica Sustancial: Primera evidencia empírica del impacto de GenAI en la productividad empresarial
- Análisis de Mecanismo Profundo: Identificación clara de canales de creación de valor del lado de la demanda
- Análisis de Heterogeneidad Integral: Revela efectos diferenciados desde múltiples dimensiones de vendedores, consumidores y productos
- Cuantificación Económica Precisa: Proporciona estimaciones específicas de valor incremental
- Limitaciones de Validez Externa: Experimento en una sola plataforma, cuestionable generalización de resultados
- Ausencia de Efectos a Largo Plazo: Incapacidad para evaluar el impacto del uso continuado y adaptación de consumidores
- Cobertura Incompleta de Flujos de Trabajo: No abarca todos los posibles escenarios de aplicación de GenAI
- Omisión de Efectos Competitivos: No considera efectos de equilibrio de adopción a nivel de industria
- Contribución Académica: Proporciona base empírica importante para investigación sobre impacto económico de GenAI
- Valor Práctico: Proporciona evidencia cuantificada para decisiones de inversión en GenAI empresarial
- Implicaciones Políticas: Respalda formulación de políticas para promover adopción de tecnología de IA
- Reproducibilidad: Diseño experimental claro proporciona paradigma para investigación posterior
- Plataformas de Comercio Electrónico: Directamente aplicable a implementación de GenAI en entornos de comercio electrónico minorista
- Industria de Servicios: Escenarios de aplicación como servicio al cliente, generación de contenido
- Economía de Plataformas: Aplicaciones de reducción de fricción en mercados bilaterales
- Evaluación de Inversión en Tecnología: Evaluación de retorno sobre inversión en IA empresarial
Este estudio cita literatura relevante abundante, incluyendo principalmente:
- Brynjolfsson et al. (2025): Impacto de GenAI en productividad en el lugar de trabajo
- Noy and Zhang (2023): Evidencia experimental de efectos de productividad de GenAI
- Acemoglu (2025): Análisis macroeconómico simple de IA
- Syverson (2011): Revisión de determinantes de productividad
Evaluación General: Este es un artículo de investigación empírica de alta calidad que proporciona evidencia convincente del impacto de GenAI en la productividad empresarial a través de experimentos de campo a gran escala. El diseño de investigación es riguroso y los resultados tienen significancia teórica y práctica importante, realizando una contribución significativa a la comprensión del impacto económico de la tecnología de IA. Aunque existen algunas limitaciones, estas no afectan su valor como investigación pionera en este campo.