2025-11-16T21:28:12.824561

Generative AI and Firm Productivity: Field Experiments in Online Retail

Fang, Yuan, Zhang et al.
We quantify the impact of Generative Artificial Intelligence (GenAI) on firm productivity through a series of large-scale randomized field experiments involving millions of users and products at a leading cross-border online retail platform. Over six months in 2023-2024, GenAI-based enhancements were integrated into seven consumer-facing business workflows. We find that GenAI adoption significantly increases sales, with treatment effects ranging from 0\% to 16.3\%, depending on GenAI's marginal contribution relative to existing firm practices. Because inputs and prices were held constant across experimental arms, these gains map directly into total factor productivity improvements. Across the four GenAI applications with positive effects, the implied annual incremental value is approximately \$5 per consumer-an economically meaningful impact given the retailer's scale and the early stage of GenAI adoption. The primary mechanism operates through higher conversion rates, consistent with GenAI reducing frictions in the marketplace and improving consumer experience. We also document substantial heterogeneity: smaller and newer sellers, as well as less experienced consumers, exhibit disproportionately larger gains. Our findings provide novel, large-scale causal evidence on the productivity effects of GenAI in online retail, highlighting both its immediate value and broader potential.
academic

L'IA générative et la productivité des entreprises : Expériences de terrain dans le commerce électronique en ligne

Informations de base

  • ID de l'article : 2510.12049
  • Titre : Generative AI and Firm Productivity: Field Experiments in Online Retail
  • Auteurs : Lu Fang, Zhe Yuan, Kaifu Zhang, Dante Donati, Miklos Sarvary
  • Classification : econ.GN cs.AI q-fin.EC
  • Date de publication : 10 octobre 2025 (version préliminaire)
  • Lien de l'article : https://arxiv.org/abs/2510.12049

Résumé

Cette étude quantifie l'impact de l'intelligence artificielle générative (GenAI) sur la productivité des entreprises par le biais d'une vaste expérience aléatoire de terrain menée sur une plateforme de commerce électronique transfrontalier de premier plan. Au cours d'une période de six mois en 2023-2024, les fonctionnalités améliorées par GenAI ont été intégrées dans sept flux de travail commerciaux orientés vers les consommateurs. L'étude révèle que l'adoption de GenAI a considérablement augmenté les ventes, avec des effets de traitement variant de 0 % à 16,3 %, selon la contribution marginale de GenAI par rapport aux pratiques commerciales existantes. Comme les intrants et les prix restent constants entre les groupes expérimentaux, ces gains se traduisent directement par une augmentation de la productivité totale des facteurs. Pour les quatre applications GenAI présentant des effets positifs, la valeur supplémentaire annuelle implicite est d'environ 5 dollars par consommateur, ce qui constitue un impact économiquement significatif compte tenu de l'échelle du détaillant et du stade précoce de l'adoption de GenAI.

Contexte et motivation de la recherche

Définition du problème

Bien que la diffusion rapide des outils GenAI ait suscité un large intérêt quant à son potentiel de transformation de la productivité dans diverses industries, il existe actuellement un manque de preuves empiriques concernant les bénéfices mesurables de GenAI sur la productivité génératrice de revenus au niveau de l'entreprise. Les recherches existantes se concentrent principalement sur l'efficacité des tâches au niveau individuel, ce qui rend difficile la détection des gains de productivité au niveau de l'entreprise.

Importance de la recherche

  1. Besoin pratique : Les investisseurs et les professionnels du secteur s'inquiètent de savoir si les investissements massifs en IA peuvent se traduire par des rendements commerciaux durables
  2. Lacune théorique : La littérature existante se concentre principalement sur les gains d'efficacité du côté de l'offre, manquant de preuves concernant la création de valeur du côté de la demande
  3. Défis méthodologiques : Nécessité de données de revenus détaillées et d'un environnement d'identification causale, rarement disponibles dans la pratique

Limitations des approches existantes

  1. Contraintes de mise en œuvre : Les limitations en expertise technique et les besoins d'investissements complémentaires peuvent retarder la mise en œuvre
  2. Limitations de portée : La plupart des applications GenAI en sont encore au stade pilote, se concentrant sur des tâches étroitement définies
  3. Difficultés d'identification : Manque de données de revenus détaillées et de configuration d'identification causale requises pour une analyse empirique rigoureuse

Contributions principales

  1. Fournir des preuves à grande échelle du monde réel : Première fourniture de preuves de l'impact causal de GenAI sur la productivité des entreprises par le biais d'expériences aléatoires de terrain impliquant des millions d'utilisateurs et de produits
  2. Révéler les mécanismes de création de valeur du côté de la demande : Démontrer que GenAI crée des gains de productivité en réduisant les frictions du marché et en améliorant l'expérience des consommateurs, plutôt que simplement en réduisant les coûts d'intrants
  3. Découvrir des effets hétérogènes : Les petits vendeurs et nouveaux vendeurs, ainsi que les consommateurs moins expérimentés, tirent des bénéfices plus importants de GenAI
  4. Quantifier l'impact économique : Estimer que quatre applications GenAI aux effets positifs créent environ 5 dollars de valeur supplémentaire annuelle par consommateur

Détails méthodologiques

Cadre théorique

Basé sur la fonction de production Cobb-Douglas du modèle de croissance Solow standard : Y=AKαL1α,0<α<1Y = AK^{\alpha}L^{1-\alpha}, 0 < \alpha < 1

où Y est la production, K est le stock de capital, L est l'intrant de travail, et A est la productivité totale des facteurs (PTF).

Sous la condition que le capital et l'intrant de travail restent constants : dlnK=0,dlnL=0dlnY=dlnAd\ln K = 0, d\ln L = 0 \Rightarrow d\ln Y = d\ln A

Conception expérimentale

Sept flux de travail commerciaux

  1. Chatbot de service avant-vente : Service client GenAI 24/7 vs réponses automatisées préprogrammées
  2. Optimisation des requêtes de recherche : Compréhension sémantique GenAI et optimisation des requêtes vs traduction basique
  3. Génération de descriptions de produits : Descriptions structurées générées par GenAI vs descriptions manuelles
  4. Messages de marketing push : Messages personnalisés générés par GenAI vs messages standardisés
  5. Optimisation des titres d'annonces Google : Titres d'annonces optimisés par GenAI vs titres originaux
  6. Traitement des litiges de retour : Agent GenAI vs traitement manuel
  7. Traduction de chat en temps réel : Assistance de traduction en temps réel GenAI vs pas de support de traduction

Caractéristiques expérimentales

  • Niveau de randomisation : Niveau consommateur (6 expériences) et niveau produit (1 expérience)
  • Taille de l'échantillon : Allant de 30 000 à 13,7 millions de participants
  • Période expérimentale : Septembre 2023 à juin 2024
  • Taux de chevauchement : Chevauchement des consommateurs entre expériences inférieur à 1 %

Modèle économétrique

Spécification de régression de base : yi=β×Treati+αc(i)+εiy_i = \beta \times Treat_i + \alpha_{c(i)} + \varepsilon_i

yiy_i est la variable de résultat, TreatiTreat_i est la variable indicatrice du groupe de traitement, et αc(i)\alpha_{c(i)} est l'effet fixe de cohorte.

Configuration expérimentale

Sources de données

En collaboration avec une plateforme de commerce électronique transfrontalier de premier plan au monde, obtention de :

  • Données transactionnelles au niveau consommateur (dépenses, conversion, clics)
  • Données caractéristiques des vendeurs (ventes annuelles, années d'exploitation, nombre de sous-comptes)
  • Données caractéristiques des produits (concentration de catégories, prix, volume de ventes)
  • Données démographiques des consommateurs et historique d'achat

Indicateurs d'évaluation

  • Indicateurs principaux : Ventes (en dollars), taux de conversion
  • Indicateurs auxiliaires : Vues de produits, clics, nombre de commandes, valeur moyenne du panier
  • Indicateurs de mécanisme : Taux de clic, taux de conversion des clics en commandes

Statistiques de l'échantillon

Les statistiques descriptives des variables clés pour chaque expérience montrent :

  • Taux de conversion : entre 0,004 et 0,09
  • Ventes moyennes : entre 0,045 et 2,24 dollars
  • Vues de produits : entre 5 et 313
  • Clics sur produits : entre 0,22 et 8,23

Résultats expérimentaux

Résultats principaux

Impact sur la productivité (ventes)

  1. Chatbot de service avant-vente : Croissance de 16,3 % (p<0,01)
  2. Optimisation des requêtes de recherche : Croissance de 2,93 % (p<0,05)
  3. Génération de descriptions de produits : Croissance de 2,05 % (p<0,05)
  4. Messages de marketing push : Croissance de 1,6 % (non significatif)
  5. Titres d'annonces Google : -4,5 % (non significatif)
  6. Traitement des litiges de retour : Amélioration du taux de succès de 15 %
  7. Traduction de chat en temps réel : Amélioration de la satisfaction des consommateurs de 5,2 %

Analyse des mécanismes (taux de conversion)

Augmentation significative du taux de conversion pour tous les flux de travail efficaces :

  • Chatbot de service avant-vente : Augmentation de 21,7 %
  • Optimisation des requêtes de recherche : Augmentation de 1,15 %
  • Génération de descriptions de produits : Augmentation de 1,27 %
  • Messages de marketing push : Augmentation de 3,0 %

Analyse de la marge intensive

La valeur moyenne du panier ne change pas significativement dans tous les flux de travail, indiquant que GenAI stimule la croissance principalement en élargissant le marché (augmentant le nombre de consommateurs convertis) plutôt qu'en augmentant les dépenses des acheteurs existants.

Analyse de l'hétérogénéité

Hétérogénéité des vendeurs

Les petits vendeurs obtiennent des bénéfices plus importants :

  • Vendeurs avec ventes annuelles plus faibles : Croissance des ventes de 3,68 % vs grands vendeurs 2,18 %
  • Vendeurs avec durée d'exploitation plus courte : 3,19 % vs 2,28 %
  • Vendeurs avec moins de sous-comptes : 3,48 % vs 0,97 %

Hétérogénéité des consommateurs

Les consommateurs moins expérimentés bénéficient davantage :

  • Temps d'enregistrement plus court : Croissance des ventes de 22,4 % vs consommateurs expérimentés 13,7 %
  • Nombre de jours de connexion inférieur : 18,5 % vs 15,0 %
  • Consommation antérieure plus faible : 25,9 % vs 8,6 %

Hétérogénéité des produits

Les résultats varient selon le flux de travail spécifique :

  • Optimisation de la recherche : Les catégories à faible concentration, les produits de longue traîne et les produits à prix élevé bénéficient davantage
  • Description de produits : Les catégories à forte concentration et les produits à prix élevé bénéficient davantage
  • Service avant-vente : Les produits de longue traîne bénéficient davantage

Quantification de l'impact économique

Sur la base de quatre applications GenAI aux effets positifs, la valeur supplémentaire annualisée est d'environ 4,6 à 5,0 dollars par consommateur, représentant 5,5 à 6 % de la croissance des revenus des utilisateurs du commerce électronique mondial en 2023-2024.

Travaux connexes

Recherche sur l'impact économique de GenAI

Les recherches existantes se concentrent principalement sur :

  • L'amélioration de la productivité individuelle (programmation, rédaction, service client, etc.)
  • Les gains d'efficacité du côté de l'offre (temps d'exécution des tâches, nombre de tâches complétées)
  • La mesure des effets dans des environnements de laboratoire

Cette recherche comble le vide dans l'étude de la création de valeur au niveau de l'entreprise et du côté de la demande.

Réduction des frictions sur les marchés en ligne

Les technologies connexes incluent :

  • Les systèmes de réputation et d'évaluation pour atténuer l'asymétrie informationnelle
  • La recherche et les recommandations personnalisées pilotées par l'IA
  • La publicité ciblée pour améliorer l'efficacité de l'appariement

Cette recherche étend cette littérature en montrant comment GenAI réduit davantage plusieurs types de frictions du marché.

Conclusions et discussion

Conclusions principales

  1. GenAI peut produire des améliorations mesurables de la productivité : Croissance significative des ventes observée dans plusieurs flux de travail commerciaux
  2. Mécanisme de création de valeur du côté de la demande : Gains de productivité réalisés en réduisant les frictions du marché et en améliorant l'expérience des consommateurs
  3. Effets d'hétérogénéité significatifs : Les petits vendeurs et les consommateurs moins expérimentés obtiennent des bénéfices plus importants
  4. Importance économique significative : Même au stade précoce de l'adoption, génère une valeur supplémentaire considérable

Limitations

  1. Effets à court terme : Période expérimentale relativement courte (semaines à mois), manque de données sur l'impact à long terme
  2. Biais de sélection des flux de travail : Les sept flux de travail ont été sélectionnés sur la base du jugement administratif, non de manière systématique
  3. Hypothèse d'intrants de capital et de travail : Les changements d'intrants des facteurs pourraient survenir à l'avenir
  4. Validité externe : Expérience sur une seule plateforme, réponses stratégiques des concurrents non considérées

Directions futures

  1. Recherche sur les effets à long terme : Impact du comportement d'adaptation des consommateurs et de l'optimisation du modèle de plateforme
  2. Applications plus larges : Autres processus commerciaux tels que la logistique, la gestion des stocks et la tarification dynamique
  3. Effets d'équilibre général : Dynamiques concurrentielles après adoption généralisée dans l'industrie
  4. Ajustements du côté des coûts : Substitution du travail et adaptation de la structure organisationnelle

Évaluation approfondie

Points forts

  1. Rigueur méthodologique : Les expériences aléatoires de terrain à grande échelle fournissent une identification causale solide
  2. Importance pratique significative : Première fourniture de preuves empiriques de l'impact de GenAI sur la productivité au niveau de l'entreprise
  3. Analyse des mécanismes approfondie : Identification claire des canaux de création de valeur du côté de la demande
  4. Analyse complète de l'hétérogénéité : Révélation des effets différenciés selon les dimensions des vendeurs, des consommateurs et des produits
  5. Quantification économique précise : Fournit des estimations spécifiques de la valeur supplémentaire

Insuffisances

  1. Limitations de la validité externe : Expérience sur une seule plateforme, généralisation des résultats douteuse
  2. Absence d'effets à long terme : Incapacité à évaluer l'impact de l'utilisation continue et de l'adaptation des consommateurs
  3. Couverture incomplète des flux de travail : N'englobe pas tous les scénarios d'application GenAI possibles
  4. Omission des effets concurrentiels : Ne considère pas les effets d'équilibre au niveau de l'industrie

Impact

  1. Contribution académique : Fournit une base empirique importante pour la recherche sur l'impact économique de GenAI
  2. Valeur pratique : Fournit des preuves quantifiées pour les décisions d'investissement en GenAI des entreprises
  3. Implications politiques : Soutient l'élaboration de politiques favorisant l'adoption de la technologie IA
  4. Reproductibilité : La conception expérimentale est claire, fournissant un paradigme pour les recherches ultérieures

Scénarios d'application

  1. Plateformes de commerce électronique : Directement applicable au déploiement de GenAI dans les environnements de vente au détail en ligne
  2. Secteur des services : Scénarios d'application tels que le service client et la génération de contenu
  3. Économie de plateforme : Applications de réduction des frictions dans les marchés bilatéraux
  4. Évaluation des investissements technologiques : Évaluation du retour sur investissement en IA pour les entreprises

Références bibliographiques

Cette recherche cite une riche littérature connexe, incluant principalement :

  • Brynjolfsson et al. (2025) : Impact de GenAI sur la productivité en milieu de travail
  • Noy et Zhang (2023) : Preuves expérimentales des effets de productivité de GenAI
  • Acemoglu (2025) : Analyse macroéconomique simple de l'IA
  • Syverson (2011) : Examen des déterminants de la productivité

Évaluation globale : Ceci est un article de recherche empirique de haute qualité qui fournit des preuves convaincantes de l'impact de GenAI sur la productivité des entreprises par le biais d'expériences de terrain à grande échelle. La conception de la recherche est rigoureuse et les résultats ont une importance théorique et pratique significative, contribuant de manière importante à la compréhension de l'impact économique de la technologie IA. Bien qu'il existe certaines limitations, celles-ci ne diminuent pas la valeur de cette recherche pionnière dans le domaine.