2025-11-18T14:58:13.668903

Auction Design using Value Prediction with Hallucinations

Lobel, Moreira, Mouchtaki

We investigate a Bayesian mechanism design problem where a seller seeks to maximize revenue by selling an indivisible good to one of n buyers, incorporating potentially unreliable predictions (signals) of buyers' private values derived from a machine learning model. We propose a framework where these signals are sometimes reflective of buyers' true valuations but other times are hallucinations, which are uncorrelated with the buyers' true valuations. Our main contribution is a characterization of the optimal auction under this framework. Our characterization establishes a near-decomposition of how to treat types above and below the signal. For the one buyer case, the seller's optimal strategy is to post one of three fairly intuitive prices depending on the signal, which we call the "ignore", "follow" and "cap" actions.

academic

Conception d'Enchères utilisant la Prédiction de Valeur avec Hallucinations

Informations Fondamentales

ID de l'article: 2502.08792
Titre: Conception d'Enchères utilisant la Prédiction de Valeur avec Hallucinations
Auteurs: Ilan Lobel (NYU Stern), Humberto Moreira (FGV/EPGE), Omar Mouchtaki (NYU Stern)
Classification: cs.GT (Théorie des Jeux), cs.AI (Intelligence Artificielle)
Date de publication: 10 février 2025 (version originale), 6 octobre 2025 (version actuelle)
Lien de l'article: https://arxiv.org/abs/2502.08792

Résumé

Cet article étudie un problème de conception de mécanisme bayésien où un vendeur cherche à maximiser ses revenus en vendant un bien indivisible à l'un de n acheteurs, en incorporant des prédictions potentiellement peu fiables des valeurs privées des acheteurs (signaux) provenant de modèles d'apprentissage automatique. Les auteurs proposent un cadre dans lequel ces signaux reflètent parfois les véritables évaluations des acheteurs, mais sont parfois des « hallucinations » sans rapport avec les véritables valeurs des acheteurs. La contribution principale est la caractérisation des enchères optimales dans ce cadre, établissant comment traiter les types au-dessus et au-dessous du signal par une décomposition approximative. Pour le cas d'un seul acheteur, la stratégie optimale du vendeur consiste à publier l'un des trois prix intuitifs en fonction du signal, appelés actions « ignorer », « suivre » et « plafonner ».

Contexte et Motivation de la Recherche

Définition du Problème

Le problème central que cet article résout est : comment concevoir des mécanismes d'enchères optimaux dans un contexte où les modèles modernes d'apprentissage automatique (en particulier les grands modèles de langage et les réseaux de neurones profonds) produisent des « hallucinations ». Ces modèles génèrent parfois des résultats apparemment de haute qualité mais complètement sans rapport avec la quantité cible réelle.

Importance

Valeur d'application pratique: Dans les applications pratiques telles que les enchères publicitaires, les vendeurs utilisent fréquemment des modèles d'apprentissage automatique pour prédire les évaluations des acheteurs, mais ces prédictions peuvent être peu fiables
Défis théoriques: La théorie classique des enchères de Myerson (1981) ne peut pas être directement appliquée aux cas où la distribution a posteriori ne possède pas de densité continue
Tendances du développement technologique: Avec l'adoption généralisée des LLM et des réseaux de neurones profonds, le problème des hallucinations devient de plus en plus important

Limitations des Approches Existantes

Conception de mécanismes traditionnelle: Suppose que le vendeur ne dispose que d'informations de distribution a priori, sans tenir compte des prédictions d'apprentissage automatique
Algorithmes améliorés par l'apprentissage: Adoptent généralement des hypothèses d'erreur adversariale plutôt que d'erreur aléatoire
Modèles de signaux classiques: Supposent que les erreurs de signal sont du bruit gaussien, incapables de capturer la nature globale des hallucinations

Contributions Principales

Cadre bayésien novateur: Intègre pour la première fois le phénomène d'hallucination des modèles d'apprentissage automatique dans la théorie des enchères, établissant un modèle binaire où les signaux sont soit précis, soit complètement aléatoires
Caractérisation complète des enchères optimales: Étend les techniques de Monteiro et Svaiter (2010), fournissant des solutions en forme fermée pour les enchères optimales lorsque la distribution a posteriori ne possède pas de densité
Théorème de décomposition approximative: Prouve que la fonction de valeur virtuelle peut être approximativement décomposée près des points de signal, simplifiant le processus complexe d'ironing
Stratégie à trois intervalles: Pour le cas d'un seul acheteur, fournit une stratégie intuitive « ignorer-suivre-plafonner »
Analyse comparative: Comparaison approfondie avec le modèle traditionnel « valeur plus bruit », révélant l'importance cruciale de différents modèles d'erreur sur la structure des mécanismes optimaux

Détails de la Méthode

Définition de la Tâche

Entrée: n acheteurs, chaque acheteur i possédant une valeur privée $v_i \sim F_i$ , le vendeur observe un signal $s_i$
Processus de génération de signal: Avec probabilité $\gamma_i$ , $s_i$ est une hallucination (échantillonnée indépendamment de $F_i$ ); avec probabilité $1-\gamma_i$ , $s_i = v_i$ (signal précis)
Objectif: Concevoir un mécanisme d'enchères $(x,p)$ maximisant les revenus, où $x$ est la fonction d'allocation et $p$ est la fonction de paiement

v - \frac{1/\gamma - F(v)}{f(v)}, & \text{pour } v < s \\ v - \frac{1-F(v)}{f(v)}, & \text{pour } v > s \end{cases}$$ #### Théorème Principal **Théorème 1**: En supposant que $F_i$ satisfait les conditions de régularité, il existe un mécanisme direct maximisant les revenus, où la fonction de valeur virtuelle est: $$\bar{\phi}^i_{\gamma_i,s_i}(v) = \begin{cases} \text{IRON}_{[0,s_i]}[\gamma_i F_i](v), & \text{si } a \leq v < s_i \\ \phi_{F_i}(T_i), & \text{si } s_i \leq v < T_i \\ \phi_{F_i}(v), & \text{si } T_i \leq v \leq b \end{cases}$$ ### Points d'Innovation Technique 1. **Opérateur d'ironing tronqué**: Introduit une version tronquée du processus d'ironing de Myerson, permettant l'ironing sur des sous-intervalles 2. **Méthode d'enveloppe convexe généralisée**: Utilise la technique de Monteiro-Svaiter pour traiter les distributions sans densité de valeur virtuelle 3. **Structure de décomposition approximative**: Prouve que l'ironing avant et après le signal peut être effectué approximativement de manière indépendante ## Configuration Expérimentale ### Vérification Théorique L'article valide principalement les résultats par analyse théorique et exemples numériques: 1. **Cas de distribution uniforme**: $F$ est une distribution uniforme sur $[0,1]$ 2. **Cas de distribution exponentielle**: Vérifie que même pour les distributions à taux de risque monotone, la distribution avant le signal peut nécessiter un ironing 3. **Construction de contre-exemples**: Démontre la nécessité des conditions de régularité ### Méthodes de Comparaison Comparaison avec le modèle « valeur plus bruit » où le signal $s = v + \epsilon$, $\epsilon \sim N(0,\sigma^2)$ ## Résultats Expérimentaux ### Résultats Principaux #### Stratégie Optimale pour un Seul Acheteur (Proposition 1) Il existe des seuils $L_\gamma$ et $U_\gamma$ tels que le prix optimal soit: $$p^* = \begin{cases} p_{\text{ignorer}} & \text{si } s < L_\gamma \\ s & \text{si } L_\gamma \leq s < U_\gamma \\ p_{\text{plafonner}} & \text{si } s \geq U_\gamma \end{cases}$$ où: - $p_{\text{ignorer}}$: prix de monopole ignorant le signal - $p_{\text{plafonner}}$: prix plafonné, satisfaisant $p_{\text{plafonner}} - \frac{1/\gamma - F(p_{\text{plafonner}})}{f(p_{\text{plafonner}})} = 0$ #### Comparaison avec le Modèle de Bruit La Figure 5 montre les différences structurelles du prix optimal entre les deux modèles: - **Modèle d'hallucination**: Présente une structure à trois segments (ignorer-suivre-plafonner) - **Modèle de bruit**: Ajustement de prix lisse, augmentation du prix pour les signaux faibles, diminution pour les signaux élevés ### Analyses de Cas #### Cas de Distribution Uniforme Pour $F = \text{Uniforme}[0,1]$, $\gamma = 0,75$: - Intervalle de signal faible: Ignore complètement le signal, utilise le prix optimal a priori de 0,5 - Intervalle de signal moyen: Fait entièrement confiance au signal, le prix égale la valeur du signal - Intervalle de signal élevé: Utilise un prix plafonné d'environ 0,66 #### Cas de Distribution Exponentielle Même pour la distribution exponentielle avec taux de risque monotone, la valeur virtuelle avant le signal nécessite toujours un traitement d'ironing. ## Travaux Connexes ### Théorie de la Conception de Mécanismes - **Myerson (1981)**: Fondement de la théorie classique des enchères maximisant les revenus - **Monteiro & Svaiter (2010)**: Techniques d'ironing pour les distributions arbitraires ### Algorithmes Améliorés par l'Apprentissage - **Cohérence vs Robustesse**: Les approches traditionnelles se concentrent sur la performance lorsque les prédictions sont parfaites (cohérence) et lorsqu'elles sont adversariales (robustesse) - **Distinction de cet article**: Adopte un cadre bayésien, supposant que les erreurs sont aléatoires plutôt qu'adversariales ### Mécanismes Pilotés par les Données - **Complexité d'échantillonnage**: Conception de mécanismes utilisant un nombre fini d'échantillons - **Contribution de cet article**: Considère les cas où les signaux peuvent être des hallucinations, plutôt que simplement la contamination d'échantillons ## Conclusions et Discussion ### Conclusions Principales 1. **Traitabilité du modèle d'hallucination**: Malgré l'absence de densité continue dans la distribution a posteriori, des solutions optimales en forme fermée peuvent être obtenues 2. **Intuitivité de la stratégie à trois segments**: La stratégie optimale pour le cas d'un seul acheteur possède une intuition économique claire 3. **Importance du modèle d'erreur**: Différentes hypothèses d'erreur de prédiction conduisent à des structures de mécanismes optimaux radicalement différentes ### Limitations 1. **Hypothèse de divulgation de signal**: Suppose que le vendeur divulgue publiquement le signal, ce qui peut ne pas être optimal en pratique 2. **Probabilité d'hallucination connue**: Suppose que $\gamma_i$ est connu, ce qui peut nécessiter une estimation dans les applications réelles 3. **Modèle d'erreur binaire**: Les erreurs réelles de ML peuvent être une combinaison d'hallucinations et de bruit gaussien ### Directions Futures 1. **Mécanismes non-directs**: Analyse des mécanismes optimaux lorsque le vendeur ne divulgue pas le signal 2. **Probabilité d'hallucination inconnue**: Étude de la conception de mécanismes robustes lorsque $\gamma_i$ est inconnue 3. **Modèle d'erreur mixte**: Modèles plus réalistes combinant hallucinations et bruit traditionnel ## Évaluation Approfondie ### Avantages 1. **Importance du problème**: Saisit le défi central de la conception de mécanismes à l'ère de l'IA 2. **Rigueur théorique**: Fournit une caractérisation mathématique complète et des preuves 3. **Intuitions directes**: La stratégie à trois segments fournit une intuition économique claire 4. **Innovation technique**: Étend avec succès la théorie classique des enchères à de nouveaux paramètres ### Insuffisances 1. **Simplification du modèle**: Le modèle d'erreur binaire peut être trop simplifié pour les situations réelles 2. **Vérification empirique insuffisante**: Manque d'expériences de validation sur des données réelles 3. **Complexité de calcul**: La complexité de calcul pour les cas multi-acheteurs n'est pas suffisamment discutée 4. **Hypothèse de divulgation de signal**: Peut ne pas correspondre aux besoins des applications réelles ### Impact 1. **Contribution théorique**: Fournit une nouvelle base théorique pour la conception de mécanismes à l'ère de l'IA 2. **Valeur pratique**: Fournit des directives de conception pour les applications telles que les enchères publicitaires 3. **Impact interdisciplinaire**: Relie la conception de mécanismes, l'apprentissage automatique et l'économie de l'information ### Scénarios Applicables 1. **Enchères publicitaires en ligne**: Scénarios utilisant des modèles ML pour prédire la valeur des utilisateurs 2. **Plateformes de commerce électronique**: Tarification dynamique basée sur la prédiction du comportement des utilisateurs 3. **Allocation de ressources informatiques en nuage**: Enchères de ressources basées sur la prédiction de charge ## Références 1. Myerson, R. B. (1981). Optimal auction design. Mathematics of operations research, 6(1), 58-73. 2. Monteiro, P. K., & Svaiter, B. F. (2010). Optimal auction with a general distribution: Virtual valuation without densities. Journal of Mathematical Economics, 46(1), 21-31. 3. Crémer, J., & McLean, R. P. (1988). Full extraction of the surplus in bayesian and dominant strategy auctions. Econometrica, 1247-1257. --- Cet article apporte une contribution importante au domaine de la conception théorique de mécanismes, intégrant avec succès le problème des hallucinations des systèmes d'IA modernes dans le cadre classique de la théorie des enchères, fournissant des directives théoriques précieuses pour les applications pratiques. Bien qu'il y ait encore de la place pour l'amélioration dans les hypothèses du modèle et la vérification empirique, son innovation théorique et sa valeur pratique en font un travail important dans ce domaine.