2025-11-18T14:58:13.668903

Auction Design using Value Prediction with Hallucinations

Lobel, Moreira, Mouchtaki
We investigate a Bayesian mechanism design problem where a seller seeks to maximize revenue by selling an indivisible good to one of n buyers, incorporating potentially unreliable predictions (signals) of buyers' private values derived from a machine learning model. We propose a framework where these signals are sometimes reflective of buyers' true valuations but other times are hallucinations, which are uncorrelated with the buyers' true valuations. Our main contribution is a characterization of the optimal auction under this framework. Our characterization establishes a near-decomposition of how to treat types above and below the signal. For the one buyer case, the seller's optimal strategy is to post one of three fairly intuitive prices depending on the signal, which we call the "ignore", "follow" and "cap" actions.
academic

Дизайн аукционов с использованием предсказания стоимости с галлюцинациями

Основная информация

  • ID статьи: 2502.08792
  • Название: Auction Design using Value Prediction with Hallucinations
  • Авторы: Илан Лобел (NYU Stern), Умберто Морейра (FGV/EPGE), Омар Муштаки (NYU Stern)
  • Классификация: cs.GT (Теория игр), cs.AI (Искусственный интеллект)
  • Дата публикации: 10 февраля 2025 г. (оригинальная версия), 6 октября 2025 г. (текущая версия)
  • Ссылка на статью: https://arxiv.org/abs/2502.08792

Аннотация

В статье исследуется задача байесовского проектирования механизмов, в которой продавец стремится максимизировать доход от продажи неделимого товара одному из n покупателей, используя потенциально ненадежные предсказания (сигналы) о частных стоимостях покупателей, полученные из моделей машинного обучения. Авторы предлагают структуру, в которой эти сигналы иногда отражают истинные оценки покупателей, но иногда являются "галлюцинациями", не связанными с истинной стоимостью. Основной вклад заключается в характеризации оптимальных аукционов в этой структуре, установлении приблизительной декомпозиции для обработки типов выше и ниже сигнала. Для случая одного покупателя оптимальная стратегия продавца состоит в установлении одной из трех интуитивных цен на основе сигнала, называемых действиями "игнорировать", "следовать" и "ограничивать".

Исследовательский контекст и мотивация

Определение проблемы

Основная проблема, которую решает данная статья: как спроектировать оптимальный механизм аукциона в контексте, когда современные модели машинного обучения (особенно большие языковые модели и глубокие нейронные сети) генерируют "галлюцинации". Эти модели иногда генерируют выходные данные, которые выглядят высокого качества, но на самом деле полностью не связаны с истинной целевой величиной.

Значимость

  1. Практическая ценность: В практических приложениях, таких как аукционы объявлений, продавцы часто используют модели машинного обучения для предсказания оценок покупателей, но эти предсказания могут быть ненадежными
  2. Теоретические вызовы: Классическая теория аукционов Майерсона (1981) не может быть напрямую применена к случаям, когда апостериорное распределение не имеет непрерывной плотности
  3. Тренды технологического развития: С широким распространением больших языковых моделей и глубоких нейронных сетей проблема галлюцинаций становится все более актуальной

Ограничения существующих подходов

  1. Традиционное проектирование механизмов: Предполагает, что продавец располагает только информацией о априорном распределении, не учитывая предсказания машинного обучения
  2. Алгоритмы, усиленные обучением: Обычно используют предположение об антагонистических ошибках, а не о стохастических ошибках
  3. Классические модели сигналов: Предполагают, что ошибки сигнала распределены по Гауссу, не могут захватить глобальный характер галлюцинаций

Основные вклады

  1. Новая байесовская структура: Впервые включает явление галлюцинаций моделей машинного обучения в теорию аукционов, устанавливая бинарную модель, в которой сигнал либо точен, либо полностью случаен
  2. Полная характеризация оптимальных аукционов: Расширяет технику Монтейро и Сватьера (2010), предоставляя закрытое решение для оптимальных аукционов, когда апостериорное распределение не имеет плотности
  3. Теорема приблизительной декомпозиции: Доказывает, что функция виртуальной стоимости может быть приблизительно разложена вблизи точек сигнала, упрощая сложный процесс "утюжки" (ironing)
  4. Трехинтервальная стратегия: Для случая одного покупателя предоставляет интуитивную стратегию "игнорировать-следовать-ограничивать"
  5. Сравнительный анализ: Проводит глубокое сравнение с традиционной моделью "стоимость плюс шум", раскрывая важность различных моделей ошибок для структуры оптимального механизма

Подробное описание методов

Определение задачи

  • Входные данные: n покупателей, каждый покупатель i имеет частную стоимость viFiv_i \sim F_i, продавец наблюдает сигнал sis_i
  • Процесс генерации сигнала: С вероятностью γi\gamma_i, sis_i является галлюцинацией (независимо выбирается из FiF_i); с вероятностью 1γi1-\gamma_i, si=vis_i = v_i (точный сигнал)
  • Цель: Спроектировать механизм аукциона (x,p)(x,p), максимизирующий доход, где xx — функция распределения, pp — функция платежа

Архитектура модели

Байесовское обновление

После наблюдения сигнала sis_i, апостериорное убеждение продавца о viv_i имеет вид: fγi,sii(v)=γifi(v)+(1γi)δsi(v)f^i_{\gamma_i,s_i}(v) = \gamma_i \cdot f_i(v) + (1-\gamma_i) \cdot \delta_{s_i}(v)

где δsi()\delta_{s_i}(\cdot) — дельта-функция Дирака в точке sis_i.

Функция виртуальной стоимости

Для апостериорного распределения Fγ,sF_{\gamma,s}, функция виртуальной стоимости имеет вид:

v - \frac{1/\gamma - F(v)}{f(v)}, & \text{для } v < s \\ v - \frac{1-F(v)}{f(v)}, & \text{для } v > s \end{cases}$$ #### Основная теорема **Теорема 1**: Предположим, что $F_i$ удовлетворяет условиям регулярности, тогда существует прямой механизм, максимизирующий доход, в котором функция виртуальной стоимости имеет вид: $$\bar{\phi}^i_{\gamma_i,s_i}(v) = \begin{cases} \text{IRON}_{[0,s_i]}[\gamma_i F_i](v), & \text{если } a \leq v < s_i \\ \phi_{F_i}(T_i), & \text{если } s_i \leq v < T_i \\ \phi_{F_i}(v), & \text{если } T_i \leq v \leq b \end{cases}$$ ### Технические инновации 1. **Оператор усеченной утюжки**: Вводит усеченную версию процесса утюжки Майерсона, позволяющую проводить утюжку на подинтервалах 2. **Обобщенный метод выпуклой оболочки**: Использует технику Монтейро-Сватьера для обработки распределений без плотности виртуальной стоимости 3. **Структура приблизительной декомпозиции**: Доказывает, что утюжка до и после сигнала может быть приблизительно проведена независимо ## Экспериментальная установка ### Теоретическая верификация Статья в основном проверяет результаты через теоретический анализ и численные примеры: 1. **Случай равномерного распределения**: $F$ — равномерное распределение на $[0,1]$ 2. **Случай экспоненциального распределения**: Проверка того, что даже для распределений с монотонной интенсивностью отказов распределение до сигнала может требовать утюжки 3. **Конструкция контрпримеров**: Демонстрация необходимости условий регулярности ### Методы сравнения Сравнение с моделью "стоимость плюс шум", где сигнал $s = v + \epsilon$, $\epsilon \sim N(0,\sigma^2)$ ## Результаты экспериментов ### Основные результаты #### Оптимальная стратегия для одного покупателя (Предложение 1) Существуют пороги $L_\gamma$ и $U_\gamma$ такие, что оптимальная цена имеет вид: $$p^* = \begin{cases} p_{\text{игнорировать}} & \text{если } s < L_\gamma \\ s & \text{если } L_\gamma \leq s < U_\gamma \\ p_{\text{ограничивать}} & \text{если } s \geq U_\gamma \end{cases}$$ где: - $p_{\text{игнорировать}}$: монопольная цена, игнорирующая сигнал - $p_{\text{ограничивать}}$: ограничивающая цена, удовлетворяющая $p_{\text{ограничивать}} - \frac{1/\gamma - F(p_{\text{ограничивать}})}{f(p_{\text{ограничивать}})} = 0$ #### Сравнение с моделью шума На рисунке 5 показаны структурные различия оптимальной цены в двух моделях: - **Модель галлюцинаций**: Демонстрирует трехсегментную структуру (игнорировать-следовать-ограничивать) - **Модель шума**: Плавная корректировка цены, повышение цены при низком сигнале, понижение при высоком сигнале ### Анализ случаев #### Случай равномерного распределения Для $F = \text{Uniform}[0,1]$, $\gamma = 0.75$: - Интервал низкого сигнала: полностью игнорировать сигнал, использовать оптимальную цену по априори 0.5 - Интервал среднего сигнала: полностью доверять сигналу, цена равна значению сигнала - Интервал высокого сигнала: использовать ограничивающую цену примерно 0.66 #### Случай экспоненциального распределения Даже для экспоненциального распределения с монотонной интенсивностью отказов виртуальная стоимость до сигнала требует обработки утюжкой. ## Связанные работы ### Теория проектирования механизмов - **Майерсон (1981)**: Основание классической теории аукционов, максимизирующих доход - **Монтейро и Сватьер (2010)**: Техника утюжки для произвольных распределений ### Алгоритмы, усиленные обучением - **Согласованность vs. Робастность**: Традиционные подходы сосредоточены на производительности при идеальных предсказаниях (согласованность) и при антагонистических предсказаниях (робастность) - **Отличие данной работы**: Использует байесовскую структуру, предполагая, что ошибки являются стохастическими, а не антагонистическими ### Механизмы, управляемые данными - **Сложность выборки**: Проектирование механизмов с использованием конечных выборок - **Вклад данной работы**: Рассматривает случаи, когда сигналы могут быть галлюцинациями, а не только загрязнение выборки ## Заключение и обсуждение ### Основные выводы 1. **Управляемость модели галлюцинаций**: Несмотря на отсутствие непрерывной плотности апостериорного распределения, можно получить закрытое оптимальное решение 2. **Интуитивность трехсегментной стратегии**: Оптимальная стратегия для случая одного покупателя имеет четкую экономическую интерпретацию 3. **Важность модели ошибок**: Различные предположения об ошибках предсказания приводят к принципиально различным структурам оптимального механизма ### Ограничения 1. **Предположение о раскрытии сигнала**: Предполагается, что продавец раскрывает сигнал, что может быть не оптимальным на практике 2. **Известная вероятность галлюцинаций**: Предполагается, что $\gamma_i$ известна, в практических приложениях может потребоваться оценка 3. **Бинарная модель ошибок**: В реальности ошибки машинного обучения могут быть комбинацией галлюцинаций и гауссова шума ### Направления будущих исследований 1. **Непрямые механизмы**: Анализ оптимальных механизмов, когда продавец не раскрывает сигнал 2. **Неизвестная вероятность галлюцинаций**: Исследование робастного проектирования механизмов при неизвестном $\gamma_i$ 3. **Смешанные модели ошибок**: Более реалистичные модели, объединяющие галлюцинации и традиционный шум ## Глубокая оценка ### Преимущества 1. **Важность проблемы**: Захватывает центральный вызов, стоящий перед проектированием механизмов в эпоху искусственного интеллекта 2. **Теоретическая строгость**: Предоставляет полную математическую характеризацию и доказательства 3. **Интуитивные идеи**: Трехсегментная стратегия предоставляет четкую экономическую интерпретацию 4. **Техническая инновация**: Успешно расширяет классическую теорию аукционов на новые условия ### Недостатки 1. **Упрощение модели**: Бинарная модель ошибок может быть чрезмерно упрощенной для реальных ситуаций 2. **Недостаточная эмпирическая верификация**: Отсутствуют экспериментальные проверки на реальных данных 3. **Вычислительная сложность**: Вычислительная сложность для случая многих покупателей недостаточно обсуждена 4. **Предположение о раскрытии сигнала**: Может не соответствовать требованиям практических приложений ### Влияние 1. **Теоретический вклад**: Предоставляет новую теоретическую основу для проектирования механизмов в эпоху искусственного интеллекта 2. **Практическая ценность**: Предоставляет рекомендации по проектированию для аукционов объявлений и других приложений 3. **Междисциплинарное влияние**: Связывает проектирование механизмов, машинное обучение и информационную экономику ### Применимые сценарии 1. **Аукционы онлайн-объявлений**: Сценарии, использующие модели машинного обучения для предсказания стоимости пользователей 2. **Платформы электронной коммерции**: Динамическое ценообразование на основе предсказания поведения пользователей 3. **Распределение ресурсов облачных вычислений**: Аукционы ресурсов на основе предсказания нагрузки ## Библиография 1. Myerson, R. B. (1981). Optimal auction design. Mathematics of operations research, 6(1), 58-73. 2. Monteiro, P. K., & Svaiter, B. F. (2010). Optimal auction with a general distribution: Virtual valuation without densities. Journal of Mathematical Economics, 46(1), 21-31. 3. Crémer, J., & McLean, R. P. (1988). Full extraction of the surplus in bayesian and dominant strategy auctions. Econometrica, 1247-1257. --- Данная статья вносит важный вклад в область теоретического проектирования механизмов, успешно интегрируя проблему галлюцинаций современных систем искусственного интеллекта в классическую структуру теории аукционов и предоставляя ценные теоретические рекомендации для практических приложений. Хотя существует место для улучшений в предположениях модели и эмпирической верификации, теоретические инновации и практическая ценность делают эту работу значительным вкладом в данную область.