2025-11-21T15:07:15.261021

Online Auction Design Using Distribution-Free Uncertainty Quantification with Applications to E-Commerce

Han, Dai
Online auction is a cornerstone of e-commerce, and a key challenge is designing incentive-compatible mechanisms that maximize expected revenue. Existing approaches often assume known bidder value distributions and fixed sets of bidders and items, but these assumptions rarely hold in real-world settings where bidder values are unknown, and the number of future participants is uncertain. In this paper, we introduce the Conformal Online Auction Design (COAD), a novel mechanism that maximizes revenue by quantifying uncertainty in bidder values without relying on known distributions. COAD incorporates both bidder and item features, using historical data to design an incentive-compatible mechanism for online auctions. Unlike traditional methods, COAD leverages distribution-free uncertainty quantification techniques and integrates machine learning methods, such as random forests, kernel methods, and deep neural networks, to predict bidder values while ensuring revenue guarantees. Moreover, COAD introduces bidder-specific reserve prices, based on the lower confidence bounds of bidder valuations, contrasting with the single reserve prices commonly used in the literature. We demonstrate the practical effectiveness of COAD through an application to real-world eBay auction data. Theoretical results and extensive simulation studies further validate the properties of our approach.
academic

Diseño de Subastas en Línea Utilizando Cuantificación de Incertidumbre Libre de Distribución con Aplicaciones al Comercio Electrónico

Información Básica

  • ID del Artículo: 2405.07038
  • Título: Online Auction Design Using Distribution-Free Uncertainty Quantification with Applications to E-Commerce
  • Autores: Jiale Han (UCLA), Xiaowu Dai (UCLA)
  • Clasificación: cs.GT cs.LG stat.ML
  • Fecha de Publicación/Conferencia: Por aparecer en Journal of the American Statistical Association
  • Enlace del Artículo: https://arxiv.org/abs/2405.07038

Resumen

Las subastas en línea son fundamentales para el comercio electrónico, cuyo desafío central es diseñar mecanismos compatibles con incentivos para maximizar los ingresos esperados. Los métodos existentes generalmente asumen que la distribución de valores de los postores es conocida y que el conjunto de postores y artículos es fijo, pero estas suposiciones rara vez se cumplen en entornos reales, ya que los valores de los postores son desconocidos y el número de participantes futuros es incierto. Este artículo propone el Diseño de Subastas en Línea Conforme (COAD, por sus siglas en inglés), un mecanismo novedoso que maximiza los ingresos cuantificando la incertidumbre en los valores de los postores sin depender de distribuciones conocidas. COAD integra características de postores y artículos, utilizando datos históricos para diseñar mecanismos compatibles con incentivos para subastas en línea. A diferencia de los métodos tradicionales, COAD aprovecha técnicas de cuantificación de incertidumbre sin supuestos de distribución e integra métodos de aprendizaje automático (como bosques aleatorios, métodos de kernel y redes neuronales profundas) para predecir valores de postores, mientras garantiza ingresos. Además, COAD introduce precios de reserva personalizados basados en límites inferiores de confianza de las valoraciones de postores, en contraste con los precios de reserva únicos comúnmente utilizados en la literatura.

Antecedentes y Motivación de la Investigación

Definición del Problema

El problema central de las subastas en línea es cómo diseñar mecanismos compatibles con incentivos para maximizar los ingresos de la plataforma cuando la distribución de valores de los postores es desconocida. Esto es particularmente importante en aplicaciones prácticas como subastas de eBay y publicidad en línea.

Importancia del Problema

  1. Valor Económico: Las subastas en línea generan una proporción significativa de ingresos para las principales plataformas
  2. Practicidad: En la realidad, la distribución de valores de los postores es desconocida y el número de participantes es incierto
  3. Heterogeneidad: Diferentes postores y artículos tienen características distintas, requiriendo tratamiento personalizado

Limitaciones de Métodos Existentes

  1. Supuestos de Distribución: Métodos clásicos como Myerson (1981) asumen que la distribución de valores de los postores es conocida
  2. Configuración Fija: Asumen un conjunto fijo de postores y artículos
  3. Precio de Reserva Único: Los métodos tradicionales utilizan un precio de reserva uniforme, incapaz de manejar heterogeneidad
  4. Eficiencia de Datos: Los métodos de aprendizaje existentes requieren muchas muestras para estimar distribuciones específicas de postores

Motivación de la Investigación

Diseñar un mecanismo de subasta que funcione en entornos reales donde la distribución es desconocida y los participantes son heterogéneos, mientras garantiza compatibilidad con incentivos y desempeño de ingresos.

Contribuciones Principales

  1. Propone el Mecanismo COAD: Primer marco que combina predicción conforme y diseño de subastas, logrando cuantificación de incertidumbre libre de distribución
  2. Precios de Reserva Personalizados: Diseña precios de reserva personalizados basados en límites inferiores de confianza de valoraciones de postores, superiores a precios de reserva únicos tradicionales
  3. Integración de Características: Considera simultáneamente características de postores y artículos, adaptándose a entornos heterogéneos
  4. Garantías Teóricas: Proporciona análisis teórico de compatibilidad con incentivos y límites inferiores de ingresos
  5. Verificación Empírica: Valida la efectividad del método en datos reales de eBay

Explicación Detallada del Método

Definición de la Tarea

Entrada:

  • Datos históricos de subastas D={(xj,zj,vj)j=1,2,...,N}D = \{(x_j, z_j, v_j) | j = 1,2,...,N\}
  • Características del postor xix^*_i y características del artículo zz^* en la nueva subasta

Salida:

  • Regla de asignación ai(v,x,z)a_i(\vec{v}^*, \vec{x}^*, z^*)
  • Regla de pago pi(v,x,z)p_i(\vec{v}^*, \vec{x}^*, z^*)

Restricciones: Compatibilidad con incentivos (IC) y racionalidad individual (IR)

Arquitectura del Modelo

1. Modelo de Regresión

Se asume que el valor del postor sigue un modelo de regresión: v=μ(x,z)+ϵv = \mu(x, z) + \epsilon donde μ(x,z)=E[vx,z]\mu(x, z) = E[v|x, z] representa el efecto esperado de las características en el valor.

2. Construcción de Intervalos de Predicción Conforme

Para cada postor ii, se construye un intervalo de predicción (1α)(1-\alpha): [v^iL,v^iU]=[μ^n(xi,z)S,μ^n(xi,z)+S][\hat{v}^L_i, \hat{v}^U_i] = [\hat{\mu}_n(x^*_i, z^*) - S^*, \hat{\mu}_n(x^*_i, z^*) + S^*]

donde SS^* se determina mediante el método de predicción conforme, garantizando cobertura condicional.

3. Pseudo-Valor Virtual

Se define el pseudo-valor virtual como: ci(vi,xi,z)=viI{viv^iL}c_i(v^*_i, x^*_i, z^*) = v^*_i \mathbf{I}\{v^*_i \geq \hat{v}^L_i\}

4. Mecanismo COAD

Regla de Asignación: Asigna el artículo al postor con el pseudo-valor virtual más alto Regla de Pago: El ganador paga la oferta ganadora mínima ri(vi,x,z)r_i(\vec{v}^*_{-i}, \vec{x}^*, z^*)

Puntos de Innovación Técnica

  1. Aplicación de Predicción Conforme: Primera aplicación de predicción conforme al diseño de subastas, logrando cuantificación de incertidumbre independiente de la distribución
  2. Mecanismo Personalizado: Cada postor tiene un precio de reserva diferente, basado en sus características e intervalo de confianza de predicción
  3. Impulsado por Características: Aprovecha simultáneamente características de postores y artículos, adaptándose a entornos heterogéneos
  4. Compatible con Aprendizaje Automático: Puede combinarse con varios algoritmos de ML (bosques aleatorios, redes neuronales, etc.)

Configuración Experimental

Conjunto de Datos

  1. Datos de eBay: 149 subastas de 7 días de Palm Pilot M515 PDA, 813 entradas históricas
  2. Configuración de Características:
    • Características del artículo: Identidad del vendedor (3 vendedores principales)
    • Características del postor: Tiempo de oferta, calificación, oferta promedio histórica

Métricas de Evaluación

  • Comparación de ingresos promedio
  • Probabilidad de cobertura de intervalos de predicción conforme
  • Desempeño bajo diferentes volúmenes de datos

Métodos de Comparación

  1. Subasta de Segundo Precio: Mecanismo actualmente utilizado por eBay
  2. Subasta Myerson Empírica: Mecanismo Myerson basado en estimación de distribución a partir de datos históricos

Detalles de Implementación

  • Tasa de no cobertura: α=0.1\alpha = 0.1
  • División de datos: 50% datos de entrenamiento/calibración cada uno
  • Método de regresión: Regresión polinomial cuadrática
  • Repeticiones experimentales: 1000

Resultados Experimentales

Resultados Principales

  1. Ventaja de Ingresos: COAD supera los métodos de referencia en todas las configuraciones
  2. Eficiencia de Datos: Los ingresos de COAD mejoran constantemente con el aumento de datos
  3. Garantía de Cobertura: Los intervalos de predicción conforme logran la tasa de cobertura objetivo del 90%

Experimentos de Simulación

Experimento de Red Neuronal

  • Configuración: 20 características dimensionales, 30 tipos de artículos
  • Resultados: Los ingresos de COAD aumentan con el número de postores, validando predicciones teóricas

Experimento de Regresión Polinomial

  • Configuración: 100 características dimensionales, modelo de regresión más complejo
  • Resultados: COAD mantiene ventaja incluso en configuraciones de alta dimensionalidad

Análisis de Robustez

Cuando se violan supuestos centrales (independencia de datos, acotación de errores), COAD aún muestra buen desempeño, demostrando la practicidad del método.

Trabajo Relacionado

Diseño Óptimo de Subastas

  • Teoría Clásica: Myerson (1981), Riley & Samuelson (1981)
  • Métodos de Aprendizaje: Cole & Roughgarden (2014), Huang et al. (2015)

Aprendizaje de Precios de Reserva

  • Precio de Reserva Único: Cesa-Bianchi et al. (2014), Mohri & Medina (2016)
  • Precio de Reserva Personalizado: Aplicaciones en sistemas reales de Even-Dar et al. (2008)

Predicción Conforme

  • Fundamentos Teóricos: Vovk et al. (2005), Lei et al. (2018)
  • Garantías Condicionales: Métodos de cobertura condicional de Gibbs et al. (2025)

Conclusiones y Discusión

Conclusiones Principales

  1. COAD resuelve exitosamente el problema de distribución desconocida en subastas reales
  2. Los precios de reserva personalizados son significativamente superiores a precios de reserva únicos
  3. La predicción conforme proporciona cuantificación confiable de incertidumbre

Limitaciones

  1. Condiciones de Supuestos: Las garantías teóricas dependen de supuestos como independencia de datos
  2. Complejidad Computacional: Requiere construir intervalos de predicción para cada postor
  3. Dependencia de Características: El desempeño del método depende de la calidad de las características

Direcciones Futuras

  1. Restricciones de Presupuesto: Extensión a escenarios con participación repetida y presupuesto limitado
  2. Entornos Dinámicos: Manejo de situaciones donde la distribución de datos cambia con el tiempo
  3. Subastas de Múltiples Artículos: Extensión a configuraciones complejas de subastas de múltiples artículos

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: Primer trabajo en aplicar predicción conforme al diseño de subastas, trabajo pionero
  2. Teoría Completa: Proporciona análisis teórico riguroso de compatibilidad con incentivos y garantías de ingresos
  3. Alto Valor Práctico: El método es aplicable a entornos heterogéneos reales, como eBay y publicidad en línea
  4. Experimentos Suficientes: Incluye validación con datos reales y experimentos de simulación exhaustivos

Deficiencias

  1. Limitaciones de Supuestos: Algunos resultados teóricos dependen de supuestos de independencia relativamente fuertes
  2. Costo Computacional: Requiere construir intervalos de predicción separados para cada postor
  3. Ingeniería de Características: El desempeño del método depende en gran medida de la selección y calidad de características

Impacto

  1. Contribución Académica: Conecta tres campos: aprendizaje automático, estadística y economía
  2. Valor Práctico: Proporciona soluciones de diseño de subastas prácticas para plataformas en línea
  3. Significado Metodológico: Demuestra el potencial de aplicación de predicción conforme en diseño de mecanismos

Escenarios Aplicables

  1. Publicidad en Línea: Pujas en tiempo real en plataformas como Google y Meta
  2. Subastas de Comercio Electrónico: Subastas de productos en plataformas como eBay
  3. Asignación de Recursos: Problemas generales de diseño de mecanismos que requieren manejo de incertidumbre

Referencias

  1. Myerson, R. B. (1981). Optimal auction design. Mathematics of Operations Research, 6(1), 58-73.
  2. Gibbs, I., Cherian, J. J., & Candès, E. J. (2025). Conformal prediction with conditional guarantees. Journal of the Royal Statistical Society Series B.
  3. Cole, R., & Roughgarden, T. (2014). The sample complexity of revenue maximization. STOC.
  4. Even-Dar, E., et al. (2008). Position auctions with bidder-specific minimum prices. WINE.

Este artículo logra un buen equilibrio entre innovación teórica y aplicación práctica, proporcionando nuevas direcciones de investigación y herramientas prácticas para el diseño de subastas en línea. La combinación de predicción conforme y teoría de subastas tiene un valor académico importante y amplias perspectivas de aplicación.