2025-11-14T17:58:11.620505

Edge-weighted Online Stochastic Matching: Beating $1-\frac1e$

Yan

We study the edge-weighted online stochastic matching problem. Since Feldman, Mehta, Mirrokni, and Muthukrishnan proposed the $(1-\frac1e)$-competitive Suggested Matching algorithm, there has been no improvement for the general edge-weighted online stochastic matching problem. In this paper, we introduce the first algorithm beating the $1-\frac1e$ barrier in this setting, achieving a competitive ratio of $0.645$. Under the LP proposed by Jaillet and Lu, we design an algorithmic preprocessing, dividing all edges into two classes. Then based on the Suggested Matching algorithm, we adjust the matching strategy to improve the performance on one class in the early stage and on another class in the late stage, while keeping the matching events of different edges highly independent. By balancing them, we finally guarantee the matched probability of every single edge.

academic

Emparejamiento Estocástico En Línea Ponderado por Aristas: Superando $1-\frac1e$

Información Básica

ID del Artículo: 2210.12543
Título: Edge-weighted Online Stochastic Matching: Beating $1-\frac1e$
Autor: Shuyi Yan (Departamento de Ciencias de la Computación, Universidad de Copenhague)
Clasificación: cs.DS (Estructuras de Datos y Algoritmos), cs.GT (Teoría de Juegos)
Fecha de Publicación: 8 de abril de 2025 (Versión 3 del preimpreso de arXiv)
Enlace del Artículo: https://arxiv.org/abs/2210.12543

Resumen

Este artículo estudia el problema del emparejamiento estocástico en línea ponderado por aristas. Desde que Feldman et al. propusieron el algoritmo Suggested Matching con competitividad $(1-\frac1e)$ , no ha habido mejoras en el problema general de emparejamiento estocástico en línea ponderado por aristas. Este artículo propone por primera vez un algoritmo que supera la barrera $1-\frac1e$ , logrando una razón de competitividad de 0.645. Basándose en la programación lineal propuesta por Jaillet y Lu, diseñamos un preprocesamiento de algoritmo que divide todas las aristas en dos clases. Luego, basándonos en el algoritmo Suggested Matching, ajustamos la estrategia de emparejamiento para mejorar el rendimiento de una clase de aristas en la etapa temprana y de la otra clase en la etapa tardía, manteniendo simultáneamente una alta independencia en los eventos de emparejamiento de diferentes aristas. Al equilibrar estas operaciones, finalmente garantizamos la probabilidad de emparejamiento de cada arista.

Antecedentes de Investigación y Motivación

Importancia del Problema

El problema del emparejamiento bipartito en línea, introducido por Karp et al. en 1990, ha jugado un papel importante en el campo de los algoritmos en línea. Su aplicación más importante es la publicidad en línea: cuando un usuario busca en un motor de búsqueda, es necesario seleccionar anuncios apropiados para mostrar. En este problema, los anunciantes se modelan como vértices fuera de línea (conocidos al inicio del algoritmo), y las impresiones (búsquedas de usuarios) se modelan como vértices en línea (que llegan uno por uno).

Limitaciones de Métodos Existentes

Modelo del Peor Caso: El algoritmo Ranking de Karp et al. logra una razón de competitividad de $1-\frac1e \approx 0.632$ en emparejamiento sin pesos, y se ha demostrado su optimalidad.
Modelo de Emparejamiento Estocástico en Línea: El algoritmo Suggested Matching propuesto por Feldman et al. solo logra una razón de competitividad de $1-\frac1e$ en la configuración general ponderada por aristas.
Mejoras en Casos Especiales: Aunque ha habido mejoras en casos especiales como emparejamiento ponderado por vértices y emparejamiento ponderado por aristas con disposición libre, la configuración general ponderada por aristas carece de estas propiedades útiles.

Motivación de la Investigación

La configuración general ponderada por aristas es esencialmente más difícil porque:

Las aristas ligeras pueden ocupar vértices fuera de línea, impidiendo que aristas pesadas se emparejen en el futuro
No se puede obtener simplemente una buena razón de competitividad estableciendo límites inferiores en la probabilidad de emparejamiento de cada vértice o arista
El límite superior de 0.703 sugiere que esta configuración es efectivamente más difícil que los casos especiales

Contribuciones Principales

Primera Superación de la Barrera $1-\frac1e$ : Propone un algoritmo de tiempo polinomial con razón de competitividad de 0.645 para el problema general de emparejamiento estocástico en línea ponderado por aristas
Técnica de Preprocesamiento Innovadora: Diseña preprocesamiento basado en la programación lineal de Jaillet-Lu, dividiendo aristas en dos clases y simplificando la estructura del problema
Estrategia de Emparejamiento Multietapa: Propone el algoritmo Multistage Suggested Matching, que adopta diferentes estrategias en diferentes etapas para optimizar el rendimiento
Análisis de Preservación de Independencia: Desarrolla un marco de análisis que mantiene una alta independencia en los eventos de emparejamiento de diferentes aristas

Explicación Detallada del Método

Definición de la Tarea

Entrada:

Conjunto de tipos de vértices en línea $I$ y conjunto de vértices fuera de línea $J$
Conjunto de aristas $E = \{(i,j) : i \in I, j \in J_i\}$ , donde cada arista $(i,j)$ tiene peso no negativo $w_{ij}$
Tasa de llegada $\lambda_i$ para cada tipo de vértice en línea $i$

Proceso: Los vértices en línea llegan según un proceso de Poisson, donde cada vértice elige independientemente el tipo $i$ con probabilidad $\frac{\lambda_i}{\Lambda}$

Objetivo: Maximizar el peso total esperado de todas las aristas emparejadas

Marco Técnico Principal

1. Programación Lineal de Jaillet-Lu

Utiliza una programación lineal mejorada para acotar la solución óptima fuera de línea:

maximizar ∑_{(i,j)∈E} w_{ij}x_{ij}
sujeto a:
∑_j x_{ij} ≤ λ_i  ∀i ∈ I
∑_i x_{ij} ≤ 1   ∀j ∈ J  
∑_i (2x_{ij} - λ_i)^+ ≤ 1 - ln 2  ∀j ∈ J
x_{ij} ≥ 0  ∀(i,j) ∈ E

2. Técnica de Preprocesamiento

Teorema 2: Cualquier solución de la programación lineal de Jaillet-Lu puede convertirse en un emparejamiento fraccionario equivalente que satisface:

$\forall i \in I, x_i = λ_i$ (restricción 2)
$\forall j \in J, x_j = 1$ (restricción 3)
$\forall (i,j) ∈ E, x_{ij} \in \{0, \frac{1}{2}λ_i, λ_i\}$ (restricción 4)

Esto divide las aristas en dos clases:

Aristas de Clase I: $x_{ij} = λ_i$ (el tipo de vértice en línea se empareja con un único vértice fuera de línea)
Aristas de Clase II: $x_{ij} = \frac{1}{2}λ_i$ (el tipo de vértice en línea se empareja con dos vértices fuera de línea, cada uno con probabilidad media)

Arquitectura del Modelo: Emparejamiento Sugerido Multietapa

El algoritmo se divide en tres etapas temporales:

Etapa 1 ( $0 ≤ t ≤ t_0$ ):

Vértices de Clase I: Se emparejan con su único vecino (si no están emparejados)
Vértices de Clase II: Se descartan directamente

Etapa 2 ( $t_0 < t ≤ t_1$ ):

Vértices de Clase I: Se emparejan con su único vecino (si no están emparejados)
Vértices de Clase II: Se emparejan con probabilidad $\frac{1}{2}$ a cada vecino no emparejado

Etapa 3 ( $t_1 < t ≤ 1$ ):

Vértices de Clase I: Se emparejan con su único vecino (si no están emparejados)
Vértices de Clase II:
- Si en el tiempo $t_1$ solo hay un vecino no emparejado, se empareja con ese vecino
- De lo contrario, se emparejan con probabilidad $\frac{1}{2}$ a cada vecino no emparejado

Puntos de Innovación Técnica

Estrategia de Segmentación Temporal:
- Sacrificar aristas de Clase II en la etapa temprana para mejorar la probabilidad de emparejamiento de aristas de Clase I
- Ajustar la estrategia de aristas de Clase II en la etapa tardía observando el estado
Mantenimiento de Independencia:
- Observar el estado de vértices fuera de línea solo una vez en el tiempo $t_1$
- Mantener una alta independencia en los eventos de emparejamiento de diferentes aristas
Análisis de Probabilidad:
- Establecer límites inferiores independientes en la probabilidad de no emparejamiento de cada vértice fuera de línea en cualquier momento
- Calcular independientemente la probabilidad de emparejamiento de cada arista basándose en tasas de emparejamiento exactas

Configuración Experimental

Este artículo es principalmente análisis teórico, verificando el rendimiento del algoritmo mediante pruebas matemáticas:

Configuración de Parámetros

Tiempos límite: $t_0 = 0.05$ , $t_1 = 0.757$
Estos parámetros se obtienen mediante optimización numérica; ajustes adicionales solo pueden mejorar la razón de competitividad en el cuarto decimal

Métricas de Evaluación

Razón de Competitividad: Relación entre el valor objetivo esperado del algoritmo y el valor objetivo esperado del emparejamiento óptimo fuera de línea

Resultados Experimentales

Resultado Principal

Teorema 9: El algoritmo Multistage Suggested Matching es 0.645-competitivo para el problema de emparejamiento estocástico en línea ponderado por aristas.

Análisis Detallado

Para aristas de Clase I $(i,j)$ , la razón de competitividad es: $\int_0^1 E[A_j(t)]dt ≥ \int_0^{t_0} e^{-y_j t}dt + \int_{t_0}^{t_1} e^{-y_j t_0-(t-t_0)}dt + \int_{t_1}^1 e^{-y_j t_0-(t_1-t_0)-(2-y_j)(t-t_1)}dt$

Para aristas de Clase II $(i,j)$ , la razón de competitividad es: $\int_{t_0}^{t_1} E[A_j(t)]dt + E[A_{j'}(t_1)]\int_{t_1}^1 E[A_j(t)|A_{j'}(t_1)=1]dt + 2(1-E[A_{j'}(t_1)])\int_{t_1}^1 E[A_j(t)|A_{j'}(t_1)=0]dt$

Hallazgos Clave

Caso Peor: Cuando $y_j = 1 - \ln 2$ , la razón de competitividad de ambas clases de aristas alcanza el valor mínimo de 0.645
Diseño Equilibrado: Al ajustar $t_0$ y $t_1$ , el algoritmo supera la razón de competitividad de $1-\frac{1}{e} ≈ 0.632$ en cada arista
Garantía Teórica: La prueba matemática rigurosa asegura el límite inferior de rendimiento del algoritmo

Trabajo Relacionado

Evolución del Campo

Modelo del Peor Caso:
- Karp et al. (1990): Algoritmo Ranking, razón de competitividad $1-\frac{1}{e}$
- Aggarwal et al.: Extensión ponderada por vértices
Modelo de Orden Aleatorio:
- Goel y Mehta: Algoritmo Greedy, razón de competitividad $1-\frac{1}{e}$
- Mahdian y Yan: Mejora a 0.696
Emparejamiento Estocástico en Línea:
- Feldman et al. (2009): Primera superación de $1-\frac{1}{e}$ (sin pesos, con suposición de enteros)
- Ponderado por vértices: Razón de competitividad 0.716
- Ponderado por aristas con disposición libre: Razón de competitividad 0.706
- Ponderado por aristas bajo suposición de enteros: Razón de competitividad 0.705

Posicionamiento de Este Artículo

Este artículo es el primero en superar la barrera $1-\frac{1}{e}$ en la configuración general ponderada por aristas, llenando un vacío importante en este campo.

Conclusiones y Discusión

Conclusiones Principales

Avance Teórico: Primera realización de una razón de competitividad superior a $1-\frac{1}{e}$ en emparejamiento estocástico en línea general ponderado por aristas
Innovación Metodológica: Las estrategias multietapa y el análisis de independencia proporcionan nuevas herramientas técnicas para este campo
Mejora de Rendimiento: Mejora de 0.632 a 0.645, que aunque parece pequeña, es significativa teóricamente

Limitaciones

Magnitud de Mejora: Comparada con casos especiales (como el 0.716 ponderado por vértices), la mejora es relativamente pequeña
Complejidad: El algoritmo requiere control temporal preciso y observación de estado
Límite Superior Teórico: Aún hay una brecha respecto al límite superior teórico de 0.703

Direcciones Futuras

Mejora Adicional: Buscar mejores estrategias de segmentación temporal o reglas de emparejamiento
Aplicación Práctica: Aplicar el algoritmo teórico a escenarios prácticos como publicidad en línea
Extensión del Modelo: Considerar patrones de llegada más generales o condiciones de restricción

Evaluación Profunda

Ventajas

Avance Teórico Importante: Resuelve un problema abierto en este campo durante más de una década
Innovación Técnica:
- Técnica de preprocesamiento ingeniosa que simplifica la estructura del problema
- Estrategia multietapa que equilibra el rendimiento de diferentes tipos de aristas
- Marco de análisis de independencia con aplicabilidad general
Rigor Matemático:
- Análisis teórico completo y pruebas
- Cálculo de probabilidad preciso y análisis de límites
- Proceso detallado de optimización de parámetros
Posicionamiento Preciso del Problema: Identifica claramente las dificultades de la configuración general ponderada por aristas

Insuficiencias

Limitaciones de Practicidad:
- Requiere suposición precisa de llegada de Poisson
- Los parámetros temporales necesitan control preciso
- Falta validación con datos reales
Magnitud de Mejora: Aunque teóricamente importante, la mejora numérica es relativamente pequeña
Complejidad: Tanto el diseño del algoritmo como el análisis son bastante complejos, con alta dificultad de implementación

Impacto

Contribución Teórica: Proporciona progreso importante para la teoría de algoritmos en línea y teoría de emparejamiento
Valor Metodológico: Las técnicas de análisis multietapa y mantenimiento de independencia pueden ser aplicables a otros problemas
Significado Inspirador: Proporciona nuevas ideas y herramientas para mejoras adicionales

Escenarios de Aplicación

Publicidad en Línea: Asignación de anuncios en motores de búsqueda
Asignación de Recursos: Asignación dinámica de recursos en computación en la nube
Mercados de Emparejamiento: Varias plataformas de emparejamiento en línea

Referencias Bibliográficas

El artículo cita trabajos importantes en este campo, incluyendo:

Trabajo pionero de Karp et al.
Modelo de emparejamiento estocástico en línea de Feldman et al.
Mejora de programación lineal de Jaillet y Lu
Mejoras de algoritmos en varios casos especiales

Resumen: Este es un artículo de importancia significativa en el campo de la informática teórica. Aunque la mejora parece pequeña numéricamente, resuelve un problema abierto importante en este campo, demostrando profunda perspicacia técnica y análisis matemático riguroso.

Edge-weighted Online Stochastic Matching: Beating $1-\frac1e$

Emparejamiento Estocástico En Línea Ponderado por Aristas: Superando 1−1e1-\frac1e1−e1​

Emparejamiento Estocástico En Línea Ponderado por Aristas: Superando $1-\frac1e$