We study the edge-weighted online stochastic matching problem. Since Feldman, Mehta, Mirrokni, and Muthukrishnan proposed the $(1-\frac1e)$-competitive Suggested Matching algorithm, there has been no improvement for the general edge-weighted online stochastic matching problem. In this paper, we introduce the first algorithm beating the $1-\frac1e$ barrier in this setting, achieving a competitive ratio of $0.645$. Under the LP proposed by Jaillet and Lu, we design an algorithmic preprocessing, dividing all edges into two classes. Then based on the Suggested Matching algorithm, we adjust the matching strategy to improve the performance on one class in the early stage and on another class in the late stage, while keeping the matching events of different edges highly independent. By balancing them, we finally guarantee the matched probability of every single edge.
论文ID : 2210.12543标题 : Edge-weighted Online Stochastic Matching: Beating 1 − 1 e 1-\frac1e 1 − e 1 作者 : Shuyi Yan (哥本哈根大学计算机科学系)分类 : cs.DS (数据结构与算法), cs.GT (博弈论)发表时间 : 2025年4月8日 (arXiv预印本第3版)论文链接 : https://arxiv.org/abs/2210.12543 本文研究边加权在线随机匹配问题。自从Feldman等人提出( 1 − 1 e ) (1-\frac1e) ( 1 − e 1 ) -竞争性的Suggested Matching算法以来,在一般边加权在线随机匹配问题上一直没有改进。本文首次提出突破1 − 1 e 1-\frac1e 1 − e 1 屏障的算法,实现了0.645的竞争比。基于Jaillet和Lu提出的线性规划,我们设计了算法预处理,将所有边分为两类。然后基于Suggested Matching算法,调整匹配策略以在早期阶段改善一类边的性能,在后期阶段改善另一类边的性能,同时保持不同边的匹配事件高度独立。通过平衡这些操作,最终保证每条边的匹配概率。
在线二部匹配问题自Karp等人在1990年引入以来,在在线算法领域扮演着重要角色。其最重要的应用是在线广告:当用户在搜索引擎上搜索时,需要选择合适的广告展示。在这个问题中,广告商被建模为离线顶点(算法开始时已知),印象(用户搜索)被建模为在线顶点(逐一到达)。
最坏情况模型 :Karp等人的Ranking算法在无权匹配中达到1 − 1 e ≈ 0.632 1-\frac1e \approx 0.632 1 − e 1 ≈ 0.632 的竞争比,并证明了其最优性。在线随机匹配模型 :Feldman等人提出的Suggested Matching算法在一般边加权设置中仍然只能达到1 − 1 e 1-\frac1e 1 − e 1 的竞争比。特殊情况的改进 :虽然在顶点加权匹配、带自由处置的边加权匹配等特殊情况下已有改进,但一般边加权设置缺乏这些有用性质。一般边加权设置本质上更困难,因为:
轻边可能占据离线顶点,阻止重边在未来匹配 无法简单地通过下界每个顶点或边的匹配概率来获得好的竞争比 上界0.703表明该设置确实比特殊情况更困难 首次突破1 − 1 e 1-\frac1e 1 − e 1 屏障 :在一般边加权在线随机匹配问题中提出竞争比为0.645的多项式时间算法创新的预处理技术 :基于Jaillet-Lu线性规划设计预处理,将边分为两类并简化问题结构多阶段匹配策略 :提出Multistage Suggested Matching算法,在不同阶段采用不同策略优化性能独立性保持分析 :发展了保持不同边匹配事件高度独立的分析框架输入 :
在线顶点类型集合I I I 和离线顶点集合J J J 边集E = { ( i , j ) : i ∈ I , j ∈ J i } E = \{(i,j) : i \in I, j \in J_i\} E = {( i , j ) : i ∈ I , j ∈ J i } ,每条边( i , j ) (i,j) ( i , j ) 有非负权重w i j w_{ij} w ij 每个在线顶点类型i i i 的到达率λ i \lambda_i λ i 过程 :在线顶点按泊松过程到达,每个顶点独立地以概率λ i Λ \frac{\lambda_i}{\Lambda} Λ λ i 选择类型i i i
目标 :最大化所有匹配边的期望总权重
使用改进的线性规划界定离线最优解:
maximize ∑_{(i,j)∈E} w_{ij}x_{ij}
subject to:
∑_j x_{ij} ≤ λ_i ∀i ∈ I
∑_i x_{ij} ≤ 1 ∀j ∈ J
∑_i (2x_{ij} - λ_i)^+ ≤ 1 - ln 2 ∀j ∈ J
x_{ij} ≥ 0 ∀(i,j) ∈ E
定理2 :任何Jaillet-Lu线性规划的解都可以转换为满足以下条件的等价分数匹配:
∀ i ∈ I , x i = λ i \forall i \in I, x_i = λ_i ∀ i ∈ I , x i = λ i (约束2)∀ j ∈ J , x j = 1 \forall j \in J, x_j = 1 ∀ j ∈ J , x j = 1 (约束3)∀ ( i , j ) ∈ E , x i j ∈ { 0 , 1 2 λ i , λ i } \forall (i,j) ∈ E, x_{ij} \in \{0, \frac{1}{2}λ_i, λ_i\} ∀ ( i , j ) ∈ E , x ij ∈ { 0 , 2 1 λ i , λ i } (约束4)这将边分为两类:
一类边 :x i j = λ i x_{ij} = λ_i x ij = λ i (在线顶点类型只匹配一个离线顶点)二类边 :x i j = 1 2 λ i x_{ij} = \frac{1}{2}λ_i x ij = 2 1 λ i (在线顶点类型匹配两个离线顶点各一半)算法分为三个时间阶段:
阶段1 (0 ≤ t ≤ t 0 0 ≤ t ≤ t_0 0 ≤ t ≤ t 0 ):
一类顶点:匹配到唯一邻居(如果未匹配) 二类顶点:直接丢弃 阶段2 (t 0 < t ≤ t 1 t_0 < t ≤ t_1 t 0 < t ≤ t 1 ):
一类顶点:匹配到唯一邻居(如果未匹配) 二类顶点:以概率1 2 \frac{1}{2} 2 1 匹配到每个未匹配邻居 阶段3 (t 1 < t ≤ 1 t_1 < t ≤ 1 t 1 < t ≤ 1 ):
一类顶点:匹配到唯一邻居(如果未匹配) 二类顶点:
如果在时间t 1 t_1 t 1 时只有一个邻居未匹配,则匹配到该邻居 否则以概率1 2 \frac{1}{2} 2 1 匹配到每个未匹配邻居 时间分段策略 :早期牺牲二类边来提高一类边的匹配概率 后期观察状态调整二类边策略 独立性维护 :只在时间t 1 t_1 t 1 观察一次离线顶点状态 保持不同边匹配事件的高度独立性 概率分析 :独立下界每个离线顶点在任意时间的未匹配概率 基于精确匹配率独立计算每条边的匹配概率 本文主要是理论分析,通过数学证明验证算法性能:
边界时间:t 0 = 0.05 t_0 = 0.05 t 0 = 0.05 , t 1 = 0.757 t_1 = 0.757 t 1 = 0.757 这些参数通过数值优化获得,进一步调整只能在小数点后第4位改善竞争比 竞争比 :算法期望目标值与离线最优匹配期望目标值的比值
定理9 :Multistage Suggested Matching算法对边加权在线随机匹配问题是0.645-竞争的。
对于一类边( i , j ) (i,j) ( i , j ) ,竞争比为:
∫ 0 1 E [ A j ( t ) ] d t ≥ ∫ 0 t 0 e − y j t d t + ∫ t 0 t 1 e − y j t 0 − ( t − t 0 ) d t + ∫ t 1 1 e − y j t 0 − ( t 1 − t 0 ) − ( 2 − y j ) ( t − t 1 ) d t \int_0^1 E[A_j(t)]dt ≥ \int_0^{t_0} e^{-y_j t}dt + \int_{t_0}^{t_1} e^{-y_j t_0-(t-t_0)}dt + \int_{t_1}^1 e^{-y_j t_0-(t_1-t_0)-(2-y_j)(t-t_1)}dt ∫ 0 1 E [ A j ( t )] d t ≥ ∫ 0 t 0 e − y j t d t + ∫ t 0 t 1 e − y j t 0 − ( t − t 0 ) d t + ∫ t 1 1 e − y j t 0 − ( t 1 − t 0 ) − ( 2 − y j ) ( t − t 1 ) d t
对于二类边( i , j ) (i,j) ( i , j ) ,竞争比为:
∫ t 0 t 1 E [ A j ( t ) ] d t + E [ A j ′ ( t 1 ) ] ∫ t 1 1 E [ A j ( t ) ∣ A j ′ ( t 1 ) = 1 ] d t + 2 ( 1 − E [ A j ′ ( t 1 ) ] ) ∫ t 1 1 E [ A j ( t ) ∣ A j ′ ( t 1 ) = 0 ] d t \int_{t_0}^{t_1} E[A_j(t)]dt + E[A_{j'}(t_1)]\int_{t_1}^1 E[A_j(t)|A_{j'}(t_1)=1]dt + 2(1-E[A_{j'}(t_1)])\int_{t_1}^1 E[A_j(t)|A_{j'}(t_1)=0]dt ∫ t 0 t 1 E [ A j ( t )] d t + E [ A j ′ ( t 1 )] ∫ t 1 1 E [ A j ( t ) ∣ A j ′ ( t 1 ) = 1 ] d t + 2 ( 1 − E [ A j ′ ( t 1 )]) ∫ t 1 1 E [ A j ( t ) ∣ A j ′ ( t 1 ) = 0 ] d t
最坏情况 :当y j = 1 − ln 2 y_j = 1 - \ln 2 y j = 1 − ln 2 时,两类边的竞争比都达到最小值0.645平衡设计 :通过调整t 0 t_0 t 0 和t 1 t_1 t 1 ,算法在每条边上都超过1 − 1 e ≈ 0.632 1-\frac{1}{e} ≈ 0.632 1 − e 1 ≈ 0.632 的竞争比理论保证 :严格的数学证明确保了算法的性能下界最坏情况模型 :Karp等人(1990):Ranking算法,1 − 1 e 1-\frac{1}{e} 1 − e 1 竞争比 Aggarwal等人:顶点加权扩展 随机顺序模型 :Goel和Mehta:Greedy算法,1 − 1 e 1-\frac{1}{e} 1 − e 1 竞争比 Mahdian和Yan:改进到0.696 在线随机匹配 :Feldman等人(2009):首次突破1 − 1 e 1-\frac{1}{e} 1 − e 1 (无权,整数假设) 顶点加权:0.716竞争比 带自由处置边加权:0.706竞争比 整数假设下边加权:0.705竞争比 本文是首个在一般边加权设置下突破1 − 1 e 1-\frac{1}{e} 1 − e 1 屏障的工作,填补了该领域的重要空白。
理论突破 :首次在一般边加权在线随机匹配中实现超过1 − 1 e 1-\frac{1}{e} 1 − e 1 的竞争比方法创新 :多阶段策略和独立性分析为该领域提供了新的技术工具性能提升 :从0.632提升到0.645,虽然看似微小但在理论上具有重要意义改进幅度 :相比特殊情况(如顶点加权的0.716),改进幅度相对较小复杂性 :算法需要精确的时间控制和状态观察理论上界 :距离0.703的理论上界仍有差距进一步改进 :寻找更好的时间分段策略或匹配规则实际应用 :将理论算法应用到实际在线广告等场景扩展模型 :考虑更一般的到达模式或约束条件重要理论突破 :解决了该领域十多年来的开放问题技术创新性 :巧妙的预处理技术简化问题结构 多阶段策略平衡不同类型边的性能 独立性分析框架具有普适性 数学严谨性 :完整的理论分析和证明 精确的概率计算和界限分析 详细的参数优化过程 问题定位准确 :清晰识别一般边加权设置的困难所在实用性限制 :需要精确的泊松到达假设 时间参数需要精确控制 缺乏实际数据验证 改进幅度 :虽然理论上重要,但数值改进相对较小复杂性 :算法设计和分析都相当复杂,实现难度较高理论贡献 :为在线算法和匹配理论提供了重要进展方法论价值 :多阶段分析和独立性维护技术可能适用于其他问题启发意义 :为进一步改进提供了新的思路和工具在线广告 :搜索引擎广告分配资源分配 :云计算资源动态分配匹配市场 :各种在线匹配平台论文引用了该领域的重要工作,包括:
Karp等人的开创性工作 Feldman等人的在线随机匹配模型 Jaillet和Lu的线性规划改进 各种特殊情况下的算法改进 总结 :这是一篇在理论计算机科学领域具有重要意义的论文,虽然改进幅度看似微小,但解决了该领域的一个重要开放问题,展示了深刻的技术洞察和严谨的数学分析。