We study metric distortion in distributed voting, where $n$ voters are partitioned into $k$ groups, each selecting a local representative, and a final winner is chosen from these representatives (or from the entire set of candidates). This setting models systems like U.S. presidential elections, where state-level decisions determine the national outcome. We focus on four cost objectives from \citep{anshelevich2022distortion}: $\avgavg$, $\avgmax$, $\maxavg$, and $\maxmax$. We present improved distortion bounds for both deterministic and randomized mechanisms, offering a near-complete characterization of distortion in this model.
For deterministic mechanisms, we reduce the upper bound for $\avgmax$ from $11$ to $7$, establish a tight lower bound of $5$ for $\maxavg$ (improving on $2+\sqrt{5}$), and tighten the upper bound for $\maxmax$ from $5$ to $3$.
For randomized mechanisms, we consider two settings: (i) only the second stage is randomized, and (ii) both stages may be randomized. In case (i), we prove tight bounds: $5\!-\!2/k$ for $\avgavg$, $3$ for $\avgmax$ and $\maxmax$, and $5$ for $\maxavg$. In case (ii), we show tight bounds of $3$ for $\maxavg$ and $\maxmax$, and nearly tight bounds for $\avgavg$ and $\avgmax$ within $[3\!-\!2/n,\ 3\!-\!2/(kn^*)]$ and $[3\!-\!2/n,\ 3]$, respectively, where $n^*$ denotes the largest group size.
Tight Bounds On the Distortion of Randomized and Deterministic Distributed Voting 论文ID : 2509.17134标题 : Tight Bounds On the Distortion of Randomized and Deterministic Distributed Voting作者 : MohammadAli Abam, Davoud Kareshki, Marzieh Nilipour, MohammadHossein Paydar, Masoud Seddighin机构 : Sharif University of Technology (Tehran, Iran); Tehran Institute for Advanced Studies (TeIAS), Khatam University分类 : cs.GT (Game Theory)发表时间 : 2025年11月23日 (arXiv v2)论文链接 : https://arxiv.org/abs/2509.17134v2 本文研究分布式投票中的度量扭曲(metric distortion)问题,其中n个投票者被划分为k个组,每组选择一个本地代表,最终从这些代表(或所有候选人)中选出获胜者。该设置模拟了美国总统选举等系统。论文针对四种成本目标(avg-avg, avg-max, max-avg, max-max)提出了改进的扭曲界限。对于确定性机制,将avg-max的上界从11降至7,为max-avg建立了紧的下界5(改进了2+√5),将max-max的上界从5紧化为3。对于随机化机制,在两种设置下建立了紧或近紧的界限。
在社会选择理论中,投票规则需要将代理人的偏好转化为最终结果。传统的集中式投票假设所有投票者的偏好可以直接聚合,但在大规模场景中(如美国总统选举),决策通常通过两阶段分布式过程完成:
组内阶段 :每个组独立选择本地代表组间阶段 :从代表中选择最终获胜者实际应用广泛 :美国选举人团制度、联邦制决策、多层级组织投票都采用分布式结构信息不对称 :投票规则只能访问序数偏好(排序),而非真实的基数效用值理论挑战 :需要在有限信息下评估机制的性能保证Anshelevich et al. (2022) 首次系统研究了确定性分布式投票的扭曲,但存在较大gap:
avg-max: 2+√5, 11 max-avg: 2+√5, 5 max-max: 3, 5 随机化机制未被研究 :尽管随机化在集中式投票中能突破扭曲下界3,但分布式场景下的随机化机制完全空白特殊度量空间 :线性度量已被Voudouris (2023)解决,但一般度量空间仍有开放问题探索随机化能否在分布式设置中带来扭曲改进 收紧确定性机制的已知界限 提供近乎完整的分布式投票扭曲刻画 首次系统研究随机化分布式机制 :rand-det机制(仅第二阶段随机):建立所有四个目标的紧界 rand-rand机制(两阶段均随机):建立紧或近紧界 改进确定性机制界限 :avg-max: 上界从11降至7 max-avg: 下界从2+√5提升至紧的5 max-max: 上界从5紧化至3 引入新的分析工具——偏差锦标赛(Bias Tournament) :捕捉确定性规则的平局打破偏好 用于构造高扭曲实例的下界证明 欧几里得空间的专门界限 :rand-rand: 下界√5-ε rand-det: 下界2+√5-ε 集中式投票的附带结果 :证明随机化投票规则在max目标下的扭曲至少为3-ε(几乎匹配已知上界3) 输入 :
投票者集合V(|V|=n),划分为k个组G 候选人集合C(|C|=m) 度量空间d:V×C→ℝ⁺,满足三角不等式 偏好序π:每个投票者按距离递增排序候选人 输出 :
分布式机制Ψ=(f_in, f_ov)选择的获胜者w 目标 :
最小化扭曲D(Ψ) = sup_I Ecost(w|I) / min_c cost(c|I)
四种成本目标 :
avg-avg : 组内平均再组间平均avg-max : 组内最大再组间平均max-avg : 组内平均再组间最大max-max : 组内最大再组间最大定义 :给定确定性规则f和候选人排序σ,构造有向完全图T(f,C,σ):
顶点:每个候选人 边:对于候选人对(u,w),若在两投票者偏好为σ↑w↑u和σ↑u↑w的选举中f选择u,则添加u→w的边 关键性质 (Observation 2.2):
任何m个顶点的锦标赛至少有一个顶点的入度≥⌈(m-1)/2⌉
应用 :
识别"失败候选人"(高入度) 构造使该候选人成为最优但无法被选中的实例 用于rand-det和det-det的下界证明 机制设计 :(f_pm-par, f_ur)
第一阶段:Plurality Matching with Pareto Efficiency 第二阶段:均匀随机选择 关键定理 :
Theorem 3.1 (max-avg):D((f_α, f_ur)) ≤ α+2
证明思路:利用Pareto效率,存在投票者v_g偏好w_g胜过o 通过三角不等式链式展开:
E[cost(w)] ≤ cost(o) + (1/k)Σ_g d(o,w_g)
≤ cost(o) + (1/k)Σ_g [d(o,v_g) + d(v_g,w_g)]
≤ cost(o) + 2(1/k)Σ_g d(v_g,o) [因为d(v_g,w_g)≤d(v_g,o)]
≤ (α+2)cost(o)
Theorem 3.3 (avg-avg):D((f_α, f_ur)) ≤ α+2-2/k
Theorem 3.5 (avg-max, max-max):D((f_par, f_ur)) ≤ 3
仅需Pareto效率即可达到3(无需α=3的强假设) 下界构造 :
Theorem 3.7 (max-avg, 下界5):
使用偏差锦标赛找到入度≥2的候选人c₁ 构造4候选人、4投票者、2组的线性度量实例 确保c₂和c₃作为代表,cost(c₁)=1/4, cost(c₂)=cost(c₃)=5/4 Theorem 3.8 (avg-avg, 下界5-2/k):
使用图最短路径度量(非线性) k组单投票者,2k候选人 树状图结构:中心候选人c_2k为最优,但每组代表为c_i (1≤i≤k) 机制设计 :(f_rd, f_ur)
第一阶段:Random Dictatorship(均匀随机选投票者的首选) 第二阶段:均匀随机选择 关键观察 (Observation 2.6):
E[cost(w)] = (1/k)Σ_g (1/n_g)Σ_{v∈g} cost(top(v))
上界证明策略 :
Theorem 4.1 (max-max, 上界3):
对任意投票者v:
cost(top(v)) = d(v**(top(v)), top(v))
≤ d(v**(top(v)), o) + d(o,v) + d(v,top(v)) [三角不等式]
≤ d(v**(o), o) + d(v,o) + d(v,o) [top(v)是v的最近候选人]
≤ 3d(v**(o), o) = 3cost(o)
Theorem 4.4 (avg-avg, 上界3-2/(kn*)):
最复杂的证明,需要精细处理双重求和 关键:分离v'=v的项,贡献-2/(kn*)改进 当所有组大小相等时,界为3-2/n 下界构造 :
Theorem 4.6 (max-avg, max-max, 下界3):
2投票者、3候选人、2单投票者组 线性度量:c₁(-1), c₂(0), c₃(1); v₁(-0.5), v₂(0.5) 必须选c₁或c₃,cost=3/2,而cost(c₂)=1/2 Theorem 4.7 (avg-max, 下界3-2/n):
m个候选人、m个投票者、单组 构造m个实例I_i,在I_i中c_i最优 循环偏好:π_i = (c_i, c_{i+1}, ..., c_m, c_1, ..., c_) 概率论证:必存在i使p_i≤1/m Corollary 4.8 :该构造也证明了集中式随机投票在max目标下的3-ε下界
Theorem 4.9 (avg-avg, 下界3-2/n):
k个单投票者组,k+1个候选人 树状图:中心候选人c_m为最优,但不是任何组的代表 Theorem 5.1 (max-max, 上界3):
Arbitrary Dictator机制达到3 改进了Anshelevich et al.的5 Theorem 5.2 (avg-max, 上界2β+3):
(f_par, f_β)机制 关键:利用Pareto效率,与α无关 取β=2(f_pm-par),得上界7 Theorem 5.4 (max-avg, 下界5):
使用偏差锦标赛和图度量(非线性) 4候选人、4投票者、2组 构造两个实例I₁和I₂,确保至少一个排除最优候选人 偏差锦标赛的引入 :将确定性规则的平局打破行为形式化为图结构 利用锦标赛的组合性质(必存在高入度顶点) 可系统化构造下界实例 Pareto效率的弱化利用 :证明avg-max只需Pareto效率即可达到3(无需α=3) 解耦了两阶段的扭曲依赖关系 双重求和的精细分析 :avg-avg目标需要处理嵌套平均 通过分离对角项(v'=v, g'=g)获得改进 非线性度量空间的使用 :许多下界需要图最短路径度量(非嵌入线性或欧几里得) 证明了问题的本质复杂性 欧几里得超单纯形构造 :在R^{l+1}中构造对称实例 利用高维几何获得√5下界 注 :本文为纯理论论文,无实验部分。所有结果通过数学证明建立。
构造性证明 :下界:构造具体实例,计算扭曲 上界:对任意实例分析机制性能 度量空间类型 :一般度量空间(满足三角不等式) 线性度量(一维) 欧几里得空间(高维) 图最短路径度量 实例特征 :对称实例(所有组大小相等) 单投票者组 小规模实例(2-4个组,2-4个候选人) Table 2:完整结果概览
机制类型 目标 下界 上界 是否紧 det-det avg-avg 7 11 否 det-det avg-max 2+√5 7 ↓否 det-det max-avg 5 ↑5 紧 det-det max-max 3 3 ↓紧 rand-det avg-avg 5-2/k 5-2/k 紧 rand-det avg-max 3 3 紧 rand-det max-avg 5 5 紧 rand-det max-max 3 3 紧 rand-rand avg-avg 3-2/n 3-2/(kn*) 近紧 rand-rand avg-max 3-2/n 3 近紧 rand-rand max-avg 3 3 紧 rand-rand max-max 3 3 紧
加粗 表示本文新结果,↑/↓表示改进方向
随机化的价值 :rand-det在所有目标上达到或接近最优 rand-rand进一步改进avg-avg(从5-2/k到3-2/n) 但max-avg和max-max无法突破3 确定性机制的极限 :max-avg的紧界为5(高于集中式的3) max-max可达到3(与集中式相同) avg-max仍有gap(7 vs 2+√5) 分布式vs集中式 :集中式随机投票:max目标扭曲≥3-ε(Corollary 4.8) 分布式增加了复杂性,某些目标扭曲更高 度量空间的影响 :线性度量:许多下界可在线上实现 一般度量:某些下界需要图度量(如max-avg的5) 欧几里得:下界略低(√5 vs 3-2/n) 两阶段的相互作用 :avg-max: 第二阶段主导(2β+3与α无关) max-avg: 两阶段都重要(α+2) avg-avg: 精细的双重平均效应(α+2-2/k) Pareto效率的作用 :足以在某些目标达到3(无需完整的Plurality Matching) 提供了投票者-代表关系的关键约束 概率分析的挑战 :avg-avg的rand-rand上界需要处理四重求和 对角项的精确处理至关重要 确定性机制 :Anshelevich et al. (2018): 下界3 Gkatzelis et al. (2020): Plurality Matching达到上界3(紧) Kizilkaya & Kempe (2022): Plurality Veto简化达到3 随机化机制 :Anshelevich & Postl (2017): Random Dictatorship达到3-2/n Charikar & Ramakrishnan (2022): 下界2.112 Charikar et al. (2024): 上界2.753(当前最佳) 效用框架 :Filos-Ratsikas et al. (2020): 首次研究分布式扭曲 Filos-Ratsikas & Voudouris (2024): 随机化机制,扭曲Θ(km²) 度量框架 :Anshelevich et al. (2022): 确定性机制的首次系统研究 Voudouris (2023): 线性度量的紧界 本文 : 一般度量的随机化机制设施选址 :度量扭曲框架的应用匹配问题 :序数偏好下的近似委员会选举 :多获胜者设置首次完整研究随机化分布式机制 几乎所有界限都是紧的 (9/12紧,3/12近紧)引入新工具 (偏差锦标赛)覆盖多种度量空间 (一般、线性、欧几里得)近乎完整的刻画 :12个界限中9个紧,3个近紧 仅det-det的avg-avg仍有较大gap(7 vs 11) 随机化的有效性 :rand-det在所有目标达到紧界 rand-rand进一步改进avg-avg 简单机制(Random Dictatorship + 均匀选择)即可达到最优 确定性机制的改进 :解决了max-avg和max-max的紧界 avg-max从11降至7 方法论贡献 :偏差锦标赛提供了系统化的下界构造框架 Pareto效率的弱化利用 剩余gap :det-det的avg-avg: 7, 11 rand-rand的avg-avg: 3-2/n, 3-2/(kn*) (仅在对称时紧) rand-rand的avg-max: 3-2/n, 3 det-rand机制未研究 :第一阶段确定性,第二阶段随机 偏差锦标赛不适用于随机第一阶段 当前仅有从rand-rand和det-det继承的粗糙界 度量空间限制 :某些下界需要一般度量(图最短路径) 欧几里得空间的界可能更低 实用性考虑 :未考虑策略性行为(非激励相容) 未考虑通信复杂性 未考虑计算复杂性 det-rand机制 :收紧剩余gap :det-det的avg-avg rand-rand的avg-avg(非对称情况) 特殊度量空间 :线性度量:某些目标仍未解决 欧几里得:可能有更低的界 树度量:中间复杂度 扩展设置 :委员会选举(多获胜者) 基数信息(访问真实距离) 策略性投票(激励相容机制) 计算与通信 :理论深度 :12个界限中9个紧,展示了深刻的问题理解 证明技术多样且精妙(偏差锦标赛、双重求和分析、概率论证) 系统性 :覆盖3种机制类型×4种目标=12个问题 统一的框架和记号 清晰的结果对比(Table 2) 方法创新 :偏差锦标赛:优雅地捕捉确定性规则的结构 Pareto效率的弱化:解耦两阶段依赖 可能具有独立价值 写作质量 :结构清晰,逐步递进(简单到复杂) 充分的直觉解释和图示 完整的证明细节 完整性 :多种度量空间(一般、线性、欧几里得) 对称和非对称实例 集中式投票的附带结果 det-rand空白 :论文承认这是主要开放问题 当前工具不适用,需要新方法 某些gap未收紧 :det-det的avg-avg: 7, 11 仍较大 虽然作者已显著改进,但未完全解决 实用性有限 :纯理论结果,无实验验证 未考虑真实投票系统的约束(策略性、计算) 最坏情况分析可能过于悲观 度量空间依赖 :某些下界需要复杂的图度量 实际应用中度量空间可能更结构化 机制复杂性 :Plurality Matching计算复杂(匹配问题) 实际系统可能偏好更简单的规则 理论贡献 :近乎完整地解决了分布式投票扭曲问题 建立了该领域的基准结果 偏差锦标赛可能启发其他问题 后续研究 :det-rand机制的研究 其他社会选择问题的分布式版本 策略性和计算方面的扩展 实用价值 :为分布式投票系统设计提供理论指导 量化了不同机制的性能保证 但距离实际部署仍有距离 可复现性 :纯理论工作,证明可验证 构造实例明确,易于检查 无代码或实验,但不影响可复现性 理论研究 :系统设计 :教学 :不适用场景 :需要激励相容的实际选举 计算受限的在线系统 非度量偏好空间 Anshelevich et al. (2022) : "The distortion of distributed metric social choice" - 本文的直接前驱Gkatzelis et al. (2020) : "Resolving the optimal metric distortion conjecture" - 集中式投票的紧界3Filos-Ratsikas et al. (2020) : "The distortion of distributed voting" - 分布式投票的开创性工作Charikar et al. (2024) : "Breaking the metric voting distortion barrier" - 随机化集中式投票的最新进展Voudouris (2023) : "Tight distortion bounds for distributed metric voting on a line" - 线性度量的完整解决总体评价 :这是一篇高质量的理论论文,几乎完整地解决了分布式投票扭曲问题,引入了新的分析工具(偏差锦标赛),建立了9个紧界和3个近紧界。虽然det-rand机制仍未解决,且某些gap仍存在,但论文的系统性、技术深度和方法创新使其成为该领域的重要贡献。对于理论研究者,这是必读文献;对于实践者,提供了有价值的性能保证参考。