2025-11-25T07:52:18.319241

Tight Bounds On the Distortion of Randomized and Deterministic Distributed Voting

Abam, Kareshki, Nilipour et al.
We study metric distortion in distributed voting, where $n$ voters are partitioned into $k$ groups, each selecting a local representative, and a final winner is chosen from these representatives (or from the entire set of candidates). This setting models systems like U.S. presidential elections, where state-level decisions determine the national outcome. We focus on four cost objectives from \citep{anshelevich2022distortion}: $\avgavg$, $\avgmax$, $\maxavg$, and $\maxmax$. We present improved distortion bounds for both deterministic and randomized mechanisms, offering a near-complete characterization of distortion in this model. For deterministic mechanisms, we reduce the upper bound for $\avgmax$ from $11$ to $7$, establish a tight lower bound of $5$ for $\maxavg$ (improving on $2+\sqrt{5}$), and tighten the upper bound for $\maxmax$ from $5$ to $3$. For randomized mechanisms, we consider two settings: (i) only the second stage is randomized, and (ii) both stages may be randomized. In case (i), we prove tight bounds: $5\!-\!2/k$ for $\avgavg$, $3$ for $\avgmax$ and $\maxmax$, and $5$ for $\maxavg$. In case (ii), we show tight bounds of $3$ for $\maxavg$ and $\maxmax$, and nearly tight bounds for $\avgavg$ and $\avgmax$ within $[3\!-\!2/n,\ 3\!-\!2/(kn^*)]$ and $[3\!-\!2/n,\ 3]$, respectively, where $n^*$ denotes the largest group size.
academic

Tight Bounds On the Distortion of Randomized and Deterministic Distributed Voting

基本信息

  • 论文ID: 2509.17134
  • 标题: Tight Bounds On the Distortion of Randomized and Deterministic Distributed Voting
  • 作者: MohammadAli Abam, Davoud Kareshki, Marzieh Nilipour, MohammadHossein Paydar, Masoud Seddighin
  • 机构: Sharif University of Technology (Tehran, Iran); Tehran Institute for Advanced Studies (TeIAS), Khatam University
  • 分类: cs.GT (Game Theory)
  • 发表时间: 2025年11月23日 (arXiv v2)
  • 论文链接: https://arxiv.org/abs/2509.17134v2

摘要

本文研究分布式投票中的度量扭曲(metric distortion)问题,其中n个投票者被划分为k个组,每组选择一个本地代表,最终从这些代表(或所有候选人)中选出获胜者。该设置模拟了美国总统选举等系统。论文针对四种成本目标(avg-avg, avg-max, max-avg, max-max)提出了改进的扭曲界限。对于确定性机制,将avg-max的上界从11降至7,为max-avg建立了紧的下界5(改进了2+√5),将max-max的上界从5紧化为3。对于随机化机制,在两种设置下建立了紧或近紧的界限。

研究背景与动机

问题定义

在社会选择理论中,投票规则需要将代理人的偏好转化为最终结果。传统的集中式投票假设所有投票者的偏好可以直接聚合,但在大规模场景中(如美国总统选举),决策通常通过两阶段分布式过程完成:

  1. 组内阶段:每个组独立选择本地代表
  2. 组间阶段:从代表中选择最终获胜者

问题重要性

  1. 实际应用广泛:美国选举人团制度、联邦制决策、多层级组织投票都采用分布式结构
  2. 信息不对称:投票规则只能访问序数偏好(排序),而非真实的基数效用值
  3. 理论挑战:需要在有限信息下评估机制的性能保证

现有方法局限性

  • Anshelevich et al. (2022) 首次系统研究了确定性分布式投票的扭曲,但存在较大gap:
    • avg-max: 2+√5, 11
    • max-avg: 2+√5, 5
    • max-max: 3, 5
  • 随机化机制未被研究:尽管随机化在集中式投票中能突破扭曲下界3,但分布式场景下的随机化机制完全空白
  • 特殊度量空间:线性度量已被Voudouris (2023)解决,但一般度量空间仍有开放问题

研究动机

  1. 探索随机化能否在分布式设置中带来扭曲改进
  2. 收紧确定性机制的已知界限
  3. 提供近乎完整的分布式投票扭曲刻画

核心贡献

  1. 首次系统研究随机化分布式机制
    • rand-det机制(仅第二阶段随机):建立所有四个目标的紧界
    • rand-rand机制(两阶段均随机):建立紧或近紧界
  2. 改进确定性机制界限
    • avg-max: 上界从11降至7
    • max-avg: 下界从2+√5提升至紧的5
    • max-max: 上界从5紧化至3
  3. 引入新的分析工具——偏差锦标赛(Bias Tournament)
    • 捕捉确定性规则的平局打破偏好
    • 用于构造高扭曲实例的下界证明
  4. 欧几里得空间的专门界限
    • rand-rand: 下界√5-ε
    • rand-det: 下界2+√5-ε
  5. 集中式投票的附带结果
    • 证明随机化投票规则在max目标下的扭曲至少为3-ε(几乎匹配已知上界3)

方法详解

任务定义

输入

  • 投票者集合V(|V|=n),划分为k个组G
  • 候选人集合C(|C|=m)
  • 度量空间d:V×C→ℝ⁺,满足三角不等式
  • 偏好序π:每个投票者按距离递增排序候选人

输出

  • 分布式机制Ψ=(f_in, f_ov)选择的获胜者w

目标: 最小化扭曲D(Ψ) = sup_I Ecost(w|I) / min_c cost(c|I)

四种成本目标

  1. avg-avg: 组内平均再组间平均
  2. avg-max: 组内最大再组间平均
  3. max-avg: 组内平均再组间最大
  4. max-max: 组内最大再组间最大

核心技术框架

1. 偏差锦标赛(Bias Tournament)

定义:给定确定性规则f和候选人排序σ,构造有向完全图T(f,C,σ):

  • 顶点:每个候选人
  • 边:对于候选人对(u,w),若在两投票者偏好为σ↑w↑u和σ↑u↑w的选举中f选择u,则添加u→w的边

关键性质(Observation 2.2): 任何m个顶点的锦标赛至少有一个顶点的入度≥⌈(m-1)/2⌉

应用

  • 识别"失败候选人"(高入度)
  • 构造使该候选人成为最优但无法被选中的实例
  • 用于rand-det和det-det的下界证明

2. rand-det机制分析

机制设计:(f_pm-par, f_ur)

  • 第一阶段:Plurality Matching with Pareto Efficiency
  • 第二阶段:均匀随机选择

关键定理

Theorem 3.1 (max-avg):D((f_α, f_ur)) ≤ α+2

  • 证明思路:利用Pareto效率,存在投票者v_g偏好w_g胜过o
  • 通过三角不等式链式展开:
    E[cost(w)] ≤ cost(o) + (1/k)Σ_g d(o,w_g)
                 ≤ cost(o) + (1/k)Σ_g [d(o,v_g) + d(v_g,w_g)]
                 ≤ cost(o) + 2(1/k)Σ_g d(v_g,o)  [因为d(v_g,w_g)≤d(v_g,o)]
                 ≤ (α+2)cost(o)
    

Theorem 3.3 (avg-avg):D((f_α, f_ur)) ≤ α+2-2/k

  • 关键:分离同组和异组项,同组项贡献-2/k的改进

Theorem 3.5 (avg-max, max-max):D((f_par, f_ur)) ≤ 3

  • 仅需Pareto效率即可达到3(无需α=3的强假设)

下界构造

Theorem 3.7 (max-avg, 下界5):

  • 使用偏差锦标赛找到入度≥2的候选人c₁
  • 构造4候选人、4投票者、2组的线性度量实例
  • 确保c₂和c₃作为代表,cost(c₁)=1/4, cost(c₂)=cost(c₃)=5/4

Theorem 3.8 (avg-avg, 下界5-2/k):

  • 使用图最短路径度量(非线性)
  • k组单投票者,2k候选人
  • 树状图结构:中心候选人c_2k为最优,但每组代表为c_i (1≤i≤k)

3. rand-rand机制分析

机制设计:(f_rd, f_ur)

  • 第一阶段:Random Dictatorship(均匀随机选投票者的首选)
  • 第二阶段:均匀随机选择

关键观察(Observation 2.6):

E[cost(w)] = (1/k)Σ_g (1/n_g)Σ_{v∈g} cost(top(v))

上界证明策略

Theorem 4.1 (max-max, 上界3): 对任意投票者v:

cost(top(v)) = d(v**(top(v)), top(v))
             ≤ d(v**(top(v)), o) + d(o,v) + d(v,top(v))  [三角不等式]
             ≤ d(v**(o), o) + d(v,o) + d(v,o)  [top(v)是v的最近候选人]
             ≤ 3d(v**(o), o) = 3cost(o)

Theorem 4.4 (avg-avg, 上界3-2/(kn*)):

  • 最复杂的证明,需要精细处理双重求和
  • 关键:分离v'=v的项,贡献-2/(kn*)改进
  • 当所有组大小相等时,界为3-2/n

下界构造

Theorem 4.6 (max-avg, max-max, 下界3):

  • 2投票者、3候选人、2单投票者组
  • 线性度量:c₁(-1), c₂(0), c₃(1); v₁(-0.5), v₂(0.5)
  • 必须选c₁或c₃,cost=3/2,而cost(c₂)=1/2

Theorem 4.7 (avg-max, 下界3-2/n):

  • m个候选人、m个投票者、单组
  • 构造m个实例I_i,在I_i中c_i最优
  • 循环偏好:π_i = (c_i, c_{i+1}, ..., c_m, c_1, ..., c_)
  • 概率论证:必存在i使p_i≤1/m

Corollary 4.8:该构造也证明了集中式随机投票在max目标下的3-ε下界

Theorem 4.9 (avg-avg, 下界3-2/n):

  • k个单投票者组,k+1个候选人
  • 树状图:中心候选人c_m为最优,但不是任何组的代表

4. det-det机制改进

Theorem 5.1 (max-max, 上界3):

  • Arbitrary Dictator机制达到3
  • 改进了Anshelevich et al.的5

Theorem 5.2 (avg-max, 上界2β+3):

  • (f_par, f_β)机制
  • 关键:利用Pareto效率,与α无关
  • 取β=2(f_pm-par),得上界7

Theorem 5.4 (max-avg, 下界5):

  • 使用偏差锦标赛和图度量(非线性)
  • 4候选人、4投票者、2组
  • 构造两个实例I₁和I₂,确保至少一个排除最优候选人

技术创新点

  1. 偏差锦标赛的引入
    • 将确定性规则的平局打破行为形式化为图结构
    • 利用锦标赛的组合性质(必存在高入度顶点)
    • 可系统化构造下界实例
  2. Pareto效率的弱化利用
    • 证明avg-max只需Pareto效率即可达到3(无需α=3)
    • 解耦了两阶段的扭曲依赖关系
  3. 双重求和的精细分析
    • avg-avg目标需要处理嵌套平均
    • 通过分离对角项(v'=v, g'=g)获得改进
  4. 非线性度量空间的使用
    • 许多下界需要图最短路径度量(非嵌入线性或欧几里得)
    • 证明了问题的本质复杂性
  5. 欧几里得超单纯形构造
    • 在R^{l+1}中构造对称实例
    • 利用高维几何获得√5下界

实验设置

:本文为纯理论论文,无实验部分。所有结果通过数学证明建立。

理论验证方法

  1. 构造性证明
    • 下界:构造具体实例,计算扭曲
    • 上界:对任意实例分析机制性能
  2. 度量空间类型
    • 一般度量空间(满足三角不等式)
    • 线性度量(一维)
    • 欧几里得空间(高维)
    • 图最短路径度量
  3. 实例特征
    • 对称实例(所有组大小相等)
    • 单投票者组
    • 小规模实例(2-4个组,2-4个候选人)

实验结果

主要结果总结

Table 2:完整结果概览

机制类型目标下界上界是否紧
det-detavg-avg711
det-detavg-max2+√57
det-detmax-avg55
det-detmax-max33
rand-detavg-avg5-2/k5-2/k
rand-detavg-max33
rand-detmax-avg55
rand-detmax-max33
rand-randavg-avg3-2/n3-2/(kn*)近紧
rand-randavg-max3-2/n3近紧
rand-randmax-avg33
rand-randmax-max33

加粗表示本文新结果,↑/↓表示改进方向

关键发现

  1. 随机化的价值
    • rand-det在所有目标上达到或接近最优
    • rand-rand进一步改进avg-avg(从5-2/k到3-2/n)
    • 但max-avg和max-max无法突破3
  2. 确定性机制的极限
    • max-avg的紧界为5(高于集中式的3)
    • max-max可达到3(与集中式相同)
    • avg-max仍有gap(7 vs 2+√5)
  3. 分布式vs集中式
    • 集中式随机投票:max目标扭曲≥3-ε(Corollary 4.8)
    • 分布式增加了复杂性,某些目标扭曲更高
  4. 度量空间的影响
    • 线性度量:许多下界可在线上实现
    • 一般度量:某些下界需要图度量(如max-avg的5)
    • 欧几里得:下界略低(√5 vs 3-2/n)

技术洞察

  1. 两阶段的相互作用
    • avg-max: 第二阶段主导(2β+3与α无关)
    • max-avg: 两阶段都重要(α+2)
    • avg-avg: 精细的双重平均效应(α+2-2/k)
  2. Pareto效率的作用
    • 足以在某些目标达到3(无需完整的Plurality Matching)
    • 提供了投票者-代表关系的关键约束
  3. 概率分析的挑战
    • avg-avg的rand-rand上界需要处理四重求和
    • 对角项的精确处理至关重要

相关工作

集中式投票的扭曲

  1. 确定性机制
    • Anshelevich et al. (2018): 下界3
    • Gkatzelis et al. (2020): Plurality Matching达到上界3(紧)
    • Kizilkaya & Kempe (2022): Plurality Veto简化达到3
  2. 随机化机制
    • Anshelevich & Postl (2017): Random Dictatorship达到3-2/n
    • Charikar & Ramakrishnan (2022): 下界2.112
    • Charikar et al. (2024): 上界2.753(当前最佳)

分布式投票

  1. 效用框架
    • Filos-Ratsikas et al. (2020): 首次研究分布式扭曲
    • Filos-Ratsikas & Voudouris (2024): 随机化机制,扭曲Θ(km²)
  2. 度量框架
    • Anshelevich et al. (2022): 确定性机制的首次系统研究
    • Voudouris (2023): 线性度量的紧界
    • 本文: 一般度量的随机化机制

其他社会选择问题

  1. 设施选址:度量扭曲框架的应用
  2. 匹配问题:序数偏好下的近似
  3. 委员会选举:多获胜者设置

本文优势

  1. 首次完整研究随机化分布式机制
  2. 几乎所有界限都是紧的(9/12紧,3/12近紧)
  3. 引入新工具(偏差锦标赛)
  4. 覆盖多种度量空间(一般、线性、欧几里得)

结论与讨论

主要结论

  1. 近乎完整的刻画
    • 12个界限中9个紧,3个近紧
    • 仅det-det的avg-avg仍有较大gap(7 vs 11)
  2. 随机化的有效性
    • rand-det在所有目标达到紧界
    • rand-rand进一步改进avg-avg
    • 简单机制(Random Dictatorship + 均匀选择)即可达到最优
  3. 确定性机制的改进
    • 解决了max-avg和max-max的紧界
    • avg-max从11降至7
  4. 方法论贡献
    • 偏差锦标赛提供了系统化的下界构造框架
    • Pareto效率的弱化利用

局限性

  1. 剩余gap
    • det-det的avg-avg: 7, 11
    • rand-rand的avg-avg: 3-2/n, 3-2/(kn*)(仅在对称时紧)
    • rand-rand的avg-max: 3-2/n, 3
  2. det-rand机制未研究
    • 第一阶段确定性,第二阶段随机
    • 偏差锦标赛不适用于随机第一阶段
    • 当前仅有从rand-rand和det-det继承的粗糙界
  3. 度量空间限制
    • 某些下界需要一般度量(图最短路径)
    • 欧几里得空间的界可能更低
  4. 实用性考虑
    • 未考虑策略性行为(非激励相容)
    • 未考虑通信复杂性
    • 未考虑计算复杂性

未来方向

  1. det-rand机制
    • 开发新的分析工具
    • 可能需要不同于偏差锦标赛的技术
  2. 收紧剩余gap
    • det-det的avg-avg
    • rand-rand的avg-avg(非对称情况)
  3. 特殊度量空间
    • 线性度量:某些目标仍未解决
    • 欧几里得:可能有更低的界
    • 树度量:中间复杂度
  4. 扩展设置
    • 委员会选举(多获胜者)
    • 基数信息(访问真实距离)
    • 策略性投票(激励相容机制)
  5. 计算与通信
    • 高效算法实现
    • 通信复杂性下界
    • 在线/流式设置

深度评价

优点

  1. 理论深度
    • 12个界限中9个紧,展示了深刻的问题理解
    • 证明技术多样且精妙(偏差锦标赛、双重求和分析、概率论证)
  2. 系统性
    • 覆盖3种机制类型×4种目标=12个问题
    • 统一的框架和记号
    • 清晰的结果对比(Table 2)
  3. 方法创新
    • 偏差锦标赛:优雅地捕捉确定性规则的结构
    • Pareto效率的弱化:解耦两阶段依赖
    • 可能具有独立价值
  4. 写作质量
    • 结构清晰,逐步递进(简单到复杂)
    • 充分的直觉解释和图示
    • 完整的证明细节
  5. 完整性
    • 多种度量空间(一般、线性、欧几里得)
    • 对称和非对称实例
    • 集中式投票的附带结果

不足

  1. det-rand空白
    • 论文承认这是主要开放问题
    • 当前工具不适用,需要新方法
  2. 某些gap未收紧
    • det-det的avg-avg: 7, 11仍较大
    • 虽然作者已显著改进,但未完全解决
  3. 实用性有限
    • 纯理论结果,无实验验证
    • 未考虑真实投票系统的约束(策略性、计算)
    • 最坏情况分析可能过于悲观
  4. 度量空间依赖
    • 某些下界需要复杂的图度量
    • 实际应用中度量空间可能更结构化
  5. 机制复杂性
    • Plurality Matching计算复杂(匹配问题)
    • 实际系统可能偏好更简单的规则

影响力

  1. 理论贡献
    • 近乎完整地解决了分布式投票扭曲问题
    • 建立了该领域的基准结果
    • 偏差锦标赛可能启发其他问题
  2. 后续研究
    • det-rand机制的研究
    • 其他社会选择问题的分布式版本
    • 策略性和计算方面的扩展
  3. 实用价值
    • 为分布式投票系统设计提供理论指导
    • 量化了不同机制的性能保证
    • 但距离实际部署仍有距离
  4. 可复现性
    • 纯理论工作,证明可验证
    • 构造实例明确,易于检查
    • 无代码或实验,但不影响可复现性

适用场景

  1. 理论研究
    • 社会选择理论
    • 算法博弈论
    • 近似算法
  2. 系统设计
    • 联邦制投票系统
    • 多层级组织决策
    • 分布式共识协议
  3. 教学
    • 扭曲理论的案例研究
    • 随机化算法的应用
    • 组合优化技术
  4. 不适用场景
    • 需要激励相容的实际选举
    • 计算受限的在线系统
    • 非度量偏好空间

参考文献(关键文献)

  1. Anshelevich et al. (2022): "The distortion of distributed metric social choice" - 本文的直接前驱
  2. Gkatzelis et al. (2020): "Resolving the optimal metric distortion conjecture" - 集中式投票的紧界3
  3. Filos-Ratsikas et al. (2020): "The distortion of distributed voting" - 分布式投票的开创性工作
  4. Charikar et al. (2024): "Breaking the metric voting distortion barrier" - 随机化集中式投票的最新进展
  5. Voudouris (2023): "Tight distortion bounds for distributed metric voting on a line" - 线性度量的完整解决

总体评价:这是一篇高质量的理论论文,几乎完整地解决了分布式投票扭曲问题,引入了新的分析工具(偏差锦标赛),建立了9个紧界和3个近紧界。虽然det-rand机制仍未解决,且某些gap仍存在,但论文的系统性、技术深度和方法创新使其成为该领域的重要贡献。对于理论研究者,这是必读文献;对于实践者,提供了有价值的性能保证参考。