2025-11-14T20:37:10.471640

Constant Degree Networks for Almost-Everywhere Reliable Transmission

Bafna, Minzer

In the almost-everywhere reliable message transmission problem, introduced by [Dwork, Pippenger, Peleg, Upfal'86], the goal is to design a sparse communication network $G$ that supports efficient, fault-tolerant protocols for interactions between all node pairs. By fault-tolerant, we mean that that even if an adversary corrupts a small fraction of vertices in $G$, then all but a small fraction of vertices can still communicate perfectly via the constructed protocols. Being successful to do so allows one to simulate, on a sparse graph, any fault-tolerant distributed computing task and secure multi-party computation protocols built for a complete network, with only minimal overhead in efficiency. Previous works on this problem achieved either constant-degree networks tolerating $o(1)$ faults, constant-degree networks tolerating a constant fraction of faults via inefficient protocols (exponential work complexity), or poly-logarithmic degree networks tolerating a constant fraction of faults. We show a construction of constant-degree networks with efficient protocols (i.e., with polylogarithmic work complexity) that can tolerate a constant fraction of adversarial faults, thus solving the main open problem of Dwork et al.. Our main contribution is a composition technique for communication networks, based on graph products. Our technique combines two networks tolerant to adversarial edge-faults to construct a network with a smaller degree while maintaining efficiency and fault-tolerance. We apply this composition result multiple times, using the polylogarithmic-degree edge-fault tolerant networks constructed in a recent work of [Bafna, Minzer, Vyas'24] (that are based on high-dimensional expanders) with itself, and then with the constant-degree networks (albeit with inefficient protocols) of [Upfal'92].

academic

Constant Degree Networks for Almost-Everywhere Reliable Transmission

基本信息

论文ID: 2501.00337
标题: Constant Degree Networks for Almost-Everywhere Reliable Transmission
作者: Mitali Bafna (MIT), Dor Minzer (MIT)
分类: cs.DC (Distributed Computing), cs.CR (Cryptography), cs.DS (Data Structures and Algorithms)
发表时间: 2024年12月31日
论文链接: https://arxiv.org/abs/2501.00337

摘要

本文研究了由Dwork等人在1986年提出的"几乎处处可靠消息传输"问题。目标是设计一个稀疏通信网络G，支持节点对之间高效、容错的协议交互。即使对手破坏了G中一小部分顶点，除了少数顶点外，其余顶点仍能通过构建的协议完美通信。成功解决这一问题可以在稀疏图上模拟任何为完全网络构建的容错分布式计算任务和安全多方计算协议，且效率开销最小。

以往研究要么实现了容忍o(1)故障的常数度网络，要么通过低效协议（指数工作复杂度）实现了容忍常数比例故障的常数度网络，或者实现了容忍常数比例故障的多对数度网络。本文展示了一种具有高效协议（多对数工作复杂度）的常数度网络构造，能够容忍常数比例的对抗性故障，从而解决了Dwork等人提出的主要开放问题。

研究背景与动机

问题背景

分布式计算的现实需求：现代大规模网络中的计算任务通常需要在多台机器间分布式执行，包括拜占庭一致性、集体抛硬币、扑克等安全多方计算任务。
完全连接假设的不现实性：大多数容错协议假设每台机器都能直接与其他所有机器通信，但这在现代大规模稀疏连接网络中不切实际。
稀疏网络的挑战：在稀疏网络中，如果节点度数d远小于故障节点数t，一些诚实节点可能因为所有邻居都被破坏而变得孤立。

问题重要性

理论意义：解决了分布式计算理论中的一个基础问题，连接了理论模型与实际网络约束
实用价值：为大规模分布式系统提供了理论基础，特别是区块链、分布式存储等领域
安全性保证：在对抗环境下维护网络通信能力，对网络安全具有重要意义

现有方法局限性

DPPU86：常数度网络，但只能容忍ε = 1/log n的故障率
Upf92：常数度网络可容忍常数比例故障，但工作复杂度为指数级
CGO10, JRV20：多对数度网络可容忍常数比例故障，但度数不是常数
BMV24：多对数度网络，高效协议，但度数仍非常数

核心贡献

解决了主要开放问题：构造了首个同时具备常数度、多对数工作复杂度和常数容错率的网络
提出了组合技术：基于图乘积的通信网络组合技术，能够降低网络度数同时保持效率和容错性
建立了理论框架：为边故障模型下的网络组合提供了理论基础
实现了参数最优化：在所有关键参数（度数、工作复杂度、容错率）上都达到了理想目标

方法详解

任务定义

几乎处处可靠消息传输问题：

输入：n个节点的通信网络G = (V,E)
目标：设计协议集合R = {R(u,v)}使得任意两个节点都能可靠通信
约束：在ε比例的边被破坏时，最多νn个节点变为"注定失败"节点

关键参数：

稀疏性：图G的度数（理想为常数）
轮复杂度：通信轮数（理想为O(log n)）
工作复杂度：总计算量（理想为polylog n）
容错性：(ε,ν)-容错，其中ε为常数，ν = ε^Ω(1)

核心技术：平衡替换乘积

图乘积定义：给定n个顶点的d-正则图G和d个顶点的k-正则图H，构造Z = G ⊙ H：

顶点构造：将G的每个顶点u替换为H的一个副本Cu（称为云）
边关联：G中每条边e与其端点云中的特定顶点关联
连接规则：对于G中的边e = (u,v)，在Cu和Cv的关联顶点间添加deg(H)条平行边

关键性质：

Z有|V(G)||V(H)|个顶点
每个顶点度数为2deg(H)
云内边数等于云间边数

协议设计

排列分解：

将Z上的排列π分解为d个G上的排列π₁,...,πd
每个协议R((u,a), π(u,a))模拟相应的G上协议R(u,πᵢ(u))

云到云协议：

Cv → (v,e₁) → (w,e₂) → Cw

每个箭头表示通过多数投票的传播过程。

模拟过程：

初始化：(u,a)将消息m发送给云Cu中所有顶点
轮模拟：对于R的每一轮t：
- 每个云中顶点计算应发送的消息向量
- 通过云到云协议传输消息向量
- 更新各顶点的历史记录
结果输出：目标顶点通过多数投票得到最终消息

技术创新点

边故障模型：相比顶点故障模型更强，为超常数度图提供了更强的结果
组合保持性质：组合后的网络继承较小网络的度数和较大网络的效率
递归应用：可以多次应用组合技术逐步降低度数

实验设置

理论构造过程

本文主要是理论工作，通过以下构造序列验证方法有效性：

G₁：来自BMV24的多对数度网络，度数polylog N
G₂：另一个BMV24网络，度数polylog log N
G₃ = G₁ ⊙ G₂：度数polylog log log N
G₄：再次应用BMV24构造
G₅ = G₃ ⊙ G₄：度数poly(log log log N) ≤ log log N
G₆：Upf92的常数度网络
G₇ = G₅ ⊙ G₆：最终的常数度网络

参数设置

容错参数：ε³² → O(ε)的容错保证
工作复杂度：保持polylog n
轮复杂度：Õ(log n)
成功概率：1 - exp(-n^polylog n)

实验结果

主要理论结果

定理1.1：存在常数D，对于所有ε > 0和足够大的n，存在D-正则图G，具有Θ(n)个顶点和协议集合R = {R(u,v)}，满足：

工作复杂度：polylog n
轮复杂度：Õ(log n)
容错性：ε比例边故障下，至多poly(ε)比例顶点注定失败

引理1.2（排列模型）：存在常数D，对于所有排列π，图G允许(ε³², O(ε))-边容错的路由协议。

组合定理

引理3.1：如果G具有(ε₁,ν₁)-边容错性，H具有相应的协议集合，那么Z = G ⊙ H具有(ε,ν)-边容错性，其中：

ε ≲ min(c, ε₂², (ε₁ - O(ν₂))²)
ν ≲ O(√ε + ν₁ + ν₂)
工作复杂度：O(W₁W₂)
轮复杂度：O(R₁R₂)

应用效果

通过递归应用组合技术：

从polylog度降至常数度
保持多对数工作复杂度
维持常数容错率
构造时间为多项式

相关工作

历史发展

DPPU86：开创性工作，提出问题并给出初始解决方案
Upf92：常数度网络但指数工作复杂度
CGO10, CGO12：改进参数但度数仍为多对数
JRV20：进一步优化但未解决主要问题
BMV24：基于高维展开子的多对数度解决方案

技术联系

PCP理论：组合技术受概率可检验证明启发
展开子理论：利用RVW02的图乘积技术
高维展开子：BMV24的构造基于LSV05的代数构造

本文优势

首次同时实现所有理想参数
提供了通用的组合框架
在边故障模型下给出最强结果

结论与讨论

主要结论

解决开放问题：完全解决了DPPU86提出的主要开放问题
建立理论框架：为网络组合提供了系统性方法
实现参数最优：在所有关键参数上达到理想目标

局限性

边故障假设：不清楚组合技术是否适用于纯顶点故障模型
常数因子：虽然度数是常数，但具体常数可能较大
构造复杂性：需要多层递归构造，实际实现可能复杂

未来方向

顶点故障模型：研究组合技术在顶点故障下的适用性
具体参数优化：降低隐含的常数因子
实际应用：将理论结果应用到具体的分布式系统中
动态网络：扩展到动态变化的网络环境

深度评价

优点

理论突破：解决了30多年的开放问题，具有重要理论价值
技术创新：图乘积组合技术新颖且通用
结果完整：同时优化了所有关键参数
分析严谨：数学证明完整，技术细节充分

不足

实用性有限：主要是理论结果，距离实际应用还有距离
常数较大：虽然是常数度，但可能在实际中不够小
构造复杂：多层递归使得实际构造较为复杂

影响力

理论影响：将成为分布式计算理论的重要里程碑
技术影响：组合技术可能启发其他领域的研究
实用价值：为未来的分布式系统设计提供理论指导

适用场景

大规模分布式计算系统
区块链共识协议
容错存储系统
安全多方计算平台

参考文献

关键参考文献包括：

DPPU86: 原始问题提出
BMV24: 高维展开子构造
Upf92: 常数度网络基础
RVW02: 图乘积理论
LSV05a,b: 高维展开子的代数构造

本文通过创新的图乘积组合技术，成功解决了分布式计算中一个重要的开放问题，在理论上具有重大突破意义。虽然在实用性方面还有提升空间，但为未来的研究和应用奠定了坚实的理论基础。