2025-11-15T01:49:11.595404

$O(\log n)$-Approximation Algorithms for Bipartiteness Ratio

Soma, Ye, Yoshida
We propose an $O(\log n)$-approximation algorithm for the bipartiteness ratio of undirected graphs introduced by Trevisan (SIAM Journal on Computing, vol. 41, no. 6, 2012), where $n$ is the number of vertices. Our approach extends the cut-matching game framework for sparsest cut to the bipartiteness ratio, and requires only $\mathop{\mathrm{polylog}} n$ many single-commodity undirected maximum flow computations. Therefore, with the current fastest undirected max-flow algorithms, it runs in almost linear time. Along the way, we introduce the concept of well-linkedness for skew-symmetric graphs and prove a novel characterization of bipartiteness ratio in terms of well-linkedness in an auxiliary skew-symmetric graph, which may be of independent interest. As an application, we devise an $\tilde{O}(mn)$-time algorithm for the minimum uncut problem: given a graph whose optimal cut leaves an $η$ fraction of edges uncut, we find a cut that leaves only an $O(\log n \log(1/η)) \cdot η$ fraction of edges uncut, where $m$ is the number of edges. Finally, we propose a directed analogue of the bipartiteness ratio, and we give a polynomial-time algorithm that achieves an $O(\log n)$ approximation for this measure via a directed Leighton--Rao-style embedding. We also propose an algorithm for the minimum directed uncut problem with a guarantee similar to that for the minimum uncut problem.
academic

O(logn)O(\log n)-Approximation Algorithms for Bipartiteness Ratio

基本信息

  • 论文ID: 2507.12847
  • 标题: O(logn)O(\log n)-Approximation Algorithms for Bipartiteness Ratio
  • 作者: Tasuku Soma (The Institute of Statistical Mathematics & RIKEN AIP), Mingquan Ye (National Institute of Informatics & University of California, Santa Cruz), Yuichi Yoshida (National Institute of Informatics)
  • 分类: cs.DS (Data Structures and Algorithms)
  • 发表时间: November 5, 2025 (arXiv v2)
  • 论文链接: https://arxiv.org/abs/2507.12847

摘要

本文提出了首个针对无向图二部性比率(bipartiteness ratio)的O(logn)O(\log n)近似算法,其中nn为顶点数。该方法将稀疏割(sparsest cut)的割-匹配博弈框架扩展到二部性比率问题,仅需polylog n\text{polylog } n次单商品无向最大流计算。结合当前最快的无向最大流算法,可实现近线性时间复杂度。研究引入了偏对称图的良好连接性概念,并证明了二部性比率在辅助偏对称图中关于良好连接性的新刻画。作为应用,提出了O~(mn)\tilde{O}(mn)时间的最小未割(minimum uncut)算法。此外,定义了有向二部性比率,并通过有向Leighton-Rao风格嵌入给出O(logn)O(\log n)近似算法。

研究背景与动机

问题定义

二部性比率问题是Trevisan Tre12引入的图论优化问题。对于无向图G=(V,E,w)G=(V,E,w),定义: β(G):=minx{0,±1}V{0}e=(i,j)Ew(e)xi+xjiVdeg(i)xi\beta(G) := \min_{x\in\{0,\pm1\}^V\setminus\{0\}} \frac{\sum_{e=(i,j)\in E} w(e)\cdot|x_i+x_j|}{\sum_{i\in V} \deg(i)\cdot|x_i|}

这个比率刻画了图与二部图的偏离程度:β(G)=0\beta(G)=0当且仅当GG是二部图。

研究重要性

  1. 理论意义: 二部性比率是对偶Cheeger不等式的核心概念,与归一化拉普拉斯矩阵的最大特征值λn\lambda_n紧密相关: 2λn2β(G)2(2λn)\frac{2-\lambda_n}{2} \leq \beta(G) \leq \sqrt{2(2-\lambda_n)}
  2. 应用价值:
    • 谱算法设计:Trevisan利用该不等式设计了最大割的纯谱算法
    • 网络分析:在符号图聚类、社区检测等领域有应用XOG20; AL20; NP22
    • 组合优化:与最大割、最小未割等经典问题密切相关

现有方法局限性

  1. 缺乏近似算法: 尽管Cheeger不等式和稀疏割有成熟的近似算法(如O(logn)O(\sqrt{\log n})近似),但二部性比率此前没有任何多项式时间近似算法
  2. 谱方法不足: 现有谱方法(基于特征向量)仅能给出理论界,无法直接求解优化问题
  3. 与稀疏割的差异: 虽然二部性比率形式上类似稀疏割,但其约束条件(三分割结构)使得直接应用现有技术面临挑战

研究动机

填补二部性比率近似算法的空白,为图谱理论和组合优化提供新的算法工具。

核心贡献

  1. 首个近似算法: 提出首个针对bb-二部性比率的O(logn)O(\log n)近似算法,时间复杂度为O~(min{b(V),n2}+m)\tilde{O}(\min\{b(V),n^2\}+m)
  2. 理论创新:
    • 引入偏对称图的良好连接性(well-linkedness)概念
    • 证明二部性比率与辅助图GG'良好连接性的等价刻画(定理3.5)
    • 将割-匹配博弈框架从稀疏割扩展到二部性比率
  3. 最小未割应用: 设计O~(mn)\tilde{O}(mn)时间算法,对最小未割比率为η\eta的图,找到未割比率为O(lognlog(1/η))ηO(\log n\log(1/\eta))\cdot\eta的割
  4. 有向扩展:
    • 定义有向二部性比率及其小模函数刻画
    • 通过有向1\ell_1嵌入实现O(logn)O(\log n)近似
    • 提供有向最小未割算法

方法详解

任务定义

bb-二部性比率: 给定无向图G=(V,E,w)G=(V,E,w)和正顶点权重b:VZ++b:V\to\mathbb{Z}_{++},定义: βb(G):=minx{0,±1}V{0}βb(x),βb(x):=(i,j)Ew(i,j)xi+xjiVb(i)xi\beta_b(G) := \min_{x\in\{0,\pm1\}^V\setminus\{0\}} \beta_b(x), \quad \beta_b(x) := \frac{\sum_{(i,j)\in E} w(i,j)\cdot|x_i+x_j|}{\sum_{i\in V} b(i)\cdot|x_i|}

输入: 图GG,边权ww,顶点权bb,参数r>0r>0
输出: 向量x{0,±1}Vx\in\{0,\pm1\}^V使得βb(x)O(logn)βb(G)\beta_b(x)\leq O(\log n)\cdot\beta_b(G)

核心技术框架

1. 辅助图构造

构造偏对称二部图G=(V+V,E)G'=(V^+\cup V^-,E'):

  • V+,VV^+,V^-VV的两个不相交副本
  • 对每条边(i,j)E(i,j)\in E,添加边(i+,j)(i^+,j^-)(i,j+)(i^-,j^+)EE'
  • 继承边权和顶点权

关键性质(引理3.2): 对任意x{0,±1}Vx\in\{0,\pm1\}^V对应的三分割(L,R,Z)(L,R,Z),令S=L+RS=L^+\cup R^-,则: βb(x)=w(E(S,Sˉ))b(S)\beta_b(x) = \frac{w(E'(S,\bar{S}))}{b(S)}

因此: βb(G)=minS=L+R, disjoint L,RVw(E(S,Sˉ))b(S)\beta_b(G) = \min_{S=L^+\cup R^-, \text{ disjoint }L,R\subseteq V} \frac{w(E'(S,\bar{S}))}{b(S)}

2. 良好连接性刻画

定义(对称源汇对): (A,B)(A,B)称为对称的,如果存在不相交的L,RVL,R\subseteq V使得: A=L+R,B=LR+A = L^+\cup R^-, \quad B = L^-\cup R^+

定义3.3(良好连接性): 对称对(A,B)(A,B)称为rr-良好连接的,如果辅助网络NA,B,r\mathcal{N}_{A,B,r}中存在s+s^+ss^-的饱和流,其中:

  • 边容量:s+s^+AA中每个顶点uu的容量为b(u)b(u);BBss^-类似
  • EE'中边ee的容量为w(e)/rw(e)/r

GG'称为rr-良好连接的,如果所有对称对都是rr-良好连接的。

定理3.5(核心刻画): βb(G)r\beta_b(G)\geq r 当且仅当 GG'rr-良好连接的。

证明思路:

  • (⇒) 若βb(G)r\beta_b(G)\geq r,则对任意对称(A,B)(A,B),最小s+s^+-ss^-割值b(A)\geq b(A),由最大流最小割定理存在饱和流
  • (⇐) 若存在对称(A,B)(A,B)不是rr-良好连接,则最小割对应的一致集SS满足w(E(S,Sˉ))/b(S)<rw(E'(S,\bar{S}))/b(S)<r

3. 割-匹配博弈

博弈框架(算法1):

  • 维护: MMWU密度矩阵XtX_t,空多重图HH
  • 每轮:
    1. 割玩家: 计算Db1/2XtDb1/2D_b^{-1/2}X_tD_b^{-1/2}的(近似)Gram分解{vi}\{v_i\}
    2. 采样高斯向量gN(0,In)g\sim\mathcal{N}(0,I_n),计算v~i=g,vi\tilde{v}_i=\langle g,v_i\rangle
    3. L={i:v~i>0}L'=\{i:\tilde{v}_i>0\},R={i:v~i<0}R'=\{i:\tilde{v}_i<0\},取较大的作为LL,设(A,B)(A,B)为对应对称对
    4. 判断: 若(A,B)(A,B)不是rr-良好连接,返回最小割对应的xx
    5. 匹配玩家: 否则找饱和流,分解为路径多重集Pt\mathcal{P}_t,需求图为MtM_t
    6. 更新Ft=Db1/2(DMt+AMt)Db1/2F_t = D_b^{-1/2}(D_{M_t}+A_{M_t})D_b^{-1/2},进行MMWU更新
  • 终止: T=O(log2n)T=O(\log^2 n)轮后,返回H=M1MTH=M_1\oplus\cdots\oplus M_T

关键分析:

  1. 宽度: Ft4IF_t\preceq 4I(引理证明)
  2. 增益: Ft,Xt=(i,j)Mtvi+vj2Ω(1/logn)\langle F_t,X_t\rangle = \sum_{(i,j)\in M_t}\|v_i+v_j\|^2 \geq \Omega(1/\log n)(通过高斯投影)
  3. MMWU界(引理3.7): λmin(t=1TFt)(1ρδ)t=1TFt,Xtlnnδ\lambda_{\min}\left(\sum_{t=1}^T F_t\right) \geq (1-\rho\delta)\sum_{t=1}^T\langle F_t,X_t\rangle - \frac{\ln n}{\delta}
    δ=O(1)\delta=O(1),T=O(log2n)T=O(\log^2 n),得λminΩ(logn)\lambda_{\min}\geq\Omega(\log n)
  4. 证书: 引理3.9证明βb(H)=Ω(logn)\beta_b(H)=\Omega(\log n),由于HH可以O(T)O(T)拥塞嵌入到GG,得βb(G)=Ω(r/logn)\beta_b(G)=\Omega(r/\log n)

技术创新点

  1. 偏对称性利用: 通过辅助图GG'的偏对称结构,将三分割问题转化为对称源汇对的流问题,这是关键的问题重构
  2. 一致割引理(引理3.4): 利用偏对称性和引理2.5,证明可以总是找到一致的最小割,简化了分析
  3. 高斯投影技巧:
    • 将高维Gram分解投影到一维,保持vi+vj\|v_i+v_j\|的近似(式3.6)
    • 引理3.8用Laurent-Massart界保证b(i)v~i21/2\sum b(i)|\tilde{v}_i|^2\geq 1/2以常数概率成立
  4. 快速Gram分解(引理3.11): 通过JL降维和截断Taylor展开,将O(n3)O(n^3)的精确分解降至O~(min{b(V),n2})\tilde{O}(\min\{b(V),n^2\})

实验设置

理论算法,无实验部分

本文是纯理论算法论文,主要贡献在于:

  1. 理论保证:O(logn)O(\log n)近似比
  2. 时间复杂度分析:O~(m)\tilde{O}(m)对原始二部性比率
  3. 与现有方法的理论对比(表1)

实验结果

理论结果总结

主要定理(定理3.12):

  • 近似比: O(logn)O(\log n)
  • 时间复杂度:
    • O(log3nmax{log2n,logb(V)}min{b(V),n2})O(\log^3 n\cdot\max\{\log^2 n,\log b(V)\}\cdot\min\{b(V),n^2\})算术运算
    • O(log2n)O(\log^2 n)次单商品最大流计算
  • 成功概率: 11/poly(n)\geq 1-1/\text{poly}(n)

最小未割应用(定理4.1):

  • 输入: 最小未割比率为η\eta的图
  • 输出: 未割比率O(lognlog(1/η))η\leq O(\log n\log(1/\eta))\cdot\eta的割
  • 时间: O~(mn)\tilde{O}(mn)

对比分析(表1):

方法未割比率时间复杂度
Tre12O(η)O(\sqrt{\eta})谱分解
KLLO+13O(kαklogαkkη)ηO(\frac{k}{\alpha_k}\log\frac{\alpha_k}{k\eta})\cdot\eta谱分解
GS111+ελnkη\frac{1+\varepsilon}{\lambda_{n-k}}\cdot\eta2O(k/ε3)nO(1/ε)2^{O(k/\varepsilon^3)}n^{O(1/\varepsilon)}
GVY93O(logn)ηO(\log n)\cdot\etaO~(mω)\tilde{O}(m^\omega)
ACMM05O(logn)ηO(\sqrt{\log n})\cdot\etaO~(mω)\tilde{O}(m^\omega)
本文O(lognlog(1/η))ηO(\log n\log(1/\eta))\cdot\etaO~(mn)\tilde{O}(mn)

优势:

  • 相比谱方法Tre12, KLLO+13:不依赖特征值,近似比更优
  • 相比SDP方法GVY93, ACMM05:虽然近似比稍弱,但时间从O~(mω)\tilde{O}(m^\omega)降至O~(mn)\tilde{O}(mn)(ω2.37\omega\approx 2.37)

有向图扩展

有向二部性比率(式1.3): βb(x)=(i,j)Eψij(x)ib(i)xi,ψij(x)={xi+xjxixjxi+xjotherwise\beta_b(x) = \frac{\sum_{(i,j)\in E}\psi_{ij}(x)}{\sum_i b(i)|x_i|}, \quad \psi_{ij}(x)=\begin{cases}|x_i+x_j| & x_i\geq x_j\\ |x_i|+|x_j| & \text{otherwise}\end{cases}

定理1.3: 多项式时间O(logn)O(\log n)近似算法,通过:

  1. 构造偏对称小工具图GG'
  2. 求解有向半度量松弛(LP)
  3. 有向1\ell_1弱嵌入CMM06实现O(logV)=O(logn)O(\log|V'|)=O(\log n)近似

定理1.4: 有向最小未割的O(lognlog(1/η))ηO(\log n\log(1/\eta))\cdot\eta近似

相关工作

谱图理论

  1. Cheeger不等式AM85; Alo86: 联系第二小特征值λ2\lambda_2与电导ϕ(G)\phi(G): λ22ϕ(G)2λ2\frac{\lambda_2}{2}\leq\phi(G)\leq\sqrt{2\lambda_2}
  2. 对偶Cheeger不等式Tre12; BJ13: 本文研究的二部性比率与最大特征值λn\lambda_n的关系
  3. 高阶谱方法KLLO+13; GS11: 利用多个特征值改进近似

稀疏割算法

  1. 组合方法:
    • 割-匹配博弈KRV06:O(log2n)O(\log^2 n)
    • 改进OSVV08:O(logn)O(\log n)
    • 最优AK16:O(logn)O(\sqrt{\log n})通过MMWU
  2. SDP方法ARV09:O(logn)O(\sqrt{\log n})通过度量嵌入
  3. 有向图Lou10; LTW24:有向稀疏割的O(logn)O(\log n)近似

最大割/最小未割

  1. 近似算法:
    • GW算法GW94:0.8780.878近似(SDP)
    • 谱方法Tre12; KLLO+13:依赖特征值
    • SDP层次GS11; ACMM05:更强但更慢
  2. 本文贡献: 首次将割-匹配博弈应用于二部性比率,实现近线性时间

结论与讨论

主要结论

  1. 首次为二部性比率提供多项式时间O(logn)O(\log n)近似算法
  2. 引入偏对称图良好连接性,建立新的流-割刻画
  3. 实现近线性时间O~(m)\tilde{O}(m),显著优于SDP方法
  4. 成功扩展到有向图,提供统一框架

局限性

  1. 近似比: O(logn)O(\log n)弱于SDP的O(logn)O(\sqrt{\log n})ARV09; ACMM05
  2. 最小未割: 额外log(1/η)\log(1/\eta)因子,相比ACMM05O(logn)ηO(\sqrt{\log n})\cdot\eta有差距
  3. 有向图时间: 有向版本仍需多项式时间(未达到近线性),依赖LP求解
  4. 实践性能: 纯理论结果,未提供实验验证

未来方向

  1. 改进近似比: 能否达到O(logn)O(\sqrt{\log n})同时保持近线性时间?
  2. 有向图加速: 能否将有向二部性比率近似也降至O~(m)\tilde{O}(m)时间?
  3. 下界: O(logn)O(\log n)是否是基于流计算的方法的固有界?
  4. 实际应用: 在网络分析、社区检测中的实证研究

深度评价

优点

  1. 理论突破:
    • 解决了长期开放问题(自2012年以来无近似算法)
    • 首次建立二部性比率与良好连接性的等价刻画(定理3.5)
    • 优雅地统一了无向和有向情形
  2. 技术创新:
    • 偏对称性利用: 辅助图构造巧妙地将三分割转化为对称流问题
    • MMWU分析: 将AK16的框架创造性地应用于新问题,高斯投影技巧处理Gram分解
    • 快速实现: 引理3.11的近似Gram分解避免了O(n3)O(n^3)瓶颈
  3. 算法效率:
    • 时间复杂度O~(m)\tilde{O}(m)接近最优(需读入图)
    • 仅需单商品流,可利用最新近线性时间算法CKLP+22
    • 相比SDP方法(O~(mω)\tilde{O}(m^\omega))有数量级提升
  4. 理论完整性:
    • 严格的概率分析(引理3.8用Laurent-Massart界)
    • 详细的时间复杂度分解
    • 有向扩展展示框架通用性

不足

  1. 近似比差距:
    • O(logn)O(\log n) vs. O(logn)O(\sqrt{\log n})ARV09:虽可接受但非最优
    • 未讨论是否可能改进(如通过更强的SDP松弛)
  2. 实验缺失:
    • 无实际图上的性能评估
    • 未比较常数因子(大O隐藏的常数可能很大)
    • 缺少与谱方法的实证对比
  3. 有向图未完全解决:
    • 有向版本时间复杂度未明确(定理1.3只说"多项式时间")
    • 需要LP求解,可能慢于无向情形
    • 未讨论是否可能达到O~(m)\tilde{O}(m)
  4. 技术细节:
    • 引理3.11的证明放在附录,主文缺少直觉
    • 高斯投影需O(logn)O(\log n)次重采样(引理3.8),实际可能影响性能
    • MMWU步长δ\delta选择缺少指导
  5. 应用局限:
    • 最小未割的额外log(1/η)\log(1/\eta)因子在η\eta很小时可能显著
    • 未讨论加权版本(bb任意)的实际意义

影响力

  1. 理论贡献:
    • 为谱图理论提供新算法视角
    • 偏对称图良好连接性概念可能有独立价值
    • 展示割-匹配博弈的更广泛适用性
  2. 技术影响:
    • MMWU+高斯投影范式可能适用于其他比率问题
    • 快速Gram分解技术(引理3.11)可复用
  3. 实用价值:
    • 近线性时间使大规模图处理可行
    • 可能促进二部性比率在网络分析中的应用
    • 有向版本为有向图社区检测提供工具
  4. 开放问题:
    • 激发改进近似比的研究
    • 有向图加速问题有明确价值

适用场景

  1. 大规模图分析:
    • 社交网络的准二部性检测
    • 推荐系统中用户-物品图的结构分析
  2. 谱聚类:
    • 作为基于最大特征值的聚类方法
    • 符号图的社区检测XOG20; NP22
  3. 组合优化:
    • 最大割的预处理(通过递归二分)
    • 图分割问题的启发式
  4. 理论研究:
    • 图参数近似的基准
    • 流-割对偶的新视角

不适用: 需要O(logn)O(\sqrt{\log n})最优近似的场景(应用SDP方法)

参考文献(精选)

  1. Tre12 L. Trevisan. "Max cut and the smallest eigenvalue". SIAM J. Comput. 41.6 (2012): 定义二部性比率,证明对偶Cheeger不等式
  2. KRV06 R. Khandekar, S. Rao, U. Vazirani. "Graph partitioning using single commodity flows". STOC 2006: 提出割-匹配博弈
  3. AK16 S. Arora, S. Kale. "A combinatorial, primal-dual approach to semidefinite programs". J. ACM 63.2 (2016): MMWU框架,本文主要技术基础
  4. ACMM05 A. Agarwal et al. "O(logn)O(\sqrt{\log n}) approximation algorithms for min uncut...". STOC 2005: 最小未割的SDP方法,本文主要对比
  5. CKLP+22 L. Chen et al. "Maximum flow and minimum-cost flow in almost-linear time". FOCS 2022: 近线性时间最大流,使本文算法高效

总体评价: 这是一篇高质量的理论算法论文,解决了长期开放问题,技术创新显著(偏对称图刻画、MMWU扩展),实现了近线性时间复杂度。主要不足在于近似比未达最优且缺乏实验验证。对理论计算机科学社区有重要贡献,可能开启二部性比率实用化研究。推荐发表于顶级会议(FOCS/SODA级别)。