Correlation Clustering is a fundamental clustering problem, and there has been a line of work on improving the approximation ratio for this problem in recent years. A key algorithmic component in these works is the cluster LP. Chromatic Correlation Clustering is an interesting generalization that has also been intensively studied. In light of success of the cluster LP in Correlation Clustering, it would be an interesting question whether the cluster LP can be used in Chromatic Correlation Clustering. We answer this question with affirmatives by presenting a $(2+\varepsilon)$-approximation algorithm for Chromatic Correlation Clustering using a chromatic cluster LP.
- 论文ID: 2510.13446
- 标题: Chromatic correlation clustering via cluster LP
- 作者: Fateme Abbasi, Hyung-Chan An, Jarosław Byrka, Changyeol Lee, Yongho Shin
- 分类: cs.DS (Data Structures and Algorithms)
- 发表时间: 2025年10月15日 (arXiv预印本)
- 论文链接: https://arxiv.org/abs/2510.13446
相关聚类(Correlation Clustering)是一个基础的聚类问题,近年来在改进该问题的近似比方面有一系列工作。这些工作中的关键算法组件是cluster LP。彩色相关聚类(Chromatic Correlation Clustering)是一个有趣的推广,也得到了深入研究。鉴于cluster LP在相关聚类中的成功,一个有趣的问题是cluster LP是否可以用于彩色相关聚类。本文通过提出一个使用彩色cluster LP的(2+ε)-近似算法来肯定地回答这个问题。
- 相关聚类问题:相关聚类是组合优化和机器学习领域的基础问题,目标是将顶点划分为若干簇,使得正边(+边)的端点在同一簇内,负边(-边)的端点在不同簇内。
- 彩色相关聚类:这是相关聚类的推广,其中每条正边都有一个颜色标签,同一簇内的顶点必须通过相同颜色的边连接。
- 研究动机:
- 近年来相关聚类的近似比不断改进,从最初的3近似提升到目前的1.437近似
- cluster LP是这些改进的关键技术组件
- 彩色相关聚类的现有方法局限于色盲算法、归约到标准相关聚类或使用标准LP松弛
- 最新的2.15近似算法仍基于归约方法
探索cluster LP技术能否直接应用于彩色相关聚类,以获得更好的近似比,这对理论和实践都具有重要意义。
- 提出彩色cluster LP:设计了相关聚类中cluster LP的自然推广版本,适用于彩色相关聚类问题
- 多项式时间求解:证明了彩色cluster LP可以在多项式时间内近似最优求解
- 2近似舍入算法:设计了将彩色cluster LP的可行解舍入为整数解的算法,近似比为2
- (2+ε)-近似算法:结合上述两个结果,得到了彩色相关聚类的(2+ε)-近似算法,改进了之前的2.15近似
- 预聚类技术:将相关聚类中的预聚类(preclustering)概念推广到彩色情况,这是实现多项式时间求解的关键
输入:
- 颜色集合 L
- 完全图,每条边标记为+边或-边
- 每条+边 e 关联一个颜色 ce∈L
输出:
- 顶点划分 C
- 着色函数 χ:C→L,为每个簇分配颜色
目标:最小化不一致边的数量,其中不一致边定义为:
- -边的两端在同一簇内
- +边的两端在不同簇内
- +边的两端在同一簇内,但簇的颜色与边的颜色不匹配
核心的线性规划松弛定义为:
min∑S⊆V,ℓ∈L(2∣δ+(S)∣+∣E−ℓ[S]∣)zSℓ
约束条件:
∑S∋v,ℓ∈LzSℓ=1,∀v∈VzSℓ≥0,∀S⊆V,∀ℓ∈L
其中:
- zSℓ 表示集合S是否为颜色ℓ的簇
- δ+(S) 是跨越S的+边集合
- E−ℓ[S] 是S内除ℓ色+边外的所有边集合
第一步:预聚类构造
- 使用常数近似算法获得初始解(Cinit,χinit)
- 标记满足特定条件的顶点(基于参数α,β)
- 构造预聚类K和颜色分配χpre
第二步:有界子cluster LP
- 将搜索空间限制在大小不超过r=Θ(ε−12)的簇
- 构造多项式大小的LP并求解
第三步:Monte Carlo采样
- 从LP解中采样Δy∅个着色簇
- 使用Raghavendra-Tan舍入算法
- 构造最终的可行解
- 彩色预聚类:
- 将预聚类概念推广到彩色情况
- 证明最优解必须尊重预聚类结构
- 控制可容许边的数量为O(ε−2)opt
- 基于簇的舍入算法:
- 设计了专门的概率舍入过程
- 分析了不同类型边成为不一致的概率
- 证明了2倍近似比
本文是理论计算机科学论文,主要贡献在于算法设计和理论分析,没有包含实验评估部分。研究重点在于:
- 理论分析:证明算法的正确性和近似比
- 复杂度分析:证明算法的多项式时间复杂度
- 数学证明:通过严格的数学推导验证结果
定理 3.2:给定彩色cluster LP的可行解,基于簇的算法输出的整数解期望代价至多是LP解代价的2倍。
定理 4.3:存在多项式时间算法构造预聚类实例,满足:
- 存在代价至多(1+O(ε))opt的尊重解
- 可容许边数量∣Eadm∣≤O(ε−2)opt
主要结果:彩色相关聚类存在(2+ε)-近似算法,改进了之前的2.15近似。
- 预聚类构造:O(n2)时间
- LP求解:poly(n,ε−1)时间
- Monte Carlo采样:nO(ε−12)时间
- 经典结果:Bansal等人的3近似算法
- 近期进展:通过cluster LP技术将近似比改进到1.437
- 关键技术:Sherali-Adams层次结构、预聚类技术
- 色盲算法:忽略颜色信息的方法
- 归约方法:转化为标准相关聚类问题
- LP舍入:基于标准LP松弛的舍入算法
- 最新结果:Lee等人的2.15近似和1.64近似算法
相比现有工作,本文首次将cluster LP技术直接应用于彩色相关聚类,避免了归约的损失。
- 彩色cluster LP可以在多项式时间内近似求解
- 存在2倍近似的舍入算法
- 整体获得(2+ε)-近似算法,改进了现有最好的2.15近似
- 时间复杂度:虽然是多项式时间,但指数依赖于ε−1
- 近似比:仍有改进空间,与标准相关聚类的1.437近似存在差距
- 实用性:缺乏实验验证算法的实际性能
- 探索是否能达到与标准相关聚类相同的近似比
- 改进算法的时间复杂度
- 研究两个问题之间近似比的理论分离
- 理论创新:首次将cluster LP技术成功应用于彩色相关聚类
- 技术深度:预聚类技术的推广具有很高的技术难度
- 结果改进:在理论上改进了现有最好结果
- 证明严谨:数学分析完整且严格
- 实验缺失:作为算法论文,缺乏实验验证
- 复杂度较高:算法的实际运行时间可能很长
- 改进有限:从2.15到2的改进相对较小
- 适用性:方法的推广性有待进一步验证
- 理论贡献:为彩色相关聚类提供了新的技术路径
- 方法论:cluster LP技术的推广具有方法论价值
- 后续研究:为进一步改进近似比奠定了基础
- 理论研究:为近似算法理论提供新的案例
- 实际应用:适用于需要考虑边颜色约束的聚类问题
- 算法设计:为相关优化问题提供技术参考
论文引用了24篇重要文献,主要包括:
- Bansal, Blum, Chawla (2004) - 相关聚类的奠基工作
- Cao等人 (2024) - 1.437近似算法
- Cohen-Addad等人 (2023) - 预聚类技术
- Lee等人 (2025) - 彩色相关聚类的最新结果
- Raghavendra, Tan (2012) - 舍入算法技术
这些文献构成了本文研究的重要理论基础和技术支撑。