2025-11-24T18:19:18.135266

The frequency $K_i$s for symmetrical traveling salesman problem

Wang
The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
academic

The frequency KiK_is for symmetrical traveling salesman problem

基本信息

  • 论文ID: 2504.19608
  • 标题: The frequency KiK_is for symmetrical traveling salesman problem
  • 作者: Yong Wang (North China Electric Power University)
  • 分类: cs.DM math.CO math.OC
  • 发表时间: 2025年10月15日 (arXiv v3)
  • 论文链接: https://arxiv.org/abs/2504.19608v3

摘要

本文研究对称旅行商问题(TSP)中的频率KiK_is (i[4,n]i\in[4,n])以识别最优哈密顿回路(OHC)中的边。频率KiK_i通过KnK_n中对应KiK_i内的(i2)\binom{i}{2}个给定端点的最优ii顶点路径计算得出。在频率KiK_i中,边的频率是包含该边的最优ii顶点路径的数量。研究发现:OHC边在对应频率KiK_i中的频率大于12(i2)\frac{1}{2}\binom{i}{2},而普通边小于此值;OHC边的期望频率大于i24i+72\frac{i^2-4i+7}{2},普通边小于2;当i[0.3660n+5.5849]i \geq [0.3660n + 5.5849]时,普通边的平均频率小于12(i2)\frac{1}{2}\binom{i}{2}。基于这些发现,提出了O(n620.3660n)O(n^62^{0.3660n})时间复杂度的动态规划算法。

研究背景与动机

问题背景

旅行商问题(TSP)是组合优化领域的经典NP完全问题。给定nn个顶点的完全图KnK_n,目标是找到访问所有顶点恰好一次的最短哈密顿回路。对于对称TSP,边(u,v)(u,v)(v,u)(v,u)的距离相等。

现有方法局限性

  1. 精确算法时间复杂度高:如Bellman和Held-Karp的动态规划算法需要O(n22n)O(n^22^n)时间
  2. 启发式方法缺乏理论保证:虽然LKH等启发式算法在实践中表现良好,但缺乏理论基础
  3. 边的结构特性难以识别:OHC边在距离上没有显著特征,难以与普通边区分

研究动机

现有研究表明,基于频率K4K_4s可以有效识别OHC边,但缺乏对更一般情况频率KiK_is (i>4i > 4)的系统研究。本文旨在:

  1. 建立OHC边和普通边在频率KiK_is上的理论界限
  2. 分析边的频率和概率随ii的变化规律
  3. 基于频率特性设计高效的OHC识别算法

核心贡献

  1. 建立了频率下界理论:证明了OHC边在频率KiK_i中的频率大于12(i2)\frac{1}{2}\binom{i}{2},普通边小于此值
  2. 分析了频率变化规律:揭示了OHC边频率随ii增加而增加或保持稳定,普通边频率单调递减
  3. 确定了临界点:证明当i[0.3660n+5.5849]i \geq [0.3660n + 5.5849]时,可完全区分OHC边和普通边
  4. 提出了高效算法:基于频率特性的O(n620.3660n)O(n^62^{0.3660n})时间算法
  5. 提供了概率递减条件:给出了识别普通边的概率递减判据pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g)

方法详解

任务定义

输入nn个顶点的完全图KnK_n及边的距离函数d(u,v)d(u,v)输出:最优哈密顿回路OHC 约束:对称TSP,即d(u,v)=d(v,u)d(u,v) = d(v,u)

核心概念

最优ii顶点路径(OP^i)

给定KiK_i中的ii个顶点和固定端点,最优ii顶点路径是访问所有ii个顶点恰好一次的最短路径。每个KiK_i包含(i2)\binom{i}{2}个不同端点对的OP^i。

频率KiK_i

频率KiK_i与对应的KiK_i具有相同的顶点和边,但边的权重被替换为该边在(i2)\binom{i}{2}个OP^i中出现的次数(频率)。

理论框架

定理3.3(OHC边频率下界)

对于包含(i2)\binom{i}{2}个OP^i的KiK_i (i4i \geq 4),OHC边在对应频率KiK_i中的频率大于12(i2)\frac{1}{2}\binom{i}{2}

证明思路

  • i=4i=4时,通过枚举所有可能的频率K4K_4验证
  • 对于i>4i>4,使用归纳法,证明从KiK_i扩展到Ki+1K_{i+1}时OHC边频率的单调性

定理3.4(普通边频率上界)

普通边在频率KiK_i中的频率小于12(i2)\frac{1}{2}\binom{i}{2},期望频率在最佳平均情况下小于i+22\frac{i+2}{2}

定理4.1(KnK_n中OHC边的频率界限)

对于KnK_n中的OHC边,在包含该边的任意频率KiK_i中,其频率在最坏平均情况下大于12(i2)\frac{1}{2}\binom{i}{2}

算法设计

基于频率的识别算法

  1. 计算频率KiK_i:对选定的ii值,计算所有KiK_i的频率
  2. 边分类:根据频率阈值12(i2)\frac{1}{2}\binom{i}{2}分类边
  3. 概率递减检测:使用条件pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g)识别普通边

时间复杂度分析

  • 计算单个KiK_i的OP^i需要O(i42i)O(i^42^i)时间
  • 对于i=[0.3660n+5.5849]i = [0.3660n + 5.5849],总时间复杂度为O(n620.3660n)O(n^62^{0.3660n})

实验设置

数据集

  1. 小规模TSP实例n[4,14]n \in [4,14]的构造实例和Oliver30的子图
  2. 真实TSP实例:TSPLIB中的48个实例,包括:
    • Euclidean TSP:att48, eil51, pr76等
    • ATT TSP:att532等
    • GEO TSP:多个地理距离实例
    • Matrix TSP:si535, si1032等

评价指标

  • 频率准确性:OHC边和普通边的频率分布
  • 分离效果:使用频率阈值能正确分类的边的比例
  • 算法效率:计算时间和空间复杂度

实现细节

  • 使用动态规划计算OP^i
  • 对于大规模实例,随机采样1000个KiK_i计算平均频率
  • C++实现,在2.3GHz CPU、4GB内存的笔记本上运行

实验结果

频率界限验证

小规模实例结果

对于n[4,14]n \in [4,14]的实例:

  • OHC边频率:最小频率始终大于718(i2)\frac{7}{18}\binom{i}{2},多数情况大于12(i2)\frac{1}{2}\binom{i}{2}
  • 普通边频率:最大频率小于12(i2)\frac{1}{2}\binom{i}{2},平均频率接近2
  • 频率比:OHC边与普通边的平均频率比从4(n=4n=4)增长到37.3(n=14n=14

真实TSP实例结果

对于TSPLIB实例:

  • 第一最小OHC边频率在多数情况下大于flb=12(i2)f_{lb} = \frac{1}{2}\binom{i}{2}
  • 第二最小OHC边频率几乎总是大于flbf_{lb}
  • OHC边平均频率favg>foavg=i24i+72f_{avg} > f_{oavg} = \frac{i^2-4i+7}{2}

边分类效果

基于频率阈值的分类

使用第1、5、10、15、20小的OHC边频率作为阈值:

  • 第1小频率:保留20%-30%的普通边(小实例),大实例中比例更低
  • 第5小频率:保留普通边比例降至15%以下(小实例)、10%以下(中等实例)
  • 随着阈值增加,保留的普通边数量快速减少

概率递减条件的效果

使用条件pi(g)pi+1(g)>2pi(g)i(i1)p_i(g) - p_{i+1}(g) > \frac{2p_i(g)}{i(i-1)}

  • i=45i=4 \to 5时识别出约90%的普通边
  • i=56i=5 \to 6时识别出所有普通边(n10n \leq 10
  • 比频率阈值方法更高效,计算量更小

频率变化规律

OHC边的频率变化

  • 单调性:概率pi(e)p_i(e)ii增加而增加或保持稳定
  • 峰值:频率在P0=n2+2P_0 = \frac{n}{2}+2(偶数nn)或P0=n+12+1P_0 = \frac{n+1}{2}+1(奇数nn)处达到峰值
  • 误差界限:概率递减时满足pi+1(e)[12i(i1)]pi(e)p_{i+1}(e) \geq [1-\frac{2}{i(i-1)}]p_i(e)

普通边的频率变化

  • 单调递减:概率pi(g)p_i(g)ii单调递减
  • 快速下降:递减幅度通常大于2pi(g)i(i1)\frac{2p_i(g)}{i(i-1)}
  • 临界点:当i[0.3660n+5.5849]i \geq [0.3660n + 5.5849]时,平均频率小于12(i2)\frac{1}{2}\binom{i}{2}

相关工作

TSP精确算法

  • 动态规划:Bellman (1962)和Held-Karp (1962)的O(n22n)O(n^22^n)算法
  • 分支定界:Carpaneto等人的大规模不对称TSP算法
  • 割平面法:Applegate等人解决85,900城市的实例

TSP启发式算法

  • Lin-Kernighan算法:经典的局部搜索算法
  • LKH算法:基于α\alpha-measure的改进版本
  • 伪骨干边方法:Jäger等人提出的高质量巡回路径方法

频率方法

  • 频率K4K_4:Wang和Remmel (2016)首次提出基于频率四边形的方法
  • 二项分布模型:建立了边频率的概率模型
  • 充要条件:Wang (2019)给出了基于频率K4K_4的OHC边充要条件

结论与讨论

主要结论

  1. 理论界限:建立了OHC边和普通边在频率KiK_i中的严格界限
  2. 变化规律:揭示了边频率随ii的不同变化模式
  3. 算法效率:提出了时间复杂度优于传统方法的识别算法
  4. 实用性:在多种类型的TSP实例上验证了方法的有效性

局限性

  1. 计算复杂度:虽然改进了指数项,但对于超大规模实例仍然困难
  2. 特殊情况:对于包含大量等权边的实例,方法效果可能降低
  3. 采样误差:大规模实例中使用随机采样可能引入误差
  4. 存储需求:需要存储大量的KiK_i和OP^i,空间复杂度较高

未来方向

  1. 算法优化:进一步降低时间复杂度,特别是常数项
  2. 并行化:利用频率计算的独立性进行并行优化
  3. 近似方法:开发基于频率特性的近似算法
  4. 扩展应用:将方法扩展到不对称TSP和其他组合优化问题

深度评价

优点

  1. 理论严谨:提供了完整的数学证明和理论分析
  2. 实验全面:涵盖了从小规模到大规模、多种类型的TSP实例
  3. 方法创新:首次系统研究了频率KiK_is的性质和应用
  4. 实用价值:提供了可实现的算法和明确的时间复杂度界限

不足

  1. 写作冗长:论文篇幅过长,部分内容可以精简
  2. 符号复杂:数学符号较多,可读性有待提高
  3. 实验规模:受计算能力限制,最大实例规模相对较小
  4. 对比不足:缺乏与其他精确算法的直接性能对比

影响力

  1. 理论贡献:为TSP的结构性质研究提供了新视角
  2. 算法价值:在特定规模范围内提供了有效的精确算法
  3. 方法启发:频率分析方法可能适用于其他组合优化问题
  4. 实现难度:方法相对复杂,实际应用需要一定的技术门槛

适用场景

  1. 中等规模TSP:特别适合n100n \leq 100的精确求解需求
  2. 理论研究:为TSP结构分析提供工具
  3. 预处理步骤:可作为大规模TSP的边筛选预处理
  4. 教学研究:为组合优化教学提供案例

参考文献

本文引用了25篇重要参考文献,包括:

  • Bellman (1962), Held & Karp (1962): TSP动态规划算法的奠基工作
  • Lin & Kernighan (1973): 经典LK启发式算法
  • Helsgaun (2000, 2009): LKH算法系列
  • Wang & Remmel (2016): 频率K4K_4方法的原创工作
  • Applegate et al. (2009): 大规模TSP求解记录

总体评价:这是一篇理论深入、实验详尽的组合优化论文,在TSP边的结构特性研究方面做出了重要贡献。虽然在算法效率和写作简洁性方面还有改进空间,但其理论价值和方法创新性值得认可。