The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
- 论文ID: 2504.19608
- 标题: The frequency Kis for symmetrical traveling salesman problem
- 作者: Yong Wang (North China Electric Power University)
- 分类: cs.DM math.CO math.OC
- 发表时间: 2025年10月15日 (arXiv v3)
- 论文链接: https://arxiv.org/abs/2504.19608v3
本文研究对称旅行商问题(TSP)中的频率Kis (i∈[4,n])以识别最优哈密顿回路(OHC)中的边。频率Ki通过Kn中对应Ki内的(2i)个给定端点的最优i顶点路径计算得出。在频率Ki中,边的频率是包含该边的最优i顶点路径的数量。研究发现:OHC边在对应频率Ki中的频率大于21(2i),而普通边小于此值;OHC边的期望频率大于2i2−4i+7,普通边小于2;当i≥[0.3660n+5.5849]时,普通边的平均频率小于21(2i)。基于这些发现,提出了O(n620.3660n)时间复杂度的动态规划算法。
旅行商问题(TSP)是组合优化领域的经典NP完全问题。给定n个顶点的完全图Kn,目标是找到访问所有顶点恰好一次的最短哈密顿回路。对于对称TSP,边(u,v)和(v,u)的距离相等。
- 精确算法时间复杂度高:如Bellman和Held-Karp的动态规划算法需要O(n22n)时间
- 启发式方法缺乏理论保证:虽然LKH等启发式算法在实践中表现良好,但缺乏理论基础
- 边的结构特性难以识别:OHC边在距离上没有显著特征,难以与普通边区分
现有研究表明,基于频率K4s可以有效识别OHC边,但缺乏对更一般情况频率Kis (i>4)的系统研究。本文旨在:
- 建立OHC边和普通边在频率Kis上的理论界限
- 分析边的频率和概率随i的变化规律
- 基于频率特性设计高效的OHC识别算法
- 建立了频率下界理论:证明了OHC边在频率Ki中的频率大于21(2i),普通边小于此值
- 分析了频率变化规律:揭示了OHC边频率随i增加而增加或保持稳定,普通边频率单调递减
- 确定了临界点:证明当i≥[0.3660n+5.5849]时,可完全区分OHC边和普通边
- 提出了高效算法:基于频率特性的O(n620.3660n)时间算法
- 提供了概率递减条件:给出了识别普通边的概率递减判据pi+1(g)<[1−i(i−1)2]pi(g)
输入:n个顶点的完全图Kn及边的距离函数d(u,v)输出:最优哈密顿回路OHC
约束:对称TSP,即d(u,v)=d(v,u)
给定Ki中的i个顶点和固定端点,最优i顶点路径是访问所有i个顶点恰好一次的最短路径。每个Ki包含(2i)个不同端点对的OP^i。
频率Ki与对应的Ki具有相同的顶点和边,但边的权重被替换为该边在(2i)个OP^i中出现的次数(频率)。
对于包含(2i)个OP^i的Ki (i≥4),OHC边在对应频率Ki中的频率大于21(2i)。
证明思路:
- 当i=4时,通过枚举所有可能的频率K4验证
- 对于i>4,使用归纳法,证明从Ki扩展到Ki+1时OHC边频率的单调性
普通边在频率Ki中的频率小于21(2i),期望频率在最佳平均情况下小于2i+2。
对于Kn中的OHC边,在包含该边的任意频率Ki中,其频率在最坏平均情况下大于21(2i)。
- 计算频率Ki:对选定的i值,计算所有Ki的频率
- 边分类:根据频率阈值21(2i)分类边
- 概率递减检测:使用条件pi+1(g)<[1−i(i−1)2]pi(g)识别普通边
- 计算单个Ki的OP^i需要O(i42i)时间
- 对于i=[0.3660n+5.5849],总时间复杂度为O(n620.3660n)
- 小规模TSP实例:n∈[4,14]的构造实例和Oliver30的子图
- 真实TSP实例:TSPLIB中的48个实例,包括:
- Euclidean TSP:att48, eil51, pr76等
- ATT TSP:att532等
- GEO TSP:多个地理距离实例
- Matrix TSP:si535, si1032等
- 频率准确性:OHC边和普通边的频率分布
- 分离效果:使用频率阈值能正确分类的边的比例
- 算法效率:计算时间和空间复杂度
- 使用动态规划计算OP^i
- 对于大规模实例,随机采样1000个Ki计算平均频率
- C++实现,在2.3GHz CPU、4GB内存的笔记本上运行
对于n∈[4,14]的实例:
- OHC边频率:最小频率始终大于187(2i),多数情况大于21(2i)
- 普通边频率:最大频率小于21(2i),平均频率接近2
- 频率比:OHC边与普通边的平均频率比从4(n=4)增长到37.3(n=14)
对于TSPLIB实例:
- 第一最小OHC边频率在多数情况下大于flb=21(2i)
- 第二最小OHC边频率几乎总是大于flb
- OHC边平均频率favg>foavg=2i2−4i+7
使用第1、5、10、15、20小的OHC边频率作为阈值:
- 第1小频率:保留20%-30%的普通边(小实例),大实例中比例更低
- 第5小频率:保留普通边比例降至15%以下(小实例)、10%以下(中等实例)
- 随着阈值增加,保留的普通边数量快速减少
使用条件pi(g)−pi+1(g)>i(i−1)2pi(g):
- 在i=4→5时识别出约90%的普通边
- 在i=5→6时识别出所有普通边(n≤10)
- 比频率阈值方法更高效,计算量更小
- 单调性:概率pi(e)随i增加而增加或保持稳定
- 峰值:频率在P0=2n+2(偶数n)或P0=2n+1+1(奇数n)处达到峰值
- 误差界限:概率递减时满足pi+1(e)≥[1−i(i−1)2]pi(e)
- 单调递减:概率pi(g)随i单调递减
- 快速下降:递减幅度通常大于i(i−1)2pi(g)
- 临界点:当i≥[0.3660n+5.5849]时,平均频率小于21(2i)
- 动态规划:Bellman (1962)和Held-Karp (1962)的O(n22n)算法
- 分支定界:Carpaneto等人的大规模不对称TSP算法
- 割平面法:Applegate等人解决85,900城市的实例
- Lin-Kernighan算法:经典的局部搜索算法
- LKH算法:基于α-measure的改进版本
- 伪骨干边方法:Jäger等人提出的高质量巡回路径方法
- 频率K4:Wang和Remmel (2016)首次提出基于频率四边形的方法
- 二项分布模型:建立了边频率的概率模型
- 充要条件:Wang (2019)给出了基于频率K4的OHC边充要条件
- 理论界限:建立了OHC边和普通边在频率Ki中的严格界限
- 变化规律:揭示了边频率随i的不同变化模式
- 算法效率:提出了时间复杂度优于传统方法的识别算法
- 实用性:在多种类型的TSP实例上验证了方法的有效性
- 计算复杂度:虽然改进了指数项,但对于超大规模实例仍然困难
- 特殊情况:对于包含大量等权边的实例,方法效果可能降低
- 采样误差:大规模实例中使用随机采样可能引入误差
- 存储需求:需要存储大量的Ki和OP^i,空间复杂度较高
- 算法优化:进一步降低时间复杂度,特别是常数项
- 并行化:利用频率计算的独立性进行并行优化
- 近似方法:开发基于频率特性的近似算法
- 扩展应用:将方法扩展到不对称TSP和其他组合优化问题
- 理论严谨:提供了完整的数学证明和理论分析
- 实验全面:涵盖了从小规模到大规模、多种类型的TSP实例
- 方法创新:首次系统研究了频率Kis的性质和应用
- 实用价值:提供了可实现的算法和明确的时间复杂度界限
- 写作冗长:论文篇幅过长,部分内容可以精简
- 符号复杂:数学符号较多,可读性有待提高
- 实验规模:受计算能力限制,最大实例规模相对较小
- 对比不足:缺乏与其他精确算法的直接性能对比
- 理论贡献:为TSP的结构性质研究提供了新视角
- 算法价值:在特定规模范围内提供了有效的精确算法
- 方法启发:频率分析方法可能适用于其他组合优化问题
- 实现难度:方法相对复杂,实际应用需要一定的技术门槛
- 中等规模TSP:特别适合n≤100的精确求解需求
- 理论研究:为TSP结构分析提供工具
- 预处理步骤:可作为大规模TSP的边筛选预处理
- 教学研究:为组合优化教学提供案例
本文引用了25篇重要参考文献,包括:
- Bellman (1962), Held & Karp (1962): TSP动态规划算法的奠基工作
- Lin & Kernighan (1973): 经典LK启发式算法
- Helsgaun (2000, 2009): LKH算法系列
- Wang & Remmel (2016): 频率K4方法的原创工作
- Applegate et al. (2009): 大规模TSP求解记录
总体评价:这是一篇理论深入、实验详尽的组合优化论文,在TSP边的结构特性研究方面做出了重要贡献。虽然在算法效率和写作简洁性方面还有改进空间,但其理论价值和方法创新性值得认可。