The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
- 논문 ID: 2504.19608
- 제목: 대칭 외판원 문제의 빈도 Kis
- 저자: Yong Wang (화북전력대학교)
- 분류: cs.DM math.CO math.OC
- 발표 시간: 2025년 10월 15일 (arXiv v3)
- 논문 링크: https://arxiv.org/abs/2504.19608v3
본 논문은 대칭 외판원 문제(TSP)에서 최적 해밀턴 회로(OHC)의 간선을 식별하기 위해 빈도 Kis (i∈[4,n])를 연구한다. 빈도 Ki는 Kn 내에서 Ki에 해당하는 주어진 끝점을 가진 (2i)개의 최적 i-정점 경로로부터 계산된다. 빈도 Ki에서 간선의 빈도는 그 간선을 포함하는 최적 i-정점 경로의 개수이다. 연구 결과, OHC 간선은 대응하는 빈도 Ki에서 21(2i)보다 큰 빈도를 가지며, 일반 간선은 이보다 작은 값을 가진다. OHC 간선의 기댓값 빈도는 2i2−4i+7보다 크고, 일반 간선은 2보다 작다. i≥[0.3660n+5.5849]일 때, 일반 간선의 평균 빈도는 21(2i)보다 작다. 이러한 발견을 바탕으로 O(n620.3660n) 시간 복잡도의 동적 계획법 알고리즘을 제안한다.
외판원 문제(TSP)는 조합 최적화 분야의 고전적인 NP-완전 문제이다. n개의 정점을 가진 완전 그래프 Kn이 주어졌을 때, 목표는 모든 정점을 정확히 한 번씩 방문하는 최단 해밀턴 회로를 찾는 것이다. 대칭 TSP의 경우, 간선 (u,v)와 (v,u)의 거리가 같다.
- 정확 알고리즘의 높은 시간 복잡도: Bellman과 Held-Karp의 동적 계획법 알고리즘은 O(n22n) 시간이 필요함
- 휴리스틱 방법의 이론적 보장 부족: LKH 등의 휴리스틱 알고리즘은 실무에서 우수한 성능을 보이지만 이론적 기초가 부족함
- 간선의 구조적 특성 식별의 어려움: OHC 간선은 거리상 뚜렷한 특징이 없어 일반 간선과 구별하기 어려움
기존 연구에 따르면 빈도 K4s를 기반으로 OHC 간선을 효과적으로 식별할 수 있지만, 더 일반적인 경우인 빈도 Kis (i>4)에 대한 체계적인 연구가 부족하다. 본 논문의 목표는:
- OHC 간선과 일반 간선의 빈도 Kis에서의 이론적 경계 설정
- 간선의 빈도와 확률이 i에 따라 변하는 규칙 분석
- 빈도 특성을 기반으로 한 효율적인 OHC 식별 알고리즘 설계
- 빈도 하한 이론 수립: OHC 간선의 빈도 Ki에서의 빈도가 21(2i)보다 크고, 일반 간선은 이보다 작음을 증명
- 빈도 변화 규칙 분석: OHC 간선 빈도는 i 증가에 따라 증가하거나 안정적이고, 일반 간선 빈도는 단조 감소함을 규명
- 임계점 결정: i≥[0.3660n+5.5849]일 때 OHC 간선과 일반 간선을 완전히 구별할 수 있음을 증명
- 효율적 알고리즘 제안: 빈도 특성 기반의 O(n620.3660n) 시간 알고리즘
- 확률 감소 조건 제공: 일반 간선 식별을 위한 확률 감소 판정식 pi+1(g)<[1−i(i−1)2]pi(g) 제시
입력: n개 정점의 완전 그래프 Kn 및 간선의 거리 함수 d(u,v)출력: 최적 해밀턴 회로 OHC
제약: 대칭 TSP, 즉 d(u,v)=d(v,u)
Ki에서 i개의 정점과 고정된 끝점이 주어졌을 때, 최적 i-정점 경로는 모든 i개의 정점을 정확히 한 번씩 방문하는 최단 경로이다. 각 Ki는 (2i)개의 서로 다른 끝점 쌍에 대한 OP^i를 포함한다.
빈도 Ki는 대응하는 Ki와 동일한 정점과 간선을 가지지만, 간선의 가중치가 (2i)개의 OP^i에서 나타나는 횟수(빈도)로 대체된다.
(2i)개의 OP^i를 포함하는 Ki (i≥4)에 대해, OHC 간선의 대응 빈도 Ki에서의 빈도는 21(2i)보다 크다.
증명 개요:
- i=4일 때, 가능한 모든 빈도 K4를 열거하여 검증
- i>4에 대해, 귀납법을 사용하여 Ki에서 Ki+1로 확장할 때 OHC 간선 빈도의 단조성 증명
일반 간선의 빈도 Ki에서의 빈도는 21(2i)보다 작으며, 최적 평균 경우에서 기댓값 빈도는 2i+2보다 작다.
Kn의 OHC 간선에 대해, 그 간선을 포함하는 임의의 빈도 Ki에서, 그 빈도는 최악 평균 경우에서 21(2i)보다 크다.
- 빈도 Ki 계산: 선택된 i 값에 대해 모든 Ki의 빈도 계산
- 간선 분류: 빈도 임계값 21(2i)에 따라 간선 분류
- 확률 감소 감지: 조건 pi+1(g)<[1−i(i−1)2]pi(g)를 사용하여 일반 간선 식별
- 단일 Ki의 OP^i 계산에 O(i42i) 시간 소요
- i=[0.3660n+5.5849]에 대해, 총 시간 복잡도는 O(n620.3660n)
- 소규모 TSP 인스턴스: n∈[4,14]의 구성 인스턴스 및 Oliver30의 부분 그래프
- 실제 TSP 인스턴스: TSPLIB의 48개 인스턴스, 포함:
- 유클리드 TSP: att48, eil51, pr76 등
- ATT TSP: att532 등
- GEO TSP: 여러 지리적 거리 인스턴스
- 행렬 TSP: si535, si1032 등
- 빈도 정확성: OHC 간선과 일반 간선의 빈도 분포
- 분리 효과: 빈도 임계값을 사용하여 올바르게 분류된 간선의 비율
- 알고리즘 효율성: 계산 시간 및 공간 복잡도
- 동적 계획법을 사용하여 OP^i 계산
- 대규모 인스턴스의 경우, 1000개의 Ki를 무작위 샘플링하여 평균 빈도 계산
- C++로 구현, 2.3GHz CPU, 4GB 메모리의 노트북에서 실행
n∈[4,14]의 인스턴스에 대해:
- OHC 간선 빈도: 최소 빈도는 항상 187(2i)보다 크고, 대부분의 경우 21(2i)보다 큼
- 일반 간선 빈도: 최대 빈도는 21(2i)보다 작고, 평균 빈도는 약 2에 가까움
- 빈도 비율: OHC 간선과 일반 간선의 평균 빈도 비율은 4(n=4)에서 37.3(n=14)으로 증가
TSPLIB 인스턴스에 대해:
- 첫 번째 최소 OHC 간선 빈도는 대부분의 경우 flb=21(2i)보다 큼
- 두 번째 최소 OHC 간선 빈도는 거의 항상 flb보다 큼
- OHC 간선 평균 빈도 favg>foavg=2i2−4i+7
첫 번째, 5번째, 10번째, 15번째, 20번째 최소 OHC 간선 빈도를 임계값으로 사용:
- 첫 번째 최소 빈도: 일반 간선의 20%-30% 유지(소규모 인스턴스), 대규모 인스턴스에서는 비율이 더 낮음
- 5번째 최소 빈도: 유지된 일반 간선 비율이 15% 이하(소규모 인스턴스), 10% 이하(중규모 인스턴스)
- 임계값 증가에 따라 유지된 일반 간선 수가 빠르게 감소
조건 pi(g)−pi+1(g)>i(i−1)2pi(g) 사용:
- i=4→5에서 약 90%의 일반 간선 식별
- i=5→6에서 모든 일반 간선 식별(n≤10)
- 빈도 임계값 방법보다 더 효율적이고 계산량이 적음
- 단조성: 확률 pi(e)는 i 증가에 따라 증가하거나 안정적
- 최댓값: 빈도는 P0=2n+2(짝수 n) 또는 P0=2n+1+1(홀수 n)에서 최댓값 달성
- 오차 경계: 확률 감소 시 pi+1(e)≥[1−i(i−1)2]pi(e) 만족
- 단조 감소: 확률 pi(g)는 i에 따라 단조 감소
- 빠른 감소: 감소폭은 일반적으로 i(i−1)2pi(g)보다 큼
- 임계점: i≥[0.3660n+5.5849]일 때, 평균 빈도는 21(2i)보다 작음
- 동적 계획법: Bellman (1962)과 Held-Karp (1962)의 O(n22n) 알고리즘
- 분지 한계법: Carpaneto 등의 대규모 비대칭 TSP 알고리즘
- 절단 평면법: Applegate 등의 85,900개 도시 인스턴스 해결
- Lin-Kernighan 알고리즘: 고전적인 국소 탐색 알고리즘
- LKH 알고리즘: α-measure 기반의 개선 버전
- 의사 백본 간선 방법: Jäger 등이 제안한 고품질 순회 경로 방법
- 빈도 K4: Wang과 Remmel (2016)이 처음 제안한 빈도 사각형 기반 방법
- 이항 분포 모델: 간선 빈도의 확률 모델 수립
- 필요충분조건: Wang (2019)이 빈도 K4 기반의 OHC 간선 필요충분조건 제시
- 이론적 경계: OHC 간선과 일반 간선의 빈도 Ki에서의 엄격한 경계 수립
- 변화 규칙: 간선 빈도가 i에 따라 변하는 서로 다른 패턴 규명
- 알고리즘 효율성: 기존 방법보다 개선된 시간 복잡도의 식별 알고리즘 제안
- 실용성: 다양한 유형의 TSP 인스턴스에서 방법의 유효성 검증
- 계산 복잡도: 지수항이 개선되었지만 초대규모 인스턴스에는 여전히 어려움
- 특수 경우: 많은 동일 가중치 간선을 포함하는 인스턴스에서 방법의 효과 저하 가능
- 샘플링 오차: 대규모 인스턴스에서 무작위 샘플링 사용 시 오차 발생 가능
- 저장 요구사항: 많은 Ki와 OP^i를 저장해야 하므로 공간 복잡도가 높음
- 알고리즘 최적화: 시간 복잡도 추가 감소, 특히 상수항 개선
- 병렬화: 빈도 계산의 독립성을 활용한 병렬 최적화
- 근사 방법: 빈도 특성 기반의 근사 알고리즘 개발
- 응용 확장: 비대칭 TSP 및 기타 조합 최적화 문제로의 방법 확장
- 이론적 엄밀성: 완전한 수학적 증명과 이론적 분석 제공
- 포괄적 실험: 소규모부터 대규모, 다양한 유형의 TSP 인스턴스 포함
- 방법론 혁신: 빈도 Kis의 특성과 응용을 처음으로 체계적으로 연구
- 실용적 가치: 구현 가능한 알고리즘과 명확한 시간 복잡도 경계 제공
- 글의 길이: 논문 분량이 과도하며 일부 내용은 간결하게 정리 가능
- 기호의 복잡성: 수학 기호가 많아 가독성 개선 필요
- 실험 규모: 계산 능력의 제한으로 최대 인스턴스 규모가 상대적으로 작음
- 비교 부족: 다른 정확 알고리즘과의 직접적인 성능 비교 부재
- 이론적 기여: TSP의 구조적 특성 연구에 새로운 관점 제공
- 알고리즘 가치: 특정 규모 범위에서 효과적인 정확 알고리즘 제공
- 방법론 영감: 빈도 분석 방법이 다른 조합 최적화 문제에 적용 가능
- 구현 난이도: 방법이 상대적으로 복잡하여 실제 응용에 일정한 기술 수준 필요
- 중규모 TSP: 특히 n≤100의 정확 해결 필요 시 적합
- 이론 연구: TSP 구조 분석을 위한 도구 제공
- 전처리 단계: 대규모 TSP의 간선 필터링 전처리로 활용 가능
- 교육 연구: 조합 최적화 교육을 위한 사례 제공
본 논문은 25개의 중요 참고문헌을 인용하며, 다음을 포함:
- Bellman (1962), Held & Karp (1962): TSP 동적 계획법 알고리즘의 기초 연구
- Lin & Kernighan (1973): 고전적 LK 휴리스틱 알고리즘
- Helsgaun (2000, 2009): LKH 알고리즘 시리즈
- Wang & Remmel (2016): 빈도 K4 방법의 원창 연구
- Applegate et al. (2009): 대규모 TSP 해결 기록
종합 평가: 본 논문은 이론이 깊고 실험이 상세한 조합 최적화 논문으로, TSP 간선의 구조적 특성 연구에 중요한 기여를 하였다. 알고리즘 효율성과 글의 간결성 측면에서 개선 여지가 있지만, 이론적 가치와 방법론의 혁신성은 충분히 인정할 만하다.