2025-11-24T18:19:18.135266

The frequency $K_i$s for symmetrical traveling salesman problem

Wang

The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.

academic

Die Häufigkeit $K_i$ s für das symmetrische Traveling-Salesman-Problem

Grundlegende Informationen

Papier-ID: 2504.19608
Titel: Die Häufigkeit $K_i$ s für das symmetrische Traveling-Salesman-Problem
Autor: Yong Wang (North China Electric Power University)
Klassifizierung: cs.DM math.CO math.OC
Veröffentlichungsdatum: 15. Oktober 2025 (arXiv v3)
Papierlink: https://arxiv.org/abs/2504.19608v3

Zusammenfassung

Dieses Papier untersucht die Häufigkeit $K_i$ s ( $i\in[4,n]$ ) im symmetrischen Traveling-Salesman-Problem (TSP), um Kanten im optimalen Hamiltonschen Kreis (OHC) zu identifizieren. Die Häufigkeit $K_i$ wird durch die optimalen $i$ -Vertex-Pfade mit $\binom{i}{2}$ gegebenen Endpunkten in $K_i$ berechnet. In der Häufigkeit $K_i$ ist die Häufigkeit einer Kante die Anzahl der optimalen $i$ -Vertex-Pfade, die diese Kante enthalten. Die Forschung zeigt: OHC-Kanten haben in der entsprechenden Häufigkeit $K_i$ eine Häufigkeit größer als $\frac{1}{2}\binom{i}{2}$ , während gewöhnliche Kanten kleiner als dieser Wert sind; die erwartete Häufigkeit von OHC-Kanten ist größer als $\frac{i^2-4i+7}{2}$ , gewöhnliche Kanten kleiner als 2; wenn $i \geq [0.3660n + 5.5849]$ , ist die durchschnittliche Häufigkeit gewöhnlicher Kanten kleiner als $\frac{1}{2}\binom{i}{2}$ . Basierend auf diesen Erkenntnissen wird ein Algorithmus mit dynamischer Programmierung mit Zeitkomplexität $O(n^62^{0.3660n})$ vorgeschlagen.

Forschungshintergrund und Motivation

Problematischer Hintergrund

Das Traveling-Salesman-Problem (TSP) ist ein klassisches NP-vollständiges Problem in der kombinatorischen Optimierung. Gegeben ist ein vollständiger Graph $K_n$ mit $n$ Vertices, das Ziel ist es, den kürzesten Hamiltonschen Kreis zu finden, der alle Vertices genau einmal besucht. Für das symmetrische TSP sind die Abstände der Kanten $(u,v)$ und $(v,u)$ gleich.

Einschränkungen bestehender Methoden

Hohe Zeitkomplexität exakter Algorithmen: Der Algorithmus der dynamischen Programmierung von Bellman und Held-Karp benötigt $O(n^22^n)$ Zeit
Heuristische Methoden ohne theoretische Garantien: Obwohl heuristische Algorithmen wie LKH in der Praxis gut funktionieren, fehlt die theoretische Grundlage
Schwierig zu identifizierende Kantenstrukturmerkmale: OHC-Kanten haben keine signifikanten Merkmale in Bezug auf Abstände und sind schwer von gewöhnlichen Kanten zu unterscheiden

Forschungsmotivation

Bestehende Forschungen zeigen, dass OHC-Kanten basierend auf der Häufigkeit $K_4$ s effektiv identifiziert werden können, aber es fehlt eine systematische Untersuchung des allgemeineren Falls der Häufigkeit $K_i$ s ( $i > 4$ ). Dieses Papier zielt darauf ab:

Theoretische Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit $K_i$ s zu etablieren
Die Veränderungsmuster der Kantenhäufigkeit und Wahrscheinlichkeit mit $i$ zu analysieren
Basierend auf Häufigkeitsmerkmalen einen effizienten OHC-Identifikationsalgorithmus zu entwerfen

Kernbeiträge

Etablierung der Häufigkeitsuntergrenzentheorie: Es wird bewiesen, dass OHC-Kanten in der Häufigkeit $K_i$ eine Häufigkeit größer als $\frac{1}{2}\binom{i}{2}$ haben, während gewöhnliche Kanten kleiner als dieser Wert sind
Analyse der Häufigkeitsveränderungsmuster: Es werden die Muster offengelegt, dass die Häufigkeit von OHC-Kanten mit zunehmendem $i$ zunimmt oder stabil bleibt, während die Häufigkeit gewöhnlicher Kanten monoton abnimmt
Bestimmung des kritischen Punktes: Es wird bewiesen, dass wenn $i \geq [0.3660n + 5.5849]$ , OHC-Kanten und gewöhnliche Kanten vollständig unterschieden werden können
Vorschlag eines effizienten Algorithmus: Ein Algorithmus mit Zeitkomplexität $O(n^62^{0.3660n})$ basierend auf Häufigkeitsmerkmalen
Bereitstellung von Wahrscheinlichkeitsabnahmebedingungen: Bereitstellung des Wahrscheinlichkeitsabnahmekriteriums $p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g)$ zur Identifikation gewöhnlicher Kanten

Methodische Erläuterung

Aufgabendefinition

Eingabe: Vollständiger Graph $K_n$ mit $n$ Vertices und Abstandsfunktion $d(u,v)$ Ausgabe: Optimaler Hamiltonscher Kreis OHC Einschränkung: Symmetrisches TSP, d.h. $d(u,v) = d(v,u)$

Kernkonzepte

Optimaler $i$ -Vertex-Pfad (OP^i)

Gegeben $i$ Vertices in $K_i$ und feste Endpunkte, ist der optimale $i$ -Vertex-Pfad der kürzeste Pfad, der alle $i$ Vertices genau einmal besucht. Jedes $K_i$ enthält $\binom{i}{2}$ verschiedene OP^i mit unterschiedlichen Endpunktpaaren.

Häufigkeit $K_i$

Die Häufigkeit $K_i$ hat dieselben Vertices und Kanten wie das entsprechende $K_i$ , aber die Kantengewichte werden durch die Häufigkeit ersetzt, mit der die Kante in den $\binom{i}{2}$ OP^i vorkommt.

Theoretischer Rahmen

Theorem 3.3 (Häufigkeitsuntergrenze für OHC-Kanten)

Für $K_i$ ( $i \geq 4$ ) mit $\binom{i}{2}$ OP^i ist die Häufigkeit von OHC-Kanten in der entsprechenden Häufigkeit $K_i$ größer als $\frac{1}{2}\binom{i}{2}$ .

Beweisidee:

Für $i=4$ wird durch Aufzählung aller möglichen Häufigkeiten $K_4$ verifiziert
Für $i>4$ wird Induktion verwendet, um die Monotonie der OHC-Kantenhäufigkeit bei der Erweiterung von $K_i$ zu $K_{i+1}$ zu beweisen

Theorem 3.4 (Häufigkeitsobergrenze für gewöhnliche Kanten)

Gewöhnliche Kanten haben in der Häufigkeit $K_i$ eine Häufigkeit kleiner als $\frac{1}{2}\binom{i}{2}$ , und die erwartete Häufigkeit im besten Durchschnittsfall ist kleiner als $\frac{i+2}{2}$ .

Theorem 4.1 (Häufigkeitsgrenzen für OHC-Kanten in $K_n$ )

Für OHC-Kanten in $K_n$ ist ihre Häufigkeit in jeder beliebigen Häufigkeit $K_i$ , die diese Kante enthält, im schlimmsten Durchschnittsfall größer als $\frac{1}{2}\binom{i}{2}$ .

Algorithmisches Design

Häufigkeitsbasierter Identifikationsalgorithmus

Berechnung der Häufigkeit $K_i$ : Für ausgewählte $i$ -Werte werden die Häufigkeiten aller $K_i$ berechnet
Kantenklassifizierung: Kanten werden basierend auf dem Häufigkeitsschwellenwert $\frac{1}{2}\binom{i}{2}$ klassifiziert
Wahrscheinlichkeitsabnahmeerkennung: Verwendung der Bedingung $p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g)$ zur Identifikation gewöhnlicher Kanten

Zeitkomplexitätsanalyse

Die Berechnung einzelner OP^i für $K_i$ benötigt $O(i^42^i)$ Zeit
Für $i = [0.3660n + 5.5849]$ beträgt die Gesamtzeitkomplexität $O(n^62^{0.3660n})$

Experimentelle Einrichtung

Datensätze

Kleinmaßstäbliche TSP-Instanzen: Konstruierte Instanzen mit $n \in [4,14]$ und Subgraphen von Oliver30
Echte TSP-Instanzen: 48 Instanzen aus TSPLIB, einschließlich:
- Euklidisches TSP: att48, eil51, pr76 usw.
- ATT TSP: att532 usw.
- GEO TSP: mehrere geografische Distanzinstanzen
- Matrix TSP: si535, si1032 usw.

Bewertungsmetriken

Häufigkeitsgenauigkeit: Häufigkeitsverteilung von OHC-Kanten und gewöhnlichen Kanten
Trennungseffekt: Anteil der Kanten, die mit dem Häufigkeitsschwellenwert korrekt klassifiziert werden
Algorithmuseffizienz: Berechnungszeit und Raumkomplexität

Implementierungsdetails

Verwendung dynamischer Programmierung zur Berechnung von OP^i
Für großmaßstäbliche Instanzen wird eine zufällige Stichprobe von 1000 $K_i$ zur Berechnung der durchschnittlichen Häufigkeit verwendet
C++-Implementierung auf einem Laptop mit 2,3-GHz-CPU und 4-GB-RAM

Experimentelle Ergebnisse

Verifizierung der Häufigkeitsgrenzen

Ergebnisse für kleinmaßstäbliche Instanzen

Für Instanzen mit $n \in [4,14]$ :

OHC-Kantenhäufigkeit: Die Mindesthäufigkeit ist immer größer als $\frac{7}{18}\binom{i}{2}$ , in den meisten Fällen größer als $\frac{1}{2}\binom{i}{2}$
Gewöhnliche Kantenhäufigkeit: Die maximale Häufigkeit ist kleiner als $\frac{1}{2}\binom{i}{2}$ , die durchschnittliche Häufigkeit liegt nahe bei 2
Häufigkeitsverhältnis: Das durchschnittliche Häufigkeitsverhältnis von OHC-Kanten zu gewöhnlichen Kanten wächst von 4 ( $n=4$ ) auf 37,3 ( $n=14$ )

Ergebnisse für echte TSP-Instanzen

Für TSPLIB-Instanzen:

Die kleinste OHC-Kantenhäufigkeit ist in den meisten Fällen größer als $f_{lb} = \frac{1}{2}\binom{i}{2}$
Die zweitkleinste OHC-Kantenhäufigkeit ist fast immer größer als $f_{lb}$
Die durchschnittliche OHC-Kantenhäufigkeit $f_{avg} > f_{oavg} = \frac{i^2-4i+7}{2}$

Kantenklassifizierungseffekt

Klassifizierung basierend auf Häufigkeitsschwellenwert

Verwendung der 1., 5., 10., 15., 20. kleinsten OHC-Kantenhäufigkeit als Schwellenwert:

1. kleinste Häufigkeit: Behält 20%-30% der gewöhnlichen Kanten (kleine Instanzen), der Anteil ist bei großen Instanzen niedriger
5. kleinste Häufigkeit: Der Anteil der behaltenen gewöhnlichen Kanten sinkt auf unter 15% (kleine Instanzen), unter 10% (mittlere Instanzen)
Mit zunehmendem Schwellenwert sinkt die Anzahl der behaltenen gewöhnlichen Kanten schnell

Effekt der Wahrscheinlichkeitsabnahmebedingung

Verwendung der Bedingung $p_i(g) - p_{i+1}(g) > \frac{2p_i(g)}{i(i-1)}$ :

Bei $i=4 \to 5$ werden etwa 90% der gewöhnlichen Kanten identifiziert
Bei $i=5 \to 6$ werden alle gewöhnlichen Kanten identifiziert ( $n \leq 10$ )
Effizienter als die Häufigkeitsschwellenwertmethode mit geringerem Rechenaufwand

Häufigkeitsveränderungsmuster

Häufigkeitsveränderung von OHC-Kanten

Monotonie: Die Wahrscheinlichkeit $p_i(e)$ nimmt mit zunehmendem $i$ zu oder bleibt stabil
Spitzenwert: Die Häufigkeit erreicht ihren Höchstwert bei $P_0 = \frac{n}{2}+2$ (gerade $n$ ) oder $P_0 = \frac{n+1}{2}+1$ (ungerade $n$ )
Fehlergrenze: Bei Wahrscheinlichkeitsabnahme gilt $p_{i+1}(e) \geq [1-\frac{2}{i(i-1)}]p_i(e)$

Häufigkeitsveränderung gewöhnlicher Kanten

Monotone Abnahme: Die Wahrscheinlichkeit $p_i(g)$ nimmt mit zunehmendem $i$ monoton ab
Schneller Rückgang: Das Abnahmevolumen ist normalerweise größer als $\frac{2p_i(g)}{i(i-1)}$
Kritischer Punkt: Wenn $i \geq [0.3660n + 5.5849]$ , ist die durchschnittliche Häufigkeit kleiner als $\frac{1}{2}\binom{i}{2}$

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

Theoretische Grenzen: Etablierung strenger Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit $K_i$
Veränderungsmuster: Offenlegung unterschiedlicher Veränderungsmuster der Kantenhäufigkeit mit $i$
Algorithmuseffizienz: Vorschlag eines Identifikationsalgorithmus mit verbesserter Zeitkomplexität gegenüber traditionellen Methoden
Praktikabilität: Verifizierung der Methodeneffektivität auf verschiedenen Arten von TSP-Instanzen

Einschränkungen

Rechenkomplexität: Obwohl der Exponent verbessert wurde, bleibt es für übergroße Instanzen schwierig
Spezialfälle: Bei Instanzen mit vielen gleichgewichtigen Kanten kann die Methodeneffektivität sinken
Stichprobenfehler: Die Verwendung von Zufallsstichproben bei großmaßstäblichen Instanzen kann Fehler einführen
Speicheranforderungen: Speicherung großer Mengen von $K_i$ und OP^i erforderlich, höhere Raumkomplexität

Zukünftige Richtungen

Algorithmusoptimierung: Weitere Reduzierung der Zeitkomplexität, besonders der Konstanten
Parallelisierung: Nutzung der Unabhängigkeit der Häufigkeitsberechnung für parallele Optimierung
Approximationsmethoden: Entwicklung von Approximationsalgorithmen basierend auf Häufigkeitsmerkmalen
Erweiterte Anwendungen: Erweiterung der Methode auf asymmetrisches TSP und andere kombinatorische Optimierungsprobleme

Tiefgreifende Bewertung

Stärken

Theoretische Strenge: Vollständige mathematische Beweise und theoretische Analyse
Umfassende Experimente: Abdeckung von kleinmaßstäblichen bis großmaßstäblichen und verschiedenen Arten von TSP-Instanzen
Methodische Innovation: Erste systematische Untersuchung der Eigenschaften und Anwendungen von Häufigkeit $K_i$ s
Praktischer Wert: Bereitstellung implementierbarer Algorithmen und klarer Zeitkomplexitätsgrenzen

Mängel

Ausführliche Schreibweise: Papier ist zu lang, einige Inhalte könnten gestrafft werden
Komplexe Symbole: Viele mathematische Symbole, Lesbarkeit könnte verbessert werden
Experimentelle Skalierung: Aufgrund von Rechenbeschränkungen ist die maximale Instanzgröße relativ klein
Unzureichende Vergleiche: Mangel an direktem Leistungsvergleich mit anderen Exaktalgorithmen

Einfluss

Theoretischer Beitrag: Neue Perspektive für die Forschung der Struktureigenschaften von TSP
Algorithmischer Wert: Bereitstellung eines effektiven Exaktalgorithmus für bestimmte Größenbereiche
Methodische Inspiration: Häufigkeitsanalysemethode könnte auf andere kombinatorische Optimierungsprobleme anwendbar sein
Implementierungsschwierigkeit: Methode ist relativ komplex, praktische Anwendung erfordert gewisse technische Fähigkeiten

Anwendungsszenarien

Mittlere TSP-Größe: Besonders geeignet für exakte Lösungsanforderungen mit $n \leq 100$
Theoretische Forschung: Bereitstellung von Werkzeugen für die Strukturanalyse von TSP
Vorverarbeitungsschritt: Kann als Kantenfiltervorbereitung für großmaßstäbliche TSP dienen
Lehre und Forschung: Bereitstellung von Fallstudien für die Lehre kombinatorischer Optimierung

Literaturverzeichnis

Dieses Papier zitiert 25 wichtige Referenzen, einschließlich:

Bellman (1962), Held & Karp (1962): Grundlegende Arbeiten zum TSP-Algorithmus der dynamischen Programmierung
Lin & Kernighan (1973): Klassischer LK-Heuristikalgorithmus
Helsgaun (2000, 2009): LKH-Algorithmusserie
Wang & Remmel (2016): Originalarbeit zur Häufigkeit $K_4$ -Methode
Applegate et al. (2009): Rekorde zur Lösung großmaßstäblicher TSP

Gesamtbewertung: Dies ist ein Papier mit tiefgreifender Theorie und umfassenden Experimenten in der kombinatorischen Optimierung, das wichtige Beiträge zur Forschung der Kantenstrukturmerkale von TSP leistet. Obwohl es noch Verbesserungsspielraum in Bezug auf Algorithmuseffizienz und Schreibkompaktheit gibt, sind sein theoretischer Wert und seine methodische Innovation anerkennenswert.

The frequency $K_i$s for symmetrical traveling salesman problem

Die Häufigkeit KiK_iKi​s für das symmetrische Traveling-Salesman-Problem

Die Häufigkeit $K_i$ s für das symmetrische Traveling-Salesman-Problem