The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
- Papier-ID: 2504.19608
- Titel: Die Häufigkeit Kis für das symmetrische Traveling-Salesman-Problem
- Autor: Yong Wang (North China Electric Power University)
- Klassifizierung: cs.DM math.CO math.OC
- Veröffentlichungsdatum: 15. Oktober 2025 (arXiv v3)
- Papierlink: https://arxiv.org/abs/2504.19608v3
Dieses Papier untersucht die Häufigkeit Kis (i∈[4,n]) im symmetrischen Traveling-Salesman-Problem (TSP), um Kanten im optimalen Hamiltonschen Kreis (OHC) zu identifizieren. Die Häufigkeit Ki wird durch die optimalen i-Vertex-Pfade mit (2i) gegebenen Endpunkten in Ki berechnet. In der Häufigkeit Ki ist die Häufigkeit einer Kante die Anzahl der optimalen i-Vertex-Pfade, die diese Kante enthalten. Die Forschung zeigt: OHC-Kanten haben in der entsprechenden Häufigkeit Ki eine Häufigkeit größer als 21(2i), während gewöhnliche Kanten kleiner als dieser Wert sind; die erwartete Häufigkeit von OHC-Kanten ist größer als 2i2−4i+7, gewöhnliche Kanten kleiner als 2; wenn i≥[0.3660n+5.5849], ist die durchschnittliche Häufigkeit gewöhnlicher Kanten kleiner als 21(2i). Basierend auf diesen Erkenntnissen wird ein Algorithmus mit dynamischer Programmierung mit Zeitkomplexität O(n620.3660n) vorgeschlagen.
Das Traveling-Salesman-Problem (TSP) ist ein klassisches NP-vollständiges Problem in der kombinatorischen Optimierung. Gegeben ist ein vollständiger Graph Kn mit n Vertices, das Ziel ist es, den kürzesten Hamiltonschen Kreis zu finden, der alle Vertices genau einmal besucht. Für das symmetrische TSP sind die Abstände der Kanten (u,v) und (v,u) gleich.
- Hohe Zeitkomplexität exakter Algorithmen: Der Algorithmus der dynamischen Programmierung von Bellman und Held-Karp benötigt O(n22n) Zeit
- Heuristische Methoden ohne theoretische Garantien: Obwohl heuristische Algorithmen wie LKH in der Praxis gut funktionieren, fehlt die theoretische Grundlage
- Schwierig zu identifizierende Kantenstrukturmerkmale: OHC-Kanten haben keine signifikanten Merkmale in Bezug auf Abstände und sind schwer von gewöhnlichen Kanten zu unterscheiden
Bestehende Forschungen zeigen, dass OHC-Kanten basierend auf der Häufigkeit K4s effektiv identifiziert werden können, aber es fehlt eine systematische Untersuchung des allgemeineren Falls der Häufigkeit Kis (i>4). Dieses Papier zielt darauf ab:
- Theoretische Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit Kis zu etablieren
- Die Veränderungsmuster der Kantenhäufigkeit und Wahrscheinlichkeit mit i zu analysieren
- Basierend auf Häufigkeitsmerkmalen einen effizienten OHC-Identifikationsalgorithmus zu entwerfen
- Etablierung der Häufigkeitsuntergrenzentheorie: Es wird bewiesen, dass OHC-Kanten in der Häufigkeit Ki eine Häufigkeit größer als 21(2i) haben, während gewöhnliche Kanten kleiner als dieser Wert sind
- Analyse der Häufigkeitsveränderungsmuster: Es werden die Muster offengelegt, dass die Häufigkeit von OHC-Kanten mit zunehmendem i zunimmt oder stabil bleibt, während die Häufigkeit gewöhnlicher Kanten monoton abnimmt
- Bestimmung des kritischen Punktes: Es wird bewiesen, dass wenn i≥[0.3660n+5.5849], OHC-Kanten und gewöhnliche Kanten vollständig unterschieden werden können
- Vorschlag eines effizienten Algorithmus: Ein Algorithmus mit Zeitkomplexität O(n620.3660n) basierend auf Häufigkeitsmerkmalen
- Bereitstellung von Wahrscheinlichkeitsabnahmebedingungen: Bereitstellung des Wahrscheinlichkeitsabnahmekriteriums pi+1(g)<[1−i(i−1)2]pi(g) zur Identifikation gewöhnlicher Kanten
Eingabe: Vollständiger Graph Kn mit n Vertices und Abstandsfunktion d(u,v)Ausgabe: Optimaler Hamiltonscher Kreis OHC
Einschränkung: Symmetrisches TSP, d.h. d(u,v)=d(v,u)
Gegeben i Vertices in Ki und feste Endpunkte, ist der optimale i-Vertex-Pfad der kürzeste Pfad, der alle i Vertices genau einmal besucht. Jedes Ki enthält (2i) verschiedene OP^i mit unterschiedlichen Endpunktpaaren.
Die Häufigkeit Ki hat dieselben Vertices und Kanten wie das entsprechende Ki, aber die Kantengewichte werden durch die Häufigkeit ersetzt, mit der die Kante in den (2i) OP^i vorkommt.
Für Ki (i≥4) mit (2i) OP^i ist die Häufigkeit von OHC-Kanten in der entsprechenden Häufigkeit Ki größer als 21(2i).
Beweisidee:
- Für i=4 wird durch Aufzählung aller möglichen Häufigkeiten K4 verifiziert
- Für i>4 wird Induktion verwendet, um die Monotonie der OHC-Kantenhäufigkeit bei der Erweiterung von Ki zu Ki+1 zu beweisen
Gewöhnliche Kanten haben in der Häufigkeit Ki eine Häufigkeit kleiner als 21(2i), und die erwartete Häufigkeit im besten Durchschnittsfall ist kleiner als 2i+2.
Für OHC-Kanten in Kn ist ihre Häufigkeit in jeder beliebigen Häufigkeit Ki, die diese Kante enthält, im schlimmsten Durchschnittsfall größer als 21(2i).
- Berechnung der Häufigkeit Ki: Für ausgewählte i-Werte werden die Häufigkeiten aller Ki berechnet
- Kantenklassifizierung: Kanten werden basierend auf dem Häufigkeitsschwellenwert 21(2i) klassifiziert
- Wahrscheinlichkeitsabnahmeerkennung: Verwendung der Bedingung pi+1(g)<[1−i(i−1)2]pi(g) zur Identifikation gewöhnlicher Kanten
- Die Berechnung einzelner OP^i für Ki benötigt O(i42i) Zeit
- Für i=[0.3660n+5.5849] beträgt die Gesamtzeitkomplexität O(n620.3660n)
- Kleinmaßstäbliche TSP-Instanzen: Konstruierte Instanzen mit n∈[4,14] und Subgraphen von Oliver30
- Echte TSP-Instanzen: 48 Instanzen aus TSPLIB, einschließlich:
- Euklidisches TSP: att48, eil51, pr76 usw.
- ATT TSP: att532 usw.
- GEO TSP: mehrere geografische Distanzinstanzen
- Matrix TSP: si535, si1032 usw.
- Häufigkeitsgenauigkeit: Häufigkeitsverteilung von OHC-Kanten und gewöhnlichen Kanten
- Trennungseffekt: Anteil der Kanten, die mit dem Häufigkeitsschwellenwert korrekt klassifiziert werden
- Algorithmuseffizienz: Berechnungszeit und Raumkomplexität
- Verwendung dynamischer Programmierung zur Berechnung von OP^i
- Für großmaßstäbliche Instanzen wird eine zufällige Stichprobe von 1000 Ki zur Berechnung der durchschnittlichen Häufigkeit verwendet
- C++-Implementierung auf einem Laptop mit 2,3-GHz-CPU und 4-GB-RAM
Für Instanzen mit n∈[4,14]:
- OHC-Kantenhäufigkeit: Die Mindesthäufigkeit ist immer größer als 187(2i), in den meisten Fällen größer als 21(2i)
- Gewöhnliche Kantenhäufigkeit: Die maximale Häufigkeit ist kleiner als 21(2i), die durchschnittliche Häufigkeit liegt nahe bei 2
- Häufigkeitsverhältnis: Das durchschnittliche Häufigkeitsverhältnis von OHC-Kanten zu gewöhnlichen Kanten wächst von 4 (n=4) auf 37,3 (n=14)
Für TSPLIB-Instanzen:
- Die kleinste OHC-Kantenhäufigkeit ist in den meisten Fällen größer als flb=21(2i)
- Die zweitkleinste OHC-Kantenhäufigkeit ist fast immer größer als flb
- Die durchschnittliche OHC-Kantenhäufigkeit favg>foavg=2i2−4i+7
Verwendung der 1., 5., 10., 15., 20. kleinsten OHC-Kantenhäufigkeit als Schwellenwert:
- 1. kleinste Häufigkeit: Behält 20%-30% der gewöhnlichen Kanten (kleine Instanzen), der Anteil ist bei großen Instanzen niedriger
- 5. kleinste Häufigkeit: Der Anteil der behaltenen gewöhnlichen Kanten sinkt auf unter 15% (kleine Instanzen), unter 10% (mittlere Instanzen)
- Mit zunehmendem Schwellenwert sinkt die Anzahl der behaltenen gewöhnlichen Kanten schnell
Verwendung der Bedingung pi(g)−pi+1(g)>i(i−1)2pi(g):
- Bei i=4→5 werden etwa 90% der gewöhnlichen Kanten identifiziert
- Bei i=5→6 werden alle gewöhnlichen Kanten identifiziert (n≤10)
- Effizienter als die Häufigkeitsschwellenwertmethode mit geringerem Rechenaufwand
- Monotonie: Die Wahrscheinlichkeit pi(e) nimmt mit zunehmendem i zu oder bleibt stabil
- Spitzenwert: Die Häufigkeit erreicht ihren Höchstwert bei P0=2n+2 (gerade n) oder P0=2n+1+1 (ungerade n)
- Fehlergrenze: Bei Wahrscheinlichkeitsabnahme gilt pi+1(e)≥[1−i(i−1)2]pi(e)
- Monotone Abnahme: Die Wahrscheinlichkeit pi(g) nimmt mit zunehmendem i monoton ab
- Schneller Rückgang: Das Abnahmevolumen ist normalerweise größer als i(i−1)2pi(g)
- Kritischer Punkt: Wenn i≥[0.3660n+5.5849], ist die durchschnittliche Häufigkeit kleiner als 21(2i)
- Dynamische Programmierung: Bellman (1962) und Held-Karp (1962) O(n22n) Algorithmus
- Branch-and-Bound: Algorithmen von Carpaneto et al. für großmaßstäbliche asymmetrische TSP
- Schnittebenenverfahren: Applegate et al. lösten Instanzen mit 85.900 Städten
- Lin-Kernighan-Algorithmus: Klassischer lokaler Suchalgorithmus
- LKH-Algorithmus: Verbesserte Version basierend auf α-Maß
- Pseudo-Backbone-Edge-Methode: Von Jäger et al. vorgeschlagene Methode für hochwertige Touren
- Häufigkeit K4: Erstmals von Wang und Remmel (2016) vorgeschlagene Methode basierend auf Häufigkeitsvierecken
- Binomialverteilungsmodell: Etablierung eines Wahrscheinlichkeitsmodells für Kantenhäufigkeit
- Notwendige und hinreichende Bedingungen: Wang (2019) gab notwendige und hinreichende Bedingungen basierend auf Häufigkeit K4 an
- Theoretische Grenzen: Etablierung strenger Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit Ki
- Veränderungsmuster: Offenlegung unterschiedlicher Veränderungsmuster der Kantenhäufigkeit mit i
- Algorithmuseffizienz: Vorschlag eines Identifikationsalgorithmus mit verbesserter Zeitkomplexität gegenüber traditionellen Methoden
- Praktikabilität: Verifizierung der Methodeneffektivität auf verschiedenen Arten von TSP-Instanzen
- Rechenkomplexität: Obwohl der Exponent verbessert wurde, bleibt es für übergroße Instanzen schwierig
- Spezialfälle: Bei Instanzen mit vielen gleichgewichtigen Kanten kann die Methodeneffektivität sinken
- Stichprobenfehler: Die Verwendung von Zufallsstichproben bei großmaßstäblichen Instanzen kann Fehler einführen
- Speicheranforderungen: Speicherung großer Mengen von Ki und OP^i erforderlich, höhere Raumkomplexität
- Algorithmusoptimierung: Weitere Reduzierung der Zeitkomplexität, besonders der Konstanten
- Parallelisierung: Nutzung der Unabhängigkeit der Häufigkeitsberechnung für parallele Optimierung
- Approximationsmethoden: Entwicklung von Approximationsalgorithmen basierend auf Häufigkeitsmerkmalen
- Erweiterte Anwendungen: Erweiterung der Methode auf asymmetrisches TSP und andere kombinatorische Optimierungsprobleme
- Theoretische Strenge: Vollständige mathematische Beweise und theoretische Analyse
- Umfassende Experimente: Abdeckung von kleinmaßstäblichen bis großmaßstäblichen und verschiedenen Arten von TSP-Instanzen
- Methodische Innovation: Erste systematische Untersuchung der Eigenschaften und Anwendungen von Häufigkeit Kis
- Praktischer Wert: Bereitstellung implementierbarer Algorithmen und klarer Zeitkomplexitätsgrenzen
- Ausführliche Schreibweise: Papier ist zu lang, einige Inhalte könnten gestrafft werden
- Komplexe Symbole: Viele mathematische Symbole, Lesbarkeit könnte verbessert werden
- Experimentelle Skalierung: Aufgrund von Rechenbeschränkungen ist die maximale Instanzgröße relativ klein
- Unzureichende Vergleiche: Mangel an direktem Leistungsvergleich mit anderen Exaktalgorithmen
- Theoretischer Beitrag: Neue Perspektive für die Forschung der Struktureigenschaften von TSP
- Algorithmischer Wert: Bereitstellung eines effektiven Exaktalgorithmus für bestimmte Größenbereiche
- Methodische Inspiration: Häufigkeitsanalysemethode könnte auf andere kombinatorische Optimierungsprobleme anwendbar sein
- Implementierungsschwierigkeit: Methode ist relativ komplex, praktische Anwendung erfordert gewisse technische Fähigkeiten
- Mittlere TSP-Größe: Besonders geeignet für exakte Lösungsanforderungen mit n≤100
- Theoretische Forschung: Bereitstellung von Werkzeugen für die Strukturanalyse von TSP
- Vorverarbeitungsschritt: Kann als Kantenfiltervorbereitung für großmaßstäbliche TSP dienen
- Lehre und Forschung: Bereitstellung von Fallstudien für die Lehre kombinatorischer Optimierung
Dieses Papier zitiert 25 wichtige Referenzen, einschließlich:
- Bellman (1962), Held & Karp (1962): Grundlegende Arbeiten zum TSP-Algorithmus der dynamischen Programmierung
- Lin & Kernighan (1973): Klassischer LK-Heuristikalgorithmus
- Helsgaun (2000, 2009): LKH-Algorithmusserie
- Wang & Remmel (2016): Originalarbeit zur Häufigkeit K4-Methode
- Applegate et al. (2009): Rekorde zur Lösung großmaßstäblicher TSP
Gesamtbewertung: Dies ist ein Papier mit tiefgreifender Theorie und umfassenden Experimenten in der kombinatorischen Optimierung, das wichtige Beiträge zur Forschung der Kantenstrukturmerkale von TSP leistet. Obwohl es noch Verbesserungsspielraum in Bezug auf Algorithmuseffizienz und Schreibkompaktheit gibt, sind sein theoretischer Wert und seine methodische Innovation anerkennenswert.