2025-11-24T18:19:18.135266

The frequency $K_i$s for symmetrical traveling salesman problem

Wang
The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
academic

Die Häufigkeit KiK_is für das symmetrische Traveling-Salesman-Problem

Grundlegende Informationen

  • Papier-ID: 2504.19608
  • Titel: Die Häufigkeit KiK_is für das symmetrische Traveling-Salesman-Problem
  • Autor: Yong Wang (North China Electric Power University)
  • Klassifizierung: cs.DM math.CO math.OC
  • Veröffentlichungsdatum: 15. Oktober 2025 (arXiv v3)
  • Papierlink: https://arxiv.org/abs/2504.19608v3

Zusammenfassung

Dieses Papier untersucht die Häufigkeit KiK_is (i[4,n]i\in[4,n]) im symmetrischen Traveling-Salesman-Problem (TSP), um Kanten im optimalen Hamiltonschen Kreis (OHC) zu identifizieren. Die Häufigkeit KiK_i wird durch die optimalen ii-Vertex-Pfade mit (i2)\binom{i}{2} gegebenen Endpunkten in KiK_i berechnet. In der Häufigkeit KiK_i ist die Häufigkeit einer Kante die Anzahl der optimalen ii-Vertex-Pfade, die diese Kante enthalten. Die Forschung zeigt: OHC-Kanten haben in der entsprechenden Häufigkeit KiK_i eine Häufigkeit größer als 12(i2)\frac{1}{2}\binom{i}{2}, während gewöhnliche Kanten kleiner als dieser Wert sind; die erwartete Häufigkeit von OHC-Kanten ist größer als i24i+72\frac{i^2-4i+7}{2}, gewöhnliche Kanten kleiner als 2; wenn i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], ist die durchschnittliche Häufigkeit gewöhnlicher Kanten kleiner als 12(i2)\frac{1}{2}\binom{i}{2}. Basierend auf diesen Erkenntnissen wird ein Algorithmus mit dynamischer Programmierung mit Zeitkomplexität O(n620.3660n)O(n^62^{0.3660n}) vorgeschlagen.

Forschungshintergrund und Motivation

Problematischer Hintergrund

Das Traveling-Salesman-Problem (TSP) ist ein klassisches NP-vollständiges Problem in der kombinatorischen Optimierung. Gegeben ist ein vollständiger Graph KnK_n mit nn Vertices, das Ziel ist es, den kürzesten Hamiltonschen Kreis zu finden, der alle Vertices genau einmal besucht. Für das symmetrische TSP sind die Abstände der Kanten (u,v)(u,v) und (v,u)(v,u) gleich.

Einschränkungen bestehender Methoden

  1. Hohe Zeitkomplexität exakter Algorithmen: Der Algorithmus der dynamischen Programmierung von Bellman und Held-Karp benötigt O(n22n)O(n^22^n) Zeit
  2. Heuristische Methoden ohne theoretische Garantien: Obwohl heuristische Algorithmen wie LKH in der Praxis gut funktionieren, fehlt die theoretische Grundlage
  3. Schwierig zu identifizierende Kantenstrukturmerkmale: OHC-Kanten haben keine signifikanten Merkmale in Bezug auf Abstände und sind schwer von gewöhnlichen Kanten zu unterscheiden

Forschungsmotivation

Bestehende Forschungen zeigen, dass OHC-Kanten basierend auf der Häufigkeit K4K_4s effektiv identifiziert werden können, aber es fehlt eine systematische Untersuchung des allgemeineren Falls der Häufigkeit KiK_is (i>4i > 4). Dieses Papier zielt darauf ab:

  1. Theoretische Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit KiK_is zu etablieren
  2. Die Veränderungsmuster der Kantenhäufigkeit und Wahrscheinlichkeit mit ii zu analysieren
  3. Basierend auf Häufigkeitsmerkmalen einen effizienten OHC-Identifikationsalgorithmus zu entwerfen

Kernbeiträge

  1. Etablierung der Häufigkeitsuntergrenzentheorie: Es wird bewiesen, dass OHC-Kanten in der Häufigkeit KiK_i eine Häufigkeit größer als 12(i2)\frac{1}{2}\binom{i}{2} haben, während gewöhnliche Kanten kleiner als dieser Wert sind
  2. Analyse der Häufigkeitsveränderungsmuster: Es werden die Muster offengelegt, dass die Häufigkeit von OHC-Kanten mit zunehmendem ii zunimmt oder stabil bleibt, während die Häufigkeit gewöhnlicher Kanten monoton abnimmt
  3. Bestimmung des kritischen Punktes: Es wird bewiesen, dass wenn i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], OHC-Kanten und gewöhnliche Kanten vollständig unterschieden werden können
  4. Vorschlag eines effizienten Algorithmus: Ein Algorithmus mit Zeitkomplexität O(n620.3660n)O(n^62^{0.3660n}) basierend auf Häufigkeitsmerkmalen
  5. Bereitstellung von Wahrscheinlichkeitsabnahmebedingungen: Bereitstellung des Wahrscheinlichkeitsabnahmekriteriums pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g) zur Identifikation gewöhnlicher Kanten

Methodische Erläuterung

Aufgabendefinition

Eingabe: Vollständiger Graph KnK_n mit nn Vertices und Abstandsfunktion d(u,v)d(u,v)Ausgabe: Optimaler Hamiltonscher Kreis OHC Einschränkung: Symmetrisches TSP, d.h. d(u,v)=d(v,u)d(u,v) = d(v,u)

Kernkonzepte

Optimaler ii-Vertex-Pfad (OP^i)

Gegeben ii Vertices in KiK_i und feste Endpunkte, ist der optimale ii-Vertex-Pfad der kürzeste Pfad, der alle ii Vertices genau einmal besucht. Jedes KiK_i enthält (i2)\binom{i}{2} verschiedene OP^i mit unterschiedlichen Endpunktpaaren.

Häufigkeit KiK_i

Die Häufigkeit KiK_i hat dieselben Vertices und Kanten wie das entsprechende KiK_i, aber die Kantengewichte werden durch die Häufigkeit ersetzt, mit der die Kante in den (i2)\binom{i}{2} OP^i vorkommt.

Theoretischer Rahmen

Theorem 3.3 (Häufigkeitsuntergrenze für OHC-Kanten)

Für KiK_i (i4i \geq 4) mit (i2)\binom{i}{2} OP^i ist die Häufigkeit von OHC-Kanten in der entsprechenden Häufigkeit KiK_i größer als 12(i2)\frac{1}{2}\binom{i}{2}.

Beweisidee:

  • Für i=4i=4 wird durch Aufzählung aller möglichen Häufigkeiten K4K_4 verifiziert
  • Für i>4i>4 wird Induktion verwendet, um die Monotonie der OHC-Kantenhäufigkeit bei der Erweiterung von KiK_i zu Ki+1K_{i+1} zu beweisen

Theorem 3.4 (Häufigkeitsobergrenze für gewöhnliche Kanten)

Gewöhnliche Kanten haben in der Häufigkeit KiK_i eine Häufigkeit kleiner als 12(i2)\frac{1}{2}\binom{i}{2}, und die erwartete Häufigkeit im besten Durchschnittsfall ist kleiner als i+22\frac{i+2}{2}.

Theorem 4.1 (Häufigkeitsgrenzen für OHC-Kanten in KnK_n)

Für OHC-Kanten in KnK_n ist ihre Häufigkeit in jeder beliebigen Häufigkeit KiK_i, die diese Kante enthält, im schlimmsten Durchschnittsfall größer als 12(i2)\frac{1}{2}\binom{i}{2}.

Algorithmisches Design

Häufigkeitsbasierter Identifikationsalgorithmus

  1. Berechnung der Häufigkeit KiK_i: Für ausgewählte ii-Werte werden die Häufigkeiten aller KiK_i berechnet
  2. Kantenklassifizierung: Kanten werden basierend auf dem Häufigkeitsschwellenwert 12(i2)\frac{1}{2}\binom{i}{2} klassifiziert
  3. Wahrscheinlichkeitsabnahmeerkennung: Verwendung der Bedingung pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g) zur Identifikation gewöhnlicher Kanten

Zeitkomplexitätsanalyse

  • Die Berechnung einzelner OP^i für KiK_i benötigt O(i42i)O(i^42^i) Zeit
  • Für i=[0.3660n+5.5849]i = [0.3660n + 5.5849] beträgt die Gesamtzeitkomplexität O(n620.3660n)O(n^62^{0.3660n})

Experimentelle Einrichtung

Datensätze

  1. Kleinmaßstäbliche TSP-Instanzen: Konstruierte Instanzen mit n[4,14]n \in [4,14] und Subgraphen von Oliver30
  2. Echte TSP-Instanzen: 48 Instanzen aus TSPLIB, einschließlich:
    • Euklidisches TSP: att48, eil51, pr76 usw.
    • ATT TSP: att532 usw.
    • GEO TSP: mehrere geografische Distanzinstanzen
    • Matrix TSP: si535, si1032 usw.

Bewertungsmetriken

  • Häufigkeitsgenauigkeit: Häufigkeitsverteilung von OHC-Kanten und gewöhnlichen Kanten
  • Trennungseffekt: Anteil der Kanten, die mit dem Häufigkeitsschwellenwert korrekt klassifiziert werden
  • Algorithmuseffizienz: Berechnungszeit und Raumkomplexität

Implementierungsdetails

  • Verwendung dynamischer Programmierung zur Berechnung von OP^i
  • Für großmaßstäbliche Instanzen wird eine zufällige Stichprobe von 1000 KiK_i zur Berechnung der durchschnittlichen Häufigkeit verwendet
  • C++-Implementierung auf einem Laptop mit 2,3-GHz-CPU und 4-GB-RAM

Experimentelle Ergebnisse

Verifizierung der Häufigkeitsgrenzen

Ergebnisse für kleinmaßstäbliche Instanzen

Für Instanzen mit n[4,14]n \in [4,14]:

  • OHC-Kantenhäufigkeit: Die Mindesthäufigkeit ist immer größer als 718(i2)\frac{7}{18}\binom{i}{2}, in den meisten Fällen größer als 12(i2)\frac{1}{2}\binom{i}{2}
  • Gewöhnliche Kantenhäufigkeit: Die maximale Häufigkeit ist kleiner als 12(i2)\frac{1}{2}\binom{i}{2}, die durchschnittliche Häufigkeit liegt nahe bei 2
  • Häufigkeitsverhältnis: Das durchschnittliche Häufigkeitsverhältnis von OHC-Kanten zu gewöhnlichen Kanten wächst von 4 (n=4n=4) auf 37,3 (n=14n=14)

Ergebnisse für echte TSP-Instanzen

Für TSPLIB-Instanzen:

  • Die kleinste OHC-Kantenhäufigkeit ist in den meisten Fällen größer als flb=12(i2)f_{lb} = \frac{1}{2}\binom{i}{2}
  • Die zweitkleinste OHC-Kantenhäufigkeit ist fast immer größer als flbf_{lb}
  • Die durchschnittliche OHC-Kantenhäufigkeit favg>foavg=i24i+72f_{avg} > f_{oavg} = \frac{i^2-4i+7}{2}

Kantenklassifizierungseffekt

Klassifizierung basierend auf Häufigkeitsschwellenwert

Verwendung der 1., 5., 10., 15., 20. kleinsten OHC-Kantenhäufigkeit als Schwellenwert:

  • 1. kleinste Häufigkeit: Behält 20%-30% der gewöhnlichen Kanten (kleine Instanzen), der Anteil ist bei großen Instanzen niedriger
  • 5. kleinste Häufigkeit: Der Anteil der behaltenen gewöhnlichen Kanten sinkt auf unter 15% (kleine Instanzen), unter 10% (mittlere Instanzen)
  • Mit zunehmendem Schwellenwert sinkt die Anzahl der behaltenen gewöhnlichen Kanten schnell

Effekt der Wahrscheinlichkeitsabnahmebedingung

Verwendung der Bedingung pi(g)pi+1(g)>2pi(g)i(i1)p_i(g) - p_{i+1}(g) > \frac{2p_i(g)}{i(i-1)}:

  • Bei i=45i=4 \to 5 werden etwa 90% der gewöhnlichen Kanten identifiziert
  • Bei i=56i=5 \to 6 werden alle gewöhnlichen Kanten identifiziert (n10n \leq 10)
  • Effizienter als die Häufigkeitsschwellenwertmethode mit geringerem Rechenaufwand

Häufigkeitsveränderungsmuster

Häufigkeitsveränderung von OHC-Kanten

  • Monotonie: Die Wahrscheinlichkeit pi(e)p_i(e) nimmt mit zunehmendem ii zu oder bleibt stabil
  • Spitzenwert: Die Häufigkeit erreicht ihren Höchstwert bei P0=n2+2P_0 = \frac{n}{2}+2 (gerade nn) oder P0=n+12+1P_0 = \frac{n+1}{2}+1 (ungerade nn)
  • Fehlergrenze: Bei Wahrscheinlichkeitsabnahme gilt pi+1(e)[12i(i1)]pi(e)p_{i+1}(e) \geq [1-\frac{2}{i(i-1)}]p_i(e)

Häufigkeitsveränderung gewöhnlicher Kanten

  • Monotone Abnahme: Die Wahrscheinlichkeit pi(g)p_i(g) nimmt mit zunehmendem ii monoton ab
  • Schneller Rückgang: Das Abnahmevolumen ist normalerweise größer als 2pi(g)i(i1)\frac{2p_i(g)}{i(i-1)}
  • Kritischer Punkt: Wenn i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], ist die durchschnittliche Häufigkeit kleiner als 12(i2)\frac{1}{2}\binom{i}{2}

Verwandte Arbeiten

TSP-Exaktalgorithmen

  • Dynamische Programmierung: Bellman (1962) und Held-Karp (1962) O(n22n)O(n^22^n) Algorithmus
  • Branch-and-Bound: Algorithmen von Carpaneto et al. für großmaßstäbliche asymmetrische TSP
  • Schnittebenenverfahren: Applegate et al. lösten Instanzen mit 85.900 Städten

TSP-Heuristiken

  • Lin-Kernighan-Algorithmus: Klassischer lokaler Suchalgorithmus
  • LKH-Algorithmus: Verbesserte Version basierend auf α\alpha-Maß
  • Pseudo-Backbone-Edge-Methode: Von Jäger et al. vorgeschlagene Methode für hochwertige Touren

Häufigkeitsmethoden

  • Häufigkeit K4K_4: Erstmals von Wang und Remmel (2016) vorgeschlagene Methode basierend auf Häufigkeitsvierecken
  • Binomialverteilungsmodell: Etablierung eines Wahrscheinlichkeitsmodells für Kantenhäufigkeit
  • Notwendige und hinreichende Bedingungen: Wang (2019) gab notwendige und hinreichende Bedingungen basierend auf Häufigkeit K4K_4 an

Schlussfolgerung und Diskussion

Hauptschlussfolgerungen

  1. Theoretische Grenzen: Etablierung strenger Grenzen für OHC-Kanten und gewöhnliche Kanten in der Häufigkeit KiK_i
  2. Veränderungsmuster: Offenlegung unterschiedlicher Veränderungsmuster der Kantenhäufigkeit mit ii
  3. Algorithmuseffizienz: Vorschlag eines Identifikationsalgorithmus mit verbesserter Zeitkomplexität gegenüber traditionellen Methoden
  4. Praktikabilität: Verifizierung der Methodeneffektivität auf verschiedenen Arten von TSP-Instanzen

Einschränkungen

  1. Rechenkomplexität: Obwohl der Exponent verbessert wurde, bleibt es für übergroße Instanzen schwierig
  2. Spezialfälle: Bei Instanzen mit vielen gleichgewichtigen Kanten kann die Methodeneffektivität sinken
  3. Stichprobenfehler: Die Verwendung von Zufallsstichproben bei großmaßstäblichen Instanzen kann Fehler einführen
  4. Speicheranforderungen: Speicherung großer Mengen von KiK_i und OP^i erforderlich, höhere Raumkomplexität

Zukünftige Richtungen

  1. Algorithmusoptimierung: Weitere Reduzierung der Zeitkomplexität, besonders der Konstanten
  2. Parallelisierung: Nutzung der Unabhängigkeit der Häufigkeitsberechnung für parallele Optimierung
  3. Approximationsmethoden: Entwicklung von Approximationsalgorithmen basierend auf Häufigkeitsmerkmalen
  4. Erweiterte Anwendungen: Erweiterung der Methode auf asymmetrisches TSP und andere kombinatorische Optimierungsprobleme

Tiefgreifende Bewertung

Stärken

  1. Theoretische Strenge: Vollständige mathematische Beweise und theoretische Analyse
  2. Umfassende Experimente: Abdeckung von kleinmaßstäblichen bis großmaßstäblichen und verschiedenen Arten von TSP-Instanzen
  3. Methodische Innovation: Erste systematische Untersuchung der Eigenschaften und Anwendungen von Häufigkeit KiK_is
  4. Praktischer Wert: Bereitstellung implementierbarer Algorithmen und klarer Zeitkomplexitätsgrenzen

Mängel

  1. Ausführliche Schreibweise: Papier ist zu lang, einige Inhalte könnten gestrafft werden
  2. Komplexe Symbole: Viele mathematische Symbole, Lesbarkeit könnte verbessert werden
  3. Experimentelle Skalierung: Aufgrund von Rechenbeschränkungen ist die maximale Instanzgröße relativ klein
  4. Unzureichende Vergleiche: Mangel an direktem Leistungsvergleich mit anderen Exaktalgorithmen

Einfluss

  1. Theoretischer Beitrag: Neue Perspektive für die Forschung der Struktureigenschaften von TSP
  2. Algorithmischer Wert: Bereitstellung eines effektiven Exaktalgorithmus für bestimmte Größenbereiche
  3. Methodische Inspiration: Häufigkeitsanalysemethode könnte auf andere kombinatorische Optimierungsprobleme anwendbar sein
  4. Implementierungsschwierigkeit: Methode ist relativ komplex, praktische Anwendung erfordert gewisse technische Fähigkeiten

Anwendungsszenarien

  1. Mittlere TSP-Größe: Besonders geeignet für exakte Lösungsanforderungen mit n100n \leq 100
  2. Theoretische Forschung: Bereitstellung von Werkzeugen für die Strukturanalyse von TSP
  3. Vorverarbeitungsschritt: Kann als Kantenfiltervorbereitung für großmaßstäbliche TSP dienen
  4. Lehre und Forschung: Bereitstellung von Fallstudien für die Lehre kombinatorischer Optimierung

Literaturverzeichnis

Dieses Papier zitiert 25 wichtige Referenzen, einschließlich:

  • Bellman (1962), Held & Karp (1962): Grundlegende Arbeiten zum TSP-Algorithmus der dynamischen Programmierung
  • Lin & Kernighan (1973): Klassischer LK-Heuristikalgorithmus
  • Helsgaun (2000, 2009): LKH-Algorithmusserie
  • Wang & Remmel (2016): Originalarbeit zur Häufigkeit K4K_4-Methode
  • Applegate et al. (2009): Rekorde zur Lösung großmaßstäblicher TSP

Gesamtbewertung: Dies ist ein Papier mit tiefgreifender Theorie und umfassenden Experimenten in der kombinatorischen Optimierung, das wichtige Beiträge zur Forschung der Kantenstrukturmerkale von TSP leistet. Obwohl es noch Verbesserungsspielraum in Bezug auf Algorithmuseffizienz und Schreibkompaktheit gibt, sind sein theoretischer Wert und seine methodische Innovation anerkennenswert.