2025-11-24T18:19:18.135266

The frequency $K_i$s for symmetrical traveling salesman problem

Wang
The frequency $K_i$s ($i\in[4,n]$) are studied for symmetrical traveling salesman problem ($TSP$) to identify the edges in optimal Hamiltonian cycle ($OHC$). A frequency $K_i$ is computed with a sort of ${{i}\choose{2}}$ optimal $i$-vertex paths with given endpoints (optimal $i$-vertex path) in a corresponding $K_i$ in $K_n$. In frequency $K_i$, the frequency of an edge is the number of the optimal $i$-vertex paths containing the edge in the corresponding $K_i$. Given an $OHC$ edge related to $K_i$, it has a frequency bigger than $\frac{1}{2}{{i}\choose{2}}$ in the corresponding frequency $K_i$, and that of an ordinary edge not in $OHC$ is smaller than $\frac{1}{2}{{i}\choose{2}}$. On average, an $OHC$ edge in $K_i$ has the expected frequency bigger than $\frac{i^2-4i+7}{2}$ whereas an ordinary edge has the expected frequency smaller than 2. Moreover, given a frequency $K_i$ containing an $OHC$ edge related to $K_n$, the frequency of the $OHC$ edge is bigger than $\frac{1}{2}{{i}\choose{2}}$ in the worst average case. It implies that the average frequency of an $OHC$ edge computed with frequency $K_i$s is bigger than $\frac{1}{2}{{i}\choose{2}}$. It also found that the probability that an $OHC$ edge is contained in optimal $i$-vertex paths keeps stable or increases according to $i\in [4, n]$. As the frequency $K_i$s are used to compute the frequency of an edge, each $OHC$ edge has its own peak frequency at $i=P_0$ where $P_0=\frac{n}{2} + 2$ for even $n$ or $\frac{n+1}{2} + 1$ for odd $n$. For ordinary edges out of $OHC$, the probability that they are contained in optimal $i$-vertex paths decreases according to $i$. Moreover, the average frequency of an ordinary edge will be smaller than $\frac{1}{2}{{i}\choose{2}}$ if $i \geq [0.3660n + 5.5849]$. Based on these findings, an algorithm is presented to find $OHC$ in $O(n^62^{0.3660n})$ time using dynamic programming.
academic

La frequenza KiK_is per il problema del commesso viaggiatore simmetrico

Informazioni di base

  • ID articolo: 2504.19608
  • Titolo: La frequenza KiK_is per il problema del commesso viaggiatore simmetrico
  • Autore: Yong Wang (North China Electric Power University)
  • Classificazione: cs.DM math.CO math.OC
  • Data di pubblicazione: 15 ottobre 2025 (arXiv v3)
  • Link articolo: https://arxiv.org/abs/2504.19608v3

Riassunto

Questo articolo studia la frequenza KiK_is (i[4,n]i\in[4,n]) nel problema del commesso viaggiatore simmetrico (TSP) per identificare gli archi nel circuito hamiltoniano ottimale (OHC). La frequenza KiK_i è calcolata attraverso i percorsi ottimali di ii vertici corrispondenti ai (i2)\binom{i}{2} endpoint dati all'interno di KiK_i in KnK_n. Nella frequenza KiK_i, la frequenza di un arco è il numero di percorsi ottimali di ii vertici che contengono quell'arco. Lo studio rivela che: gli archi OHC hanno frequenza maggiore di 12(i2)\frac{1}{2}\binom{i}{2} nella frequenza KiK_i corrispondente, mentre gli archi ordinari hanno frequenza minore di questo valore; la frequenza attesa degli archi OHC è maggiore di i24i+72\frac{i^2-4i+7}{2}, mentre gli archi ordinari hanno frequenza minore di 2; quando i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], la frequenza media degli archi ordinari è minore di 12(i2)\frac{1}{2}\binom{i}{2}. Sulla base di questi risultati, è proposto un algoritmo di programmazione dinamica con complessità temporale O(n620.3660n)O(n^62^{0.3660n}).

Contesto di ricerca e motivazione

Contesto del problema

Il problema del commesso viaggiatore (TSP) è un problema classico NP-completo nell'ottimizzazione combinatoria. Dato un grafo completo KnK_n con nn vertici, l'obiettivo è trovare il circuito hamiltoniano più breve che visiti tutti i vertici esattamente una volta. Per il TSP simmetrico, le distanze degli archi (u,v)(u,v) e (v,u)(v,u) sono uguali.

Limitazioni dei metodi esistenti

  1. Alta complessità temporale degli algoritmi esatti: algoritmi come la programmazione dinamica di Bellman e Held-Karp richiedono tempo O(n22n)O(n^22^n)
  2. Mancanza di garanzie teoriche nei metodi euristici: sebbene algoritmi euristici come LKH funzionino bene in pratica, mancano di fondamenti teorici
  3. Difficoltà nell'identificare le caratteristiche strutturali degli archi: gli archi OHC non hanno caratteristiche significative nelle distanze, rendendo difficile distinguerli dagli archi ordinari

Motivazione della ricerca

Ricerche precedenti hanno dimostrato che gli archi OHC possono essere identificati efficacemente sulla base della frequenza K4K_4s, ma manca uno studio sistematico del caso più generale della frequenza KiK_is (i>4i > 4). Questo articolo mira a:

  1. Stabilire limiti teorici tra gli archi OHC e gli archi ordinari nelle frequenze KiK_is
  2. Analizzare le leggi di variazione della frequenza e della probabilità degli archi al variare di ii
  3. Progettare algoritmi efficienti per l'identificazione di OHC basati sulle caratteristiche di frequenza

Contributi principali

  1. Stabilimento di teoria dei limiti inferiori di frequenza: dimostrazione che gli archi OHC hanno frequenza maggiore di 12(i2)\frac{1}{2}\binom{i}{2} nella frequenza KiK_i, mentre gli archi ordinari hanno frequenza minore di questo valore
  2. Analisi delle leggi di variazione della frequenza: rivelazione che la frequenza degli archi OHC aumenta o rimane stabile al crescere di ii, mentre la frequenza degli archi ordinari diminuisce monotonicamente
  3. Determinazione del punto critico: dimostrazione che quando i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], gli archi OHC e gli archi ordinari possono essere completamente distinti
  4. Proposta di algoritmo efficiente: algoritmo di tempo O(n620.3660n)O(n^62^{0.3660n}) basato sulle caratteristiche di frequenza
  5. Fornitura di condizioni di decremento probabilistico: criterio di decremento probabilistico per l'identificazione degli archi ordinari pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g)

Dettagli del metodo

Definizione del compito

Input: grafo completo KnK_n con nn vertici e funzione di distanza degli archi d(u,v)d(u,v)Output: circuito hamiltoniano ottimale OHC Vincoli: TSP simmetrico, cioè d(u,v)=d(v,u)d(u,v) = d(v,u)

Concetti fondamentali

Percorso ottimale di ii vertici (OP^i)

Dati ii vertici in KiK_i e endpoint fissi, il percorso ottimale di ii vertici è il percorso più breve che visita tutti gli ii vertici esattamente una volta. Ogni KiK_i contiene OP^i con (i2)\binom{i}{2} coppie di endpoint diverse.

Frequenza KiK_i

La frequenza KiK_i ha gli stessi vertici e archi del corrispondente KiK_i, ma i pesi degli archi sono sostituiti dal numero di volte che l'arco appare nei (i2)\binom{i}{2} OP^i (frequenza).

Quadro teorico

Teorema 3.3 (Limite inferiore della frequenza degli archi OHC)

Per KiK_i (i4i \geq 4) contenente (i2)\binom{i}{2} OP^i, la frequenza degli archi OHC nella corrispondente frequenza KiK_i è maggiore di 12(i2)\frac{1}{2}\binom{i}{2}.

Schema della dimostrazione:

  • Quando i=4i=4, verifica attraverso enumerazione di tutte le possibili frequenze K4K_4
  • Per i>4i>4, utilizzo del metodo di induzione, dimostrazione della monotonicità della frequenza degli archi OHC nell'estensione da KiK_i a Ki+1K_{i+1}

Teorema 3.4 (Limite superiore della frequenza degli archi ordinari)

La frequenza degli archi ordinari nella frequenza KiK_i è minore di 12(i2)\frac{1}{2}\binom{i}{2}, e la frequenza attesa nel migliore dei casi medi è minore di i+22\frac{i+2}{2}.

Teorema 4.1 (Limiti di frequenza degli archi OHC in KnK_n)

Per gli archi OHC in KnK_n, nella qualsiasi frequenza KiK_i che contiene l'arco, la frequenza nel peggiore dei casi medi è maggiore di 12(i2)\frac{1}{2}\binom{i}{2}.

Progettazione dell'algoritmo

Algoritmo di identificazione basato sulla frequenza

  1. Calcolo della frequenza KiK_i: per i valori di ii selezionati, calcolo della frequenza di tutti i KiK_i
  2. Classificazione degli archi: classificazione degli archi in base alla soglia di frequenza 12(i2)\frac{1}{2}\binom{i}{2}
  3. Rilevamento del decremento probabilistico: utilizzo della condizione pi+1(g)<[12i(i1)]pi(g)p_{i+1}(g) < [1-\frac{2}{i(i-1)}]p_i(g) per identificare gli archi ordinari

Analisi della complessità temporale

  • Il calcolo di un singolo OP^i di KiK_i richiede tempo O(i42i)O(i^42^i)
  • Per i=[0.3660n+5.5849]i = [0.3660n + 5.5849], la complessità temporale totale è O(n620.3660n)O(n^62^{0.3660n})

Configurazione sperimentale

Set di dati

  1. Istanze TSP su piccola scala: istanze costruite con n[4,14]n \in [4,14] e sottografi di Oliver30
  2. Istanze TSP reali: 48 istanze da TSPLIB, incluse:
    • TSP euclideo: att48, eil51, pr76, ecc.
    • TSP ATT: att532, ecc.
    • TSP GEO: multiple istanze di distanza geografica
    • TSP Matrix: si535, si1032, ecc.

Metriche di valutazione

  • Accuratezza della frequenza: distribuzione della frequenza degli archi OHC e degli archi ordinari
  • Effetto di separazione: proporzione di archi correttamente classificati utilizzando la soglia di frequenza
  • Efficienza dell'algoritmo: tempo di calcolo e complessità spaziale

Dettagli di implementazione

  • Utilizzo della programmazione dinamica per il calcolo di OP^i
  • Per istanze su larga scala, campionamento casuale di 1000 KiK_i per il calcolo della frequenza media
  • Implementazione in C++, esecuzione su un notebook con CPU 2.3GHz e 4GB di memoria

Risultati sperimentali

Verifica dei limiti di frequenza

Risultati su istanze su piccola scala

Per istanze con n[4,14]n \in [4,14]:

  • Frequenza degli archi OHC: la frequenza minima è sempre maggiore di 718(i2)\frac{7}{18}\binom{i}{2}, nella maggior parte dei casi maggiore di 12(i2)\frac{1}{2}\binom{i}{2}
  • Frequenza degli archi ordinari: la frequenza massima è minore di 12(i2)\frac{1}{2}\binom{i}{2}, la frequenza media è prossima a 2
  • Rapporto di frequenza: il rapporto medio tra frequenza degli archi OHC e degli archi ordinari cresce da 4 (n=4n=4) a 37.3 (n=14n=14)

Risultati su istanze TSP reali

Per istanze TSPLIB:

  • La frequenza del primo arco OHC più piccolo è nella maggior parte dei casi maggiore di flb=12(i2)f_{lb} = \frac{1}{2}\binom{i}{2}
  • La frequenza del secondo arco OHC più piccolo è quasi sempre maggiore di flbf_{lb}
  • La frequenza media degli archi OHC favg>foavg=i24i+72f_{avg} > f_{oavg} = \frac{i^2-4i+7}{2}

Effetto della classificazione degli archi

Classificazione basata sulla soglia di frequenza

Utilizzo del 1°, 5°, 10°, 15°, 20° arco OHC più piccolo come soglia:

  • Soglia del 1° più piccolo: conservazione del 20%-30% degli archi ordinari (istanze piccole), proporzione più bassa nelle istanze grandi
  • Soglia del 5° più piccolo: proporzione di archi ordinari conservati scende al di sotto del 15% (istanze piccole), al di sotto del 10% (istanze medie)
  • Con l'aumento della soglia, il numero di archi ordinari conservati diminuisce rapidamente

Effetto della condizione di decremento probabilistico

Utilizzo della condizione pi(g)pi+1(g)>2pi(g)i(i1)p_i(g) - p_{i+1}(g) > \frac{2p_i(g)}{i(i-1)}:

  • Identificazione di circa il 90% degli archi ordinari nella transizione i=45i=4 \to 5
  • Identificazione di tutti gli archi ordinari nella transizione i=56i=5 \to 6 (n10n \leq 10)
  • Metodo più efficiente rispetto al metodo della soglia di frequenza, con carico computazionale minore

Leggi di variazione della frequenza

Variazione della frequenza degli archi OHC

  • Monotonicità: la probabilità pi(e)p_i(e) aumenta o rimane stabile al crescere di ii
  • Valore di picco: la frequenza raggiunge il picco a P0=n2+2P_0 = \frac{n}{2}+2 (per nn pari) o P0=n+12+1P_0 = \frac{n+1}{2}+1 (per nn dispari)
  • Limite di errore: quando la probabilità diminuisce, soddisfa pi+1(e)[12i(i1)]pi(e)p_{i+1}(e) \geq [1-\frac{2}{i(i-1)}]p_i(e)

Variazione della frequenza degli archi ordinari

  • Decremento monotono: la probabilità pi(g)p_i(g) diminuisce monotonicamente al crescere di ii
  • Rapido declino: l'entità del decremento è solitamente maggiore di 2pi(g)i(i1)\frac{2p_i(g)}{i(i-1)}
  • Punto critico: quando i[0.3660n+5.5849]i \geq [0.3660n + 5.5849], la frequenza media è minore di 12(i2)\frac{1}{2}\binom{i}{2}

Lavori correlati

Algoritmi esatti per TSP

  • Programmazione dinamica: algoritmo O(n22n)O(n^22^n) di Bellman (1962) e Held-Karp (1962)
  • Branch and bound: algoritmi per TSP asimmetrico su larga scala di Carpaneto et al.
  • Metodo dei piani di taglio: risoluzione di istanze con 85.900 città di Applegate et al.

Algoritmi euristici per TSP

  • Algoritmo Lin-Kernighan: algoritmo classico di ricerca locale
  • Algoritmo LKH: versione migliorata basata su α\alpha-measure
  • Metodo dello pseudo-backbone edge: metodo di percorsi di tour di alta qualità proposto da Jäger et al.

Metodi di frequenza

  • Frequenza K4K_4: primo metodo basato su quadrilateri di frequenza proposto da Wang e Remmel (2016)
  • Modello di distribuzione binomiale: stabilimento di modello probabilistico per la frequenza degli archi
  • Condizioni necessarie e sufficienti: condizioni necessarie e sufficienti per gli archi OHC basate sulla frequenza K4K_4 fornite da Wang (2019)

Conclusioni e discussione

Conclusioni principali

  1. Limiti teorici: stabilimento di limiti rigorosi tra gli archi OHC e gli archi ordinari nella frequenza KiK_i
  2. Leggi di variazione: rivelazione di diversi modelli di variazione della frequenza degli archi al variare di ii
  3. Efficienza dell'algoritmo: proposta di algoritmo di identificazione con complessità temporale migliore rispetto ai metodi tradizionali
  4. Praticità: verifica dell'efficacia del metodo su vari tipi di istanze TSP

Limitazioni

  1. Complessità computazionale: sebbene il termine esponenziale sia migliorato, rimane difficile per istanze su scala molto grande
  2. Casi speciali: l'efficacia del metodo potrebbe diminuire per istanze con numerosi archi di peso uguale
  3. Errore di campionamento: l'utilizzo di campionamento casuale per istanze su larga scala potrebbe introdurre errori
  4. Requisiti di memoria: necessità di memorizzare numerosi KiK_i e OP^i, complessità spaziale relativamente elevata

Direzioni future

  1. Ottimizzazione dell'algoritmo: ulteriore riduzione della complessità temporale, in particolare del termine costante
  2. Parallelizzazione: sfruttamento dell'indipendenza del calcolo della frequenza per l'ottimizzazione parallela
  3. Metodi approssimati: sviluppo di algoritmi approssimati basati sulle caratteristiche di frequenza
  4. Estensione dell'applicazione: estensione del metodo al TSP asimmetrico e ad altri problemi di ottimizzazione combinatoria

Valutazione approfondita

Punti di forza

  1. Rigore teorico: fornitura di prove matematiche complete e analisi teorica
  2. Esperimenti completi: copertura di istanze da piccola scala a grande scala, di vari tipi
  3. Innovazione del metodo: primo studio sistematico delle proprietà e dell'applicazione della frequenza KiK_is
  4. Valore pratico: fornitura di algoritmi implementabili e limiti di complessità temporale espliciti

Insufficienze

  1. Lunghezza della scrittura: lunghezza eccessiva dell'articolo, parte del contenuto potrebbe essere sintetizzato
  2. Complessità della notazione: numerosi simboli matematici, leggibilità da migliorare
  3. Scala degli esperimenti: limitazione della capacità computazionale, scala massima dell'istanza relativamente piccola
  4. Confronto insufficiente: mancanza di confronto diretto delle prestazioni con altri algoritmi esatti

Impatto

  1. Contributo teorico: fornitura di nuova prospettiva per la ricerca sulle proprietà strutturali del TSP
  2. Valore dell'algoritmo: fornitura di algoritmo esatto efficace per intervalli di dimensioni specifici
  3. Ispirazione del metodo: il metodo di analisi della frequenza potrebbe essere applicabile ad altri problemi di ottimizzazione combinatoria
  4. Difficoltà di implementazione: il metodo è relativamente complesso, l'applicazione pratica richiede una certa competenza tecnica

Scenari applicabili

  1. TSP su scala media: particolarmente adatto per esigenze di risoluzione esatta con n100n \leq 100
  2. Ricerca teorica: fornitura di strumenti per l'analisi strutturale del TSP
  3. Fase di preprocessing: utilizzo come preprocessing di selezione degli archi per TSP su larga scala
  4. Ricerca didattica: fornitura di casi di studio per l'insegnamento dell'ottimizzazione combinatoria

Bibliografia

Questo articolo cita 25 importanti riferimenti bibliografici, inclusi:

  • Bellman (1962), Held & Karp (1962): lavori fondamentali dell'algoritmo di programmazione dinamica per TSP
  • Lin & Kernighan (1973): algoritmo euristico classico LK
  • Helsgaun (2000, 2009): serie di algoritmi LKH
  • Wang & Remmel (2016): lavoro originale del metodo di frequenza K4K_4
  • Applegate et al. (2009): record di risoluzione di TSP su larga scala

Valutazione complessiva: questo è un articolo di ottimizzazione combinatoria con teoria approfondita e esperimenti dettagliati, che ha apportato importanti contributi nella ricerca sulle proprietà strutturali degli archi del TSP. Sebbene vi sia ancora spazio per miglioramenti in termini di efficienza dell'algoritmo e semplicità della scrittura, il suo valore teorico e l'innovazione del metodo meritano riconoscimento.