$O(\log n)$-Approximation Algorithms for Bipartiteness Ratio
Soma, Ye, Yoshida
We propose an $O(\log n)$-approximation algorithm for the bipartiteness ratio of undirected graphs introduced by Trevisan (SIAM Journal on Computing, vol. 41, no. 6, 2012), where $n$ is the number of vertices. Our approach extends the cut-matching game framework for sparsest cut to the bipartiteness ratio, and requires only $\mathop{\mathrm{polylog}} n$ many single-commodity undirected maximum flow computations. Therefore, with the current fastest undirected max-flow algorithms, it runs in almost linear time. Along the way, we introduce the concept of well-linkedness for skew-symmetric graphs and prove a novel characterization of bipartiteness ratio in terms of well-linkedness in an auxiliary skew-symmetric graph, which may be of independent interest.
As an application, we devise an $\tilde{O}(mn)$-time algorithm for the minimum uncut problem: given a graph whose optimal cut leaves an $η$ fraction of edges uncut, we find a cut that leaves only an $O(\log n \log(1/η)) \cdot η$ fraction of edges uncut, where $m$ is the number of edges.
Finally, we propose a directed analogue of the bipartiteness ratio, and we give a polynomial-time algorithm that achieves an $O(\log n)$ approximation for this measure via a directed Leighton--Rao-style embedding. We also propose an algorithm for the minimum directed uncut problem with a guarantee similar to that for the minimum uncut problem.
academic
Algoritmi di Approssimazione O(logn) per il Rapporto di Bipartitezza
Titolo: Algoritmi di Approssimazione O(logn) per il Rapporto di Bipartitezza
Autori: Tasuku Soma (The Institute of Statistical Mathematics & RIKEN AIP), Mingquan Ye (National Institute of Informatics & University of California, Santa Cruz), Yuichi Yoshida (National Institute of Informatics)
Classificazione: cs.DS (Strutture Dati e Algoritmi)
Questo articolo propone il primo algoritmo di approssimazione O(logn) per il rapporto di bipartitezza (bipartiteness ratio) di grafi non orientati, dove n è il numero di vertici. Il metodo estende il framework del gioco taglio-matching del problema del taglio più sparso (sparsest cut) al problema del rapporto di bipartitezza, richiedendo solo polylog n calcoli di flusso massimo non orientato a singola merce. Combinato con gli attuali algoritmi di flusso massimo non orientato più veloci, si ottiene una complessità temporale quasi-lineare. La ricerca introduce il concetto di buona connettività (well-linkedness) per grafi parzialmente simmetrici e dimostra una nuova caratterizzazione del rapporto di bipartitezza rispetto alla buona connettività nel grafo ausiliario parzialmente simmetrico. Come applicazione, viene proposto un algoritmo di tempo O~(mn) per il taglio minimo non tagliato (minimum uncut). Inoltre, viene definito il rapporto di bipartitezza orientato e fornito un algoritmo di approssimazione O(logn) tramite embedding di stile Leighton-Rao orientato.
Il problema del rapporto di bipartitezza è un problema di ottimizzazione su grafi introdotto da Trevisan Tre12. Per un grafo non orientato G=(V,E,w), si definisce:
β(G):=minx∈{0,±1}V∖{0}∑i∈Vdeg(i)⋅∣xi∣∑e=(i,j)∈Ew(e)⋅∣xi+xj∣
Questo rapporto caratterizza quanto il grafo si discosta da un grafo bipartito: β(G)=0 se e solo se G è bipartito.
Significato Teorico: Il rapporto di bipartitezza è un concetto centrale nella disuguaglianza di Cheeger duale, strettamente correlato all'autovalore massimo λn della matrice laplaciana normalizzata:
22−λn≤β(G)≤2(2−λn)
Valore Applicativo:
Progettazione di algoritmi spettrali: Trevisan ha utilizzato questa disuguaglianza per progettare algoritmi puramente spettrali per il taglio massimo
Analisi di reti: applicazioni nel clustering di grafi con segni, rilevamento di comunità e altri campi XOG20; AL20; NP22
Ottimizzazione combinatoria: stretta relazione con problemi classici come il taglio massimo e il taglio minimo non tagliato
Mancanza di Algoritmi di Approssimazione: Sebbene la disuguaglianza di Cheeger e il taglio più sparso abbiano algoritmi di approssimazione consolidati (come l'approssimazione O(logn)), il rapporto di bipartitezza non aveva alcun algoritmo di approssimazione in tempo polinomiale in precedenza
Insufficienza dei Metodi Spettrali: I metodi spettrali esistenti (basati su autovettori) forniscono solo limiti teorici e non possono risolvere direttamente il problema di ottimizzazione
Differenza dal Taglio Più Sparso: Sebbene il rapporto di bipartitezza sia formalmente simile al taglio più sparso, i suoi vincoli (struttura di tripartizione) rendono difficile l'applicazione diretta delle tecniche esistenti
Colmare il vuoto negli algoritmi di approssimazione per il rapporto di bipartitezza, fornendo nuovi strumenti algoritmici per la teoria spettrale dei grafi e l'ottimizzazione combinatoria.
Primo Algoritmo di Approssimazione: Propone il primo algoritmo di approssimazione O(logn) per il rapporto di bipartitezza b, con complessità temporale O~(min{b(V),n2}+m)
Innovazioni Teoriche:
Introduce il concetto di buona connettività (well-linkedness) per grafi parzialmente simmetrici
Dimostra una caratterizzazione equivalente del rapporto di bipartitezza rispetto alla buona connettività del grafo ausiliario G′ (Teorema 3.5)
Estende il framework del gioco taglio-matching dal taglio più sparso al rapporto di bipartitezza
Applicazione al Taglio Minimo Non Tagliato: Progetta un algoritmo di tempo O~(mn) che, per grafi con rapporto di taglio minimo non tagliato η, trova un taglio con rapporto di taglio non tagliato O(lognlog(1/η))⋅η
Estensione Orientata:
Definisce il rapporto di bipartitezza orientato e la sua caratterizzazione tramite funzioni submodulari
Realizza un'approssimazione O(logn) tramite embedding ℓ1 orientato
Fornisce un algoritmo per il taglio minimo non tagliato orientato
Rapporto di bipartitezza b: Dato un grafo non orientato G=(V,E,w) e pesi positivi sui vertici b:V→Z++, si definisce:
βb(G):=minx∈{0,±1}V∖{0}βb(x),βb(x):=∑i∈Vb(i)⋅∣xi∣∑(i,j)∈Ew(i,j)⋅∣xi+xj∣
Input: Grafo G, pesi degli archi w, pesi dei vertici b, parametro r>0 Output: Vettore x∈{0,±1}V tale che βb(x)≤O(logn)⋅βb(G)
Definizione (Coppie di sorgente-pozzo simmetriche): (A,B) è detta simmetrica se esistono L,R⊆V disgiunti tali che:
A=L+∪R−,B=L−∪R+
Definizione 3.3 (Buona Connettività): Una coppia simmetrica (A,B) è detta r-ben connessa se nella rete ausiliaria NA,B,r esiste un flusso saturo da s+ a s−, dove:
Capacità degli archi: da s+ a ogni vertice u in A la capacità è b(u); analogamente da B a s−
Capacità degli archi in E′ è w(e)/r
G′ è detto r-ben connesso se tutte le coppie simmetriche sono r-ben connesse.
Teorema 3.5 (Caratterizzazione Principale): βb(G)≥rse e solo seG′ è r-ben connesso.
Schema di Prova:
(⇒) Se βb(G)≥r, allora per ogni coppia simmetrica (A,B), il valore del taglio minimo s+-s− è ≥b(A), e per il teorema del flusso massimo-taglio minimo esiste un flusso saturo
(⇐) Se esiste una coppia simmetrica (A,B) non r-ben connessa, allora il taglio minimo corrispondente a un insieme coerente S soddisfa w(E′(S,Sˉ))/b(S)<r
Sfruttamento della Simmetria Parziale: Tramite la struttura parzialmente simmetrica del grafo ausiliario G′, il problema della tripartizione viene trasformato in un problema di flusso con coppie di sorgente-pozzo simmetriche, che è la ricostruzione chiave del problema
Lemma del Taglio Coerente (Lemma 3.4): Utilizzando la simmetria parziale e il Lemma 2.5, si dimostra che è sempre possibile trovare un taglio minimo coerente, semplificando l'analisi
Tecnica di Proiezione Gaussiana:
Proietta la decomposizione di Gram ad alta dimensione in una dimensione, preservando l'approssimazione di ∥vi+vj∥ (equazione 3.6)
Il Lemma 3.8 utilizza il limite di Laurent-Massart per garantire che ∑b(i)∣v~i∣2≥1/2 con probabilità costante
Decomposizione di Gram Veloce (Lemma 3.11): Tramite riduzione di Johnson-Lindenstrauss e espansione di Taylor troncata, riduce la decomposizione esatta da O(n3) a O~(min{b(V),n2})
Risolve un problema aperto di lunga data (nessun algoritmo di approssimazione dal 2012)
Primo stabilimento della caratterizzazione equivalente tra rapporto di bipartitezza e buona connettività (Teorema 3.5)
Unificazione elegante di casi non orientati e orientati
Innovazione Tecnica:
Sfruttamento della Simmetria Parziale: La costruzione del grafo ausiliario trasforma elegantemente il problema della tripartizione in un problema di flusso simmetrico
Analisi MMWU: Applicazione creativa del framework di AK16 al nuovo problema, tecnica di proiezione gaussiana che gestisce la decomposizione di Gram
Implementazione Veloce: Il Lemma 3.11 sulla decomposizione di Gram approssimata evita il collo di bottiglia O(n3)
Efficienza Algoritmica:
Complessità temporale O~(m) quasi ottimale (richiede lettura del grafo)
Richiede solo flusso a singola merce, può sfruttare algoritmi recenti quasi-lineari CKLP+22
Miglioramento di ordini di grandezza rispetto ai metodi SDP (O~(mω))
Completezza Teorica:
Analisi probabilistica rigorosa (Lemma 3.8 utilizza limite di Laurent-Massart)
Decomposizione dettagliata della complessità temporale
Estensione a grafi orientati dimostra generalità del framework
Tre12 L. Trevisan. "Max cut and the smallest eigenvalue". SIAM J. Comput. 41.6 (2012): Definisce il rapporto di bipartitezza, dimostra la disuguaglianza di Cheeger duale
KRV06 R. Khandekar, S. Rao, U. Vazirani. "Graph partitioning using single commodity flows". STOC 2006: Propone il gioco taglio-matching
AK16 S. Arora, S. Kale. "A combinatorial, primal-dual approach to semidefinite programs". J. ACM 63.2 (2016): Framework MMWU, base tecnica principale di questo articolo
ACMM05 A. Agarwal et al. "O(logn) approximation algorithms for min uncut...". STOC 2005: Metodo SDP per il taglio minimo non tagliato, principale confronto di questo articolo
CKLP+22 L. Chen et al. "Maximum flow and minimum-cost flow in almost-linear time". FOCS 2022: Flusso massimo in tempo quasi-lineare, rende efficiente l'algoritmo di questo articolo
Valutazione Complessiva: Questo è un articolo di algoritmi teorici di alta qualità che risolve un problema aperto di lunga data, con innovazioni tecniche significative (caratterizzazione di grafi parzialmente simmetrici, estensione di MMWU) e realizzazione di complessità temporale quasi-lineare. Le principali insufficienze sono il rapporto di approssimazione non ottimale e la mancanza di verifica sperimentale. Fornisce contributi importanti alla comunità di informatica teorica e potrebbe aprire ricerca sulla praticità del rapporto di bipartitezza. Consigliato per la pubblicazione in conferenze di alto livello (livello FOCS/SODA).