A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Zhou, Luo, Wang et al.
A graph with $n$ vertices is an $f(\cdot)$-dense graph if it has at least $f(n)$ edges, $f(\cdot)$ being a well-defined function. The notion $f(\cdot)$-dense graph encompasses various clique models like $γ$-quasi cliques, $k$-defective cliques, and dense cliques, arising in cohesive subgraph extraction applications. However, the $f(\cdot)$-dense graph may be disconnected or weakly connected. To conquer this, we study the problem of finding the largest $f(\cdot)$-dense subgraph with a diameter of at most two in the paper. Specifically, we present a decomposition-based branch-and-bound algorithm to optimally solve this problem. The key feature of the algorithm is a decomposition framework that breaks the graph into $n$ smaller subgraphs, allowing independent searches in each subgraph. We also introduce decomposition strategies including degeneracy and two-hop degeneracy orderings, alongside a branch-and-bound algorithm with a novel sorting-based upper bound to solve each subproblem. Worst-case complexity for each component is provided. Empirical results on 139 real-world graphs under two $f(\cdot)$ functions show our algorithm outperforms the MIP solver and pure branch-and-bound, solving nearly twice as many instances optimally within one hour.
academic
Ein Branch-and-Bound-Ansatz für Probleme mit maximalen dichtem Subgraph mit niedrigem Durchmesser
Titel: A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Autoren: Yi Zhou (University of Electronic Science and Technology of China), Chunyu Luo (University of Electronic Science and Technology of China), Zhengren Wang (Peking University), Zhang-Hua Fu (Shenzhen Institute of Artificial Intelligence and Robotics for Society, CUHK Shenzhen)
Klassifizierung: cs.DS (Datenstrukturen und Algorithmen)
Veröffentlichungsdatum: 6. November 2025 (arXiv v2)
Dieses Paper untersucht das Problem der maximalen f(·)-dichten Subgraphen mit niedrigem Durchmesser (MfDS). Ein f(·)-dichter Graph ist ein Graph mit n Knoten und mindestens f(n) Kanten, wobei f(·) eine wohldefinierte Funktion ist. Dieses Konzept umfasst mehrere Relaxationen von Cliquen wie γ-Quasi-Cliquen, k-defekte Cliquen und dichte Cliquen. Allerdings können f(·)-dichte Graphen unzusammenhängend oder schwach zusammenhängend sein. Um dieses Problem zu lösen, untersucht das Paper die Suche nach maximalen f(·)-dichten Subgraphen mit Durchmesser nicht größer als 2. Konkret wird ein auf Zerlegung basierender Branch-and-Bound-Algorithmus zur optimalen Lösung des Problems vorgeschlagen. Ein Schlüsselmerkmal des Algorithmus ist die Zerlegung des Graphen in n kleinere Subgraphen, die eine unabhängige Suche in jedem Subgraph ermöglichen. Das Paper führt auch Degeneracy-Ordnung und Two-Hop-Degeneracy-Ordnung als Zerlegungsstrategien sowie einen Branch-and-Bound-Algorithmus mit neuartigen Ordnungsschranken ein. Experimentelle Ergebnisse auf 139 realen Graphen zeigen, dass der Algorithmus MIP-Solver und reine Branch-and-Bound-Methoden übertrifft und innerhalb einer Stunde fast doppelt so viele Instanzen optimal löst.
Die Identifikation dicht verbundener Subgraphen (cohesive subgraph) ist eine Kernaufgabe in der Netzwerkanalyse mit Anwendungen in Gemeinschaftserkennung, Proteinkomplementerkennung, Finanzierungsnetzwerkanalyse und anderen Bereichen. Das klassische Clique-Modell erfordert Kanten zwischen allen Knotenpaaren, aber diese Anforderung ist zu streng, besonders in praktischen Anwendungen mit Rauschen und Fehlern. Daher entstanden mehrere Relaxationen von Clique-Modellen, wie:
γ-Quasi-Cliquen: Ein induzierter Subgraph mit n Knoten hat mindestens γ(n choose 2) Kanten
s-defekte Cliquen: Mindestens (n choose 2) - s Kanten
Bestehende f(·)-Dichte-Graphen-Modelle haben einen schwerwiegenden Mangel: Sie können unzusammenhängend oder schwach zusammenhängend sein. Das Paper zeigt dies durch zwei Beispiele in Abbildung 1:
G1: Eine Clique mit 200 Knoten plus ein Pfad mit 10 Knoten, wobei der Weg von v1 zu v210 10 Sprünge benötigt
G2: Eine Clique mit 200 Knoten plus 10 isolierte Knoten, wobei kein Pfad zwischen v1 und v210 existiert
Beide Graphen erfüllen die Dichte-Anforderung f(n)=0.9(n choose 2), sind aber offensichtlich keine dicht verbundenen Gemeinschaften.
MIP-Methoden: Obwohl gemischte ganzzahlige Programmiermodelle für spezifische f(·)-Funktionen existieren (wie GF3), sind sie für große Graphen ineffizient und es gibt keine MIP-Modelle für Durchmesser-Beschränkungen
Branch-and-Bound-Methoden: Es gibt Algorithmen für spezifische Probleme (wie maximale s-defekte Cliquen, maximale γ-Quasi-Cliquen), aber es fehlt ein universelles Lösungsgerüst für f(·)-dichte Graphen
Zusammenhangsbeschränkungen: Santos et al. (2024) schlugen auf Spannbäumen basierende Zusammenhangsbeschränkungen vor, aber Durchmesser-Beschränkungen garantieren bessere Dichte-Verbundenheit
Dieses Paper führt das Konzept niedriger Durchmesser f(·)-dichter Graphen ein: Es wird verlangt, dass der Graph zusammenhängend ist, mindestens f(n) Kanten hat und einen Durchmesser nicht größer als 2 hat. Die Durchmesser-2-Beschränkung (genannt 2-club) stellt sicher, dass der kürzeste Pfad zwischen beliebigen zwei Knoten nicht größer als 2 ist, was starke Zusammenhangsfähigkeit garantiert. Das Paper zielt darauf ab, effiziente exakte Algorithmen zur Lösung dieses NP-schweren Problems zu entwerfen.
Erste systematische Definition von f(·)-dichten Graphen und deren Vererbungseigenschaften (hereditary property)
Formalisierung des Problems der maximalen f(·)-dichten Subgraphen mit niedrigem Durchmesser (MfDS)
Bereitstellung eines MIP-fD-Modells für gemischte ganzzahlige lineare Programmierung
Algorithmen-Framework:
Vorschlag eines auf Graphzerlegung basierenden Vorverarbeitungs-Frameworks, das den Eingabegraph in n kleinere Subgraphen zerlegt
Einführung von zwei Zerlegungsstrategien: Degeneracy-Ordnung (degeneracy ordering) und Two-Hop-Degeneracy-Ordnung (two-hop degeneracy ordering)
Entwurf eines Branch-and-Bound-Algorithmus mit neuartigen Ordnungsschranken
Bereitstellung von Worst-Case-Komplexitätsanalysen für Komponenten und den Gesamtalgorithmus
Experimentelle Validierung:
Test auf 139 realen Graphen mit zwei f(·)-Funktionen (γ-Quasi-Cliquen und s-defekte Cliquen)
Nachweis, dass das Zerlegungs-Framework die Leistung erheblich verbessert, wobei innerhalb einer Stunde doppelt so viele Instanzen gelöst werden wie mit reinem Branch-and-Bound
Demonstration, dass die Ordnungsschranken-Methode die Suchbaumgröße drastisch reduziert
Schlüssel-Lemma (Lemma 3): Gegeben eine beliebige Knotenordnung π=⟨v1,...,vn⟩ des Graphen G, definieren Sie für jeden Knoten vi:
Vi = {vi} ∪ {N^(2)_G(vi) ∩ {vi+1,...,vn}}
Gi = GVi
Wenn S_i der maximale f(·)-dichte Subgraph mit niedrigem Durchmesser in Gi ist, der vi enthält, dann:
**ωf(G) = max(|S_1|,...,|S*_n|)**
Algorithmus-Ablauf:
1. Heuristische Algorithmen verwenden, um Anfangslösung S zu erhalten (Untergrenze)
2. Ordnungsalgorithmus verwenden, um Knotenreihenfolge π zu bestimmen
3. Für jeden vi in π:
- Subgraph Gi = G[Vi] konstruieren
- ExactSearch(Gi, f(·), {vi}, N^(2)_G(vi), lb) verwenden zur Lösung
4. Maximale Lösung aller Teilprobleme zurückgeben
Basierend auf Degeneracy-Ordnung (degeneracy ordering):
Definition: Eine k-Degeneracy-Ordnung ist eine Knotenordnung ⟨v1,...,vn⟩, so dass jeder vi im induzierten Subgraph {vi,...,vn} einen Grad ≤ k hat
Berechnung: Peel-Algorithmus verwenden, O(|V|+|E|) Zeit, wiederholt Knoten mit minimalem Grad löschen
Degeneracy-Grad dG: Minimaler k-Wert
Heuristische Ablauf:
1. Degeneracy-Ordnung ⟨v1,...,vn⟩ berechnen
2. Für jeden vi:
- Si ← {vi} ∪ {NG(vi) ∩ {vi+1,...,vn}}
- Gi ← G[Si] (Durchmesser ≤ 2)
- Während |Ei| < f(|Si|):
Knoten mit minimalem Grad in Gi löschen
- Optimale Lösung S* aktualisieren
3. S* zurückgeben
Zeitkomplexität: O(|E| + |V|d²G)
In praktischen Graphen dG << |V| (z.B. ca-dblp-2010: dG=74, |V|=226413)
BranchBound(G, S, C, lb):
Eingabe: Graph G, aktuelle Lösung S, Kandidatenmenge C, Untergrenze lb
1. Wenn G[S] eine zulässige Lösung ist und |S|>lb: lb und optimale Lösung aktualisieren
2. Wenn f(·) erblich ist und |E(S)|<f(|S|): Pruning zurückgeben
3. UB ← SortBound(G, f(·), S, C) // Obergrenze berechnen
4. Wenn UB ≤ lb: Pruning zurückgeben
5. Wenn f(·) erblich ist: Reduktionsregeln anwenden (Lemma 5)
6. Zufällig u∈C wählen
7. Wenn die Bedingungen von Lemma 4 erfüllt sind: Nur S∪{u}-Zweig rekursiv durchsuchen
Sonst: Beide Zweige S∪{u} und S rekursiv durchsuchen
Einfache Schranke ignoriert Kanten zwischen S und C
Einfache Schranke berücksichtigt nicht die Two-Hop-Beschränkung
Algorithmus-Ablauf:
1. Verwenden Sie einen gierigen Algorithmus, um C in χ unabhängige Mengen Π1,...,Πχ zu partitionieren
(Minimieren Sie χ ≈ Graphfärbungsproblem, verwenden Sie O(|C|³) gierig)
2. Für jedes Πi:
a. Ordnen Sie Πi nach wS(v)
b. Partitionieren Sie Πi weiter in mehrere Rσ, so dass beliebige zwei Knoten in Rσ Abstand > 2 haben
c. Wählen Sie aus jedem Rσ den Knoten mit minimalem wS(·) und fügen Sie ihn zu C' hinzu
d. Berechnen Sie w'S(uj) = wS(uj) + j - 1
3. Ordnen Sie C' nach w'S(·), finden Sie das maximale k so dass |E(S)| + w'S(Sk) ≤ gf(|S|+k)
4. Geben Sie |S|+k zurück
Zeitkomplexität: O(|C|³ + |S||C|)
Korrektheit (Theorem 3):
Jede unabhängige Menge Πi kann höchstens s'i Knoten beitragen
Jedes Rσ kann aufgrund der Two-Hop-Beschränkung höchstens 1 Knoten beitragen
Gesamtbewertung: Dies ist ein theoretisch strenger, algorithmisch innovativer und experimentell umfassender ausgezeichneter Artikel. Das Zerlegungs-Framework und die Ordnungsschranken-Methode haben hohe Universalität und praktischen Wert. Der Hauptbeitrag liegt in der Vereinheitlichung mehrerer Clique-Relaxations-Modelle und der Bereitstellung effizienter Lösungsalgorithmen. Empfehlung zur Annahme mit wichtigen Beiträgen zu Graph-Algorithmen und Netzwerk-Analyse.