2025-11-12T01:55:30.485107

A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems

Zhou, Luo, Wang et al.

A graph with $n$ vertices is an $f(\cdot)$-dense graph if it has at least $f(n)$ edges, $f(\cdot)$ being a well-defined function. The notion $f(\cdot)$-dense graph encompasses various clique models like $Î³$-quasi cliques, $k$-defective cliques, and dense cliques, arising in cohesive subgraph extraction applications. However, the $f(\cdot)$-dense graph may be disconnected or weakly connected. To conquer this, we study the problem of finding the largest $f(\cdot)$-dense subgraph with a diameter of at most two in the paper. Specifically, we present a decomposition-based branch-and-bound algorithm to optimally solve this problem. The key feature of the algorithm is a decomposition framework that breaks the graph into $n$ smaller subgraphs, allowing independent searches in each subgraph. We also introduce decomposition strategies including degeneracy and two-hop degeneracy orderings, alongside a branch-and-bound algorithm with a novel sorting-based upper bound to solve each subproblem. Worst-case complexity for each component is provided. Empirical results on 139 real-world graphs under two $f(\cdot)$ functions show our algorithm outperforms the MIP solver and pure branch-and-bound, solving nearly twice as many instances optimally within one hour.

academic

Ein Branch-and-Bound-Ansatz für Probleme mit maximalen dichtem Subgraph mit niedrigem Durchmesser

Grundinformationen

Paper-ID: 2511.03157
Titel: A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Autoren: Yi Zhou (University of Electronic Science and Technology of China), Chunyu Luo (University of Electronic Science and Technology of China), Zhengren Wang (Peking University), Zhang-Hua Fu (Shenzhen Institute of Artificial Intelligence and Robotics for Society, CUHK Shenzhen)
Klassifizierung: cs.DS (Datenstrukturen und Algorithmen)
Veröffentlichungsdatum: 6. November 2025 (arXiv v2)
Paper-Link: https://arxiv.org/abs/2511.03157v2

Zusammenfassung

Dieses Paper untersucht das Problem der maximalen f(·)-dichten Subgraphen mit niedrigem Durchmesser (MfDS). Ein f(·)-dichter Graph ist ein Graph mit n Knoten und mindestens f(n) Kanten, wobei f(·) eine wohldefinierte Funktion ist. Dieses Konzept umfasst mehrere Relaxationen von Cliquen wie γ-Quasi-Cliquen, k-defekte Cliquen und dichte Cliquen. Allerdings können f(·)-dichte Graphen unzusammenhängend oder schwach zusammenhängend sein. Um dieses Problem zu lösen, untersucht das Paper die Suche nach maximalen f(·)-dichten Subgraphen mit Durchmesser nicht größer als 2. Konkret wird ein auf Zerlegung basierender Branch-and-Bound-Algorithmus zur optimalen Lösung des Problems vorgeschlagen. Ein Schlüsselmerkmal des Algorithmus ist die Zerlegung des Graphen in n kleinere Subgraphen, die eine unabhängige Suche in jedem Subgraph ermöglichen. Das Paper führt auch Degeneracy-Ordnung und Two-Hop-Degeneracy-Ordnung als Zerlegungsstrategien sowie einen Branch-and-Bound-Algorithmus mit neuartigen Ordnungsschranken ein. Experimentelle Ergebnisse auf 139 realen Graphen zeigen, dass der Algorithmus MIP-Solver und reine Branch-and-Bound-Methoden übertrifft und innerhalb einer Stunde fast doppelt so viele Instanzen optimal löst.

Forschungshintergrund und Motivation

1. Zu lösende Probleme

Die Identifikation dicht verbundener Subgraphen (cohesive subgraph) ist eine Kernaufgabe in der Netzwerkanalyse mit Anwendungen in Gemeinschaftserkennung, Proteinkomplementerkennung, Finanzierungsnetzwerkanalyse und anderen Bereichen. Das klassische Clique-Modell erfordert Kanten zwischen allen Knotenpaaren, aber diese Anforderung ist zu streng, besonders in praktischen Anwendungen mit Rauschen und Fehlern. Daher entstanden mehrere Relaxationen von Clique-Modellen, wie:

γ-Quasi-Cliquen: Ein induzierter Subgraph mit n Knoten hat mindestens γ(n choose 2) Kanten
s-defekte Cliquen: Mindestens (n choose 2) - s Kanten
Durchschnittliche s-plex: Mindestens n(n-s)/2 Kanten

Diese Modelle können einheitlich als f(·)-dichte Graphen dargestellt werden: Ein Graph mit n Knoten hat mindestens f(n) Kanten.

2. Bedeutung des Problems

Bestehende f(·)-Dichte-Graphen-Modelle haben einen schwerwiegenden Mangel: Sie können unzusammenhängend oder schwach zusammenhängend sein. Das Paper zeigt dies durch zwei Beispiele in Abbildung 1:

G1: Eine Clique mit 200 Knoten plus ein Pfad mit 10 Knoten, wobei der Weg von v1 zu v210 10 Sprünge benötigt
G2: Eine Clique mit 200 Knoten plus 10 isolierte Knoten, wobei kein Pfad zwischen v1 und v210 existiert

Beide Graphen erfüllen die Dichte-Anforderung f(n)=0.9(n choose 2), sind aber offensichtlich keine dicht verbundenen Gemeinschaften.

3. Einschränkungen bestehender Methoden

MIP-Methoden: Obwohl gemischte ganzzahlige Programmiermodelle für spezifische f(·)-Funktionen existieren (wie GF3), sind sie für große Graphen ineffizient und es gibt keine MIP-Modelle für Durchmesser-Beschränkungen
Branch-and-Bound-Methoden: Es gibt Algorithmen für spezifische Probleme (wie maximale s-defekte Cliquen, maximale γ-Quasi-Cliquen), aber es fehlt ein universelles Lösungsgerüst für f(·)-dichte Graphen
Zusammenhangsbeschränkungen: Santos et al. (2024) schlugen auf Spannbäumen basierende Zusammenhangsbeschränkungen vor, aber Durchmesser-Beschränkungen garantieren bessere Dichte-Verbundenheit

4. Forschungsmotivation

Dieses Paper führt das Konzept niedriger Durchmesser f(·)-dichter Graphen ein: Es wird verlangt, dass der Graph zusammenhängend ist, mindestens f(n) Kanten hat und einen Durchmesser nicht größer als 2 hat. Die Durchmesser-2-Beschränkung (genannt 2-club) stellt sicher, dass der kürzeste Pfad zwischen beliebigen zwei Knoten nicht größer als 2 ist, was starke Zusammenhangsfähigkeit garantiert. Das Paper zielt darauf ab, effiziente exakte Algorithmen zur Lösung dieses NP-schweren Problems zu entwerfen.

Kernbeiträge

Problemformalisierung:
- Erste systematische Definition von f(·)-dichten Graphen und deren Vererbungseigenschaften (hereditary property)
- Formalisierung des Problems der maximalen f(·)-dichten Subgraphen mit niedrigem Durchmesser (MfDS)
- Bereitstellung eines MIP-fD-Modells für gemischte ganzzahlige lineare Programmierung
Algorithmen-Framework:
- Vorschlag eines auf Graphzerlegung basierenden Vorverarbeitungs-Frameworks, das den Eingabegraph in n kleinere Subgraphen zerlegt
- Einführung von zwei Zerlegungsstrategien: Degeneracy-Ordnung (degeneracy ordering) und Two-Hop-Degeneracy-Ordnung (two-hop degeneracy ordering)
- Entwurf eines Branch-and-Bound-Algorithmus mit neuartigen Ordnungsschranken
- Bereitstellung von Worst-Case-Komplexitätsanalysen für Komponenten und den Gesamtalgorithmus
Experimentelle Validierung:
- Test auf 139 realen Graphen mit zwei f(·)-Funktionen (γ-Quasi-Cliquen und s-defekte Cliquen)
- Nachweis, dass das Zerlegungs-Framework die Leistung erheblich verbessert, wobei innerhalb einer Stunde doppelt so viele Instanzen gelöst werden wie mit reinem Branch-and-Bound
- Demonstration, dass die Ordnungsschranken-Methode die Suchbaumgröße drastisch reduziert

Methodische Details

Aufgabendefinition

Eingabe:

Ungerichteter einfacher Graph G=(V,E)
Dichtefunktion f: ℤ≥0 → ℝ, erfüllt f(i) ≤ (i choose 2)
Berechnungs-Oracle für f(·) (konstante Zeit)

Ausgabe: Maximale Knotenmenge S⊆V, so dass:

|E(S)| ≥ f(|S|) (f(·)-Dichte)
diam(GS) ≤ 2 (Niedrig-Durchmesser-Beschränkung)

Ziel: ωf(G) = max{|S| : S⊆V, |E(S)|≥f(|S|), diam(GS)≤2}

Komplexität: NP-schwer, W1-schwer, schwer zu approximieren in Polynomialzeit (da maximale Clique ein Spezialfall ist)

Kern-Algorithmen-Framework

1. Gesamtes Zerlegungs-Framework (Algorithmus 1)

Schlüssel-Lemma (Lemma 3): Gegeben eine beliebige Knotenordnung π=⟨v1,...,vn⟩ des Graphen G, definieren Sie für jeden Knoten vi:

Vi = {vi} ∪ {N^(2)_G(vi) ∩ {vi+1,...,vn}}
Gi = GVi

Wenn S_i der maximale f(·)-dichte Subgraph mit niedrigem Durchmesser in Gi ist, der vi enthält, dann: **ωf(G) = max(|S_1|,...,|S*_n|)**

Algorithmus-Ablauf:

1. Heuristische Algorithmen verwenden, um Anfangslösung S zu erhalten (Untergrenze)
2. Ordnungsalgorithmus verwenden, um Knotenreihenfolge π zu bestimmen
3. Für jeden vi in π:
   - Subgraph Gi = G[Vi] konstruieren
   - ExactSearch(Gi, f(·), {vi}, N^(2)_G(vi), lb) verwenden zur Lösung
4. Maximale Lösung aller Teilprobleme zurückgeben

Zeitkomplexität: O(Theur(G) + Torder(G) + poly(αG)2^αG)

αG = max(|V1|,...,|Vn|): Maximale Subgraph-Größe
Schlüssel ist die Minimierung von αG zur Kontrolle des exponentiellen Teils

2. Effiziente Heuristische Algorithmen (Algorithmus 2)

Basierend auf Degeneracy-Ordnung (degeneracy ordering):

Definition: Eine k-Degeneracy-Ordnung ist eine Knotenordnung ⟨v1,...,vn⟩, so dass jeder vi im induzierten Subgraph {vi,...,vn} einen Grad ≤ k hat
Berechnung: Peel-Algorithmus verwenden, O(|V|+|E|) Zeit, wiederholt Knoten mit minimalem Grad löschen
Degeneracy-Grad dG: Minimaler k-Wert

Heuristische Ablauf:

1. Degeneracy-Ordnung ⟨v1,...,vn⟩ berechnen
2. Für jeden vi:
   - Si ← {vi} ∪ {NG(vi) ∩ {vi+1,...,vn}}
   - Gi ← G[Si] (Durchmesser ≤ 2)
   - Während |Ei| < f(|Si|):
       Knoten mit minimalem Grad in Gi löschen
   - Optimale Lösung S* aktualisieren
3. S* zurückgeben

Zeitkomplexität: O(|E| + |V|d²G)

In praktischen Graphen dG << |V| (z.B. ca-dblp-2010: dG=74, |V|=226413)

3. Knotenordnungs-Strategien

Plan 1: Degeneracy-Ordnung

Vorteil: O(|V|+|E|) Zeit
Schranke: αG ≤ min(dG·ΔG, |V|)
Beweis: |Vi| = 1 + |NG(vi)∩{vi+1,...,vn}| + |N^(2)_G(vi)\NG(vi)∩{vi+1,...,vn}| ≤ 1 + dG + dG·ΔG

Plan 2: Two-Hop-Degeneracy-Ordnung (Algorithmus 3)

Definition: Eine k-Two-Hop-Degeneracy-Ordnung ist eine Knotenordnung, so dass jeder vi in {vi,...,vn} höchstens k Two-Hop-Nachbarn hat
Berechnung: Ähnlich wie Peel, wiederholt Knoten mit minimalem |N^(2)_G(v)| löschen
Zeitkomplexität: O(|V||E|·min(tdG, ΔG))
Schranke: αG ≤ tdG
Vorteil: tdG ist normalerweise viel kleiner als dG·ΔG (z.B. ca-dblp-2010: tdG=238 vs dG·ΔG=17612)

Branch-and-Bound-Algorithmus (Algorithmus 4)

Kernstruktur

BranchBound(G, S, C, lb):
  Eingabe: Graph G, aktuelle Lösung S, Kandidatenmenge C, Untergrenze lb
  
  1. Wenn G[S] eine zulässige Lösung ist und |S|>lb: lb und optimale Lösung aktualisieren
  
  2. Wenn f(·) erblich ist und |E(S)|<f(|S|): Pruning zurückgeben
  
  3. UB ← SortBound(G, f(·), S, C)  // Obergrenze berechnen
  
  4. Wenn UB ≤ lb: Pruning zurückgeben
  
  5. Wenn f(·) erblich ist: Reduktionsregeln anwenden (Lemma 5)
  
  6. Zufällig u∈C wählen
  
  7. Wenn die Bedingungen von Lemma 4 erfüllt sind: Nur S∪{u}-Zweig rekursiv durchsuchen
     Sonst: Beide Zweige S∪{u} und S rekursiv durchsuchen

Reduktionsregeln (Lemma 4 & 5)

Lemma 4 (Universelle Reduktion): Wenn u∈C erfüllt:

|NG(u)| = |V|-1, oder
|NG(u)| = |V|-2 und GS∪{u} ist zulässig

Dann existiert eine optimale Lösung, die u enthält → Nur den u enthaltenden Zweig durchsuchen

Lemma 5 (Erbliche Funktions-Reduktion): Wenn f(·) erblich ist:

Wenn |E(S)| < f(|S|), dann existiert keine zulässige Lösung, die S enthält
Wenn v∈C so dass |E(S∪{v})| < f(|S|+1), dann existiert keine zulässige Lösung, die v enthält

Ordnungsschranken-Algorithmus (Algorithmus 5)

Einfache Schranke (Abschnitt 4.6.1)

Für v∈C definieren Sie wS(v) = |S\N(v)| (Anzahl der Knoten in S, die nicht v sind)

Ordnen Sie C nach wS(v) nicht absteigend, um ⟨v1,...,v|C|⟩ zu erhalten
Finden Sie das maximale k so dass wS(Sk) + |E(S)| ≤ gf(|S|+k), wobei gf(n)=(n choose 2)-f(n)
Geben Sie |S|+k zurück

Korrektheit (Lemma 6): wS(S') + |E(S)| unterschätzt |E(S∪S')|

Verbesserte Ordnungsschranke (SortBound)

Kernidee:

Einfache Schranke ignoriert Kanten zwischen S und C
Einfache Schranke berücksichtigt nicht die Two-Hop-Beschränkung

Algorithmus-Ablauf:

1. Verwenden Sie einen gierigen Algorithmus, um C in χ unabhängige Mengen Π1,...,Πχ zu partitionieren
   (Minimieren Sie χ ≈ Graphfärbungsproblem, verwenden Sie O(|C|³) gierig)

2. Für jedes Πi:
   a. Ordnen Sie Πi nach wS(v)
   b. Partitionieren Sie Πi weiter in mehrere Rσ, so dass beliebige zwei Knoten in Rσ Abstand > 2 haben
   c. Wählen Sie aus jedem Rσ den Knoten mit minimalem wS(·) und fügen Sie ihn zu C' hinzu
   d. Berechnen Sie w'S(uj) = wS(uj) + j - 1

3. Ordnen Sie C' nach w'S(·), finden Sie das maximale k so dass |E(S)| + w'S(Sk) ≤ gf(|S|+k)

4. Geben Sie |S|+k zurück

Zeitkomplexität: O(|C|³ + |S||C|)

Korrektheit (Theorem 3):

Jede unabhängige Menge Πi kann höchstens s'i Knoten beitragen
Jedes Rσ kann aufgrund der Two-Hop-Beschränkung höchstens 1 Knoten beitragen
|E(S*)| ≥ |E(S)| + Σw'S(v^(ij)m) ≥ |E(S)| + Σ^{|S'|} w'S(vj)

Vorteil:

Berücksichtigt die unabhängige Mengen-Struktur (reduziert Kantenüberschätzung)
Berücksichtigt die Two-Hop-Beschränkung (höchstens 1 Knoten pro Rσ)
Schneller als LP-Relaxation, Schranken sind vergleichbar

Experimentelle Einrichtung

Datensätze

Quelle: Network Data Repository
Größe: 139 reale ungerichtete Graphen
Bereich: Bis zu 5,87×10⁷ Knoten, 1,06×10⁸ Kanten
Bereiche: Soziale Netzwerke, biologische Netzwerke, Kooperationsnetzwerke, Straßennetzwerke usw.

f(·)-Funktions-Konfiguration

γ-Quasi-Cliquen: f(i) = γ(i choose 2), γ ∈ {0.99, 0.95, 0.90, 0.85}
- Nicht-erbliche Funktion
s-defekte Cliquen: f(i) = (i choose 2) - s, s ∈ {1, 3}
- Erbliche Funktion

Vergleichende Algorithmen

Deg-BnB: Degeneracy-Ordnung + Branch-and-Bound
TwoDeg-BnB: Two-Hop-Degeneracy-Ordnung + Branch-and-Bound
BnB: Reiner Branch-and-Bound (ohne Zerlegung)
MIP: Gurobi-Solver + MIP-fD-Modell
Deg-MIP: Degeneracy-Ordnung-Zerlegung + MIP-Lösung von Teilproblemen
TwoDeg-MIP: Two-Hop-Degeneracy-Ordnung-Zerlegung + MIP-Lösung von Teilproblemen

Experimentelle Umgebung

CPU: Intel Xeon Platinum 8360Y @ 2.40GHz
System: Ubuntu 22.04
Kompilierung: g++ 9.3.0 mit -Ofast
Zeitlimit: 3600 Sekunden (1 Stunde)
Code: https://github.com/cy-Luo000/MDSL

Bewertungskriterien

Anzahl der in verschiedenen Zeitsegmenten gelösten Instanzen
Laufzeit für spezifische Graphen
Schranken-Straffheit (Abweichung von der optimalen Lösung)
Suchbaum-Knotenzahl

Experimentelle Ergebnisse

Hauptergebnisse

1. Gesamtleistung (Abbildung 4 & 5)

γ-Quasi-Cliquen (γ=0.99, 0.95):

TwoDeg-BnB und Deg-BnB übertreffen alle anderen Algorithmen in allen Zeitsegmenten
Innerhalb einer Stunde löst TwoDeg-BnB etwa 100 Instanzen, BnB nur 50
MIP kann praktisch keine Instanzen lösen

γ-Quasi-Cliquen (γ=0.90, 0.85):

Nach 1000 Sekunden sind TwoDeg-MIP und Deg-MIP vergleichbar mit Branch-and-Bound-Methoden
Das Zerlegungs-Framework verbessert die MIP-Leistung erheblich

s-defekte Cliquen (s=1, 3):

TwoDeg-BnB und Deg-BnB lösen etwa 110 Instanzen
Reiner BnB etwa 60 Instanzen
Erbliche Eigenschaften geben Branch-and-Bound-Methoden Vorteile

Schlüsselfund: Das Zerlegungs-Framework verdoppelt die Anzahl der gelösten Instanzen

2. Detaillierte Ergebnisse für große Graphen (Tabelle 1 & 2)

Bemerkenswerte Fälle (γ=0.99):

web-uk-2005 (129.632 Knoten): TwoDeg-BnB 634 Sekunden, MIP Timeout
inf-road-usa (23.947.347 Knoten): TwoDeg-BnB 70 Sekunden, andere Methoden Timeout
scc_infect-dublin: Deg-BnB 0,54 Sekunden, TwoDeg-BnB Timeout (Ordnungswahl beeinflusst)

Beschleunigungseffekt:

TwoDeg-BnB ist 2-3 Größenordnungen schneller als BnB (z.B. web-indochina-2004: 0,25 Sekunden vs Timeout)
39 Instanzen werden von TwoDeg-BnB oder Deg-BnB gelöst, aber nicht von BnB
Zerlegung + MIP ist manchmal besser als reine kombinatorische Algorithmen (z.B. web-sk-2005)

s-defekte Cliquen (Tabelle 2):

Erbliche Eigenschaften führen zu mehr Pruning
scc_infect-dublin (s=1): TwoDeg-BnB 0,83 Sekunden vs Deg-MIP Timeout
rec-amazon: TwoDeg-BnB 0,08 Sekunden vs BnB 264 Sekunden

Ablationsstudien

Analyse der Schranken-Effektivität (Tabelle 3 & 4)

Schranken-Straffheits-Vergleich:

LP-Relaxation > SortBound > Einfache Schranke

Spezifische Fälle (γ=0.95):

ca-CondMat:
- Optimal: 28
- LP: 29, Einfach: 280, SortBound: 142
- SortBound erreicht Gleichgewicht zwischen Straffheit und Skalierbarkeit
inf-roadNet-CA:
- Optimal: 4
- LP: Nicht berechenbar, Einfach: 13, SortBound: 5
- LP schlägt bei großen Graphen fehl

Suchbaum-Größen-Auswirkung:

inf-roadNet-CA (γ=0.95):
- TwoDeg-BnB: 5 Sekunden, 10 Knoten
- TwoDeg-BnB/ub (ohne SortBound): 10 Sekunden, 14.138.820 Knoten
- Suchbaum-Reduktion um 6 Größenordnungen
ca-MathSciNet (s=3):
- TwoDeg-BnB: 7,62 Sekunden, 80 Knoten
- TwoDeg-BnB/ub: 1228 Sekunden, 256.325.020 Knoten
- 100-fache Beschleunigung

Schlüsselfund: SortBound behält Straffheit bei und ist auf Millionen-Knoten-Graphen skalierbar

αG und Laufzeit-Beziehung (Abbildung 6 & 7)

Beobachtungen:

Fast die Hälfte der Instanzen hat αG ≤ 1000 (viel kleiner als |V|)
Laufzeit korreliert positiv mit αG
Two-Hop-Degeneracy-Ordnung erzeugt normalerweise kleinere αG

Typische Fälle:

ca-dblp-2010: |V|=226.413, dG=74, tdG=238, dG·ΔG=17.612
- Two-Hop-Degeneracy-Ordnung zeigt klare Vorteile

Validierung: Unterstützt das Designprinzip der Minimierung von αG

Fallstudien

Beispiel für Graphzerlegungseffekt

Mit web-indochina-2004 als Beispiel (|V|=11.358, |E|=47.606):

Degeneracy-Grad: dG=49
Two-Hop-Degeneracy-Grad: tdG=199
Nach Zerlegung: αG=199 (Two-Hop-Ordnung) vs αG≈2450 (Degeneracy-Ordnung)
Leistung: TwoDeg-BnB 0,25 Sekunden vs Deg-BnB 0,18 Sekunden vs BnB 12,10 Sekunden

Beispiel für Ordnungsschranken-Algorithmus (Abbildung 2 & 3)

Eingabe: 10 Knoten, S={v1,v2}, C={v3,...,v10}

Schritte:

Partitionierung in unabhängige Mengen: Π1={v3,v5,v7,v9}, Π2={v4,v6,v8,v10}
Berechnung von wS: wS(v3)=0, wS(v5)=1, wS(v7)=2...
Weitere Partitionierung nach Abstand: R¹₁={v3,v7}, R²₁={v5,v9}, R¹₂={v8,v4}, R²₂={v10,v6}
Auswahl von minimalem wS: C'={v3,v5,v8,v10}
Berechnung von w'S: w'S(v3)=0, w'S(v8)=0, w'S(v5)=2, w'S(v10)=2

Ergebnis:

f(i)=0.8(i choose 2): Obergrenze=4
f(i)=(i choose 2)-4: Obergrenze=5

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

Theoretische Beiträge:
- Systematisiertes theoretisches Gerüst für f(·)-dichte Graphen
- Beweis notwendiger und hinreichender Bedingungen für Vererbungseigenschaften
- Korrektheit und Komplexitätsanalyse des Zerlegungs-Frameworks
Algorithmen-Beiträge:
- Zerlegungs-Framework zerlegt das Problem in n unabhängige Teilprobleme
- Two-Hop-Degeneracy-Ordnung kontrolliert effektiv die Subgraph-Größe
- Ordnungsschranken erreichen Gleichgewicht zwischen Straffheit und Effizienz
Experimentelle Validierung:
- Verdopplung der Anzahl gelöster Instanzen auf 139 realen Graphen
- Skalierbar auf Graphen mit zehn Millionen Knoten
- Ordnungsschranken reduzieren Suchbaum um 6 Größenordnungen

Einschränkungen

Algorithmen-Einschränkungen:
- Immer noch exponentieller Zeit-Algorithmus (O(2^αG))
- Für dichte Graphen könnte αG nahe |V| sein
- Schwierig, im Voraus zwischen zwei Ordnungsstrategien zu wählen
Modell-Einschränkungen:
- Durchmesser=2-Beschränkung könnte zu streng sein
- Knoten- oder Kantengewichte nicht berücksichtigt
- f(·) muss spezifische Bedingungen erfüllen, um Vererbungseigenschaften zu haben
Experimentelle Einschränkungen:
- Nur zwei f(·)-Funktionen getestet
- Nicht alle verwandten Arbeiten direkt verglichen
- Tests auf Graphen mit Milliarden Knoten fehlen

Zukünftige Richtungen

Algorithmen-Erweiterung:
- Parallelisierung des Zerlegungs-Frameworks (Teilprobleme sind unabhängig parallelisierbar)
- Erweiterung auf andere Durchmesser-Beschränkungen (k-club, k≥3)
- Kombination mit anderen Struktur-Beschränkungen (Knoten-Konnektivität)
Theoretische Vertiefung:
- Vererbungsanalyse für mehr f(·)-Funktionen
- Parametrisierte Komplexitätsforschung
- Approximations-Algorithmen-Design
Anwendungs-Erweiterung:
- Inkrementelle Algorithmen auf dynamischen Graphen
- Erweiterung auf gewichtete Graphen
- Domänen-spezifische Modelle (z.B. biologische Netzwerke)

Tiefenanalyse

Stärken

Theoretische Strenge:
- Vollständige mathematische Beweise (Anhang A)
- Klare Komplexitätsanalyse
- Notwendige und hinreichende Bedingungen für Vererbungseigenschaften (Lemma 1 & 2)
Algorithmen-Innovativität:
- Zerlegungs-Framework: Lemma 3 zerlegt geschickt globale Probleme in lokale Probleme
- Two-Hop-Degeneracy-Ordnung: Innovative Ordnungsstrategie für Durchmesser-Beschränkungen
- Ordnungsschranken: Mehrstufige verschachtelte Partitionierung (unabhängige Mengen + Distanz-Beschränkung) mit ausgefeiltem Design
Experimentelle Vollständigkeit:
- 139 reale Graphen, 6 Algorithmen, 2 f(·)-Funktionsklassen
- Detaillierte Ablationsstudien (Tabelle 3 & 4)
- Visualisierte Analysen (Abbildung 6 & 7)
- Open-Source-Code garantiert Reproduzierbarkeit
Praktischer Wert:
- Skalierbar auf Graphen mit zehn Millionen Knoten
- Mehrere Größenordnungen schneller als MIP
- Universelles Framework anwendbar auf mehrere Clique-Relaxations-Modelle
Schreib-Klarheit:
- Klare Motivation in der Einleitung (Abbildung 1 intuitiv)
- Detaillierte Algorithmen-Pseudocodes
- Vollständige Theorem-Beweise

Mängel

Ordnungs-Strategie-Auswahl:
- Fehlende theoretische Anleitung, wann Degeneracy vs Two-Hop-Degeneracy verwendet wird
- Tabelle 1 zeigt manchmal ist Deg-BnB schneller (z.B. scc_infect-dublin)
- Empfehlung: Adaptive Strategie oder Auswahlheuristik entwickeln
Ordnungsschranken-Algorithmus-Komplexität:
- O(|C|³) könnte zum Engpass werden
- Gierige Färbung ist nicht optimal
- Verbesserungsrichtung: Schnellere Färbungs-Algorithmen oder Relaxation der Optimalität
Experimentelle Vergleiche:
- Nicht mit Santos et al. 2024 Spannbaum-Methode verglichen
- Vergleich mit spezialisierten Algorithmen für spezifische Probleme fehlt (z.B. Chang 2023 k-defective-Clique-Algorithmus)
- MIP-Modell könnte Verbesserungspotential haben (z.B. gültige Ungleichungen hinzufügen)
Skalierbarkeits-Analyse:
- Unzureichende Diskussion für Fälle mit αG>10.000
- Leistung auf dichten Graphen nicht ausreichend getestet
- Speicherverbrauch-Analyse fehlt
Theoretische Lücken:
- Keine Approximations-Verhältnis-Analyse
- Parametrisierte Komplexität (z.B. mit αG als Parameter) nicht diskutiert
- Durchschnittliche Fallkomplexität nicht analysiert

Auswirkungen

Akademischer Beitrag:
- Einheitliches theoretisches Framework für mehrere Clique-Relaxations-Modelle
- Zerlegungs-Techniken übertragbar auf andere Subgraph-Extraktions-Probleme
- Hoher Zitationswert (kombiniert NP-schwere Probleme, Graphzerlegung, Branch-and-Bound)
Praktischer Wert:
- Direkte Anwendung in Gemeinschaftserkennung, Bioinformatik usw.
- Open-Source-Code fördert Technologie-Transfer
- Kann als Baseline für andere Algorithmen dienen
Reproduzierbarkeit:
- Detaillierte Algorithmen-Beschreibung
- Open-Source-Code (https://github.com/cy-Luo000/MDSL)
- Öffentliche Datensätze (Network Data Repository)
- Klare experimentelle Einrichtung
Einschränkungen:
- Industrielle Anwendung erfordert weitere Optimierung (z.B. Parallelisierung)
- Spezialisierte Algorithmen für spezifische f(·) könnten besser sein
- Validierung durch Domänen-Experten erforderlich

Anwendbare Szenarien

Empfohlene Szenarien:

Soziale Netzwerk-Analyse: Suche nach dicht verbundenen Gemeinschaften (Durchmesser ≤ 2 garantiert schnelle Kommunikation)
Biologische Netzwerke: Proteinkomplementerkennung (erlaubt wenige fehlende Kanten)
Kooperationsnetzwerke: Kern-Forschungsteam-Identifikation
Mittlere Graphen: |V|<10⁶, αG<5000 zeigen optimale Leistung

Nicht empfohlene Szenarien:

Sehr große dichte Graphen: αG nahe |V| führt zu exponentiellem Anstieg
Echtzeit-Anwendungen: Worst-Case benötigt immer noch exponentielle Zeit
Näherungslösung ausreichend: Exakte Algorithmen sind zu teuer

Verbesserungsempfehlungen:

Kombination mit Heuristiken für schnelle Näherungslösungen
Parallelisierung für sehr große Graphen
Spezialisierte Algorithmen für spezifische f(·)

Literaturverzeichnis

Kernverwandte Arbeiten

Veremyev et al. (2016): "Exact MIP-based approaches for finding maximum quasi-cliques and dense subgraphs" - Schlägt GF3 MIP-Modell vor
Luo et al. (2024): "A faster branching algorithm for the maximum k-defective clique problem" - ECAI 2024, O(nc·1.2ⁿ) Algorithmus
Chang (2023): "Efficient maximum k-defective clique computation with improved time complexity" - PACMMOD, verbesserter Branch-and-Bound
Santos et al. (2024): "Ensuring connectedness for the maximum quasi-clique and densest k-subgraph problems" - Spannbaum-Zusammenhangsbeschränkung
Wünsche (2021): "Mind the gap when searching for relaxed cliques" - Erste Einführung von Two-Hop-Degeneracy-Ordnung

Theoretische Grundlagen

Matula & Beck (1983): "Smallest-last ordering and clustering and graph coloring algorithms" - Klassische Arbeit zu Degeneracy-Ordnung
Asahiro et al. (2002): "Complexity of finding dense subgraphs" - Komplexitätsergebnisse für f(·)-dichte Graphen
Downey & Fellows (2012): "Parameterized complexity" - W1-Hardness-Theorie

Gesamtbewertung: Dies ist ein theoretisch strenger, algorithmisch innovativer und experimentell umfassender ausgezeichneter Artikel. Das Zerlegungs-Framework und die Ordnungsschranken-Methode haben hohe Universalität und praktischen Wert. Der Hauptbeitrag liegt in der Vereinheitlichung mehrerer Clique-Relaxations-Modelle und der Bereitstellung effizienter Lösungsalgorithmen. Empfehlung zur Annahme mit wichtigen Beiträgen zu Graph-Algorithmen und Netzwerk-Analyse.