2025-11-12T01:55:30.485107

A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems

Zhou, Luo, Wang et al.

A graph with $n$ vertices is an $f(\cdot)$-dense graph if it has at least $f(n)$ edges, $f(\cdot)$ being a well-defined function. The notion $f(\cdot)$-dense graph encompasses various clique models like $Î³$-quasi cliques, $k$-defective cliques, and dense cliques, arising in cohesive subgraph extraction applications. However, the $f(\cdot)$-dense graph may be disconnected or weakly connected. To conquer this, we study the problem of finding the largest $f(\cdot)$-dense subgraph with a diameter of at most two in the paper. Specifically, we present a decomposition-based branch-and-bound algorithm to optimally solve this problem. The key feature of the algorithm is a decomposition framework that breaks the graph into $n$ smaller subgraphs, allowing independent searches in each subgraph. We also introduce decomposition strategies including degeneracy and two-hop degeneracy orderings, alongside a branch-and-bound algorithm with a novel sorting-based upper bound to solve each subproblem. Worst-case complexity for each component is provided. Empirical results on 139 real-world graphs under two $f(\cdot)$ functions show our algorithm outperforms the MIP solver and pure branch-and-bound, solving nearly twice as many instances optimally within one hour.

academic

Un Approccio Branch-and-Bound per Problemi di Sottografi Densi a Basso Diametro Massimale

Informazioni Fondamentali

ID Articolo: 2511.03157
Titolo: A Branch-and-Bound Approach for Maximum Low-Diameter Dense Subgraph Problems
Autori: Yi Zhou (University of Electronic Science and Technology of China), Chunyu Luo (University of Electronic Science and Technology of China), Zhengren Wang (Peking University), Zhang-Hua Fu (Shenzhen Institute of Artificial Intelligence and Robotics for Society, CUHK Shenzhen)
Classificazione: cs.DS (Strutture Dati e Algoritmi)
Data di Pubblicazione: 6 novembre 2025 (arXiv v2)
Link Articolo: https://arxiv.org/abs/2511.03157v2

Riassunto

Questo articolo affronta il problema del massimo sottografo f(·)-denso a basso diametro (MfDS). Un grafo f(·)-denso è un grafo con n vertici e almeno f(n) archi, dove f(·) è una funzione ben definita. Questo concetto comprende vari modelli di rilassamento della clique come quasi-clique γ, clique difettose k e clique dense. Tuttavia, i grafi f(·)-densi potrebbero non essere connessi o debolmente connessi. Per affrontare questo problema, l'articolo studia la ricerca del massimo sottografo f(·)-denso con diametro non superiore a 2. Nello specifico, viene proposto un algoritmo branch-and-bound basato sulla decomposizione per risolvere il problema in modo ottimale. La caratteristica chiave dell'algoritmo è la decomposizione del grafo in n sottografi più piccoli, consentendo la ricerca indipendente in ciascun sottografo. L'articolo introduce inoltre strategie di decomposizione come l'ordinamento per degenerazione e l'ordinamento per degenerazione a due salti, insieme a un algoritmo branch-and-bound con nuovi limiti superiori ordinati. I risultati sperimentali su 139 grafi reali dimostrano che l'algoritmo supera i risolutori MIP e i metodi branch-and-bound puri, risolvendo in modo ottimale quasi il doppio delle istanze entro un'ora.

Contesto di Ricerca e Motivazione

1. Problema da Risolvere

Nell'analisi delle reti, l'identificazione di sottografi strettamente connessi (cohesive subgraph) è un compito centrale, con applicazioni nella scoperta di comunità, identificazione di complessi proteici, analisi di reti finanziarie e altri campi. Il modello classico di clique richiede archi tra tutte le coppie di vertici, ma questo requisito è troppo rigoroso, specialmente nelle applicazioni pratiche con rumore e errori. Di conseguenza, sono emersi vari modelli di rilassamento della clique, come:

Quasi-clique γ: sottografo indotto di n vertici con almeno γ(n choose 2) archi
Clique difettosa s: con almeno (n choose 2) - s archi
s-plex medio: con almeno n(n-s)/2 archi

Questi modelli possono essere unificati come grafi f(·)-densi: un grafo con n vertici ha almeno f(n) archi.

2. Importanza del Problema

I modelli di grafo f(·)-denso esistenti presentano un difetto grave: potrebbero non essere connessi o avere connettività debole. L'articolo illustra questo attraverso due esempi nella Figura 1:

G1: una clique di 200 vertici più un percorso di 10 vertici, dove da v1 a v210 sono necessari 10 salti
G2: una clique di 200 vertici più 10 vertici isolati, dove non esiste percorso tra v1 e v210

Entrambi i grafi soddisfano il requisito di densità f(n)=0.9(n choose 2), ma chiaramente non rappresentano comunità strettamente connesse.

3. Limitazioni dei Metodi Esistenti

Metodo MIP: sebbene esistano modelli di programmazione lineare intera per funzioni f(·) specifiche (come GF3), sono inefficienti per grafi di grandi dimensioni e mancano modelli MIP per vincoli di basso diametro
Metodo Branch-and-Bound: esistono algoritmi per problemi specifici (come massima clique difettosa, massima quasi-clique γ), ma manca un framework generale per risolvere grafi f(·)-densi
Vincoli di Connettività: Santos et al. (2024) propongono vincoli di connettività basati su alberi di copertura, ma i vincoli di diametro garantiscono meglio la connettività stretta

4. Motivazione della Ricerca

Questo articolo introduce il concetto di grafo f(·)-denso a basso diametro: richiede che il grafo sia connesso, abbia almeno f(n) archi e diametro non superiore a 2. Il vincolo di diametro 2 (denominato 2-club) assicura che il percorso più breve tra due vertici qualsiasi non superi 2, garantendo forte connettività. L'articolo mira a progettare algoritmi esatti efficienti per risolvere questo problema NP-hard.

Contributi Principali

Formalizzazione del Problema:
- Prima definizione sistematica di grafi f(·)-densi e loro proprietà ereditarie
- Formalizzazione del problema del massimo sottografo f(·)-denso a basso diametro (MfDS)
- Fornitura di modello di programmazione lineare intera MIP-fD
Framework Algoritmico:
- Proposta di framework di preprocessing basato sulla decomposizione del grafo che decompone il grafo di input in n sottografi più piccoli
- Introduzione di due strategie di decomposizione: ordinamento per degenerazione e ordinamento per degenerazione a due salti
- Progettazione di algoritmo branch-and-bound con nuovi limiti superiori ordinati
- Fornitura di analisi della complessità nel caso peggiore per componenti e algoritmo complessivo
Verifica Sperimentale:
- Test su 139 grafi reali con due funzioni f(·) (quasi-clique γ e clique difettosa s)
- Dimostrazione che il framework di decomposizione migliora significativamente le prestazioni, risolvendo il doppio delle istanze rispetto al branch-and-bound puro in un'ora
- Dimostrazione che il metodo dei limiti superiori ordinati riduce significativamente la dimensione dell'albero di ricerca

Spiegazione Dettagliata del Metodo

Definizione del Compito

Input:

Grafo semplice non orientato G=(V,E)
Funzione di densità f: ℤ≥0 → ℝ, soddisfacente f(i) ≤ (i choose 2)
Oracle di calcolo per f(·) (tempo costante)

Output: Massimo insieme di vertici S⊆V tale che:

|E(S)| ≥ f(|S|) (proprietà f(·)-denso)
diam(GS) ≤ 2 (vincolo di basso diametro)

Obiettivo: ωf(G) = max{|S| : S⊆V, |E(S)|≥f(|S|), diam(GS)≤2}

Complessità: NP-hard, W1-hard, difficile da approssimare in tempo polinomiale (poiché la massima clique è un caso speciale)

Framework Algoritmico Principale

1. Framework di Decomposizione Complessivo (Algoritmo 1)

Lemma Chiave (Lemma 3): Dato un ordinamento arbitrario di vertici π=⟨v1,...,vn⟩ del grafo G, per ogni vertice vi, definiamo:

Vi = {vi} ∪ {N^(2)_G(vi) ∩ {vi+1,...,vn}}
Gi = GVi

Se S_i è il massimo sottografo f(·)-denso a basso diametro in Gi contenente vi, allora: **ωf(G) = max(|S_1|,...,|S*_n|)**

Flusso dell'Algoritmo:

1. Ottenere soluzione iniziale S con algoritmo euristico (limite inferiore)
2. Determinare ordine dei vertici π con algoritmo di ordinamento
3. Per ogni vi in π:
   - Costruire sottografo Gi = G[Vi]
   - Risolvere con ExactSearch(Gi, f(·), {vi}, N^(2)_G(vi), lb)
4. Restituire massima soluzione tra tutti i sottoproblemi

Complessità Temporale: O(Theur(G) + Torder(G) + poly(αG)2^αG)

αG = max(|V1|,...,|Vn|): dimensione massima del sottografo
La chiave è minimizzare αG per controllare la parte esponenziale

2. Algoritmo Euristico Efficiente (Algoritmo 2)

Basato su ordinamento per degenerazione:

Definizione: un ordinamento k-degenere è un ordinamento di vertici ⟨v1,...,vn⟩ dove ogni vi ha grado ≤ k nel sottografo indotto {vi,...,vn}
Calcolo: algoritmo peel, tempo O(|V|+|E|), eliminazione ripetuta del vertice di grado minimo
Grado di degenerazione dG: valore minimo di k

Flusso Euristico:

1. Calcolare ordinamento per degenerazione ⟨v1,...,vn⟩
2. Per ogni vi:
   - Si ← {vi} ∪ {NG(vi) ∩ {vi+1,...,vn}}
   - Gi ← G[Si] (diametro ≤ 2)
   - While |Ei| < f(|Si|):
       Eliminare vertice di grado minimo in Gi
   - Aggiornare soluzione ottimale S*
3. Restituire S*

Complessità Temporale: O(|E| + |V|d²G)

Nei grafi reali dG << |V| (es. ca-dblp-2010: dG=74, |V|=226413)

3. Strategie di Ordinamento dei Vertici

Opzione 1: Ordinamento per Degenerazione

Vantaggio: tempo O(|V|+|E|)
Limite: αG ≤ min(dG·ΔG, |V|)
Dimostrazione: |Vi| = 1 + |NG(vi)∩{vi+1,...,vn}| + |N^(2)_G(vi)\NG(vi)∩{vi+1,...,vn}| ≤ 1 + dG + dG·ΔG

Opzione 2: Ordinamento per Degenerazione a Due Salti (Algoritmo 3)

Definizione: un ordinamento k-degenere a due salti dove ogni vi ha al massimo k vicini a due salti in {vi,...,vn}
Calcolo: simile a peel, eliminazione ripetuta del vertice con minimo |N^(2)_G(v)|
Complessità Temporale: O(|V||E|·min(tdG, ΔG))
Limite: αG ≤ tdG
Vantaggio: tdG è solitamente molto minore di dG·ΔG (es. ca-dblp-2010: tdG=238 vs dG·ΔG=17612)

Algoritmo Branch-and-Bound (Algoritmo 4)

Struttura Principale

BranchBound(G, S, C, lb):
  Input: grafo G, soluzione corrente S, insieme candidato C, limite inferiore lb
  
  1. Se G[S] è soluzione fattibile e |S|>lb: aggiornare lb e soluzione ottimale
  
  2. Se f(·) è ereditaria e |E(S)|<f(|S|): potatura e ritorno
  
  3. UB ← SortBound(G, f(·), S, C)  // calcolare limite superiore
  
  4. Se UB ≤ lb: potatura e ritorno
  
  5. Se f(·) è ereditaria: applicare regole di riduzione (Lemma 5)
  
  6. Selezionare casualmente u∈C
  
  7. Se soddisfa condizioni di Lemma 4: ricorsione solo su ramo S∪{u}
     Altrimenti: ricorsione su entrambi rami S∪{u} e S

Regole di Riduzione (Lemma 4 & 5)

Lemma 4 (Riduzione Universale): Se u∈C soddisfa:

|NG(u)| = |V|-1, oppure
|NG(u)| = |V|-2 e GS∪{u} è fattibile

Allora esiste soluzione ottimale contenente u → ricerca solo ramo contenente u

Lemma 5 (Riduzione per Funzioni Ereditarie): Se f(·) è ereditaria:

Se |E(S)| < f(|S|), allora nessuna soluzione fattibile contiene S
Se v∈C tale che |E(S∪{v})| < f(|S|+1), allora nessuna soluzione fattibile contiene v

Algoritmo di Limite Superiore Ordinato (Algoritmo 5)

Limite Superiore Semplice (Sezione 4.6.1)

Per v∈C, definiamo wS(v) = |S\N(v)| (numero di vertici in S non adiacenti a v)

Ordinare C in ordine non decrescente di wS(v) ottenendo ⟨v1,...,v|C|⟩
Trovare massimo k tale che wS(Sk) + |E(S)| ≤ gf(|S|+k), dove gf(n)=(n choose 2)-f(n)
Restituire |S|+k

Correttezza (Lemma 6): wS(S') + |E(S)| sottostima |E(S∪S')|

Limite Superiore Ordinato Migliorato (SortBound)

Idea Principale:

Il limite semplice ignora gli archi tra S e C
Il limite semplice non considera il vincolo a due salti

Flusso dell'Algoritmo:

1. Partizionare C in χ insiemi indipendenti Π1,...,Πχ con algoritmo greedy
   (minimizzare χ ≈ problema di colorazione grafo, greedy O(|C|³))

2. Per ogni Πi:
   a. Ordinare Πi per wS(v)
   b. Partizionare ulteriormente Πi in Rσ, dove vertici in Rσ hanno distanza >2
   c. Da ogni Rσ selezionare vertice con wS(·) minimo aggiungere a C'
   d. Calcolare w'S(uj) = wS(uj) + j - 1

3. Ordinare C' per w'S(·), trovare massimo k tale che |E(S)| + w'S(Sk) ≤ gf(|S|+k)

4. Restituire |S|+k

Complessità Temporale: O(|C|³ + |S||C|)

Correttezza (Teorema 3):

Ogni insieme indipendente Πi può contribuire al massimo s'i vertici
Ogni Rσ può contribuire al massimo 1 vertice per il vincolo a due salti
|E(S*)| ≥ |E(S)| + Σw'S(v^(ij)m) ≥ |E(S)| + Σ^{|S'|} w'S(vj)

Vantaggi:

Considera la struttura di insieme indipendente (riduce sovrastima degli archi)
Considera il vincolo a due salti (al massimo 1 vertice per Rσ)
Più veloce del rilassamento LP, limiti comparabili

Configurazione Sperimentale

Dataset

Fonte: Network Data Repository
Scala: 139 grafi non orientati reali
Intervallo: fino a 5.87×10⁷ vertici, 1.06×10⁸ archi
Domini: reti sociali, reti biologiche, reti di collaborazione, reti stradali, ecc.

Configurazione Funzione f(·)

Quasi-clique γ: f(i) = γ(i choose 2), γ ∈ {0.99, 0.95, 0.90, 0.85}
- Funzione non ereditaria
Clique difettosa s: f(i) = (i choose 2) - s, s ∈ {1, 3}
- Funzione ereditaria

Algoritmi di Confronto

Deg-BnB: ordinamento per degenerazione + branch-and-bound
TwoDeg-BnB: ordinamento per degenerazione a due salti + branch-and-bound
BnB: branch-and-bound puro (senza decomposizione)
MIP: risolutore Gurobi + modello MIP-fD
Deg-MIP: decomposizione per degenerazione + risoluzione MIP sottoproblemi
TwoDeg-MIP: decomposizione per degenerazione a due salti + risoluzione MIP sottoproblemi

Ambiente Sperimentale

CPU: Intel Xeon Platinum 8360Y @ 2.40GHz
Sistema: Ubuntu 22.04
Compilazione: g++ 9.3.0 con -Ofast
Limite Temporale: 3600 secondi (1 ora)
Codice: https://github.com/cy-Luo000/MDSL

Metriche di Valutazione

Numero di istanze risolte in diversi intervalli temporali
Tempo di esecuzione per grafi specifici
Stretta dei limiti superiori (differenza dalla soluzione ottimale)
Numero di nodi nell'albero di ricerca

Risultati Sperimentali

Risultati Principali

1. Prestazioni Complessive (Figure 4 & 5)

Quasi-clique γ (γ=0.99, 0.95):

TwoDeg-BnB e Deg-BnB superano completamente altri algoritmi in tutti gli intervalli temporali
In 1 ora, TwoDeg-BnB risolve circa 100 istanze, BnB solo 50
MIP praticamente non risolve alcuna istanza

Quasi-clique γ (γ=0.90, 0.85):

Dopo 1000 secondi, TwoDeg-MIP e Deg-MIP hanno prestazioni comparabili ai metodi branch-and-bound
Il framework di decomposizione migliora significativamente le prestazioni MIP

Clique difettosa s (s=1, 3):

TwoDeg-BnB e Deg-BnB risolvono circa 110 istanze
BnB puro circa 60 istanze
La proprietà ereditaria fornisce maggiori vantaggi ai metodi branch-and-bound

Scoperta Chiave: Il framework di decomposizione raddoppia il numero di istanze risolte

2. Risultati Dettagliati su Grafi di Grandi Dimensioni (Tabelle 1 & 2)

Casi Significativi (γ=0.99):

web-uk-2005 (129,632 vertici): TwoDeg-BnB 634 secondi, MIP timeout
inf-road-usa (23,947,347 vertici): TwoDeg-BnB 70 secondi, altri metodi timeout
scc_infect-dublin: Deg-BnB 0.54 secondi, TwoDeg-BnB timeout (scelta ordinamento influenza)

Effetto di Accelerazione:

TwoDeg-BnB è 2-3 ordini di grandezza più veloce di BnB (es. web-indochina-2004: 0.25 secondi vs timeout)
39 istanze risolte da TwoDeg-BnB o Deg-BnB ma non da BnB
Decomposizione+MIP talvolta superiore a algoritmi combinatori puri (es. web-sk-2005)

Clique Difettosa (Tabella 2):

La proprietà ereditaria fornisce più potature
scc_infect-dublin (s=1): TwoDeg-BnB 0.83 secondi vs Deg-MIP timeout
rec-amazon: TwoDeg-BnB 0.08 secondi vs BnB 264 secondi

Esperimenti di Ablazione

Analisi Efficacia Limite Superiore (Tabelle 3 & 4)

Confronto Stretta Limite:

Rilassamento LP > SortBound > Limite Semplice

Casi Specifici (γ=0.95):

ca-CondMat:
- Ottimale: 28
- LP: 29, Semplice: 280, SortBound: 142
- SortBound raggiunge equilibrio tra stretta e scalabilità
inf-roadNet-CA:
- Ottimale: 4
- LP: non calcolabile, Semplice: 13, SortBound: 5
- LP fallisce su grafi grandi

Impatto Dimensione Albero di Ricerca:

inf-roadNet-CA (γ=0.95):
- TwoDeg-BnB: 5 secondi, 10 nodi
- TwoDeg-BnB/ub (senza SortBound): 10 secondi, 14,138,820 nodi
- Riduzione albero di ricerca 6 ordini di grandezza
ca-MathSciNet (s=3):
- TwoDeg-BnB: 7.62 secondi, 80 nodi
- TwoDeg-BnB/ub: 1228 secondi, 256,325,020 nodi
- Accelerazione 100 volte

Scoperta Chiave: SortBound mantiene stretta limite mentre scala a grafi con milioni di vertici

Relazione tra αG e Tempo di Esecuzione (Figure 6 & 7)

Osservazioni:

Circa metà delle istanze hanno αG ≤ 1000 (molto minore di |V|)
Tempo di esecuzione correlato positivamente con αG
Ordinamento per degenerazione a due salti solitamente produce αG più piccolo

Casi Tipici:

ca-dblp-2010: |V|=226,413, dG=74, tdG=238, dG·ΔG=17,612
- Vantaggio evidente ordinamento degenerazione a due salti

Verifica: Supporta il principio di progettazione di minimizzare αG

Analisi di Casi

Esempio Effetto Decomposizione Grafo

Per web-indochina-2004 (|V|=11,358, |E|=47,606):

Grado di Degenerazione: dG=49
Grado Degenerazione Due Salti: tdG=199
Dopo Decomposizione: αG=199 (ordinamento due salti) vs αG≈2450 (ordinamento degenerazione)
Prestazioni: TwoDeg-BnB 0.25 secondi vs Deg-BnB 0.18 secondi vs BnB 12.10 secondi

Esempio Algoritmo Limite Superiore (Figure 2 & 3)

Input: 10 vertici, S={v1,v2}, C={v3,...,v10}

Passaggi:

Partizionare in insiemi indipendenti: Π1={v3,v5,v7,v9}, Π2={v4,v6,v8,v10}
Calcolare wS: wS(v3)=0, wS(v5)=1, wS(v7)=2...
Partizionare ulteriormente per distanza: R¹₁={v3,v7}, R²₁={v5,v9}, R¹₂={v8,v4}, R²₂={v10,v6}
Selezionare minimo wS: C'={v3,v5,v8,v10}
Calcolare w'S: w'S(v3)=0, w'S(v8)=0, w'S(v5)=2, w'S(v10)=2

Risultato:

f(i)=0.8(i choose 2): limite superiore=4
f(i)=(i choose 2)-4: limite superiore=5

Lavori Correlati

1. Modelli di Rilassamento della Clique

Quasi-clique γ (Abello et al. 2002): NP-hard per γ∈(0,1]
- Metodo MIP (Pattillo et al. 2013a)
- Branch-and-bound (Mahdavi Pajouh et al. 2014, Ribeiro & Riveaux 2019)
Clique difettosa s (Yu et al. 2006): NP-hard per s≥1
- Vincolo basso diametro (Luo et al. 2024): O(nc·1.2ⁿ)
- Branch-and-bound (Chen et al. 2021b, Gao et al. 2022, Chang 2023)
s-plex medio (Veremyev et al. 2016)

2. Grafi f(·)-Densi Generici

Veremyev et al. 2016:
- Propone più modelli MIP (GF3 ottimale)
- Non considera vincoli di basso diametro
Risultati di Complessità (Asahiro et al. 2002):
- NP-hard quando f(n)=Θ(n^(1+ε)) o f(n)=n+Ω(n^ε)
- Polinomiale quando f(n)=n+c

3. Problema 2-club

Definizione: sottografo con diametro ≤ 2
Metodo MIP (Pajouh et al. 2016, Lu et al. 2022)
Branch-and-bound (Hartung et al. 2012, Komusiewicz et al. 2019)
Contributo Articolo: Prima combinazione di 2-club con vincolo f(·)-denso

4. Vincoli di Connettività

Santos et al. 2024: quasi-clique γ connessa basata su albero di copertura
Vantaggio Articolo: vincolo di diametro più forte della semplice connettività

5. Tecniche di Decomposizione Grafo

Ordinamento per Degenerazione (Matula & Beck 1983): O(|V|+|E|)
Degenerazione Due Salti (Wünsche 2021): primo uso per k-plex e k-club
Innovazione Articolo: applicazione sistematica a grafi f(·)-densi generici

Conclusioni e Discussione

Conclusioni Principali

Contributi Teorici:
- Framework teorico sistematizzato per grafi f(·)-densi
- Dimostrazione di condizioni necessarie e sufficienti per proprietà ereditaria
- Analisi di correttezza e complessità del framework di decomposizione
Contributi Algoritmici:
- Framework di decomposizione che divide il problema in n sottoproblemi indipendenti
- Ordinamento per degenerazione a due salti che controlla efficacemente la dimensione dei sottografi
- Limite superiore ordinato che raggiunge equilibrio tra stretta e efficienza
Verifica Sperimentale:
- Raddoppia il numero di istanze risolte su 139 grafi reali
- Scalabile a grafi con decine di milioni di vertici
- Limite superiore ordinato riduce albero di ricerca di 6 ordini di grandezza

Limitazioni

Limitazioni Algoritmiche:
- Ancora algoritmo tempo esponenziale (O(2^αG))
- Per grafi densi αG potrebbe avvicinarsi a |V|
- Difficile predire a priori quale strategia di ordinamento sia migliore
Limitazioni Modello:
- Vincolo diametro=2 potrebbe essere troppo rigoroso
- Non considera pesi su vertici o archi
- f(·) deve soddisfare condizioni specifiche per proprietà ereditaria
Limitazioni Sperimentali:
- Test solo su due funzioni f(·)
- Mancano confronti diretti con tutti i lavori correlati
- Mancano test su grafi ultra-grandi (miliardi di vertici)

Direzioni Future

Estensioni Algoritmiche:
- Parallelizzazione del framework di decomposizione (sottografi indipendenti parallelizzabili)
- Estensione ad altri vincoli di diametro (k-club, k≥3)
- Combinazione con altri vincoli strutturali (connettività di vertici)
Approfondimento Teorico:
- Analisi proprietà ereditaria per più funzioni f(·)
- Ricerca di complessità parametrizzata
- Progettazione di algoritmi di approssimazione
Estensioni Applicative:
- Algoritmi incrementali per grafi dinamici
- Estensione a grafi pesati
- Modelli specifici per domini (es. reti biologiche)

Valutazione Approfondita

Punti di Forza

Rigore Teorico:
- Dimostrazioni matematiche complete (Appendice A)
- Analisi di complessità chiara
- Condizioni necessarie e sufficienti per proprietà ereditaria (Lemma 1 & 2)
Innovazione Algoritmica:
- Framework di Decomposizione: Lemma 3 decompone ingegnosamente il problema globale in problemi locali
- Ordinamento Degenerazione Due Salti: strategia di ordinamento innovativa per vincoli di diametro
- Limite Superiore Ordinato: progettazione sofisticata con partizionamento annidato (insiemi indipendenti + vincoli di distanza)
Completezza Sperimentale:
- 139 grafi reali, 6 algoritmi, 2 classi di funzioni f(·)
- Esperimenti di ablazione dettagliati (Tabelle 3 & 4)
- Analisi visuale (Figure 6 & 7)
- Codice open source garantisce riproducibilità
Valore Pratico:
- Scalabile a decine di milioni di vertici
- Ordini di grandezza più veloce di MIP
- Framework generico applicabile a vari modelli di rilassamento della clique
Chiarezza Esposizione:
- Motivazione introduttiva chiara (Figura 1 intuitiva)
- Pseudocodice algoritmi dettagliato
- Dimostrazioni teoremi complete

Insufficienze

Scelta Strategia Ordinamento:
- Manca guida teorica su quando usare degenerazione vs degenerazione due salti
- Tabella 1 mostra talvolta Deg-BnB più veloce (es. scc_infect-dublin)
- Suggerimento: progettare strategia adattiva o fornire euristica di selezione
Complessità Algoritmo Limite Superiore:
- O(|C|³) potrebbe diventare collo di bottiglia
- Colorazione greedy non ottimale
- Direzione miglioramento: algoritmi colorazione più veloci o rilassamento ottimalità
Confronto Sperimentale:
- Manca confronto con metodo albero di copertura di Santos et al. 2024
- Mancano confronti con algoritmi ottimali per problemi specifici (es. algoritmo Chang 2023 per clique difettosa k)
- Modello MIP potrebbe avere spazio di miglioramento (es. aggiunta di disuguaglianze valide)
Analisi Scalabilità:
- Discussione insufficiente per casi αG>10,000
- Prestazioni su grafi densi non sufficientemente testate
- Analisi consumo memoria mancante
Spazi Teorici:
- Manca analisi rapporto di approssimazione
- Complessità parametrizzata (es. con αG come parametro) non discussa
- Complessità caso medio non analizzata

Impatto

Contributo Accademico:
- Framework teorico unificato per vari modelli di rilassamento della clique
- Tecniche di decomposizione trasferibili ad altri problemi di estrazione di sottografi
- Alto valore citazionale (combina problema NP-hard, decomposizione grafo, branch-and-bound)
Valore Pratico:
- Applicazione diretta in scoperta comunità, bioinformatica, ecc.
- Codice open source facilita trasferimento tecnologico
- Può servire come baseline per altri algoritmi
Riproducibilità:
- Descrizione algoritmi dettagliata
- Codice open source (https://github.com/cy-Luo000/MDSL)
- Dataset pubblici (Network Data Repository)
- Configurazione sperimentale esplicita
Limitazioni:
- Applicazione industriale richiede ulteriore ottimizzazione (es. parallelizzazione)
- Algoritmi personalizzati per f(·) specifiche potrebbero essere superiori
- Necessita validazione da esperti di dominio per applicabilità pratica

Scenari Applicabili

Scenari Consigliati:

Analisi Reti Sociali: ricerca comunità strettamente connesse (diametro ≤ 2 garantisce comunicazione veloce)
Reti Biologiche: identificazione complessi proteici (consente pochi archi mancanti)
Reti di Collaborazione: identificazione team di ricerca nucleari
Grafi Scala Media: |V|<10⁶, αG<5000 prestazioni ottimali

Scenari Non Consigliati:

Grafi Densi Ultra-Grandi: αG vicino a |V| causa esplosione esponenziale
Applicazioni Real-Time: caso peggiore ancora tempo esponenziale
Scenari Soluzione Approssimata Sufficiente: costo algoritmo esatto elevato

Suggerimenti Miglioramento:

Combinare con algoritmi euristici per soluzione approssimata veloce
Parallelizzare per grafi ultra-grandi
Progettare algoritmi specializzati per f(·) specifiche

Bibliografia

Lavori Correlati Principali

Veremyev et al. (2016): "Exact MIP-based approaches for finding maximum quasi-cliques and dense subgraphs" - Propone modello MIP GF3
Luo et al. (2024): "A faster branching algorithm for the maximum k-defective clique problem" - ECAI 2024, algoritmo O(nc·1.2ⁿ)
Chang (2023): "Efficient maximum k-defective clique computation with improved time complexity" - PACMMOD, branch-and-bound migliorato
Santos et al. (2024): "Ensuring connectedness for the maximum quasi-clique and densest k-subgraph problems" - Vincoli connettività basati su albero di copertura
Wünsche (2021): "Mind the gap when searching for relaxed cliques" - Primo ordinamento degenerazione due salti

Fondamenti Teorici

Matula & Beck (1983): "Smallest-last ordering and clustering and graph coloring algorithms" - Lavoro classico ordinamento degenerazione
Asahiro et al. (2002): "Complexity of finding dense subgraphs" - Risultati complessità grafi f(·)-densi
Downey & Fellows (2012): "Parameterized complexity" - Teoria W1-hardness

Valutazione Complessiva: Questo è un articolo eccellente con rigore teorico, innovazione algoritmica e esperimenti completi. Il framework di decomposizione e il metodo di limite superiore ordinato hanno elevata generalità e valore pratico. Il principale contributo risiede nell'unificazione di vari modelli di rilassamento della clique e nella fornitura di algoritmi efficienti per la risoluzione. Consigliato per l'accettazione, con significativo contributo ai campi degli algoritmi su grafi e analisi di reti.