2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos

We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.

academic

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Informazioni Fondamentali

ID Articolo: 2501.00442
Titolo: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
Autori: Chang Ye, Gonzalo Mateos (University of Rochester)
Classificazione: eess.SP (Elaborazione dei Segnali)
Data di Presentazione: 31 dicembre 2024 su arXiv
Link Articolo: https://arxiv.org/abs/2501.00442

Riassunto

Questo articolo propone una soluzione innovativa basata su modelli di apprendimento profondo per affrontare il problema inverso della localizzazione della sorgente di diffusione in rete. Partendo dai principi fondamentali dell'elaborazione dei segnali su grafi (GSP), gli autori riducono il problema alla stima congiunta (cieca) del filtro di diffusione in avanti e del segnale di ingresso sparso che codifica la posizione della sorgente. Nonostante la natura bilineare delle osservazioni in questo compito di deconvoluzione cieca, richiedendo l'invertibilità del filtro di diffusione, è possibile formularlo come un problema di ottimizzazione convessa e risolverlo utilizzando il metodo dei moltiplicatori di direzione alternata (ADMM). Successivamente, gli autori dispiegano e troncano le nuove iterazioni ADMM, ottenendo un'architettura di rete neurale parametrizzata per la localizzazione della sorgente su grafi (SLoG-Net), addestrata end-to-end con dati etichettati. Questo approccio di apprendimento supervisionato offre vantaggi quali interpretabilità, efficienza parametrica e complessità controllabile al momento dell'inferenza.

Contesto di Ricerca e Motivazione

Definizione del Problema

La localizzazione della sorgente di diffusione in rete è un importante problema inverso che mira a identificare la posizione dei nodi sorgente nella rete dai segnali di diffusione osservati. Nello specifico:

Input: Segnale su grafo osservato Y ∈ R^(N×P), con topologia del grafo nota
Output: Segnale sorgente sparso X ∈ R^(N×P) e coefficienti del filtro di diffusione sconosciuti h
Vincoli: Il segnale sorgente è sparso (al massimo S≪N elementi non nulli per colonna)

Importanza

Questo problema ha applicazioni diffuse in molteplici settori:

Monitoraggio ambientale basato su sensori
Formazione di opinioni nei social network
Elaborazione di segnali neurali
Epidemiologia
Rilevamento della diffusione di disinformazione

Limitazioni dei Metodi Esistenti

Metodi GSP tradizionali: Dipendono da tecniche di sollevamento matriciale, con elevata complessità computazionale su grafi di grandi dimensioni
Risolutori iterativi: Richiedono un attento aggiustamento della dimensione del passo e dei parametri di regolarizzazione, convergenza lenta
Modelli probabilistici: Ottimali solo su strutture grafiche specifiche (ad esempio alberi) o richiedono ipotesi di dipendenza restrittive
Sintonizzazione dei parametri: I metodi esistenti richiedono costose ricerche in griglia per la selezione dei parametri

Contributi Principali

Contributo Teorico: Riformulazione del problema di identificazione del filtro grafico cieco come problema di ottimizzazione convessa sotto vincoli di invertibilità del filtro
Innovazione Algoritmica: Sviluppo di un algoritmo ADMM specializzato per risolvere efficientemente il problema di ottimizzazione convessa
Progettazione dell'Architettura: Proposta di SLoG-Net, che mappa le iterazioni ADMM in strati di rete neurale addestrabili mediante dispiegamento dell'algoritmo
Miglioramento delle Prestazioni: Realizzazione di prestazioni comparabili all'ADMM iterativo, ma con tempo di inferenza significativamente più veloce
Apprendimento dei Parametri: Apprendimento automatico della dimensione del passo e dei parametri di penalità tramite addestramento end-to-end, senza necessità di sintonizzazione manuale

Dettagli del Metodo

Definizione del Compito

Dato il grafo G(V,A) e il segnale osservato Y = HX, dove:

H = Σ(l=0 to L-1) h_l S^l è un filtro grafico di ordine L
S è l'operatore di spostamento grafico (ad esempio matrice di adiacenza normalizzata)
X è la matrice del segnale sorgente sparso

L'obiettivo è stimare congiuntamente i coefficienti del filtro h e l'ingresso sparso X.

Architettura del Modello

1. Formulazione Convessa

Sotto l'ipotesi di invertibilità del filtro (Assumption 2), il problema viene convertito in:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

dove g̃ è la risposta in frequenza del filtro inverso.

2. Algoritmo ADMM

Utilizzo della tecnica di separazione delle variabili:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

dove Z = Y^T V ⊙ V, x = vecX.

Regole di aggiornamento ADMM:

Aggiornamento del Filtro: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
Aggiornamento del Segnale Sorgente: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
Aggiornamento dei Moltiplicatori di Lagrange: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. Architettura SLoG-Net

Dispiegamento delle iterazioni ADMM in una rete neurale a K strati, con tre sottostrati per strato:

Sottostrato del Filtro G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Sottostrato del Segnale Sorgente X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Sottostrato dei Moltiplicatori M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Punti di Innovazione Tecnica

Vincoli Apprendibili: Sostituzione del vincolo fisso 1^T g̃ = 1 con matrice parametrizzata M^(k) e vettore m^(k)
Disaccoppiamento per Strato: Utilizzo di parametri diversi per ogni strato anziché condivisione di parametri, aumentando la capacità espressiva
Inversione Matriciale Efficiente: Sfruttamento della struttura diagonale di Z^T Z e del lemma di inversione matriciale per complessità O(N^2)
Connessioni Residue: Progettazione del flusso dati simile a ResNet, con input Z a tutti gli strati

Configurazione Sperimentale

Dataset

Dati Sintetici:
- Tipi di grafo: Erdős-Rényi, modello a blocchi casuali (SBM), Barabási-Albert, grafo geometrico casuale
- Numero di nodi: N = 20-100
- Sparsità: θ = 0.15
- Ordine del filtro: L = 5
Dati Reali:
- Rete sociale dei delfini (N=62)
- Zachary Karate Club (N=34)
- Sottografo del dataset Digg 2009 (N=20)

Metriche di Valutazione

Errore Relativo (RE): ||X̂ - X_test||_F / ||X_test||_F
Accuratezza del Supporto (ACC): Proporzione di posizioni sorgente identificate correttamente
Tempo di Inferenza: Tempo di propagazione in avanti

Metodi di Confronto

Baseline ADMM: Algoritmo ADMM iterativo
Metodo GNN: Rete neurale grafica convoluzionale
IVGD: Rete neurale di diffusione grafica consapevole dell'invertibilità

Dettagli di Implementazione

Numero di strati della rete: K = 5
Dimensione del set di addestramento: |T| = 200k
Dimensione del batch: P = 400
Ottimizzatore: Adam
Numero di epoche: 30
Dimensione dei parametri di vincolo: d = 2

Risultati Sperimentali

Risultati Principali

1. Confronto con ADMM

Robustezza al Rumore: SLoG-Net supera ADMM a diversi livelli di rumore
Velocità di Inferenza: Tempo di inferenza di SLoG-Net circa 0.009s, ADMM richiede 1.99-7.42s
Impatto del Numero di Parametri: SLoG-Net supera significativamente ADMM quando P<160

2. Prestazioni su Diversi Tipi di Grafo

Tipo di Grafo	N	MRE di X̂	MRE di ĝ	ACC
ER	20	0.149	0.164	0.953
SBM	20	0.219	0.215	0.914
RG	20	0.383	0.377	0.869
BA	20	0.579	0.537	0.772
karate	34	0.454	0.452	0.958
dolphins	62	0.719	0.578	0.841

3. Confronto della Complessità Computazionale

N	SLoG-Net	ADMM
20	0.95×10^-2s	2.04s
40	1.09×10^-2s	5.70s
60	1.27×10^-2s	9.41s
80	1.42×10^-2s	12.29s
100	1.64×10^-2s	14.62s

Esperimenti di Ablazione

Dimensione del Set di Addestramento: Le prestazioni si stabilizzano quando |T|≥160k
Numero di Strati della Rete: K=5 è la scelta ottimale
Dimensione dei Parametri di Vincolo: d=2 mostra miglioramenti significativi rispetto a d=1

Esperimenti su Dati Reali

Sul dataset Digg 2009:

AUC medio di SLoG-Net: 0.56
AUC baseline IVGD: 0.51
Sebbene le prestazioni assolute siano limitate, SLoG-Net supera comunque i metodi di confronto in questo compito difficile

Lavori Correlati

Metodi di Elaborazione dei Segnali su Grafi

I metodi GSP tradizionali utilizzano sollevamento matriciale e programmazione convessa
Limitazioni: elevata complessità computazionale, difficoltà nella sintonizzazione dei parametri

Modelli Probabilistici

Metodi di stima della massima verosimiglianza
Ottimali solo su strutture grafiche specifiche

Metodi di Apprendimento Profondo

Reti neurali grafiche (GNN)
Applicazione della tecnica di dispiegamento dell'algoritmo nell'elaborazione dei segnali

Conclusioni e Discussione

Conclusioni Principali

SLoG-Net combina con successo metodi GSP guidati da modelli con apprendimento profondo guidato da dati
Realizza prestazioni comparabili ad ADMM, ma con velocità di inferenza migliorata di 2-3 ordini di grandezza
Apprende automaticamente i parametri di ottimizzazione tramite addestramento end-to-end, senza necessità di sintonizzazione manuale
Mostra buona robustezza in ambienti rumorosi

Limitazioni

Scalabilità: Attualmente validato principalmente su grafi di piccole dimensioni (N≤100)
Requisiti di Dati di Addestramento: Richiede una grande quantità di dati etichettati (200k campioni)
Dipendenza dalla Struttura del Grafo: Le prestazioni sono strettamente correlate alle caratteristiche spettrali del grafo
Invertibilità del Filtro: Dipende da un'ipotesi di invertibilità piuttosto forte

Direzioni Future

Grafi su Larga Scala: Sviluppo di versioni scalabili per reti di grandi dimensioni
Apprendimento per Trasferimento: Ricerca sulla capacità di generalizzazione del modello tra diverse strutture grafiche
Analisi Teorica: Stabilimento di garanzie teoriche per stabilità e trasferibilità
Estensione delle Applicazioni: Estensione a neuroscienze, sismologia, epidemiologia e altri settori

Valutazione Approfondita

Punti di Forza

Fondamento Teorico Solido: Basato sulla teoria GSP, con derivazioni matematiche rigorose
Forte Innovazione del Metodo: Prima applicazione del dispiegamento ADMM al problema di localizzazione della sorgente su grafi
Esperimenti Completi: Copertura di dati sintetici e reali, molteplici tipi di grafo e metriche di valutazione
Praticità Ingegneristica: Il significativo miglioramento della velocità lo rende applicabile nella pratica
Buona Interpretabilità: L'architettura della rete corrisponde direttamente all'algoritmo di ottimizzazione, facilitando la comprensione

Carenze

Limitazioni di Scala: Gli esperimenti si concentrano principalmente su grafi di piccole dimensioni, l'applicabilità su larga scala è sconosciuta
Ipotesi Forti: L'ipotesi di invertibilità del filtro potrebbe non essere soddisfatta nelle applicazioni pratiche
Confronti Incompleti: Mancanza di confronti con più metodi di apprendimento profondo recenti
Analisi Teorica Insufficiente: Mancanza di garanzie teoriche sulla convergenza e capacità di generalizzazione

Impatto

Valore Accademico: Fornisce nuove prospettive per l'applicazione del dispiegamento dell'algoritmo nell'elaborazione dei segnali su grafi
Valore Pratico: Ha potenziale di applicazione nel monitoraggio di rete, analisi del sentimento e altri settori
Riproducibilità: Gli autori forniscono un'implementazione completa del codice

Scenari Applicabili

Compiti di localizzazione della sorgente su reti di piccole e medie dimensioni
Scenari di applicazione con elevati requisiti di tempo reale
Ambienti dove la struttura del grafo è nota e relativamente stabile
Scenari di apprendimento supervisionato dove sono disponibili dati di addestramento

Riferimenti Bibliografici

L'articolo cita 46 lavori correlati, coprendo molteplici settori quali elaborazione dei segnali su grafi, teoria dell'ottimizzazione e apprendimento profondo, fornendo una solida base teorica per la ricerca.

Valutazione Complessiva: Questo è un articolo accademico di alta qualità che combina con successo la teoria dell'ottimizzazione con l'apprendimento profondo, affrontando l'importante problema della localizzazione della sorgente su grafi. Sebbene vi sia spazio per miglioramenti in termini di scalabilità e analisi teorica, la sua innovazione e valore pratico lo rendono un contributo significativo nel settore.