2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos
We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.
academic

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Informazioni Fondamentali

  • ID Articolo: 2501.00442
  • Titolo: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
  • Autori: Chang Ye, Gonzalo Mateos (University of Rochester)
  • Classificazione: eess.SP (Elaborazione dei Segnali)
  • Data di Presentazione: 31 dicembre 2024 su arXiv
  • Link Articolo: https://arxiv.org/abs/2501.00442

Riassunto

Questo articolo propone una soluzione innovativa basata su modelli di apprendimento profondo per affrontare il problema inverso della localizzazione della sorgente di diffusione in rete. Partendo dai principi fondamentali dell'elaborazione dei segnali su grafi (GSP), gli autori riducono il problema alla stima congiunta (cieca) del filtro di diffusione in avanti e del segnale di ingresso sparso che codifica la posizione della sorgente. Nonostante la natura bilineare delle osservazioni in questo compito di deconvoluzione cieca, richiedendo l'invertibilità del filtro di diffusione, è possibile formularlo come un problema di ottimizzazione convessa e risolverlo utilizzando il metodo dei moltiplicatori di direzione alternata (ADMM). Successivamente, gli autori dispiegano e troncano le nuove iterazioni ADMM, ottenendo un'architettura di rete neurale parametrizzata per la localizzazione della sorgente su grafi (SLoG-Net), addestrata end-to-end con dati etichettati. Questo approccio di apprendimento supervisionato offre vantaggi quali interpretabilità, efficienza parametrica e complessità controllabile al momento dell'inferenza.

Contesto di Ricerca e Motivazione

Definizione del Problema

La localizzazione della sorgente di diffusione in rete è un importante problema inverso che mira a identificare la posizione dei nodi sorgente nella rete dai segnali di diffusione osservati. Nello specifico:

  1. Input: Segnale su grafo osservato Y ∈ R^(N×P), con topologia del grafo nota
  2. Output: Segnale sorgente sparso X ∈ R^(N×P) e coefficienti del filtro di diffusione sconosciuti h
  3. Vincoli: Il segnale sorgente è sparso (al massimo S≪N elementi non nulli per colonna)

Importanza

Questo problema ha applicazioni diffuse in molteplici settori:

  • Monitoraggio ambientale basato su sensori
  • Formazione di opinioni nei social network
  • Elaborazione di segnali neurali
  • Epidemiologia
  • Rilevamento della diffusione di disinformazione

Limitazioni dei Metodi Esistenti

  1. Metodi GSP tradizionali: Dipendono da tecniche di sollevamento matriciale, con elevata complessità computazionale su grafi di grandi dimensioni
  2. Risolutori iterativi: Richiedono un attento aggiustamento della dimensione del passo e dei parametri di regolarizzazione, convergenza lenta
  3. Modelli probabilistici: Ottimali solo su strutture grafiche specifiche (ad esempio alberi) o richiedono ipotesi di dipendenza restrittive
  4. Sintonizzazione dei parametri: I metodi esistenti richiedono costose ricerche in griglia per la selezione dei parametri

Contributi Principali

  1. Contributo Teorico: Riformulazione del problema di identificazione del filtro grafico cieco come problema di ottimizzazione convessa sotto vincoli di invertibilità del filtro
  2. Innovazione Algoritmica: Sviluppo di un algoritmo ADMM specializzato per risolvere efficientemente il problema di ottimizzazione convessa
  3. Progettazione dell'Architettura: Proposta di SLoG-Net, che mappa le iterazioni ADMM in strati di rete neurale addestrabili mediante dispiegamento dell'algoritmo
  4. Miglioramento delle Prestazioni: Realizzazione di prestazioni comparabili all'ADMM iterativo, ma con tempo di inferenza significativamente più veloce
  5. Apprendimento dei Parametri: Apprendimento automatico della dimensione del passo e dei parametri di penalità tramite addestramento end-to-end, senza necessità di sintonizzazione manuale

Dettagli del Metodo

Definizione del Compito

Dato il grafo G(V,A) e il segnale osservato Y = HX, dove:

  • H = Σ(l=0 to L-1) h_l S^l è un filtro grafico di ordine L
  • S è l'operatore di spostamento grafico (ad esempio matrice di adiacenza normalizzata)
  • X è la matrice del segnale sorgente sparso

L'obiettivo è stimare congiuntamente i coefficienti del filtro h e l'ingresso sparso X.

Architettura del Modello

1. Formulazione Convessa

Sotto l'ipotesi di invertibilità del filtro (Assumption 2), il problema viene convertito in:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

dove g̃ è la risposta in frequenza del filtro inverso.

2. Algoritmo ADMM

Utilizzo della tecnica di separazione delle variabili:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

dove Z = Y^T V ⊙ V, x = vecX.

Regole di aggiornamento ADMM:

  • Aggiornamento del Filtro: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
  • Aggiornamento del Segnale Sorgente: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
  • Aggiornamento dei Moltiplicatori di Lagrange: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. Architettura SLoG-Net

Dispiegamento delle iterazioni ADMM in una rete neurale a K strati, con tre sottostrati per strato:

Sottostrato del Filtro G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Sottostrato del Segnale Sorgente X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Sottostrato dei Moltiplicatori M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Punti di Innovazione Tecnica

  1. Vincoli Apprendibili: Sostituzione del vincolo fisso 1^T g̃ = 1 con matrice parametrizzata M^(k) e vettore m^(k)
  2. Disaccoppiamento per Strato: Utilizzo di parametri diversi per ogni strato anziché condivisione di parametri, aumentando la capacità espressiva
  3. Inversione Matriciale Efficiente: Sfruttamento della struttura diagonale di Z^T Z e del lemma di inversione matriciale per complessità O(N^2)
  4. Connessioni Residue: Progettazione del flusso dati simile a ResNet, con input Z a tutti gli strati

Configurazione Sperimentale

Dataset

  1. Dati Sintetici:
    • Tipi di grafo: Erdős-Rényi, modello a blocchi casuali (SBM), Barabási-Albert, grafo geometrico casuale
    • Numero di nodi: N = 20-100
    • Sparsità: θ = 0.15
    • Ordine del filtro: L = 5
  2. Dati Reali:
    • Rete sociale dei delfini (N=62)
    • Zachary Karate Club (N=34)
    • Sottografo del dataset Digg 2009 (N=20)

Metriche di Valutazione

  1. Errore Relativo (RE): ||X̂ - X_test||_F / ||X_test||_F
  2. Accuratezza del Supporto (ACC): Proporzione di posizioni sorgente identificate correttamente
  3. Tempo di Inferenza: Tempo di propagazione in avanti

Metodi di Confronto

  1. Baseline ADMM: Algoritmo ADMM iterativo
  2. Metodo GNN: Rete neurale grafica convoluzionale
  3. IVGD: Rete neurale di diffusione grafica consapevole dell'invertibilità

Dettagli di Implementazione

  • Numero di strati della rete: K = 5
  • Dimensione del set di addestramento: |T| = 200k
  • Dimensione del batch: P = 400
  • Ottimizzatore: Adam
  • Numero di epoche: 30
  • Dimensione dei parametri di vincolo: d = 2

Risultati Sperimentali

Risultati Principali

1. Confronto con ADMM

  • Robustezza al Rumore: SLoG-Net supera ADMM a diversi livelli di rumore
  • Velocità di Inferenza: Tempo di inferenza di SLoG-Net circa 0.009s, ADMM richiede 1.99-7.42s
  • Impatto del Numero di Parametri: SLoG-Net supera significativamente ADMM quando P<160

2. Prestazioni su Diversi Tipi di Grafo

Tipo di GrafoNMRE di X̂MRE di ĝACC
ER200.1490.1640.953
SBM200.2190.2150.914
RG200.3830.3770.869
BA200.5790.5370.772
karate340.4540.4520.958
dolphins620.7190.5780.841

3. Confronto della Complessità Computazionale

NSLoG-NetADMM
200.95×10^-2s2.04s
401.09×10^-2s5.70s
601.27×10^-2s9.41s
801.42×10^-2s12.29s
1001.64×10^-2s14.62s

Esperimenti di Ablazione

  1. Dimensione del Set di Addestramento: Le prestazioni si stabilizzano quando |T|≥160k
  2. Numero di Strati della Rete: K=5 è la scelta ottimale
  3. Dimensione dei Parametri di Vincolo: d=2 mostra miglioramenti significativi rispetto a d=1

Esperimenti su Dati Reali

Sul dataset Digg 2009:

  • AUC medio di SLoG-Net: 0.56
  • AUC baseline IVGD: 0.51
  • Sebbene le prestazioni assolute siano limitate, SLoG-Net supera comunque i metodi di confronto in questo compito difficile

Lavori Correlati

Metodi di Elaborazione dei Segnali su Grafi

  • I metodi GSP tradizionali utilizzano sollevamento matriciale e programmazione convessa
  • Limitazioni: elevata complessità computazionale, difficoltà nella sintonizzazione dei parametri

Modelli Probabilistici

  • Metodi di stima della massima verosimiglianza
  • Ottimali solo su strutture grafiche specifiche

Metodi di Apprendimento Profondo

  • Reti neurali grafiche (GNN)
  • Applicazione della tecnica di dispiegamento dell'algoritmo nell'elaborazione dei segnali

Conclusioni e Discussione

Conclusioni Principali

  1. SLoG-Net combina con successo metodi GSP guidati da modelli con apprendimento profondo guidato da dati
  2. Realizza prestazioni comparabili ad ADMM, ma con velocità di inferenza migliorata di 2-3 ordini di grandezza
  3. Apprende automaticamente i parametri di ottimizzazione tramite addestramento end-to-end, senza necessità di sintonizzazione manuale
  4. Mostra buona robustezza in ambienti rumorosi

Limitazioni

  1. Scalabilità: Attualmente validato principalmente su grafi di piccole dimensioni (N≤100)
  2. Requisiti di Dati di Addestramento: Richiede una grande quantità di dati etichettati (200k campioni)
  3. Dipendenza dalla Struttura del Grafo: Le prestazioni sono strettamente correlate alle caratteristiche spettrali del grafo
  4. Invertibilità del Filtro: Dipende da un'ipotesi di invertibilità piuttosto forte

Direzioni Future

  1. Grafi su Larga Scala: Sviluppo di versioni scalabili per reti di grandi dimensioni
  2. Apprendimento per Trasferimento: Ricerca sulla capacità di generalizzazione del modello tra diverse strutture grafiche
  3. Analisi Teorica: Stabilimento di garanzie teoriche per stabilità e trasferibilità
  4. Estensione delle Applicazioni: Estensione a neuroscienze, sismologia, epidemiologia e altri settori

Valutazione Approfondita

Punti di Forza

  1. Fondamento Teorico Solido: Basato sulla teoria GSP, con derivazioni matematiche rigorose
  2. Forte Innovazione del Metodo: Prima applicazione del dispiegamento ADMM al problema di localizzazione della sorgente su grafi
  3. Esperimenti Completi: Copertura di dati sintetici e reali, molteplici tipi di grafo e metriche di valutazione
  4. Praticità Ingegneristica: Il significativo miglioramento della velocità lo rende applicabile nella pratica
  5. Buona Interpretabilità: L'architettura della rete corrisponde direttamente all'algoritmo di ottimizzazione, facilitando la comprensione

Carenze

  1. Limitazioni di Scala: Gli esperimenti si concentrano principalmente su grafi di piccole dimensioni, l'applicabilità su larga scala è sconosciuta
  2. Ipotesi Forti: L'ipotesi di invertibilità del filtro potrebbe non essere soddisfatta nelle applicazioni pratiche
  3. Confronti Incompleti: Mancanza di confronti con più metodi di apprendimento profondo recenti
  4. Analisi Teorica Insufficiente: Mancanza di garanzie teoriche sulla convergenza e capacità di generalizzazione

Impatto

  1. Valore Accademico: Fornisce nuove prospettive per l'applicazione del dispiegamento dell'algoritmo nell'elaborazione dei segnali su grafi
  2. Valore Pratico: Ha potenziale di applicazione nel monitoraggio di rete, analisi del sentimento e altri settori
  3. Riproducibilità: Gli autori forniscono un'implementazione completa del codice

Scenari Applicabili

  1. Compiti di localizzazione della sorgente su reti di piccole e medie dimensioni
  2. Scenari di applicazione con elevati requisiti di tempo reale
  3. Ambienti dove la struttura del grafo è nota e relativamente stabile
  4. Scenari di apprendimento supervisionato dove sono disponibili dati di addestramento

Riferimenti Bibliografici

L'articolo cita 46 lavori correlati, coprendo molteplici settori quali elaborazione dei segnali su grafi, teoria dell'ottimizzazione e apprendimento profondo, fornendo una solida base teorica per la ricerca.


Valutazione Complessiva: Questo è un articolo accademico di alta qualità che combina con successo la teoria dell'ottimizzazione con l'apprendimento profondo, affrontando l'importante problema della localizzazione della sorgente su grafi. Sebbene vi sia spazio per miglioramenti in termini di scalabilità e analisi teorica, la sua innovazione e valore pratico lo rendono un contributo significativo nel settore.