2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos

We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.

academic

SLoG-Net: Algorithmus-Entfaltung zur Quellenlokalisation auf Graphen

Grundlegende Informationen

Papier-ID: 2501.00442
Titel: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
Autoren: Chang Ye, Gonzalo Mateos (University of Rochester)
Klassifikation: eess.SP (Signalverarbeitung)
Einreichungsdatum: 31. Dezember 2024 bei arXiv
Papierlink: https://arxiv.org/abs/2501.00442

Zusammenfassung

In diesem Papier wird eine neuartige modellgestützte Deep-Learning-Lösung für das inverse Problem der Quellenlokalisation bei Netzwerkdiffusion vorgestellt. Ausgehend von ersten Prinzipien der Graphensignalverarbeitung (GSP) vereinfachen die Autoren das Problem auf die gemeinsame (blinde) Schätzung eines Vorwärtsdiffusionsfilters und eines spärlichen Eingangssignals, das die Quellenposition kodiert. Trotz der bilinearen Natur der Beobachtungen in dieser blinden Entfaltungsaufgabe kann das Problem durch die Forderung nach Invertierbarkeit des Diffusionsfilters als konvexes Optimierungsproblem formuliert und mit der Alternating Direction Method of Multipliers (ADMM) gelöst werden. Anschließend entfalten und kürzen die Autoren die neuartige ADMM-Iteration, um eine parametrisierte Netzwerkarchitektur für die Quellenlokalisation auf Graphen (SLoG-Net) zu erhalten, die mit gekennzeichneten Daten end-to-end trainiert wird. Dieser überwachte Lernansatz bietet Vorteile wie Interpretierbarkeit, Parametereffizienz und kontrollierbare Komplexität bei der Inferenz.

Forschungshintergrund und Motivation

Problemdefinition

Die Quellenlokalisation bei Netzwerkdiffusion ist ein wichtiges inverses Problem, das darauf abzielt, die Positionen der Quellknoten im Netzwerk aus beobachteten Diffusionssignalen zu identifizieren. Konkret:

Eingabe: Beobachtetes Graphensignal Y ∈ R^(N×P), bekannte Graphentopologie
Ausgabe: Spärliches Quellensignal X ∈ R^(N×P) und unbekannte Diffusionsfilterkoeffizienten h
Einschränkungen: Quellensignale sind spärlich (maximal S≪N Nicht-Null-Elemente pro Spalte)

Bedeutung

Dieses Problem hat breite Anwendungen in mehreren Bereichen:

Sensorgestützte Umweltüberwachung
Meinungsbildung in sozialen Netzwerken
Neurosignalverarbeitung
Epidemiologie
Erkennung von Desinformationsverbreitung

Einschränkungen bestehender Methoden

Traditionelle GSP-Methoden: Basieren auf Matrix-Lifting-Techniken mit hoher Rechenkomplexität bei großen Graphen
Iterative Löser: Erfordern sorgfältige Anpassung von Schrittweiten und Regularisierungsparametern, langsame Konvergenz
Probabilistische Modelle: Nur auf spezifischen Graphstrukturen (z.B. Bäumen) optimal oder erfordern restriktive Abhängigkeitsannahmen
Parameteroptimierung: Bestehende Methoden erfordern teure Gittersuche zur Parameterauswahl

Kernbeiträge

Theoretischer Beitrag: Umformulierung des blinden Graphenfilter-Identifikationsproblems als konvexes Optimierungsproblem unter Invertierbarkeitseinschränkungen
Algorithmische Innovation: Entwicklung eines spezialisierten ADMM-Algorithmus zur effizienten Lösung des konvexen Optimierungsproblems
Architekturdesign: Vorschlag von SLoG-Net, das ADMM-Iterationen durch Algorithmus-Entfaltung auf trainierbare Netzwerkschichten abbildet
Leistungsverbesserung: Erreicht vergleichbare Leistung mit iterativem ADMM, aber signifikant schnellere Inferenzzeit
Parameterlernen: Automatisches Lernen von Schrittweiten und Strafparametern durch end-to-end-Training ohne manuelle Optimierung

Methodische Details

Aufgabendefinition

Gegeben ein Graph G(V,A) und beobachtetes Signal Y = HX, wobei:

H = Σ(l=0 bis L-1) h_l S^l ein L-ter Ordnung Graphenfilter ist
S der Graphen-Shift-Operator ist (z.B. normalisierte Adjazenzmatrix)
X die spärliche Quellensignalmatrix ist

Das Ziel ist die gemeinsame Schätzung der Filterkoeffizienten h und des spärlichen Eingangs X.

Modellarchitektur

1. Konvexe Reformulierung

Unter der Annahme der Filterinvertierbarkeit (Annahme 2) wird das Problem umgewandelt in:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

wobei g̃ die Frequenzbereichsantwort des Inversfilters ist.

2. ADMM-Algorithmus

Verwendung von Variablentrennung:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

wobei Z = Y^T V ⊙ V und x = vecX.

ADMM-Aktualisierungsregeln:

Filteraktualisierung: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
Quellensignalaktualisierung: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
Lagrange-Multiplikator-Aktualisierung: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. SLoG-Net-Architektur

Entfaltung der ADMM-Iteration in K Netzwerkschichten, jede mit drei Unterschichten:

Filterschicht G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Quellensignalschicht X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Multiplikatorschicht M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Technische Innovationspunkte

Lernbare Einschränkungen: Ersetzung fester Einschränkungen 1^T g̃ = 1 durch parametrisierte Matrix M^(k) und Vektor m^(k)
Schichtweise Entkopplung: Verwendung unterschiedlicher Parameter pro Schicht statt Parameterfreigabe für erhöhte Ausdruckskraft
Effiziente Matrixinversion: Nutzung der Diagonalstruktur von Z^T Z und des Matrix-Inversions-Lemmas für O(N^2)-Komplexität
Residualverbindungen: ResNet-ähnliches Datenflussdesign mit Z-Eingabe in alle Schichten

Experimentelle Einrichtung

Datensätze

Synthetische Daten:
- Graphtypen: Erdős-Rényi, Stochastisches Blockmodell (SBM), Barabási-Albert, Zufallsgeometrischer Graph
- Knotenzahl: N = 20-100
- Spärlichkeit: θ = 0,15
- Filterordnung: L = 5
Echte Daten:
- Delphinsoziales Netzwerk (N=62)
- Zachary Karate Club (N=34)
- Teilgraph des Digg 2009-Datensatzes (N=20)

Bewertungsmetriken

Relativer Fehler (RE): ||X̂ - X_test||_F / ||X_test||_F
Träger-Genauigkeit (ACC): Anteil korrekt identifizierter Quellenpositionen
Inferenzzeit: Durchlaufzeit der Vorwärtspropagation

Vergleichsmethoden

ADMM-Baseline: Iterativer ADMM-Algorithmus
GNN-Methode: Konvolutives Graphenneuronales Netzwerk
IVGD: Invertierbares Gültigkeits-bewusstes Graphendiffusions-Neuronales Netzwerk

Implementierungsdetails

Netzwerkschichten: K = 5
Trainingssatzgröße: |T| = 200k
Batch-Größe: P = 400
Optimierer: Adam
Trainingsepochen: 30
Einschränkungs-Parameterdimension: d = 2

Experimentelle Ergebnisse

Hauptergebnisse

1. Vergleich mit ADMM

Rausch-Robustheit: SLoG-Net übertrifft ADMM bei verschiedenen Rauschpegeln
Inferenzgeschwindigkeit: SLoG-Net-Inferenzzeit etwa 0,009s, ADMM benötigt 1,99-7,42s
Einfluss der Parameterzahl: SLoG-Net zeigt signifikante Überlegenheit gegenüber ADMM wenn P<160

2. Leistung bei verschiedenen Graphtypen

Graphtyp	N	MRE von X̂	MRE von ĝ	ACC
ER	20	0,149	0,164	0,953
SBM	20	0,219	0,215	0,914
RG	20	0,383	0,377	0,869
BA	20	0,579	0,537	0,772
karate	34	0,454	0,452	0,958
dolphins	62	0,719	0,578	0,841

3. Vergleich der Rechenkomplexität

N	SLoG-Net	ADMM
20	0,95×10^-2s	2,04s
40	1,09×10^-2s	5,70s
60	1,27×10^-2s	9,41s
80	1,42×10^-2s	12,29s
100	1,64×10^-2s	14,62s

Ablationsstudien

Trainingssatzgröße: Leistung stabilisiert sich bei |T|≥160k
Netzwerkschichten: K=5 ist die optimale Wahl
Einschränkungs-Parameterdimension: d=2 zeigt signifikante Verbesserung gegenüber d=1

Experimente mit echten Daten

Auf dem Digg 2009-Datensatz:

SLoG-Net durchschnittliche AUC: 0,56
IVGD-Baseline AUC: 0,51
Obwohl die absolute Leistung begrenzt ist, übertrifft SLoG-Net bei dieser schwierigen Aufgabe die Vergleichsmethoden

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

SLoG-Net kombiniert erfolgreich modellgestützte GSP-Methoden mit datengestütztem Deep Learning
Erreicht vergleichbare Leistung mit ADMM, aber Inferenzgeschwindigkeit um 2-3 Größenordnungen schneller
Automatisches Lernen von Optimierungsparametern durch end-to-end-Training ohne manuelle Optimierung
Zeigt gute Robustheit in rauschigen Umgebungen

Einschränkungen

Skalierbarkeit: Derzeit hauptsächlich auf kleinen Graphen (N≤100) validiert
Trainingsdatenbedarf: Erfordert große Mengen gekennzeichneter Daten (200k Samples)
Graphstruktur-Abhängigkeit: Leistung eng mit spektralen Eigenschaften des Graphen verbunden
Filterinvertierbarkeit: Abhängig von starker Invertierbarkeitsannahme

Zukünftige Richtungen

Großskalengraphen: Entwicklung skalierbarer Versionen für große Netzwerke
Transferlernen: Untersuchung der Modellverallgemeinerung über verschiedene Graphstrukturen
Theoretische Analyse: Etablierung theoretischer Garantien für Stabilität und Übertragbarkeit
Anwendungserweiterung: Erweiterung auf Neurowissenschaften, Seismologie, Epidemiologie und andere Bereiche

Tiefgreifende Bewertung

Stärken

Solide theoretische Grundlagen: Basierend auf GSP-Theorie mit rigoroser mathematischer Herleitung
Starke methodische Innovation: Erste Anwendung von ADMM-Entfaltung auf Graphen-Quellenlokalisation
Umfassende Experimente: Abdeckung synthetischer und echter Daten, mehrerer Graphtypen und Bewertungsmetriken
Ingenieurpraktische Anwendbarkeit: Signifikante Geschwindigkeitsverbesserung für praktische Anwendungen
Gute Interpretierbarkeit: Netzwerkarchitektur entspricht direkt dem Optimierungsalgorithmus, leicht verständlich

Mängel

Skalierungsbeschränkungen: Experimente hauptsächlich auf kleinen Graphen, Anwendbarkeit auf große Skalen unklar
Starke Annahmen: Filterinvertierbarkeitsannahme kann in praktischen Anwendungen möglicherweise nicht erfüllt sein
Unvollständige Vergleiche: Mangel an Vergleichen mit mehr neuesten Deep-Learning-Methoden
Unzureichende theoretische Analyse: Fehlende Konvergenz- und Generalisierungsgarantien

Auswirkungen

Akademischer Wert: Bietet neue Perspektiven für Algorithmus-Entfaltung in der Graphensignalverarbeitung
Praktischer Wert: Potenzielle Anwendungen in Netzwerküberwachung, Stimmungsanalyse und anderen Bereichen
Reproduzierbarkeit: Autoren stellen vollständige Code-Implementierung bereit

Anwendungsszenarien

Quellenlokalisation in kleinen bis mittleren Netzwerken
Anwendungen mit hohen Echtzeitanforderungen
Umgebungen mit bekannter und relativ stabiler Graphstruktur
Überwachte Lernszenarien mit verfügbaren Trainingsdaten

Literaturverzeichnis

Das Papier zitiert 46 relevante Arbeiten, die wichtige Beiträge aus Graphensignalverarbeitung, Optimierungstheorie und Deep Learning abdecken und eine solide theoretische Grundlage bieten.

Gesamtbewertung: Dies ist ein hochqualitatives akademisches Papier, das erfolgreich Optimierungstheorie mit Deep Learning kombiniert, um das wichtige Problem der Quellenlokalisation auf Graphen zu lösen. Obwohl es noch Verbesserungspotenzial bei Skalierbarkeit und theoretischer Analyse gibt, machen seine Innovation und praktischer Wert es zu einem wichtigen Beitrag in diesem Forschungsbereich.