2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos
We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.
academic

SLoG-Net: Algorithmus-Entfaltung zur Quellenlokalisation auf Graphen

Grundlegende Informationen

  • Papier-ID: 2501.00442
  • Titel: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
  • Autoren: Chang Ye, Gonzalo Mateos (University of Rochester)
  • Klassifikation: eess.SP (Signalverarbeitung)
  • Einreichungsdatum: 31. Dezember 2024 bei arXiv
  • Papierlink: https://arxiv.org/abs/2501.00442

Zusammenfassung

In diesem Papier wird eine neuartige modellgestützte Deep-Learning-Lösung für das inverse Problem der Quellenlokalisation bei Netzwerkdiffusion vorgestellt. Ausgehend von ersten Prinzipien der Graphensignalverarbeitung (GSP) vereinfachen die Autoren das Problem auf die gemeinsame (blinde) Schätzung eines Vorwärtsdiffusionsfilters und eines spärlichen Eingangssignals, das die Quellenposition kodiert. Trotz der bilinearen Natur der Beobachtungen in dieser blinden Entfaltungsaufgabe kann das Problem durch die Forderung nach Invertierbarkeit des Diffusionsfilters als konvexes Optimierungsproblem formuliert und mit der Alternating Direction Method of Multipliers (ADMM) gelöst werden. Anschließend entfalten und kürzen die Autoren die neuartige ADMM-Iteration, um eine parametrisierte Netzwerkarchitektur für die Quellenlokalisation auf Graphen (SLoG-Net) zu erhalten, die mit gekennzeichneten Daten end-to-end trainiert wird. Dieser überwachte Lernansatz bietet Vorteile wie Interpretierbarkeit, Parametereffizienz und kontrollierbare Komplexität bei der Inferenz.

Forschungshintergrund und Motivation

Problemdefinition

Die Quellenlokalisation bei Netzwerkdiffusion ist ein wichtiges inverses Problem, das darauf abzielt, die Positionen der Quellknoten im Netzwerk aus beobachteten Diffusionssignalen zu identifizieren. Konkret:

  1. Eingabe: Beobachtetes Graphensignal Y ∈ R^(N×P), bekannte Graphentopologie
  2. Ausgabe: Spärliches Quellensignal X ∈ R^(N×P) und unbekannte Diffusionsfilterkoeffizienten h
  3. Einschränkungen: Quellensignale sind spärlich (maximal S≪N Nicht-Null-Elemente pro Spalte)

Bedeutung

Dieses Problem hat breite Anwendungen in mehreren Bereichen:

  • Sensorgestützte Umweltüberwachung
  • Meinungsbildung in sozialen Netzwerken
  • Neurosignalverarbeitung
  • Epidemiologie
  • Erkennung von Desinformationsverbreitung

Einschränkungen bestehender Methoden

  1. Traditionelle GSP-Methoden: Basieren auf Matrix-Lifting-Techniken mit hoher Rechenkomplexität bei großen Graphen
  2. Iterative Löser: Erfordern sorgfältige Anpassung von Schrittweiten und Regularisierungsparametern, langsame Konvergenz
  3. Probabilistische Modelle: Nur auf spezifischen Graphstrukturen (z.B. Bäumen) optimal oder erfordern restriktive Abhängigkeitsannahmen
  4. Parameteroptimierung: Bestehende Methoden erfordern teure Gittersuche zur Parameterauswahl

Kernbeiträge

  1. Theoretischer Beitrag: Umformulierung des blinden Graphenfilter-Identifikationsproblems als konvexes Optimierungsproblem unter Invertierbarkeitseinschränkungen
  2. Algorithmische Innovation: Entwicklung eines spezialisierten ADMM-Algorithmus zur effizienten Lösung des konvexen Optimierungsproblems
  3. Architekturdesign: Vorschlag von SLoG-Net, das ADMM-Iterationen durch Algorithmus-Entfaltung auf trainierbare Netzwerkschichten abbildet
  4. Leistungsverbesserung: Erreicht vergleichbare Leistung mit iterativem ADMM, aber signifikant schnellere Inferenzzeit
  5. Parameterlernen: Automatisches Lernen von Schrittweiten und Strafparametern durch end-to-end-Training ohne manuelle Optimierung

Methodische Details

Aufgabendefinition

Gegeben ein Graph G(V,A) und beobachtetes Signal Y = HX, wobei:

  • H = Σ(l=0 bis L-1) h_l S^l ein L-ter Ordnung Graphenfilter ist
  • S der Graphen-Shift-Operator ist (z.B. normalisierte Adjazenzmatrix)
  • X die spärliche Quellensignalmatrix ist

Das Ziel ist die gemeinsame Schätzung der Filterkoeffizienten h und des spärlichen Eingangs X.

Modellarchitektur

1. Konvexe Reformulierung

Unter der Annahme der Filterinvertierbarkeit (Annahme 2) wird das Problem umgewandelt in:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

wobei g̃ die Frequenzbereichsantwort des Inversfilters ist.

2. ADMM-Algorithmus

Verwendung von Variablentrennung:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

wobei Z = Y^T V ⊙ V und x = vecX.

ADMM-Aktualisierungsregeln:

  • Filteraktualisierung: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
  • Quellensignalaktualisierung: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
  • Lagrange-Multiplikator-Aktualisierung: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. SLoG-Net-Architektur

Entfaltung der ADMM-Iteration in K Netzwerkschichten, jede mit drei Unterschichten:

Filterschicht G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Quellensignalschicht X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Multiplikatorschicht M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Technische Innovationspunkte

  1. Lernbare Einschränkungen: Ersetzung fester Einschränkungen 1^T g̃ = 1 durch parametrisierte Matrix M^(k) und Vektor m^(k)
  2. Schichtweise Entkopplung: Verwendung unterschiedlicher Parameter pro Schicht statt Parameterfreigabe für erhöhte Ausdruckskraft
  3. Effiziente Matrixinversion: Nutzung der Diagonalstruktur von Z^T Z und des Matrix-Inversions-Lemmas für O(N^2)-Komplexität
  4. Residualverbindungen: ResNet-ähnliches Datenflussdesign mit Z-Eingabe in alle Schichten

Experimentelle Einrichtung

Datensätze

  1. Synthetische Daten:
    • Graphtypen: Erdős-Rényi, Stochastisches Blockmodell (SBM), Barabási-Albert, Zufallsgeometrischer Graph
    • Knotenzahl: N = 20-100
    • Spärlichkeit: θ = 0,15
    • Filterordnung: L = 5
  2. Echte Daten:
    • Delphinsoziales Netzwerk (N=62)
    • Zachary Karate Club (N=34)
    • Teilgraph des Digg 2009-Datensatzes (N=20)

Bewertungsmetriken

  1. Relativer Fehler (RE): ||X̂ - X_test||_F / ||X_test||_F
  2. Träger-Genauigkeit (ACC): Anteil korrekt identifizierter Quellenpositionen
  3. Inferenzzeit: Durchlaufzeit der Vorwärtspropagation

Vergleichsmethoden

  1. ADMM-Baseline: Iterativer ADMM-Algorithmus
  2. GNN-Methode: Konvolutives Graphenneuronales Netzwerk
  3. IVGD: Invertierbares Gültigkeits-bewusstes Graphendiffusions-Neuronales Netzwerk

Implementierungsdetails

  • Netzwerkschichten: K = 5
  • Trainingssatzgröße: |T| = 200k
  • Batch-Größe: P = 400
  • Optimierer: Adam
  • Trainingsepochen: 30
  • Einschränkungs-Parameterdimension: d = 2

Experimentelle Ergebnisse

Hauptergebnisse

1. Vergleich mit ADMM

  • Rausch-Robustheit: SLoG-Net übertrifft ADMM bei verschiedenen Rauschpegeln
  • Inferenzgeschwindigkeit: SLoG-Net-Inferenzzeit etwa 0,009s, ADMM benötigt 1,99-7,42s
  • Einfluss der Parameterzahl: SLoG-Net zeigt signifikante Überlegenheit gegenüber ADMM wenn P<160

2. Leistung bei verschiedenen Graphtypen

GraphtypNMRE von X̂MRE von ĝACC
ER200,1490,1640,953
SBM200,2190,2150,914
RG200,3830,3770,869
BA200,5790,5370,772
karate340,4540,4520,958
dolphins620,7190,5780,841

3. Vergleich der Rechenkomplexität

NSLoG-NetADMM
200,95×10^-2s2,04s
401,09×10^-2s5,70s
601,27×10^-2s9,41s
801,42×10^-2s12,29s
1001,64×10^-2s14,62s

Ablationsstudien

  1. Trainingssatzgröße: Leistung stabilisiert sich bei |T|≥160k
  2. Netzwerkschichten: K=5 ist die optimale Wahl
  3. Einschränkungs-Parameterdimension: d=2 zeigt signifikante Verbesserung gegenüber d=1

Experimente mit echten Daten

Auf dem Digg 2009-Datensatz:

  • SLoG-Net durchschnittliche AUC: 0,56
  • IVGD-Baseline AUC: 0,51
  • Obwohl die absolute Leistung begrenzt ist, übertrifft SLoG-Net bei dieser schwierigen Aufgabe die Vergleichsmethoden

Verwandte Arbeiten

Graphensignalverarbeitungsmethoden

  • Traditionelle GSP-Methoden verwenden Matrix-Lifting und konvexe Programmierung
  • Einschränkungen: Hohe Rechenkomplexität, schwierige Parameteroptimierung

Probabilistische Modelle

  • Maximum-Likelihood-Schätzmethoden
  • Nur auf spezifischen Graphstrukturen optimal

Deep-Learning-Methoden

  • Graphenneuronale Netze (GNN)
  • Algorithmus-Entfaltungstechniken in der Signalverarbeitung

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. SLoG-Net kombiniert erfolgreich modellgestützte GSP-Methoden mit datengestütztem Deep Learning
  2. Erreicht vergleichbare Leistung mit ADMM, aber Inferenzgeschwindigkeit um 2-3 Größenordnungen schneller
  3. Automatisches Lernen von Optimierungsparametern durch end-to-end-Training ohne manuelle Optimierung
  4. Zeigt gute Robustheit in rauschigen Umgebungen

Einschränkungen

  1. Skalierbarkeit: Derzeit hauptsächlich auf kleinen Graphen (N≤100) validiert
  2. Trainingsdatenbedarf: Erfordert große Mengen gekennzeichneter Daten (200k Samples)
  3. Graphstruktur-Abhängigkeit: Leistung eng mit spektralen Eigenschaften des Graphen verbunden
  4. Filterinvertierbarkeit: Abhängig von starker Invertierbarkeitsannahme

Zukünftige Richtungen

  1. Großskalengraphen: Entwicklung skalierbarer Versionen für große Netzwerke
  2. Transferlernen: Untersuchung der Modellverallgemeinerung über verschiedene Graphstrukturen
  3. Theoretische Analyse: Etablierung theoretischer Garantien für Stabilität und Übertragbarkeit
  4. Anwendungserweiterung: Erweiterung auf Neurowissenschaften, Seismologie, Epidemiologie und andere Bereiche

Tiefgreifende Bewertung

Stärken

  1. Solide theoretische Grundlagen: Basierend auf GSP-Theorie mit rigoroser mathematischer Herleitung
  2. Starke methodische Innovation: Erste Anwendung von ADMM-Entfaltung auf Graphen-Quellenlokalisation
  3. Umfassende Experimente: Abdeckung synthetischer und echter Daten, mehrerer Graphtypen und Bewertungsmetriken
  4. Ingenieurpraktische Anwendbarkeit: Signifikante Geschwindigkeitsverbesserung für praktische Anwendungen
  5. Gute Interpretierbarkeit: Netzwerkarchitektur entspricht direkt dem Optimierungsalgorithmus, leicht verständlich

Mängel

  1. Skalierungsbeschränkungen: Experimente hauptsächlich auf kleinen Graphen, Anwendbarkeit auf große Skalen unklar
  2. Starke Annahmen: Filterinvertierbarkeitsannahme kann in praktischen Anwendungen möglicherweise nicht erfüllt sein
  3. Unvollständige Vergleiche: Mangel an Vergleichen mit mehr neuesten Deep-Learning-Methoden
  4. Unzureichende theoretische Analyse: Fehlende Konvergenz- und Generalisierungsgarantien

Auswirkungen

  1. Akademischer Wert: Bietet neue Perspektiven für Algorithmus-Entfaltung in der Graphensignalverarbeitung
  2. Praktischer Wert: Potenzielle Anwendungen in Netzwerküberwachung, Stimmungsanalyse und anderen Bereichen
  3. Reproduzierbarkeit: Autoren stellen vollständige Code-Implementierung bereit

Anwendungsszenarien

  1. Quellenlokalisation in kleinen bis mittleren Netzwerken
  2. Anwendungen mit hohen Echtzeitanforderungen
  3. Umgebungen mit bekannter und relativ stabiler Graphstruktur
  4. Überwachte Lernszenarien mit verfügbaren Trainingsdaten

Literaturverzeichnis

Das Papier zitiert 46 relevante Arbeiten, die wichtige Beiträge aus Graphensignalverarbeitung, Optimierungstheorie und Deep Learning abdecken und eine solide theoretische Grundlage bieten.


Gesamtbewertung: Dies ist ein hochqualitatives akademisches Papier, das erfolgreich Optimierungstheorie mit Deep Learning kombiniert, um das wichtige Problem der Quellenlokalisation auf Graphen zu lösen. Obwohl es noch Verbesserungspotenzial bei Skalierbarkeit und theoretischer Analyse gibt, machen seine Innovation und praktischer Wert es zu einem wichtigen Beitrag in diesem Forschungsbereich.