2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos

We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.

academic

SLoG-Net: Desenrollamiento de Algoritmos para Localización de Fuentes en Grafos

Información Básica

ID del Artículo: 2501.00442
Título: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
Autores: Chang Ye, Gonzalo Mateos (Universidad de Rochester)
Clasificación: eess.SP (Procesamiento de Señales)
Fecha de Presentación: 31 de diciembre de 2024 en arXiv
Enlace del Artículo: https://arxiv.org/abs/2501.00442

Resumen

Este artículo propone una solución novedosa de aprendizaje profundo basada en modelos para resolver el problema inverso de localización de fuentes de difusión en redes. Partiendo de los primeros principios del procesamiento de señales en grafos (GSP), los autores simplifican el problema a la estimación conjunta (ciega) del filtro de difusión hacia adelante y la señal de entrada dispersa que codifica la posición de la fuente. Aunque la tarea de deconvolución ciega presenta una naturaleza bilineal en las observaciones, mediante la exigencia de invertibilidad del filtro de difusión, se puede formular como un problema de optimización convexa y resolverse utilizando el método de multiplicadores con dirección alternada (ADMM). Posteriormente, los autores desenrollan y truncan las iteraciones novedosas de ADMM, obteniendo una arquitectura de red neuronal parametrizada para localización de fuentes en grafos (SLoG-Net), entrenada de extremo a extremo con datos etiquetados. Este enfoque de aprendizaje supervisado proporciona ventajas como interpretabilidad, eficiencia de parámetros y complejidad controlable en tiempo de inferencia.

Contexto de Investigación y Motivación

Definición del Problema

La localización de fuentes de difusión en redes es un importante problema inverso que tiene como objetivo identificar la ubicación de los nodos fuente en la red a partir de las señales de difusión observadas. Específicamente:

Entrada: Señal de grafo observada Y ∈ R^(N×P), con topología de grafo conocida
Salida: Señal de fuente dispersa X ∈ R^(N×P) y coeficientes de filtro de difusión desconocidos h
Restricciones: La señal de fuente es dispersa (como máximo S≪N elementos no nulos por columna)

Importancia

Este problema tiene aplicaciones generalizadas en múltiples campos:

Monitoreo ambiental basado en sensores
Formación de opinión en redes sociales
Procesamiento de señales neurales
Epidemiología
Detección de propagación de información falsa

Limitaciones de Métodos Existentes

Métodos GSP tradicionales: Dependen de técnicas de elevación de matrices, con alta complejidad computacional en grafos grandes
Solucionadores iterativos: Requieren ajuste cuidadoso de tamaños de paso y parámetros de regularización, convergencia lenta
Modelos probabilísticos: Solo son óptimos en estructuras de grafo específicas (como árboles) o requieren supuestos de dependencia restrictivos
Ajuste de parámetros: Los métodos existentes requieren búsqueda en cuadrícula costosa para seleccionar parámetros

Contribuciones Principales

Contribución Teórica: Reformulación del problema de identificación de filtro de grafo ciego como un problema de optimización convexa bajo restricciones de invertibilidad del filtro
Innovación Algorítmica: Desarrollo de un algoritmo ADMM especializado para resolver eficientemente el problema de optimización convexa
Diseño de Arquitectura: Propuesta de SLoG-Net, que mapea iteraciones de ADMM a capas de red neuronal entrenables mediante desenrollamiento de algoritmos
Mejora de Rendimiento: Logra rendimiento comparable a ADMM iterativo, pero con tiempo de inferencia significativamente más rápido
Aprendizaje de Parámetros: Aprende automáticamente tamaños de paso y parámetros de penalización mediante entrenamiento de extremo a extremo, sin necesidad de ajuste manual

Explicación Detallada del Método

Definición de la Tarea

Dado un grafo G(V,A) y una señal observada Y = HX, donde:

H = Σ(l=0 a L-1) h_l S^l es un filtro de grafo de orden L
S es el operador de desplazamiento de grafo (como la matriz de adyacencia normalizada)
X es la matriz de señal de fuente dispersa

El objetivo es estimar conjuntamente los coeficientes del filtro h y la entrada dispersa X.

Arquitectura del Modelo

1. Formulación de Reconstrucción Convexa

Bajo el supuesto de invertibilidad del filtro (Supuesto 2), se convierte el problema a:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

donde g̃ es la respuesta en frecuencia del filtro inverso.

2. Algoritmo ADMM

Utilizando técnica de separación de variables:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

donde Z = Y^T V ⊙ V, x = vecX.

Reglas de actualización de ADMM:

Actualización del filtro: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
Actualización de la señal de fuente: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
Actualización del multiplicador de Lagrange: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. Arquitectura SLoG-Net

Desenrolla iteraciones de ADMM en una red neuronal de K capas, donde cada capa contiene tres subcapas:

Subcapa de Filtro G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Subcapa de Señal de Fuente X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Subcapa de Multiplicador M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Puntos Técnicos Innovadores

Restricciones Aprendibles: Reemplazo de restricciones fijas 1^T g̃ = 1 con matriz parametrizada M^(k) y vector m^(k)
Desacoplamiento de Capas: Cada capa utiliza parámetros diferentes en lugar de compartir parámetros, aumentando la capacidad expresiva
Inversión Matricial Eficiente: Aprovecha la estructura diagonal de Z^T Z y el lema de inversión matricial para lograr complejidad O(N^2)
Conexiones Residuales: Diseño de flujo de datos similar a ResNet, con entrada Z en todas las capas

Configuración Experimental

Conjuntos de Datos

Datos Sintéticos:
- Tipos de grafo: Erdős-Rényi, modelo de bloques estocásticos (SBM), Barabási-Albert, grafo geométrico aleatorio
- Número de nodos: N = 20-100
- Dispersidad: θ = 0.15
- Orden del filtro: L = 5
Datos Reales:
- Red social de delfines (N=62)
- Club de karate de Zachary (N=34)
- Subgrafo del conjunto de datos Digg 2009 (N=20)

Métricas de Evaluación

Error Relativo (RE): ||X̂ - X_test||_F / ||X_test||_F
Precisión del Conjunto de Soporte (ACC): Proporción de ubicaciones de fuente identificadas correctamente
Tiempo de Inferencia: Tiempo de propagación hacia adelante

Métodos de Comparación

Línea Base ADMM: Algoritmo ADMM iterativo
Método GNN: Red neuronal convolucional de grafo
IVGD: Red neuronal de difusión de grafo consciente de validez invertible

Detalles de Implementación

Número de capas de red: K = 5
Tamaño del conjunto de entrenamiento: |T| = 200k
Tamaño de lote: P = 400
Optimizador: Adam
Épocas de entrenamiento: 30
Dimensión de parámetro de restricción: d = 2

Resultados Experimentales

Resultados Principales

1. Comparación con ADMM

Robustez al Ruido: SLoG-Net supera a ADMM en diferentes niveles de ruido
Velocidad de Inferencia: Tiempo de inferencia de SLoG-Net aproximadamente 0.009s, ADMM requiere 1.99-7.42s
Impacto del Número de Parámetros: SLoG-Net supera significativamente a ADMM cuando el número de señales observadas P<160

2. Rendimiento en Diferentes Tipos de Grafo

Tipo de Grafo	N	MRE de X̂	MRE de ĝ	ACC
ER	20	0.149	0.164	0.953
SBM	20	0.219	0.215	0.914
RG	20	0.383	0.377	0.869
BA	20	0.579	0.537	0.772
karate	34	0.454	0.452	0.958
dolphins	62	0.719	0.578	0.841

3. Comparación de Complejidad Computacional

N	SLoG-Net	ADMM
20	0.95×10^-2s	2.04s
40	1.09×10^-2s	5.70s
60	1.27×10^-2s	9.41s
80	1.42×10^-2s	12.29s
100	1.64×10^-2s	14.62s

Experimentos de Ablación

Tamaño del Conjunto de Entrenamiento: El rendimiento se estabiliza cuando |T|≥160k
Número de Capas de Red: K=5 es la opción óptima
Dimensión del Parámetro de Restricción: d=2 muestra mejora significativa en comparación con d=1

Experimentos con Datos Reales

En el conjunto de datos Digg 2009:

AUC promedio de SLoG-Net: 0.56
AUC de línea base IVGD: 0.51
Aunque el rendimiento absoluto es limitado, SLoG-Net aún supera a los métodos de comparación en esta tarea difícil

Trabajo Relacionado

Métodos de Procesamiento de Señales en Grafos

Los métodos GSP tradicionales utilizan elevación de matrices y programación convexa
Limitaciones: Alta complejidad computacional, dificultad en ajuste de parámetros

Modelos Probabilísticos

Métodos de estimación de máxima verosimilitud
Solo óptimos en estructuras de grafo específicas

Métodos de Aprendizaje Profundo

Redes neuronales de grafo (GNN)
Aplicación de técnicas de desenrollamiento de algoritmos en procesamiento de señales

Conclusiones y Discusión

Conclusiones Principales

SLoG-Net combina exitosamente métodos GSP impulsados por modelos con aprendizaje profundo impulsado por datos
Logra rendimiento comparable a ADMM, pero con mejora de velocidad de 2-3 órdenes de magnitud
Aprende automáticamente parámetros de optimización mediante entrenamiento de extremo a extremo, sin necesidad de ajuste manual
Demuestra buen rendimiento en entornos ruidosos

Limitaciones

Escalabilidad: Actualmente validado principalmente en grafos pequeños (N≤100)
Requisitos de Datos de Entrenamiento: Requiere gran cantidad de datos etiquetados (200k muestras)
Dependencia de Estructura de Grafo: El rendimiento está estrechamente relacionado con las características espectrales del grafo
Invertibilidad del Filtro: Depende de un supuesto de invertibilidad relativamente fuerte

Direcciones Futuras

Grafos a Gran Escala: Desarrollo de versiones escalables aplicables a redes grandes
Aprendizaje por Transferencia: Investigación de la capacidad de generalización del modelo entre diferentes estructuras de grafo
Análisis Teórico: Establecimiento de garantías teóricas para estabilidad y transferibilidad
Extensión de Aplicaciones: Expansión a campos como neurociencia, sismología y epidemiología

Evaluación Profunda

Fortalezas

Base Teórica Sólida: Basado en teoría GSP, con derivaciones matemáticas rigurosas
Fuerte Innovación Metodológica: Primera aplicación de desenrollamiento de ADMM al problema de localización de fuentes en grafos
Experimentación Completa: Cubre datos sintéticos y reales, múltiples tipos de grafo e indicadores de evaluación
Practicidad de Ingeniería: La mejora significativa de velocidad la hace valiosa para aplicaciones prácticas
Buena Interpretabilidad: La arquitectura de red corresponde directamente al algoritmo de optimización, facilitando la comprensión

Insuficiencias

Limitación de Escala: Los experimentos se realizan principalmente en grafos pequeños, escalabilidad a gran escala desconocida
Supuestos Fuertes: El supuesto de invertibilidad del filtro puede no satisfacerse en aplicaciones prácticas
Comparación Incompleta: Falta de comparación con más métodos de aprendizaje profundo recientes
Análisis Teórico Insuficiente: Falta de garantías teóricas sobre convergencia y capacidad de generalización

Impacto

Valor Académico: Proporciona nuevas perspectivas para la aplicación de desenrollamiento de algoritmos en procesamiento de señales en grafos
Valor Práctico: Tiene potencial de aplicación en monitoreo de redes, análisis de opinión pública y otros campos
Reproducibilidad: Los autores proporcionan implementación de código completa

Escenarios Aplicables

Tareas de localización de fuentes en redes de pequeño a mediano tamaño
Escenarios de aplicación con altos requisitos de tiempo real
Entornos donde la estructura del grafo es conocida y relativamente estable
Escenarios de aprendizaje supervisado donde se pueden obtener datos de entrenamiento

Referencias

El artículo cita 46 referencias relacionadas, abarcando múltiples campos como procesamiento de señales en grafos, teoría de optimización y aprendizaje profundo, proporcionando una base teórica sólida para la investigación.

Evaluación General: Este es un artículo académico de alta calidad que combina exitosamente teoría de optimización con aprendizaje profundo, resolviendo el importante problema de localización de fuentes en grafos. Aunque hay espacio para mejora en escalabilidad y análisis teórico, su innovación y valor práctico lo convierten en una contribución importante en este campo.