2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos
We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.
academic

SLoG-Net: Desenrollamiento de Algoritmos para Localización de Fuentes en Grafos

Información Básica

  • ID del Artículo: 2501.00442
  • Título: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
  • Autores: Chang Ye, Gonzalo Mateos (Universidad de Rochester)
  • Clasificación: eess.SP (Procesamiento de Señales)
  • Fecha de Presentación: 31 de diciembre de 2024 en arXiv
  • Enlace del Artículo: https://arxiv.org/abs/2501.00442

Resumen

Este artículo propone una solución novedosa de aprendizaje profundo basada en modelos para resolver el problema inverso de localización de fuentes de difusión en redes. Partiendo de los primeros principios del procesamiento de señales en grafos (GSP), los autores simplifican el problema a la estimación conjunta (ciega) del filtro de difusión hacia adelante y la señal de entrada dispersa que codifica la posición de la fuente. Aunque la tarea de deconvolución ciega presenta una naturaleza bilineal en las observaciones, mediante la exigencia de invertibilidad del filtro de difusión, se puede formular como un problema de optimización convexa y resolverse utilizando el método de multiplicadores con dirección alternada (ADMM). Posteriormente, los autores desenrollan y truncan las iteraciones novedosas de ADMM, obteniendo una arquitectura de red neuronal parametrizada para localización de fuentes en grafos (SLoG-Net), entrenada de extremo a extremo con datos etiquetados. Este enfoque de aprendizaje supervisado proporciona ventajas como interpretabilidad, eficiencia de parámetros y complejidad controlable en tiempo de inferencia.

Contexto de Investigación y Motivación

Definición del Problema

La localización de fuentes de difusión en redes es un importante problema inverso que tiene como objetivo identificar la ubicación de los nodos fuente en la red a partir de las señales de difusión observadas. Específicamente:

  1. Entrada: Señal de grafo observada Y ∈ R^(N×P), con topología de grafo conocida
  2. Salida: Señal de fuente dispersa X ∈ R^(N×P) y coeficientes de filtro de difusión desconocidos h
  3. Restricciones: La señal de fuente es dispersa (como máximo S≪N elementos no nulos por columna)

Importancia

Este problema tiene aplicaciones generalizadas en múltiples campos:

  • Monitoreo ambiental basado en sensores
  • Formación de opinión en redes sociales
  • Procesamiento de señales neurales
  • Epidemiología
  • Detección de propagación de información falsa

Limitaciones de Métodos Existentes

  1. Métodos GSP tradicionales: Dependen de técnicas de elevación de matrices, con alta complejidad computacional en grafos grandes
  2. Solucionadores iterativos: Requieren ajuste cuidadoso de tamaños de paso y parámetros de regularización, convergencia lenta
  3. Modelos probabilísticos: Solo son óptimos en estructuras de grafo específicas (como árboles) o requieren supuestos de dependencia restrictivos
  4. Ajuste de parámetros: Los métodos existentes requieren búsqueda en cuadrícula costosa para seleccionar parámetros

Contribuciones Principales

  1. Contribución Teórica: Reformulación del problema de identificación de filtro de grafo ciego como un problema de optimización convexa bajo restricciones de invertibilidad del filtro
  2. Innovación Algorítmica: Desarrollo de un algoritmo ADMM especializado para resolver eficientemente el problema de optimización convexa
  3. Diseño de Arquitectura: Propuesta de SLoG-Net, que mapea iteraciones de ADMM a capas de red neuronal entrenables mediante desenrollamiento de algoritmos
  4. Mejora de Rendimiento: Logra rendimiento comparable a ADMM iterativo, pero con tiempo de inferencia significativamente más rápido
  5. Aprendizaje de Parámetros: Aprende automáticamente tamaños de paso y parámetros de penalización mediante entrenamiento de extremo a extremo, sin necesidad de ajuste manual

Explicación Detallada del Método

Definición de la Tarea

Dado un grafo G(V,A) y una señal observada Y = HX, donde:

  • H = Σ(l=0 a L-1) h_l S^l es un filtro de grafo de orden L
  • S es el operador de desplazamiento de grafo (como la matriz de adyacencia normalizada)
  • X es la matriz de señal de fuente dispersa

El objetivo es estimar conjuntamente los coeficientes del filtro h y la entrada dispersa X.

Arquitectura del Modelo

1. Formulación de Reconstrucción Convexa

Bajo el supuesto de invertibilidad del filtro (Supuesto 2), se convierte el problema a:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

donde g̃ es la respuesta en frecuencia del filtro inverso.

2. Algoritmo ADMM

Utilizando técnica de separación de variables:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

donde Z = Y^T V ⊙ V, x = vecX.

Reglas de actualización de ADMM:

  • Actualización del filtro: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
  • Actualización de la señal de fuente: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
  • Actualización del multiplicador de Lagrange: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. Arquitectura SLoG-Net

Desenrolla iteraciones de ADMM en una red neuronal de K capas, donde cada capa contiene tres subcapas:

Subcapa de Filtro G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Subcapa de Señal de Fuente X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Subcapa de Multiplicador M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Puntos Técnicos Innovadores

  1. Restricciones Aprendibles: Reemplazo de restricciones fijas 1^T g̃ = 1 con matriz parametrizada M^(k) y vector m^(k)
  2. Desacoplamiento de Capas: Cada capa utiliza parámetros diferentes en lugar de compartir parámetros, aumentando la capacidad expresiva
  3. Inversión Matricial Eficiente: Aprovecha la estructura diagonal de Z^T Z y el lema de inversión matricial para lograr complejidad O(N^2)
  4. Conexiones Residuales: Diseño de flujo de datos similar a ResNet, con entrada Z en todas las capas

Configuración Experimental

Conjuntos de Datos

  1. Datos Sintéticos:
    • Tipos de grafo: Erdős-Rényi, modelo de bloques estocásticos (SBM), Barabási-Albert, grafo geométrico aleatorio
    • Número de nodos: N = 20-100
    • Dispersidad: θ = 0.15
    • Orden del filtro: L = 5
  2. Datos Reales:
    • Red social de delfines (N=62)
    • Club de karate de Zachary (N=34)
    • Subgrafo del conjunto de datos Digg 2009 (N=20)

Métricas de Evaluación

  1. Error Relativo (RE): ||X̂ - X_test||_F / ||X_test||_F
  2. Precisión del Conjunto de Soporte (ACC): Proporción de ubicaciones de fuente identificadas correctamente
  3. Tiempo de Inferencia: Tiempo de propagación hacia adelante

Métodos de Comparación

  1. Línea Base ADMM: Algoritmo ADMM iterativo
  2. Método GNN: Red neuronal convolucional de grafo
  3. IVGD: Red neuronal de difusión de grafo consciente de validez invertible

Detalles de Implementación

  • Número de capas de red: K = 5
  • Tamaño del conjunto de entrenamiento: |T| = 200k
  • Tamaño de lote: P = 400
  • Optimizador: Adam
  • Épocas de entrenamiento: 30
  • Dimensión de parámetro de restricción: d = 2

Resultados Experimentales

Resultados Principales

1. Comparación con ADMM

  • Robustez al Ruido: SLoG-Net supera a ADMM en diferentes niveles de ruido
  • Velocidad de Inferencia: Tiempo de inferencia de SLoG-Net aproximadamente 0.009s, ADMM requiere 1.99-7.42s
  • Impacto del Número de Parámetros: SLoG-Net supera significativamente a ADMM cuando el número de señales observadas P<160

2. Rendimiento en Diferentes Tipos de Grafo

Tipo de GrafoNMRE de X̂MRE de ĝACC
ER200.1490.1640.953
SBM200.2190.2150.914
RG200.3830.3770.869
BA200.5790.5370.772
karate340.4540.4520.958
dolphins620.7190.5780.841

3. Comparación de Complejidad Computacional

NSLoG-NetADMM
200.95×10^-2s2.04s
401.09×10^-2s5.70s
601.27×10^-2s9.41s
801.42×10^-2s12.29s
1001.64×10^-2s14.62s

Experimentos de Ablación

  1. Tamaño del Conjunto de Entrenamiento: El rendimiento se estabiliza cuando |T|≥160k
  2. Número de Capas de Red: K=5 es la opción óptima
  3. Dimensión del Parámetro de Restricción: d=2 muestra mejora significativa en comparación con d=1

Experimentos con Datos Reales

En el conjunto de datos Digg 2009:

  • AUC promedio de SLoG-Net: 0.56
  • AUC de línea base IVGD: 0.51
  • Aunque el rendimiento absoluto es limitado, SLoG-Net aún supera a los métodos de comparación en esta tarea difícil

Trabajo Relacionado

Métodos de Procesamiento de Señales en Grafos

  • Los métodos GSP tradicionales utilizan elevación de matrices y programación convexa
  • Limitaciones: Alta complejidad computacional, dificultad en ajuste de parámetros

Modelos Probabilísticos

  • Métodos de estimación de máxima verosimilitud
  • Solo óptimos en estructuras de grafo específicas

Métodos de Aprendizaje Profundo

  • Redes neuronales de grafo (GNN)
  • Aplicación de técnicas de desenrollamiento de algoritmos en procesamiento de señales

Conclusiones y Discusión

Conclusiones Principales

  1. SLoG-Net combina exitosamente métodos GSP impulsados por modelos con aprendizaje profundo impulsado por datos
  2. Logra rendimiento comparable a ADMM, pero con mejora de velocidad de 2-3 órdenes de magnitud
  3. Aprende automáticamente parámetros de optimización mediante entrenamiento de extremo a extremo, sin necesidad de ajuste manual
  4. Demuestra buen rendimiento en entornos ruidosos

Limitaciones

  1. Escalabilidad: Actualmente validado principalmente en grafos pequeños (N≤100)
  2. Requisitos de Datos de Entrenamiento: Requiere gran cantidad de datos etiquetados (200k muestras)
  3. Dependencia de Estructura de Grafo: El rendimiento está estrechamente relacionado con las características espectrales del grafo
  4. Invertibilidad del Filtro: Depende de un supuesto de invertibilidad relativamente fuerte

Direcciones Futuras

  1. Grafos a Gran Escala: Desarrollo de versiones escalables aplicables a redes grandes
  2. Aprendizaje por Transferencia: Investigación de la capacidad de generalización del modelo entre diferentes estructuras de grafo
  3. Análisis Teórico: Establecimiento de garantías teóricas para estabilidad y transferibilidad
  4. Extensión de Aplicaciones: Expansión a campos como neurociencia, sismología y epidemiología

Evaluación Profunda

Fortalezas

  1. Base Teórica Sólida: Basado en teoría GSP, con derivaciones matemáticas rigurosas
  2. Fuerte Innovación Metodológica: Primera aplicación de desenrollamiento de ADMM al problema de localización de fuentes en grafos
  3. Experimentación Completa: Cubre datos sintéticos y reales, múltiples tipos de grafo e indicadores de evaluación
  4. Practicidad de Ingeniería: La mejora significativa de velocidad la hace valiosa para aplicaciones prácticas
  5. Buena Interpretabilidad: La arquitectura de red corresponde directamente al algoritmo de optimización, facilitando la comprensión

Insuficiencias

  1. Limitación de Escala: Los experimentos se realizan principalmente en grafos pequeños, escalabilidad a gran escala desconocida
  2. Supuestos Fuertes: El supuesto de invertibilidad del filtro puede no satisfacerse en aplicaciones prácticas
  3. Comparación Incompleta: Falta de comparación con más métodos de aprendizaje profundo recientes
  4. Análisis Teórico Insuficiente: Falta de garantías teóricas sobre convergencia y capacidad de generalización

Impacto

  1. Valor Académico: Proporciona nuevas perspectivas para la aplicación de desenrollamiento de algoritmos en procesamiento de señales en grafos
  2. Valor Práctico: Tiene potencial de aplicación en monitoreo de redes, análisis de opinión pública y otros campos
  3. Reproducibilidad: Los autores proporcionan implementación de código completa

Escenarios Aplicables

  1. Tareas de localización de fuentes en redes de pequeño a mediano tamaño
  2. Escenarios de aplicación con altos requisitos de tiempo real
  3. Entornos donde la estructura del grafo es conocida y relativamente estable
  4. Escenarios de aprendizaje supervisado donde se pueden obtener datos de entrenamiento

Referencias

El artículo cita 46 referencias relacionadas, abarcando múltiples campos como procesamiento de señales en grafos, teoría de optimización y aprendizaje profundo, proporcionando una base teórica sólida para la investigación.


Evaluación General: Este es un artículo académico de alta calidad que combina exitosamente teoría de optimización con aprendizaje profundo, resolviendo el importante problema de localización de fuentes en grafos. Aunque hay espacio para mejora en escalabilidad y análisis teórico, su innovación y valor práctico lo convierten en una contribución importante en este campo.