SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
Ye, Mateos
We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.
academic
SLoG-Net: Развёртывание алгоритма для локализации источника на графах
В данной работе предложено инновационное решение на основе моделей глубокого обучения для решения обратной задачи локализации источника сетевой диффузии. Исходя из первых принципов обработки графических сигналов (GSP), авторы сводят задачу к совместной (слепой) оценке прямого фильтра диффузии и разреженного входного сигнала, кодирующего положение источника. Несмотря на билинейный характер наблюдений в задаче слепой деконволюции, путём требования обратимости фильтра диффузии задача может быть сформулирована как задача выпуклой оптимизации и решена методом чередующихся направлений множителей (ADMM). Затем авторы развёртывают и усекают новый ADMM-итерационный процесс, получая параметризованную архитектуру нейронной сети для локализации источника на графах (SLoG-Net), которая обучается на размеченных данных в режиме end-to-end. Такой подход контролируемого обучения обеспечивает преимущества интерпретируемости, параметрической эффективности и управляемой сложности при выводе.
Локализация источника сетевой диффузии — это важная обратная задача, целью которой является определение положения узлов-источников в сети на основе наблюдаемого сигнала диффузии. Конкретно:
Входные данные: наблюдаемый графический сигнал Y ∈ R^(N×P), известная топология графа
Выходные данные: разреженный исходный сигнал X ∈ R^(N×P) и неизвестные коэффициенты фильтра диффузии h
Ограничения: исходный сигнал имеет разреженность (максимум S≪N ненулевых элементов в каждом столбце)
Теоретический вклад: переформулировка задачи слепой идентификации графического фильтра как задачи выпуклой оптимизации с ограничением обратимости фильтра
Алгоритмическая инновация: разработка специализированного ADMM-алгоритма для эффективного решения задачи выпуклой оптимизации
Проектирование архитектуры: предложение SLoG-Net путём развёртывания ADMM-итераций в обучаемые слои нейронной сети
Повышение производительности: достижение производительности, сравнимой с итеративным ADMM, но со значительно более быстрым временем вывода
Обучение параметров: автоматическое обучение размеров шагов и параметров штрафа посредством end-to-end обучения без ручной настройки
Статья цитирует 46 связанных работ, охватывающих обработку графических сигналов, теорию оптимизации, глубокое обучение и другие области, обеспечивая прочную теоретическую базу для исследования.
Общая оценка: Это высококачественная академическая статья, которая успешно объединяет теорию оптимизации и глубокое обучение для решения важной задачи локализации источника на графах. Хотя есть место для улучшения в масштабируемости и теоретическом анализе, её инновационность и практическая ценность делают её значительным вкладом в данную область.