2025-11-16T19:07:13.213602

SLoG-Net: Algorithm Unrolling for Source Localization on Graphs

Ye, Mateos
We present a novel model-based deep learning solution for the inverse problem of localizing sources of network diffusion. Starting from first graph signal processing (GSP) principles, we show that the problem reduces to joint (blind) estimation of the forward diffusion filter and a sparse input signal that encodes the source locations. Despite the bilinear nature of the observations in said blind deconvolution task, by requiring invertibility of the diffusion filter we are able to formulate a convex optimization problem and solve it using the alternating-direction method of multipliers (ADMM). We then unroll and truncate the novel ADMM iterations to arrive at a parameterized neural network architecture for Source Localization on Graphs (SLoG-Net), that we train in an end-to-end fashion using labeled data. This supervised learning approach offers several advantages such as interpretability, parameter efficiency, and controllable complexity during inference. Our reproducible numerical experiments corroborate that SLoG-Net exhibits performance on par with the iterative ADMM baseline, but with markedly faster inference times and without needing to manually tune step-size or penalty parameters. Overall, our approach combines the best of both worlds by incorporating the inductive biases of a GSP model-based solution within a data-driven, trainable deep learning architecture for blind deconvolution of graph signals.
academic

SLoG-Net: Развёртывание алгоритма для локализации источника на графах

Основная информация

  • ID статьи: 2501.00442
  • Название: SLoG-Net: Algorithm Unrolling for Source Localization on Graphs
  • Авторы: Chang Ye, Gonzalo Mateos (Университет Рочестера)
  • Категория: eess.SP (Обработка сигналов)
  • Дата подачи: 31 декабря 2024 г. на arXiv
  • Ссылка на статью: https://arxiv.org/abs/2501.00442

Аннотация

В данной работе предложено инновационное решение на основе моделей глубокого обучения для решения обратной задачи локализации источника сетевой диффузии. Исходя из первых принципов обработки графических сигналов (GSP), авторы сводят задачу к совместной (слепой) оценке прямого фильтра диффузии и разреженного входного сигнала, кодирующего положение источника. Несмотря на билинейный характер наблюдений в задаче слепой деконволюции, путём требования обратимости фильтра диффузии задача может быть сформулирована как задача выпуклой оптимизации и решена методом чередующихся направлений множителей (ADMM). Затем авторы развёртывают и усекают новый ADMM-итерационный процесс, получая параметризованную архитектуру нейронной сети для локализации источника на графах (SLoG-Net), которая обучается на размеченных данных в режиме end-to-end. Такой подход контролируемого обучения обеспечивает преимущества интерпретируемости, параметрической эффективности и управляемой сложности при выводе.

Исследовательский контекст и мотивация

Определение задачи

Локализация источника сетевой диффузии — это важная обратная задача, целью которой является определение положения узлов-источников в сети на основе наблюдаемого сигнала диффузии. Конкретно:

  1. Входные данные: наблюдаемый графический сигнал Y ∈ R^(N×P), известная топология графа
  2. Выходные данные: разреженный исходный сигнал X ∈ R^(N×P) и неизвестные коэффициенты фильтра диффузии h
  3. Ограничения: исходный сигнал имеет разреженность (максимум S≪N ненулевых элементов в каждом столбце)

Значимость

Данная задача имеет широкое применение в нескольких областях:

  • Мониторинг окружающей среды на основе датчиков
  • Формирование общественного мнения в социальных сетях
  • Обработка нейросигналов
  • Эпидемиология
  • Обнаружение распространения дезинформации

Ограничения существующих методов

  1. Традиционные методы GSP: зависят от техники матричного лифтинга, высокая вычислительная сложность на больших графах
  2. Итеративные решатели: требуют тщательной настройки размера шага и параметров регуляризации, медленная сходимость
  3. Вероятностные модели: оптимальны только на специфических структурах графов (например, деревья) или требуют ограничивающих предположений о зависимостях
  4. Настройка параметров: существующие методы требуют дорогостоящего поиска по сетке для выбора параметров

Основные вклады

  1. Теоретический вклад: переформулировка задачи слепой идентификации графического фильтра как задачи выпуклой оптимизации с ограничением обратимости фильтра
  2. Алгоритмическая инновация: разработка специализированного ADMM-алгоритма для эффективного решения задачи выпуклой оптимизации
  3. Проектирование архитектуры: предложение SLoG-Net путём развёртывания ADMM-итераций в обучаемые слои нейронной сети
  4. Повышение производительности: достижение производительности, сравнимой с итеративным ADMM, но со значительно более быстрым временем вывода
  5. Обучение параметров: автоматическое обучение размеров шагов и параметров штрафа посредством end-to-end обучения без ручной настройки

Подробное описание метода

Определение задачи

Дан граф G(V,A) и наблюдаемый сигнал Y = HX, где:

  • H = Σ(l=0 to L-1) h_l S^l — фильтр графа порядка L
  • S — оператор сдвига графа (например, нормализованная матрица смежности)
  • X — матрица разреженного исходного сигнала

Цель — совместно оценить коэффициенты фильтра h и разреженный вход X.

Архитектура модели

1. Формулировка выпуклой реконструкции

При предположении обратимости фильтра (Предположение 2) задача преобразуется в:

min ||X||_{1,1} = ||(Y^T V ⊙ V)g̃||_1
s.t. 1^T_N g̃ = 1

где g̃ — частотная характеристика обратного фильтра.

2. ADMM-алгоритм

Использование техники разделения переменных:

min ||x||_1
s.t. Zg̃ - x = 0, 1^T_N g̃ = c

где Z = Y^T V ⊙ V, x = vecX.

Правила обновления ADMM:

  • Обновление фильтра: g̃k+1 = Γ^(-1)Z^T(ρ_λxk - λk) + (ρ_μc - μk)1_N
  • Обновление исходного сигнала: xk+1 = S_{ρ_λ^(-1)}(Zg̃k+1 + λk/ρ_λ)
  • Обновление множителей Лагранжа: λk+1 = λk + ρ_λ(Zg̃k+1 - xk+1)

3. Архитектура SLoG-Net

Развёртывание ADMM-итераций в K-слойную нейронную сеть, каждый слой содержит три подслоя:

Подслой фильтра G_k:

g̃[k+1] = (Z^T Z + ρ_2^(k) M^(k)M^(k)T)^(-1)[Z^T(x[k] - ρ_1^(k)λ[k]) + M^(k)(ρ_2^(k)m^(k) - ρ_1^(k)μ[k])]

Подслой исходного сигнала X_k:

x[k+1] = S_{τ^(k)}(α_1^(k)Zg̃[k+1] + α_2^(k)λ[k])

Подслой множителей M_k:

λ[k+1] = β_1^(k)λ[k] + β_2^(k)Zg̃[k+1] + β_3^(k)x[k+1]
μ[k+1] = γ^(k)μ[k] + M^(k)T g̃[k+1] + m^(k)

Технические инновации

  1. Обучаемые ограничения: замена фиксированного ограничения 1^T g̃ = 1 параметризованными матрицей M^(k) и вектором m^(k)
  2. Развязка слоёв: использование различных параметров в каждом слое вместо совместного использования параметров для повышения выразительной способности
  3. Эффективное обращение матриц: использование диагональной структуры Z^T Z и леммы об обращении матриц для достижения сложности O(N^2)
  4. Остаточные соединения: дизайн потока данных, аналогичный ResNet, с входом Z во все слои

Экспериментальная установка

Наборы данных

  1. Синтетические данные:
    • Типы графов: Erdős-Rényi, модель стохастических блоков (SBM), Barabási-Albert, случайный геометрический граф
    • Количество узлов: N = 20-100
    • Разреженность: θ = 0.15
    • Порядок фильтра: L = 5
  2. Реальные данные:
    • Социальная сеть дельфинов (N=62)
    • Клуб каратэ Zachary (N=34)
    • Подграф набора данных Digg 2009 (N=20)

Метрики оценки

  1. Относительная ошибка (RE): ||X̂ - X_test||_F / ||X_test||_F
  2. Точность поддержки (ACC): доля правильно идентифицированных положений источников
  3. Время вывода: время прямого распространения

Методы сравнения

  1. Базовый ADMM: итеративный алгоритм ADMM
  2. Методы GNN: сверточная нейронная сеть графа
  3. IVGD: нейронная сеть графовой диффузии с учётом обратимости

Детали реализации

  • Количество слоёв сети: K = 5
  • Размер обучающего набора: |T| = 200k
  • Размер пакета: P = 400
  • Оптимизатор: Adam
  • Количество эпох обучения: 30
  • Размерность параметров ограничений: d = 2

Экспериментальные результаты

Основные результаты

1. Сравнение с ADMM

  • Робастность к шуму: SLoG-Net превосходит ADMM при различных уровнях шума
  • Скорость вывода: время вывода SLoG-Net составляет ~0.009s, ADMM требует 1.99-7.42s
  • Влияние количества параметров: SLoG-Net значительно превосходит ADMM при P<160

2. Производительность на различных типах графов

Тип графаNMRE of X̂MRE of ĝACC
ER200.1490.1640.953
SBM200.2190.2150.914
RG200.3830.3770.869
BA200.5790.5370.772
karate340.4540.4520.958
dolphins620.7190.5780.841

3. Сравнение вычислительной сложности

NSLoG-NetADMM
200.95×10^-2s2.04s
401.09×10^-2s5.70s
601.27×10^-2s9.41s
801.42×10^-2s12.29s
1001.64×10^-2s14.62s

Абляционные исследования

  1. Размер обучающего набора: производительность стабилизируется при |T|≥160k
  2. Количество слоёв сети: K=5 является оптимальным выбором
  3. Размерность параметров ограничений: d=2 показывает значительное улучшение по сравнению с d=1

Эксперименты на реальных данных

На наборе данных Digg 2009:

  • Средний AUC SLoG-Net: 0.56
  • AUC базовой линии IVGD: 0.51
  • Хотя абсолютная производительность ограничена, SLoG-Net всё ещё превосходит методы сравнения в этой сложной задаче

Связанные работы

Методы обработки графических сигналов

  • Традиционные методы GSP используют матричный лифтинг и выпуклое программирование
  • Ограничения: высокая вычислительная сложность, сложность настройки параметров

Вероятностные модели

  • Методы оценки максимального правдоподобия
  • Оптимальны только на специфических структурах графов

Методы глубокого обучения

  • Графовые нейронные сети (GNN)
  • Применение техники развёртывания алгоритмов в обработке сигналов

Заключение и обсуждение

Основные выводы

  1. SLoG-Net успешно объединяет модельно-ориентированные методы GSP с данными-ориентированным глубоким обучением
  2. Достигает производительности, сравнимой с ADMM, но с ускорением вывода на 2-3 порядка величины
  3. Автоматически обучает параметры оптимизации посредством end-to-end обучения без ручной настройки
  4. Демонстрирует хорошую робастность в условиях шума

Ограничения

  1. Масштабируемость: в настоящее время проверена в основном на графах малого размера (N≤100)
  2. Требования к обучающим данным: требует большого объёма размеченных данных (200k образцов)
  3. Зависимость от структуры графа: производительность тесно связана со спектральными характеристиками графа
  4. Обратимость фильтра: зависит от сильного предположения об обратимости

Направления будущих исследований

  1. Графы большого масштаба: разработка масштабируемых версий для больших сетей
  2. Трансферное обучение: исследование обобщаемости модели между различными структурами графов
  3. Теоретический анализ: установление теоретических гарантий стабильности и переносимости
  4. Расширение приложений: распространение на нейронауку, сейсмологию, эпидемиологию и другие области

Глубокая оценка

Преимущества

  1. Прочная теоретическая база: основана на теории GSP, строгие математические выводы
  2. Высокая инновационность метода: первое применение развёртывания ADMM к задаче локализации источника на графах
  3. Полные эксперименты: охватывают синтетические и реальные данные, различные типы графов и метрики оценки
  4. Практическая инженерная ценность: значительное ускорение делает её практически применимой
  5. Хорошая интерпретируемость: архитектура сети напрямую соответствует алгоритму оптимизации, облегчая понимание

Недостатки

  1. Ограничение по масштабу: эксперименты проводились в основном на графах малого размера, применимость на больших масштабах неизвестна
  2. Сильные предположения: предположение об обратимости фильтра может не выполняться в реальных приложениях
  3. Неполное сравнение: отсутствует сравнение с большим количеством новых методов глубокого обучения
  4. Недостаточный теоретический анализ: отсутствуют теоретические гарантии сходимости и обобщаемости

Влияние

  1. Академическая ценность: предоставляет новый подход к применению развёртывания алгоритмов в обработке графических сигналов
  2. Практическая ценность: имеет потенциал применения в сетевом мониторинге, анализе общественного мнения и других областях
  3. Воспроизводимость: авторы предоставили полную реализацию кода

Применимые сценарии

  1. Задачи локализации источника на сетях малого и среднего размера
  2. Приложения с высокими требованиями к реальному времени
  3. Среды, где структура графа известна и относительно стабильна
  4. Сценарии контролируемого обучения, где доступны обучающие данные

Библиография

Статья цитирует 46 связанных работ, охватывающих обработку графических сигналов, теорию оптимизации, глубокое обучение и другие области, обеспечивая прочную теоретическую базу для исследования.


Общая оценка: Это высококачественная академическая статья, которая успешно объединяет теорию оптимизации и глубокое обучение для решения важной задачи локализации источника на графах. Хотя есть место для улучшения в масштабируемости и теоретическом анализе, её инновационность и практическая ценность делают её значительным вкладом в данную область.