Revisiting Node Affinity Prediction in Temporal Graphs
Mantri, Feldman, Eliasof et al.
Node affinity prediction is a common task that is widely used in temporal graph learning with applications in social and financial networks, recommender systems, and more. Recent works have addressed this task by adapting state-of-the-art dynamic link property prediction models to node affinity prediction. However, simple heuristics, such as Persistent Forecast or Moving Average, outperform these models. In this work, we analyze the challenges in training current Temporal Graph Neural Networks for node affinity prediction and suggest appropriate solutions. Combining the solutions, we develop NAViS - Node Affinity prediction model using Virtual State, by exploiting the equivalence between heuristics and state space models. While promising, training NAViS is non-trivial. Therefore, we further introduce a novel loss function for node affinity prediction. We evaluate NAViS on TGB and show that it outperforms the state-of-the-art, including heuristics. Our source code is available at https://github.com/orfeld415/NAVIS
academic
Переосмысление предсказания сродства узлов во временных графах
Предсказание сродства узлов является важной задачей в обучении на временных графах с широким применением в социальных сетях, финансовых сетях и системах рекомендаций. Несмотря на то, что недавние исследования решают задачу предсказания сродства узлов путём адаптации передовых моделей динамического предсказания связей, простые эвристические методы (такие как постоянное предсказание и скользящее среднее) превосходят эти сложные модели. В данной работе анализируются проблемы обучения современных временных графовых нейронных сетей при решении задачи предсказания сродства узлов и предлагаются соответствующие решения. Объединив эти решения, авторы разработали NAVIS (модель предсказания сродства узлов с использованием виртуального состояния), реализующую предсказание сродства узлов путём использования эквивалентности эвристических методов и моделей пространства состояний.
Предсказание сродства узлов направлено на прогнозирование интенсивности взаимодействия конкретного узла со всеми остальными узлами в будущий момент времени, что отличается от традиционной задачи предсказания связей. Предсказание связей сосредоточено на том, появится ли конкретное ребро, тогда как предсказание сродства требует полного упорядочивания всех потенциальных соседей, что делает задачу более сложной, но также более соответствующей практическим требованиям.
Парадокс производительности: сложные временные графовые нейронные сети (TGNN) показывают худшие результаты на задаче предсказания сродства узлов, чем простые эвристические методы
Ограничения выразительной способности: существующие TGNN не могут представлять простые операции, такие как скользящее среднее
Несоответствие функции потерь: потеря перекрёстной энтропии не соответствует природе упорядочивания задачи сродства
Недостаточное использование информации: TGNN не полностью используют глобальную временную динамику и информацию о долгосрочных зависимостях
Авторы путём теоретического анализа обнаружили, что простые эвристические методы фактически являются частными случаями линейных моделей пространства состояний (SSM), что обеспечивает теоретическую основу для разработки более мощных архитектур TGNN.
Теоретический вклад: доказано, что простые эвристические методы являются частными случаями линейных SSM, и на основе этой связи разработана архитектура TGNN, способная обобщать эвристические методы
Инновация архитектуры: предложена модель NAVIS, объединяющая виртуальное глобальное состояние и механизм линейного пространства состояний, эффективно решающая задачу предсказания сродства узлов
Улучшение функции потерь: проанализированы недостатки потери перекрёстной энтропии при предсказании сродства, предложена альтернатива на основе упорядочивания — Lambda-потеря
Экспериментальная верификация: метод верифицирован на эталонах TGB и множественных наборах данных, последовательно превосходя существующие методы и эвристические базовые линии
Теорема 1 (линейные SSM обобщают базовые эвристики):
Пусть H — множество базовых эвристик (PF, SMA, EMA), Flin-SSM — множество отображений, реализуемых линейными SSM, тогда:
H⊊Flin-SSM
Теорема 2 (ограничения выразительной способности RNN/LSTM/GRU):
Стандартные единицы RNN, LSTM или GRU не могут представлять наиболее базовую эвристику постоянного предсказания (PF), то есть не существует параметров, при которых hi=xi для всех входных последовательностей.
Анализ проблемы:
Теорема 3 (субоптимальность перекрёстной энтропии для упорядочивания): существуют бесконечные тройки (y,s1,s2), где rank(s1)=rank(y) и rank(s2)=rank(y), но ℓCE(s1,y)>ℓCE(s2,y).
Решение: применение Lambda-потери:
ℓLambda(s,y)=∑yi>yjlog2(1+e−σ(sπi−sπj)1)δij∣Aπi−Aπj∣
в сочетании с парной маржинальной регуляризацией:
ℓReg(s,y)=∑yi>yjmax(0,−(sπi−sπj)+Δ)
Традиционные исследования сосредоточены на структурной выразительной способности, измеряемой тестом WL, тогда как данная работа сосредоточена на функциональной выразительной способности, то есть способности представлять конкретные математические операции.
Недавние исследования показали, что простые эвристические методы превосходят сложные TGNN на нескольких эталонах; данная работа впервые явно использует формальную эквивалентность эвристик и SSM для проектирования архитектуры.
Существующие методы включают архитектуры на основе памяти (TGN, DyRep) и без памяти (DyGFormer, GraphMixer), но ни одна не может эффективно решать специальные требования задачи предсказания сродства узлов.
Недостатки существующих TGNN при предсказании сродства узлов обусловлены ограничениями выразительной способности и несоответствием целей обучения
Линейные модели пространства состояний обеспечивают теоретическую основу для обобщения эвристических методов
NAVIS эффективно решает задачу предсказания сродства узлов путём объединения виртуального глобального состояния и потери, чувствительной к упорядочиванию
Системы рекомендаций: предсказание сродства пользователей к товарам
Социальные сети: предсказание интенсивности взаимодействия пользователей
Финансовые сети: предсказание интенсивности торговых отношений
Сети цепочки поставок: предсказание отношений сотрудничества
Общая оценка: это высококачественная исследовательская статья, которая путём глубокого теоретического анализа выявляет недостатки существующих методов и предлагает эффективные решения. Модель NAVIS имеет разумное проектирование, убедительные экспериментальные результаты и положительный вклад в область обучения на временных графах. Основная ценность статьи заключается в предоставлении новой теоретической перспективы и практической методологической базы.