We propose the Soft Graph Transformer (SGT), a soft-input-soft-output neural architecture designed for MIMO detection. While Maximum Likelihood (ML) detection achieves optimal accuracy, its exponential complexity makes it infeasible in large systems, and conventional message-passing algorithms rely on asymptotic assumptions that often fail in finite dimensions. Recent Transformer-based detectors show strong performance but typically overlook the MIMO factor graph structure and cannot exploit prior soft information. SGT addresses these limitations by combining self-attention, which encodes contextual dependencies within symbol and constraint subgraphs, with graph-aware cross-attention, which performs structured message passing across subgraphs. Its soft-input interface allows the integration of auxiliary priors, producing effective soft outputs while maintaining computational efficiency. Experiments demonstrate that SGT achieves near-ML performance and offers a flexible and interpretable framework for receiver systems that leverage soft priors.
academic
Мягкий графовый трансформатор для обнаружения MIMO
В данной работе предлагается мягкий графовый трансформатор (Soft Graph Transformer, SGT) — нейросетевая архитектура с мягким входом и мягким выходом, специально разработанная для обнаружения MIMO. Хотя обнаружение по максимальному правдоподобию (ML) достигает оптимальной точности, его экспоненциальная сложность неприемлема для крупномасштабных систем, а традиционные алгоритмы передачи сообщений полагаются на асимптотические предположения, которые часто нарушаются при конечных размерностях. Недавние детекторы на основе трансформаторов показывают хорошие результаты, но обычно игнорируют структуру факторного графа MIMO и не могут использовать априорную мягкую информацию. SGT решает эти ограничения путём объединения механизма самовнимания (кодирование контекстных зависимостей внутри символов и подграфов ограничений) и механизма кросс-внимания, осведомлённого о графе (выполнение структурированной передачи сообщений между подграфами). Его интерфейс мягкого входа позволяет интегрировать вспомогательные априорные данные, производя эффективный мягкий выход при сохранении вычислительной эффективности.
Системы MIMO являются основой современной беспроводной связи, обеспечивая высокую спектральную эффективность и надёжные каналы, однако эффективное обнаружение символов остаётся сложной задачей.
Обнаружение по максимальному правдоподобию: Хотя достигает оптимальной точности, вычислительная сложность составляет O(M^Nt) (где M — количество точек созвездия), что неприемлемо для крупномасштабных систем
Алгоритмы передачи сообщений: Такие как AMP, OAMP, MAMP, хотя и имеют меньшую сложность, полагаются на асимптотические предположения и хрупки при конечных размерностях
Методы глубокого развёртывания: Такие как OAMP-Net, DetNet, изучают параметры алгоритма на основе данных, но остаются ограничены предположениями исходного алгоритма
Существующие методы на основе трансформаторов:
RE-MIMO лишён явного осознания графа
Трансформатор-based MIMO использует QR-разложение, но это дорогостоящо и игнорирует структуру факторного графа
Предложена архитектура SGT: Первый детектор MIMO, объединяющий самовнимание, управляемое факторным графом, и кросс-внимание в рамках AMP-подобной архитектуры
Метод токенизации, осведомлённый о графе: Преобразование взвешенного плотного факторного графа системы MIMO в двойное представление подграфа, подходящее для обработки трансформатором
Интерфейс мягкого входа-мягкого выхода: Естественная интеграция внешней априорной информации из других модулей приёмника
Улучшение производительности: Достижение близкой к ML точности обнаружения в малых системах MIMO и демонстрация более благоприятного квадратичного роста сложности в крупномасштабных системах
Структурированный дизайн внимания: В отличие от CrossMPT, SGT объединяет самовнимание и кросс-внимание, учитывая однородную природу подграфов MIMO
Преимущества сохранения информации: По сравнению с методами, использующими QR-разложение, токенизация, осведомлённая о графе, сохраняет больше информации на уровне символов
Унифицированная архитектура: Объединение обновлений, вдохновлённых AMP, с архитектурой трансформатора для реализации интерпретируемой передачи сообщений
SGT является первым детектором MIMO, явно интегрирующим структуру факторного графа в архитектуру трансформатора, унифицирующим кодирование контекста и передачу сообщений.
Статья цитирует важные работы в областях обнаружения MIMO, алгоритмов передачи сообщений, глубокого обучения и трансформаторов, в частности:
Основополагающие работы серии алгоритмов AMP 1-3
Представительные работы методов глубокого развёртывания 4-6
Оригинальная статья об архитектуре трансформатора 7
Связанные работы о системах коммуникации на основе трансформаторов 8-11
Общая оценка: Это статья с высокой технической инновационностью, успешно объединяющая архитектуру трансформатора со структурой факторного графа обнаружения MIMO, предлагающая метод SGT с теоретической базой и практической ценностью. Хотя остаётся место для улучшения в вычислительной эффективности и масштабе улучшения производительности, работа предоставляет ценное исследование применения глубокого обучения в структурированных задачах обработки сигналов.