2025-11-16T20:04:19.781760

In-Context Learning for Non-Stationary MIMO Equalization

Jiang, Qin, Zhu

Channel equalization is fundamental for mitigating distortions such as frequency-selective fading and inter-symbol interference. Unlike standard supervised learning approaches that require costly retraining or fine-tuning for each new task, in-context learning (ICL) adapts to new channels at inference time with only a few examples. However, existing ICL-based equalizers are primarily developed for and evaluated on static channels within the context window. Indeed, to our knowledge, prior principled analyses and theoretical studies of ICL focus exclusively on the stationary setting, where the function remains fixed within the context. In this paper, we investigate the ability of ICL to address non-stationary problems through the lens of time-varying channel equalization. We employ a principled framework for designing efficient attention mechanisms with improved adaptivity in non-stationary tasks, leveraging algorithms from adaptive signal processing to guide better designs. For example, new attention variants can be derived from the Least Mean Square (LMS) adaptive algorithm, a Least Root Mean Square (LRMS) formulation for enhanced robustness, or multi-step gradient updates for improved long-term tracking. Experimental results demonstrate that ICL holds strong promise for non-stationary MIMO equalization, and that attention mechanisms inspired by classical adaptive algorithms can substantially enhance adaptability and performance in dynamic environments. Our findings may provide critical insights for developing next-generation wireless foundation models with stronger adaptability and robustness.

academic

非定常MIMO等化のための文脈内学習

基本情報

論文ID: 2510.08711
タイトル: In-Context Learning for Non-Stationary MIMO Equalization
著者: Jiachen Jiang¹, Zhen Qin²³⁴, Zhihui Zhu¹
- ¹オハイオ州立大学コンピュータサイエンス・エンジニアリング学部
- ²³⁴ミシガン大学計算発見・エンジニアリング研究所、電気工学・コンピュータサイエンス学部、統計学部
分類: cs.LG cs.AI
投稿日: 2025年10月9日（arXiv）
論文リンク: https://arxiv.org/abs/2510.08711

要旨

チャネル等化は周波数選択性フェージングとシンボル間干渉などの歪みを軽減するための基礎技術である。新しいタスクごとに高コストな再学習または微調整が必要な標準的な教師あり学習方法とは異なり、文脈内学習（ICL）は推論時に少数のサンプルのみを用いて新しいチャネルに適応することができる。しかし、既存のICLベースの等化器は主に文脈ウィンドウ内の静的チャネルに対して開発・評価されている。著者らの知る限り、ICLの原理的分析と理論研究は定常設定に特化しており、文脈内で関数が固定されている。本論文は時変チャネル等化の観点から、ICLが非定常問題を解決する能力を調査する。著者らは原理的フレームワークを採用して適応性を改善した効率的な注意機構を設計し、適応信号処理アルゴリズムを活用してより良い設計を指導する。

研究背景と動機

問題定義

チャネル等化は無線通信システムにおける中核技術であり、周波数選択性フェージングとシンボル間干渉などのチャネルによる歪みを補償するために用いられる。時変チャネル環境では、チャネル行列は動的に進化し、通常は部分的にしか観測できないため、等化器は限定的またはノイズを含む観測に基づいて継続的に適応することが必要である。

既存手法の限界

従来手法：ゼロ強制（ZF）等化、線形最小二乗誤差（LMMSE）等化器、適応等化器などは正確なチャネル知識を必要とする
学習手法：深層学習、メタ学習、強化学習などの手法は通常、各タスクに対して独立したモデルの学習または追加のパラメータ更新を必要とする
既存ICL手法：主に文脈ウィンドウ内の静的チャネルを仮定し、標準的なソフトマックス注意を使用しており、急速なチャネル変化と時間的相関の捕捉を妨げる可能性がある

研究動機

論文は2つの中核的な問題を提起している：

ICLは文脈からタスクを識別するだけでなく、タスクの時変変化を追跡できるか？
非定常設定では、ソフトマックス注意が最適な選択であるか、それとも適応性を強化するための新しい注意機構の変種を開発できるか？

核心的貢献

ICLフレームワークの拡張：ICLを関数クラスから時変関数クラスへ拡張し、チャネル等化問題に対してインスタンス化
新規注意機構：古典的適応信号処理アルゴリズムに基づいた注意機構設計フレームワークを提案
3つの注意変種：
- LMS注意：最小二乗平均（LMS）適応アルゴリズムに基づく
- Multi-LMS注意：多段階更新戦略により長期動態を捕捉
- LRMS注意：最小根二乗平均（LRMS）公式に基づき堅牢性を強化
理論的接続：LMS触発更新とDeltaNet注意機構間の原理的接続を確立

方法の詳細

タスク定義

先前の入出力対のセット（文脈C = {(xᵢ,yᵢ)}ᴷᵢ₌₁）が与えられた場合、基礎となるチャネルの明示的な知識なしに、新しい受信観測yₖ₊₁から送信信号xₖ₊₁を推論することが目標である。

チャネルモデル

時変m₁×m₂ MIMO自己回帰モデルを採用：

Hᵢ = ρHᵢ₋₁ + √(1-ρ²)Wᵢ, i = 2,...,K

ここで：

ρ ∈ [0,1)：記憶係数、チャネル時変率を制御
Hᵢ ∈ ℂᵐ²ˣᵐ¹：複素値チャネル行列
Wᵢ ~ CN(0,σ²ᵨI)：加法性ノイズ行列

離散時間MIMOシステムモデル：

yᵢ = Qᵦ(Hᵢxᵢ + eᵢ), i = 1,...,K

適応注意機構設計

1. LMS注意

ソフトマックス関数を除去した後、出力はoᵢ = Sᵢqᵢとなり、状態行列Sᵢはテスト時回帰問題を解くことで更新される：

Sᵢ ≈ argmin_{S∈ℝᵈˣᵈ} L(S) = 1/2 Σⱼ₌₁ᶦ ||vⱼ - Skⱼ||₂²

1段階勾配降下更新を採用：

Sᵢ = Sᵢ₋₁ - βᵢ(Sᵢ₋₁kᵢ - vᵢ)kᵢᵀ

2. Multi-LMS注意

適応速度と安定性を改善するため、M段階閉形式拡張を提案：

Sᵢ = Sᵢ₋₁ - [1-(1-βᵢ||kᵢ||₂²)ᴹ]/||kᵢ||₂² (Sᵢ₋₁kᵢ - vᵢ)kᵢᵀ

3. LRMS注意

根二乗平均損失を採用して堅牢性を強化：

L(S) = 1/2 Σⱼ₌₁ᶦ ||vⱼ - Skⱼ||₂

対応する再帰形式：

Sᵢ = Sᵢ₋₁ - βᵢ [(Sᵢ₋₁kᵢ - vᵢ)/||Sᵢ₋₁kᵢ - vᵢ||₂] kᵢᵀ

技術的革新点

理論的基礎：古典的適応フィルタリングと現代的注意機構の理論的関連性を確立
計算効率：LMS注意はソフトマックスの計算オーバーヘッドを回避
堅牢性設計：LRMSは正規化項を通じて信頼性の低い更新を適応的に低重み付け
長期追跡：Multi-LMSは多段階更新により長期チャネル動態追跡を改善

実験設定

データセット

モデルアーキテクチャ：2層GPT-2トランスフォーマー（埋め込み次元64、層あたり4注意ヘッド）
チャネル構成：2×2時変MIMOシステム
入力信号：正規化QPSK星座
量子化：b ビット均一量子化器、範囲-4,4
訓練セット規模：8192個の事前学習チャネル
文脈長：K = 20

評価指標

平均二乗誤差（MSE）：

MSE(θ) = E[||fθ(C,yₖ₊₁) - xₖ₊₁||²]

実験パラメータ

記憶係数ρ：[0.9,1)から均一にサンプリング
信号対雑音比SNR：0,30 dBからサンプリング
量子化ビット数b：整数範囲1,6からサンプリング
チャネル変化ノイズレベル：σᵨ = 0.1
訓練：Adam最適化器、50000ステップ、バッチサイズ128

比較手法

LMMSE等化器（理論的ベンチマーク）
ソフトマックス注意に基づくICL等化器
LMS注意に基づくICL等化器

実験結果

主要結果

図1の実験結果から以下が観察される：

全体的性能：ICL等化器はすべての設定においてLMMSEを上回る
注意機構の比較：LMS注意はソフトマックス注意と同等またはそれ以上の性能を示す
パラメータ感度：
- 記憶係数ρ、SNR、または量子化ビット数を増加させると、推定誤差が継続的に低下
- LMS注意は計算負担を軽減するだけでなく、精度を維持または改善