2025-11-12T21:37:09.934839

Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems

Yang, Yao, Tang et al.

Fluid antenna systems (FAS) enable dynamic antenna positioning, offering new opportunities to enhance integrated sensing and communication (ISAC) performance. However, existing studies primarily focus on communication enhancement or single-target sensing, leaving multi-target scenarios underexplored. Additionally, the joint optimization of beamforming and antenna positions poses a highly non-convex problem, with traditional methods becoming impractical as the number of fluid antennas increases. To address these challenges, this letter proposes a block coordinate descent (BCD) framework integrated with a deep reinforcement learning (DRL)-based approach for intelligent antenna positioning. By leveraging the deep deterministic policy gradient (DDPG) algorithm, the proposed framework efficiently balances sensing and communication performance. Simulation results demonstrate the scalability and effectiveness of the proposed approach.

academic

インテリジェントアンテナポジショニングに向けて：DRLを活用したFAS支援ISAC システム

基本情報

論文ID: 2501.01281
タイトル: Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems
著者: Shunxing Yang, Junteng Yao, Jie Tang, Tuo Wu, Maged Elkashlan, Chau Yuen, Mérouane Debbah, Hyundong Shin, Matthew Valenti
分類: eess.SP（電気工学およびシステム科学 - 信号処理）
発表日: 2025年1月2日（arXiv プレプリント）
論文リンク: https://arxiv.org/abs/2501.01281

要約

流体アンテナシステム（FAS）は動的アンテナポジショニングを実現し、統合センシング・通信（ISAC）性能の向上に新たな機会をもたらします。しかし、既存研究は主に通信強化または単一目標センシングに焦点を当てており、マルチターゲットシナリオは十分に探索されていません。さらに、ビームフォーミングとアンテナ位置の共同最適化は高度に非凸問題を構成し、流体アンテナ数の増加に伴い従来の手法は実用的でなくなります。これらの課題に対処するため、本論文はインテリジェントアンテナポジショニングのための深度強化学習（DRL）を統合したブロック座標降下法（BCD）フレームワークを提案します。深度決定論的方針勾配（DDPG）アルゴリズムを活用することで、提案フレームワークはセンシングと通信性能を効果的にバランスさせます。シミュレーション結果は提案手法のスケーラビリティと有効性を実証しています。

研究背景と動機

問題定義

本研究が解決する中核的な問題は、マルチターゲットISACシステムにおいて、流体アンテナシステムを通じてビームフォーミングとアンテナ位置の共同最適化を実現し、通信とマルチターゲットセンシングの性能要件を同時に満たす方法です。

問題の重要性

6Gネットワーク要件: ISACは6G無線ネットワークの重要なイノベーションとして、共有スペクトラムリソース上で通信とセンシング機能を同時に実現する必要があります
空間リソース利用: 従来の固定位置アンテナ（FPA）システムは空間リソース利用に根本的な制限があります
マルチターゲットシナリオ: 実際のアプリケーションでは複数の目標を同時にセンシングする必要があり、これはシステム設計の複雑性を増加させます

既存手法の限界

研究範囲の制限: 既存のFAS研究は主に通信強化または単一目標センシングに焦点を当てており、マルチターゲットシナリオの研究が不足しています
最適化の複雑性: ビームフォーミングとアンテナ位置の共同最適化は高度に非凸問題であり、従来の交互最適化手法はアンテナ数の増加に伴い実行不可能になります
離散化処理: 一部の研究はどのポートをアクティブにするかのみを考慮し、アンテナ位置の連続最適化は行いません

研究動機

上記の制限に基づき、本論文はマルチターゲットセンシングシナリオに対応できるインテリジェントアンテナポジショニング方案を開発することを目指し、深度強化学習を通じてリアルタイム決定とスケーラブルな最適化を実現します。

核心的貢献

マルチターゲットISACシステム設計: マルチターゲットセンシングシナリオにおけるFASの応用を初めて体系的に研究し、既存研究のギャップを埋めます
BCD-DRLハイブリッドフレームワーク: ブロック座標降下法と深度強化学習を組み合わせた新規最適化フレームワークを提案します
連続位置最適化: 離散ポート選択ではなく、アンテナ位置の連続最適化を実現します
スケーラビリティ検証: マルチユーザー、マルチターゲットシナリオにおける手法のスケーラビリティとリアルタイム性をシミュレーションで検証します

手法の詳細

タスク定義

入力:

基地局のN個の流体アンテナの位置制約領域 $A_t$
ユーザー端末の単一流体アンテナの位置制約領域 $A_r$
K個のセンシング目標の位置情報
チャネルパラメータとシステム制約

出力:

最適化されたビームフォーミング行列 $U$
基地局流体アンテナ位置 $p = [p_1, p_2, ..., p_N]$
ユーザー端末アンテナ位置 $q$

制約条件:

最大送信電力制約: $\text{Tr}(U) \leq P_{\max}$
センシングゲイン制約: $\varpi(p^{(k)}) \geq \Gamma, \forall k \in K$
アンテナ間最小距離制約: $||p_\alpha - p_\beta||_2 \geq D_s$
ランク1制約: $\text{rank}(U) = 1$

モデルアーキテクチャ

1. BCDフレームワーク全体設計

アルゴリズムはブロック座標降下法を採用し、元の非凸問題を2つの部分問題に分解します：

部分問題1: アンテナ位置を固定し、送信共分散行列を最適化（凸最適化）
部分問題2: ビームフォーミング行列を固定し、アンテナ位置を最適化（DRLで求解）

2. 送信共分散行列最適化

固定されたアンテナ位置に対して、ランク1制約を一時的に緩和することで、問題を凸最適化に変換します：

$\max_{U \succeq 0} \log_2\left(1 + \frac{f(p,q)Uf^{\dagger}(p,q)}{\sigma^2}\right)$

CVXツールボックスを使用して求解し、解のランクが1より大きい場合、ガウス確率化を採用してランク1解を再構成します。

3. DDPG ベースのアンテナ位置最適化

MDP モデリング:

状態空間: $s_t \in \mathbb{R}^{2(N+1)+3}$ 、すべてのアンテナ座標とビームフォーミング特性を含む
行動空間: $a_t \in \mathbb{R}^{2(N+1)}$ 、アンテナ位置の増分調整を表す
報酬関数: $r_t = R(s_t, a_t) - \alpha_1\sum_{m=1}^{M}\max(0, \varpi(p^{(m)}) - \Gamma) - \alpha_2\max(0, P_{\max} - \text{Tr}(U)) - \alpha_3\frac{1}{N+1}\sum_{i=1}^{N+1}||\Delta p_i||_2$