2025-11-12T21:37:09.934839

Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems

Yang, Yao, Tang et al.

Fluid antenna systems (FAS) enable dynamic antenna positioning, offering new opportunities to enhance integrated sensing and communication (ISAC) performance. However, existing studies primarily focus on communication enhancement or single-target sensing, leaving multi-target scenarios underexplored. Additionally, the joint optimization of beamforming and antenna positions poses a highly non-convex problem, with traditional methods becoming impractical as the number of fluid antennas increases. To address these challenges, this letter proposes a block coordinate descent (BCD) framework integrated with a deep reinforcement learning (DRL)-based approach for intelligent antenna positioning. By leveraging the deep deterministic policy gradient (DDPG) algorithm, the proposed framework efficiently balances sensing and communication performance. Simulation results demonstrate the scalability and effectiveness of the proposed approach.

academic

Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems

基本信息

论文ID: 2501.01281
标题: Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems
作者: Shunxing Yang, Junteng Yao, Jie Tang, Tuo Wu, Maged Elkashlan, Chau Yuen, Mérouane Debbah, Hyundong Shin, Matthew Valenti
分类: eess.SP (Electrical Engineering and Systems Science - Signal Processing)
发表时间: 2025年1月2日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2501.01281

摘要

流体天线系统(FAS)能够实现动态天线定位，为增强集成感知与通信(ISAC)性能提供了新机遇。然而，现有研究主要关注通信增强或单目标感知，多目标场景尚未得到充分探索。此外，波束成形和天线位置的联合优化构成了一个高度非凸问题，随着流体天线数量的增加，传统方法变得不切实际。为了解决这些挑战，本文提出了一个集成深度强化学习(DRL)的块坐标下降(BCD)框架用于智能天线定位。通过利用深度确定性策略梯度(DDPG)算法，所提出的框架有效地平衡了感知和通信性能。仿真结果证明了所提方法的可扩展性和有效性。

研究背景与动机

问题定义

本研究要解决的核心问题是在多目标ISAC系统中，如何通过流体天线系统实现波束成形和天线位置的联合优化，以同时满足通信和多目标感知的性能需求。

问题重要性

6G网络需求: ISAC作为6G无线网络的关键创新，需要在共享频谱资源上同时实现通信和感知功能
空间资源利用: 传统固定位置天线(FPA)系统在空间资源利用方面存在根本性限制
多目标场景: 现实应用中往往需要同时感知多个目标，这增加了系统设计的复杂性

现有方法局限性

研究范围受限: 现有FAS研究主要关注通信增强或单目标感知，多目标场景研究不足
优化复杂度: 波束成形和天线位置的联合优化是高度非凸问题，传统交替优化方法在天线数量增加时变得不可行
离散化处理: 部分研究只考虑激活哪些端口，而非连续优化天线位置

研究动机

基于上述限制，本文旨在开发一个能够处理多目标感知场景的智能天线定位方案，通过深度强化学习实现实时决策和可扩展的优化。

核心贡献

多目标ISAC系统设计: 首次系统性地研究了FAS在多目标感知场景下的应用，填补了现有研究的空白
BCD-DRL混合框架: 提出了将块坐标下降与深度强化学习相结合的新颖优化框架
连续位置优化: 实现了对天线位置的连续优化，而非仅仅是离散端口选择
可扩展性验证: 通过仿真验证了方法在多用户、多目标场景下的可扩展性和实时性

方法详解

任务定义

输入:

基站N个流体天线的位置约束区域At
用户终端单个流体天线的位置约束区域Ar
K个感知目标的位置信息
信道参数和系统约束

输出:

优化的波束成形矩阵U
基站流体天线位置p = p1, p2, ..., pN
用户终端天线位置q

约束条件:

最大发射功率约束: Tr(U) ≤ Pmax
感知增益约束: ϖ(p(k)) ≥ Γ, ∀k ∈ K
天线间最小距离约束: ||pα - pβ||2 ≥ Ds
秩一约束: rank(U) = 1

模型架构

1. BCD框架整体设计

算法采用块坐标下降方法，将原始非凸问题分解为两个子问题：

子问题1: 固定天线位置，优化发射协方差矩阵(凸优化)
子问题2: 固定波束成形矩阵，优化天线位置(DRL求解)

2. 发射协方差矩阵优化

对于固定的天线位置，通过暂时松弛秩一约束，将问题转化为凸优化：

$\max_{U \succeq 0} \log_2\left(1 + \frac{f(p,q)Uf^{\dagger}(p,q)}{\sigma^2}\right)$

使用CVX工具箱求解，若解的秩大于1，则采用高斯随机化重构秩一解。

3. DDPG-based天线位置优化

MDP建模:

状态空间: $s_t \in \mathbb{R}^{2(N+1)+3}$ ，包含所有天线坐标和波束成形特征
动作空间: $a_t \in \mathbb{R}^{2(N+1)}$ ，表示天线位置的增量调整
奖励函数: $r_t = R(s_t, a_t) - \alpha_1\sum_{m=1}^{M}\max(0, \varpi(p^{(m)}) - \Gamma) - \alpha_2\max(0, P_{max} - \text{Tr}(U)) - \alpha_3\frac{1}{N+1}\sum_{i=1}^{N+1}||\Delta p_i||_2$