2025-11-12T21:37:09.934839

Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems

Yang, Yao, Tang et al.

Fluid antenna systems (FAS) enable dynamic antenna positioning, offering new opportunities to enhance integrated sensing and communication (ISAC) performance. However, existing studies primarily focus on communication enhancement or single-target sensing, leaving multi-target scenarios underexplored. Additionally, the joint optimization of beamforming and antenna positions poses a highly non-convex problem, with traditional methods becoming impractical as the number of fluid antennas increases. To address these challenges, this letter proposes a block coordinate descent (BCD) framework integrated with a deep reinforcement learning (DRL)-based approach for intelligent antenna positioning. By leveraging the deep deterministic policy gradient (DDPG) algorithm, the proposed framework efficiently balances sensing and communication performance. Simulation results demonstrate the scalability and effectiveness of the proposed approach.

academic

지능형 안테나 위치 결정을 향하여: FAS 지원 ISAC 시스템을 위한 DRL 활용

기본 정보

논문 ID: 2501.01281
제목: Towards Intelligent Antenna Positioning: Leveraging DRL for FAS-Aided ISAC Systems
저자: Shunxing Yang, Junteng Yao, Jie Tang, Tuo Wu, Maged Elkashlan, Chau Yuen, Mérouane Debbah, Hyundong Shin, Matthew Valenti
분류: eess.SP (전기공학 및 시스템 과학 - 신호 처리)
발표 시간: 2025년 1월 2일 (arXiv 사전 인쇄본)
논문 링크: https://arxiv.org/abs/2501.01281

초록

유동 안테나 시스템(FAS)은 동적 안테나 위치 결정을 가능하게 하며, 통합 감지 및 통신(ISAC) 성능 향상을 위한 새로운 기회를 제공합니다. 그러나 기존 연구는 주로 통신 향상 또는 단일 목표 감지에 초점을 맞추고 있으며, 다중 목표 시나리오는 충분히 탐색되지 않았습니다. 또한 빔포밍과 안테나 위치의 결합 최적화는 고도로 비볼록한 문제를 구성하며, 유동 안테나 수가 증가함에 따라 기존 방법은 비실용적이 됩니다. 이러한 과제를 해결하기 위해 본 논문은 지능형 안테나 위치 결정을 위해 심층 강화 학습(DRL)을 통합한 블록 좌표 하강(BCD) 프레임워크를 제안합니다. 심층 결정론적 정책 그래디언트(DDPG) 알고리즘을 활용함으로써, 제안된 프레임워크는 감지 및 통신 성능을 효과적으로 균형 있게 유지합니다. 시뮬레이션 결과는 제안된 방법의 확장성과 유효성을 입증합니다.

연구 배경 및 동기

문제 정의

본 연구가 해결하고자 하는 핵심 문제는 다중 목표 ISAC 시스템에서 유동 안테나 시스템을 통해 빔포밍과 안테나 위치의 결합 최적화를 달성하여 통신 및 다중 목표 감지 성능 요구사항을 동시에 충족하는 방법입니다.

문제의 중요성

6G 네트워크 요구사항: ISAC는 6G 무선 네트워크의 핵심 혁신으로서, 공유 주파수 자원에서 통신 및 감지 기능을 동시에 구현해야 합니다.
공간 자원 활용: 기존의 고정 위치 안테나(FPA) 시스템은 공간 자원 활용 측면에서 근본적인 제한이 있습니다.
다중 목표 시나리오: 실제 응용에서는 종종 여러 목표를 동시에 감지해야 하며, 이는 시스템 설계의 복잡성을 증가시킵니다.

기존 방법의 한계

연구 범위 제한: 기존 FAS 연구는 주로 통신 향상 또는 단일 목표 감지에 초점을 맞추고 있으며, 다중 목표 시나리오 연구는 부족합니다.
최적화 복잡도: 빔포밍과 안테나 위치의 결합 최적화는 고도로 비볼록한 문제이며, 안테나 수가 증가할 때 기존의 교대 최적화 방법은 실행 불가능해집니다.
이산화 처리: 일부 연구는 어떤 포트를 활성화할지만 고려하고 안테나 위치의 연속 최적화는 고려하지 않습니다.

연구 동기

위의 제한사항을 바탕으로, 본 논문은 다중 목표 감지 시나리오를 처리할 수 있는 지능형 안테나 위치 결정 방안을 개발하고, 심층 강화 학습을 통해 실시간 의사결정 및 확장 가능한 최적화를 구현하는 것을 목표로 합니다.

핵심 기여

다중 목표 ISAC 시스템 설계: 다중 목표 감지 시나리오에서 FAS의 적용을 처음으로 체계적으로 연구하여 기존 연구의 공백을 메웁니다.
BCD-DRL 하이브리드 프레임워크: 블록 좌표 하강과 심층 강화 학습을 결합한 새로운 최적화 프레임워크를 제안합니다.
연속 위치 최적화: 단순한 이산 포트 선택이 아닌 안테나 위치의 연속 최적화를 구현합니다.
확장성 검증: 다중 사용자, 다중 목표 시나리오에서 방법의 확장성과 실시간성을 시뮬레이션으로 검증합니다.

방법론 상세 설명

작업 정의

입력:

기지국 N개 유동 안테나의 위치 제약 영역 At
사용자 단말 단일 유동 안테나의 위치 제약 영역 Ar
K개 감지 목표의 위치 정보
채널 매개변수 및 시스템 제약

출력:

최적화된 빔포밍 행렬 U
기지국 유동 안테나 위치 p = p1, p2, ..., pN
사용자 단말 안테나 위치 q

제약 조건:

최대 송신 전력 제약: Tr(U) ≤ Pmax
감지 이득 제약: ϖ(p(k)) ≥ Γ, ∀k ∈ K
안테나 간 최소 거리 제약: ||pα - pβ||2 ≥ Ds
랭크-1 제약: rank(U) = 1

모델 아키텍처

1. BCD 프레임워크 전체 설계

알고리즘은 블록 좌표 하강 방법을 채택하여 원래의 비볼록 문제를 두 개의 부분 문제로 분해합니다:

부분 문제 1: 안테나 위치 고정, 송신 공분산 행렬 최적화(볼록 최적화)
부분 문제 2: 빔포밍 행렬 고정, 안테나 위치 최적화(DRL 해결)

2. 송신 공분산 행렬 최적화

고정된 안테나 위치에 대해, 랭크-1 제약을 일시적으로 완화하여 문제를 볼록 최적화로 변환합니다:

$\max_{U \succeq 0} \log_2\left(1 + \frac{f(p,q)Uf^{\dagger}(p,q)}{\sigma^2}\right)$

CVX 도구상자를 사용하여 해결하며, 해의 랭크가 1보다 크면 가우스 무작위화를 사용하여 랭크-1 해를 재구성합니다.

3. DDPG 기반 안테나 위치 최적화

MDP 모델링:

상태 공간: $s_t \in \mathbb{R}^{2(N+1)+3}$ , 모든 안테나 좌표 및 빔포밍 특성 포함
동작 공간: $a_t \in \mathbb{R}^{2(N+1)}$ , 안테나 위치의 증분 조정 표현
보상 함수: $r_t = R(s_t, a_t) - \alpha_1\sum_{m=1}^{M}\max(0, \varpi(p^{(m)}) - \Gamma) - \alpha_2\max(0, P_{max} - \text{Tr}(U)) - \alpha_3\frac{1}{N+1}\sum_{i=1}^{N+1}||\Delta p_i||_2$

네트워크 아키텍처:

액터 네트워크: 3층 완전 연결 네트워크(400-300 뉴런), 출력층은 tanh 활성화 및 스케일링 사용
크리틱 네트워크: 상태-동작 쌍 처리, Q값 추정 출력
목표 네트워크: 소프트 업데이트 정책을 사용한 안정적인 훈련

기술 혁신 포인트

상태 공간 설계: 공간 구성 정보와 빔포밍 특성을 혁신적으로 융합하며, 대각합, 최대 고유값 및 평균 고유값 포함
보상 함수 설계: 다중 목표 보상 함수는 통신 속도, 감지 제약, 전력 제약 및 이동 비용을 동시에 고려
탐색 정책: Ornstein-Uhlenbeck 프로세스를 사용하여 시간 상관 탐색 노이즈 생성, 물리적 제어 작업에 적합
연속 최적화: 이산 선택이 아닌 진정한 연속 위치 최적화 구현

실험 설정

시뮬레이션 매개변수

채널 모델: 원거리 모델, 피치각 및 방위각 θ, ψ는 0,π 내에서 독립 동일 분포
안테나 제약: 최소 거리 D = λ/2, 이동 범위 A×A, 최대 변위 A = 4λ
경로 설정: 송신 및 수신 경로 수 D = I = 3
전력 비: LoS에서 NLoS 경로 전력 비 τ = 1
네트워크 매개변수: 경험 재생 버퍼 10000, 배치 크기 64, 소프트 업데이트 매개변수 τ = 0.001

평가 지표

통신 성능: 평균 통신 속도 및 최대 통신 속도(bps/Hz)
시스템 구성: 다양한 안테나 수 N(4,8,12) 및 목표 수 K(1,3)의 조합
사용자 수: 단일 사용자(M=1) 및 다중 사용자(M=3) 시나리오

비교 방법

FPA 기준선: 고정 위치 안테나 시스템을 벤치마크로 사용
다양한 구성 비교: 안테나 수 및 목표 수 변화에 따른 성능 비교

실험 결과

주요 결과

평균 통신 속도 분석:

FAS는 모든 구성에서 FPA 기준선을 크게 능가합니다.
목표 수 K가 증가함에 따라 ISAC 제약이 더 엄격해지고 통신 속도가 감소합니다.
다중 목표 시나리오(K>1)에서도 FAS의 통신 속도는 단일 목표 FPA보다 높습니다.

최대 통신 속도 향상:

30dB SNR, N=12 안테나 구성에서:
- M=1: 11.64 bps/Hz
- M=3: 14.84 bps/Hz
- 향상 폭: 27.6%

확장성 검증

안테나 수 확장: N=4에서 N=12로 확장 시 성능이 지속적으로 향상됩니다.
목표 수 적응: 단일 목표에서 다중 목표 시나리오로의 전환을 효과적으로 처리합니다.
사용자 수 확장: 다중 사용자 시나리오에서 현저한 성능 향상을 달성합니다.

실험 발견

FAS 우위 현저: 모든 테스트 시나리오에서 FAS는 FPA에 비해 명확한 우위를 보입니다.
다중 목표 균형: 감지 목표 수 증가는 통신 성능을 감소시키지만, FAS는 이러한 균형을 더 잘 유지합니다.
확장성 우수: DRL 프레임워크는 더 복잡한 다중 사용자 환경에 원활하게 적응할 수 있습니다.

결론 및 토론

주요 결론

제안된 BCD-DRL 프레임워크는 FAS 지원 다중 목표 ISAC 시스템 최적화 문제를 효과적으로 해결할 수 있습니다.
DDPG 알고리즘은 빔포밍과 안테나 위치의 결합 최적화를 성공적으로 구현합니다.
시뮬레이션 결과는 방법의 확장성과 다중 목표 시나리오에서의 유효성을 입증합니다.

한계

시뮬레이션 환경: 연구는 시뮬레이션 환경을 기반으로 하며, 실제 배포에서의 하드웨어 제약 및 채널 모델 복잡성이 충분히 고려되지 않았습니다.
계산 복잡도: 확장 가능한 방안을 제안했지만, 대규모 시스템의 실시간 계산 요구사항은 여전히 추가 검증이 필요합니다.
견고성: 채널 추정 오류 및 환경 변화에 대한 견고성 분석이 제한적입니다.

향후 방향

하드웨어 구현: 실제 FAS 하드웨어 제약을 고려한 시스템 설계
견고성 향상: 채널 불확실성 및 환경 변화에 대한 적응 능력 개선
대규모 배포: 더 큰 규모의 안테나 배열 및 사용자 수에 대한 최적화 전략 연구

심층 평가

장점

문제의 중요성: FAS-ISAC 시스템의 핵심 기술 과제를 해결하며 중요한 이론적 및 실용적 가치를 가집니다.
방법 혁신: BCD-DRL 하이브리드 프레임워크의 설계는 정교하며 볼록 최적화와 강화 학습을 유기적으로 결합합니다.
기술 깊이: MDP 모델링이 합리적이며 상태 공간과 보상 함수 설계가 주의 깊게 고려되었습니다.
실험 충분성: 다양한 구성에서의 시뮬레이션 검증은 방법의 유효성과 확장성을 입증합니다.

부족한 점

이론 분석: 수렴성 및 복잡도에 대한 이론 분석이 부족합니다.
제한된 비교: 주로 FPA 기준선과 비교하며 다른 고급 방법과의 비교가 부족합니다.
실제 제약: 실제 배포에서의 공학적 제약 및 제한사항이 충분히 고려되지 않았습니다.
매개변수 민감도: 초매개변수 선택에 대한 민감도 분석이 부족합니다.

영향력

학술 기여: FAS-ISAC 시스템 최적화를 위한 새로운 연구 방향 및 기술 경로를 제공합니다.
실용적 가치: 6G 네트워크의 지능형 안테나 시스템 설계에 참고 자료를 제공합니다.
재현성: 방법 설명이 상세하지만 코드 및 상세 매개변수 설정은 공개되지 않았습니다.

적용 시나리오

6G 통신 시스템: 특히 통신과 다중 목표 감지를 동시에 수행해야 하는 시나리오에 적합합니다.
지능형 교통: 차량 통신망에서의 다중 목표 감지 및 통신
산업용 IoT: 스마트 제조에서의 장비 모니터링 및 데이터 전송
스마트 시티: 도시 환경에서의 다기능 기지국 배포

참고 문헌

논문은 11개의 관련 참고 문헌을 인용하며, FAS, ISAC, 심층 강화 학습 등 핵심 분야의 중요한 연구를 포함하여 연구에 견고한 이론적 기초를 제공합니다.

종합 평가: 이는 FAS-ISAC 시스템 최적화 분야에서 혁신적인 해결책을 제시한 기술 품질이 우수한 논문입니다. 이론 분석 및 실제 배포 고려 측면에서 개선의 여지가 있지만, 기술 기여도와 실험 검증이 충분하며 관련 분야의 발전에 긍정적인 추진력을 가집니다.