2025-11-13T11:28:10.724842

Semantic Communication Enabled Holographic Video Processing and Transmission

Ying, Qi, Feng et al.

Holographic video communication is considered a paradigm shift in visual communications, becoming increasingly popular for its ability to offer immersive experiences. This article provides an overview of holographic video communication and outlines the requirements of a holographic video communication system. Particularly, following a brief review of semantic com- munication, an architecture for a semantic-enabled holographic video communication system is presented. Key technologies, including semantic sampling, joint semantic-channel coding, and semantic-aware transmission, are designed based on the proposed architecture. Two related use cases are presented to demonstrate the performance gain of the proposed methods. Finally, potential research topics are discussed to pave the way for the realization of semantic-enabled holographic video communications.

academic

Semantic Communication Enabled Holographic Video Processing and Transmission

基本信息

论文ID: 2510.13408
标题: Semantic Communication Enabled Holographic Video Processing and Transmission
作者: Jingkai Ying, Zhiyuan Qi, Yulong Feng, Zhijin Qin, Zhu Han, Rahim Tafazolli, Yonina C. Eldar
分类: eess.IV cs.AI cs.IT cs.MM eess.SP math.IT
发表时间: 2025年10月15日 (arXiv预印本)
论文链接: https://arxiv.org/abs/2510.13408

摘要

全息视频通信被认为是视觉通信领域的范式转变，因其能够提供沉浸式体验而日益受到关注。本文概述了全息视频通信并阐述了全息视频通信系统的要求。特别地，在简要回顾语义通信后，提出了一个语义增强的全息视频通信系统架构。基于所提出的架构设计了关键技术，包括语义采样、联合语义-信道编码和语义感知传输。通过两个相关用例展示了所提方法的性能增益。最后，讨论了潜在的研究方向，为实现语义增强全息视频通信铺平道路。

研究背景与动机

问题定义

全息视频通信(HVC)作为未来视觉通信的主导范式，面临着巨大的技术挑战：

数据量爆炸性增长：全息视频需要0.1-1 Tbps的传输带宽，峰值可达10 Tbps
严格的延迟要求：空中接口传输延迟需小于1ms，端到端网络延迟需小于20ms
高可靠性需求：数据包错误率需达到10^-7级别
现有系统局限性：即使6G网络也无法完全保证支持高质量HVC服务

研究重要性

全息视频通信是实现元宇宙和众多应用(如全息会议、教育、娱乐)的关键技术，被6G无线网络确定为沉浸式通信的典型用例之一。

现有方法局限性

现有全息视频传输研究主要存在以下问题：

基于传统比特传输范式，资源消耗巨大
缺乏针对全息内容特性的优化设计
未充分利用深度学习的强大非线性表示能力

研究动机

语义通信通过传输信息的含义而非比特，能够有效提取和压缩全息内容中的有意义信息，显著降低带宽需求，并通过端到端联合训练提供全局最优性能。

核心贡献

提出了新颖的语义感知全息视频通信架构：集成语义采样、联合语义-信道编码、语义感知传输等关键模块
设计了基于注意力机制的语义感知采样方法：能够捕获点云的关键区域
开发了高效鲁棒的联合语义-信道编码调制方案：基于语义特征和信道条件自适应传输点云
提供了两个用例验证：展示了语义采样和联合编码调制的性能增益

方法详解

任务定义

本文研究如何将语义通信技术应用于全息视频传输，特别关注点云数据的高效传输。输入为原始全息数据(主要是点云)，输出为在接收端重建的高质量全息内容，约束条件包括带宽限制、延迟要求和信道噪声。

模型架构

整体系统架构

提出的语义感知HVC系统采用服务器作为中间处理节点，形成上行和下行传输链路：

上行链路：

传感器 → 语义采样 → 联合语义-信道编码 → 语义感知传输 → 服务器解码重建

下行链路：

服务器 → 联合语义-信道编码 → 语义感知传输 → 用户端解码显示

关键模块设计

语义采样模块
- 使用多层感知机(MLP)将点嵌入潜在空间
- 将点云划分为补丁，每个补丁包含一个中心点及其k个最近邻
- 局部注意力层处理每个补丁的嵌入生成中间特征和语义图
- 基于归一化标准差计算每个点的得分并选择前M个点
联合语义-信道编码(JSCC)
- 编码器：采用PointNet++进行初始处理，使用Point Transformer进行语义特征细化
- 双分支设计：主分支捕获细粒度结构特征，辅助分支提取粗粒度语义特征
- 解码器：使用Point Transformer细化噪声特征，通过上采样重建输入点云
语义感知传输
- 可微分调制模型：将JSCC输出的语义特征作为调制星座点位置的概率
- 自适应传输：根据JSCC输出生成分割点，分割点后的星座点不传输
- 信道自适应：将信道信息与JSCC输出连接学习更鲁棒的特征