2025-11-17T00:37:13.163900

Phase Transitions of the Additive Uniform Noise Channel with Peak Amplitude and Cost Constraint

Stapmanns, Dias, Eilers et al.
Under which condition is quantization optimal? We address this question in the context of the additive uniform noise channel under peak amplitude and cost constraints. We compute analytically the capacity-achieving input distribution as a function of the noise level, the average cost constraint, and the curvature of the cost function. We find that when the cost function is concave, the capacity-achieving input distribution is discrete, whereas when the cost function is convex and the cost constraint is active, the support of the capacity-achieving input distribution spans the entire interval. For the cases of a discrete capacity-achieving input distribution, we derive the analytical expressions for the capacity of the channel.
academic

Phase Transitions of the Additive Uniform Noise Channel with Peak Amplitude and Cost Constraint

基本信息

  • 论文ID: 2510.12427
  • 标题: Phase Transitions of the Additive Uniform Noise Channel with Peak Amplitude and Cost Constraint
  • 作者: Jonas Stapmanns, Luke Eilers, Catarina Dias, Tobias Kühn, Jean-Pascal Pfister
  • 分类: cs.IT math.IT
  • 发表时间/会议: IEEE International Symposium on Information Theory (ISIT) 2025 (部分内容)
  • 论文链接: https://arxiv.org/abs/2510.12427

摘要

在什么条件下量化是最优的?本文在具有峰值幅度和成本约束的加性均匀噪声信道背景下解决这一问题。我们解析计算了达到容量的输入分布,作为噪声水平、平均成本约束和成本函数曲率的函数。研究发现,当成本函数为凹函数时,达到容量的输入分布是离散的;而当成本函数为凸函数且成本约束激活时,达到容量的输入分布的支撑集跨越整个区间。对于离散容量达到输入分布的情况,我们推导出了信道容量的解析表达式。

研究背景与动机

核心问题

本文研究的核心问题是:在什么条件下量化输入是信息论上的最优选择?这是一个基础性的信息论问题,涉及离散输入分布与连续输入分布的效率比较。

问题重要性

  1. 理论意义:自Shannon引入信道容量概念以来,容量达到输入分布一直是信息论研究的核心问题
  2. 实际应用:在许多实际系统中,特别是在峰值幅度约束下,容量达到输入分布往往是离散的
  3. 生物学应用:在生物神经网络中,信号通常是离散的(如动作电位),理解离散性的最优条件具有重要意义

现有方法局限性

现有研究主要通过非构造性方法分析离散性条件,如Das、Tchamkerten和Fahs等人的工作,但这些方法不易于详细分析可能的相变现象。

研究动机

本文选择加性均匀噪声信道作为研究对象,因为它允许完全解析的处理,从而能够详细研究容量达到输入分布从离散到连续支撑集的相变现象。

核心贡献

  1. 完整的相变分析:首次完整描述了容量达到输入分布从离散到连续支撑集的相变条件
  2. 解析解:提供了加性均匀噪声信道在峰值幅度和成本约束下的完整解析解
  3. 相变机制识别:识别出两种导致相变的机制:
    • 成本函数从凹函数变为凸函数
    • 在凸成本函数下,成本预算低于临界值
  4. 容量公式:推导出离散情况下的精确容量表达式
  5. 构造性证明:提供了构造性的证明方法,能够明确分析相变现象

方法详解

任务定义

考虑加性均匀噪声信道: Y=X+N,NUniform(b,b)Y = X + N, \quad N \sim \text{Uniform}(-b, b)

约束条件:

  • 峰值幅度约束P(X<0)=P(X>1)=0P(X < 0) = P(X > 1) = 0
  • 成本约束cα(x)cˉ\langle c_\alpha(x) \rangle \leq \bar{c}

其中成本函数cα(x)=xαc_\alpha(x) = x^\alpha满足:

  • 0<α<10 < \alpha < 1:严格凹函数
  • α=1\alpha = 1:线性函数
  • α>1\alpha > 1:严格凸函数

优化框架

使用拉格朗日乘数法构造优化问题: L[pX,ν,λ]=L0[pX,ν]λ(01pX(x)c(x)dxcˉ)\mathcal{L}[p_X, \nu, \lambda] = \mathcal{L}_0[p_X, \nu] - \lambda\left(\int_0^1 p_X(x)c(x)dx - \bar{c}\right)

其中L0\mathcal{L}_0包含互信息项和归一化约束。

Smith最优性条件

容量达到输入分布pXp_X^*必须满足:

  • 不等式约束i(x;pX)I(pX)+λ(c(x)cˉ)i(x; p_X^*) \leq I(p_X^*) + \lambda(c(x) - \bar{c}) 对所有x[0,1]x \in [0,1]
  • 等式约束i(x;pX)=I(pX)+λ(c(x)cˉ)i(x; p_X^*) = I(p_X^*) + \lambda(c(x) - \bar{c}) 对所有xSx \in S(支撑集)

其中i(x;pX)i(x; p_X)是边际信息密度。

技术创新点

1. 分类讨论策略

根据噪声参数r=1/(2b)r = 1/(2b)是否为整数,分别处理:

  • rNr \in \mathbb{N}:噪声输出不重叠
  • rNr \notin \mathbb{N}:噪声输出重叠,需要更复杂的分析

2. 构造性证明方法

采用"猜测-验证"的构造性方法:

  1. 猜测支撑集SS
  2. 求解等式约束得到质量分布
  3. 验证不等式约束
  4. 证明唯一性

3. 边际信息密度的分段线性性

引理13证明了边际信息密度在相邻支撑点间是线性的,这是验证不等式约束的关键。

实验设置

理论验证

本文主要是理论工作,通过解析推导验证结果。数值验证使用Blahut-Arimoto算法进行对比。

参数设置

  • 噪声参数:r{2,2.4,3.9,4,4.4,6.2}r \in \{2, 2.4, 3.9, 4, 4.4, 6.2\}
  • 成本函数指数:α{0.5,0.7,1,1.5}\alpha \in \{0.5, 0.7, 1, 1.5\}
  • 成本预算:cˉ(0,cˉ]\bar{c} \in (0, \bar{c}^*]

实验结果

主要结果

情况I:成本约束不激活(cˉcˉ\bar{c} \geq \bar{c}^*)

容量达到输入分布为离散分布,质量点数目:

n & \text{if } r \in \mathbb{N} \\ 2n & \text{if } r \notin \mathbb{N} \end{cases}$$ 其中$n = \lfloor r \rfloor + 1$。 #### 情况IIa:成本约束激活且$\alpha \leq 1$,$r \in \mathbb{N}$ 质量分布为: $$m_j = \frac{1}{z}e^{-\lambda^* c_j}, \quad z = \sum_{j=1}^{N_r} e^{-\lambda^* c_j}$$ #### 情况IIb:成本约束激活且$\alpha \leq 1$,$r \notin \mathbb{N}$ 存在$n-1$个阈值$0 < \theta_{n-2} < \ldots < \theta_0 < \bar{c}^*$,支撑集根据成本预算分段确定。 #### 情况III:$\alpha > 1$且成本约束激活 容量达到输入分布的支撑集包含成本函数严格凸的区间,特别地,若$c(x)$在$[0,1]$上严格凸,则支撑集为整个区间$[0,1]$。 ### 容量公式 对于离散情况,容量为: - $r \in \mathbb{N}$:$C = \log(n)$(无约束)或$C = H(m)$(有约束) - $r \notin \mathbb{N}$:$C = \rho\log(n+1) + (1-\rho)\log(n)$(无约束)或$C = \rho H(\hat{m}) + (1-\rho)H(\bar{m})$(有约束) 其中$\rho = r - \lfloor r \rfloor$,$H(\cdot)$是熵函数。 ### 数值验证 图7显示了理论结果与Blahut-Arimoto算法的数值结果完全吻合,验证了理论分析的正确性。 ## 相关工作 ### 经典研究 - **Shannon (1948)**:建立了信道容量的基础理论 - **Smith (1971)**:研究了高斯加性噪声信道的容量达到输入分布 - **Oettli (1974)**:分析了分段常数噪声的加性信道 ### 离散性条件研究 - **Das (2000)**、**Tchamkerten (2004)**、**Fahs & Abou-Faycal (2018)**:研究了容量达到输入分布离散性的一般条件 - **Dytso等 (2018-2020)**:在各种约束下研究了容量达到输入分布 ### 本文与相关工作的关系 本文是Oettli工作的扩展,通过引入可调的成本约束,实现了连续到离散的相变分析。与Tchamkerten的工作相比,本文提供了必要充分条件而非仅充分条件,且考虑有界噪声而非无界噪声。 ## 结论与讨论 ### 主要结论 1. **相变机制**:识别出两种相变机制:成本函数曲率变化和成本预算变化 2. **支撑集结构**:当成本函数凹时,支撑集总是原问题支撑集的子集 3. **等价性**:离散情况下,信道容量等价于无噪声信道的容量 ### 局限性 1. **噪声类型限制**:仅考虑均匀噪声,其他噪声类型的扩展需要进一步研究 2. **成本函数形式**:主要分析幂函数形式的成本函数 3. **维度限制**:仅考虑一维情况 ### 未来方向 1. **噪声扩展**:将结果扩展到更一般的加性噪声,如$p_N(N) \propto \exp(-|N/N_0|^\gamma)$ 2. **约束软化**:考虑软峰值约束,如$c(x) = x^\alpha + x^\beta$ 3. **高维扩展**:研究向量高斯信道的$L_1$球约束情况 4. **生物应用**:在神经科学和基因表达等生物系统中的应用 ## 深度评价 ### 优点 1. **理论完整性**:提供了完整的解析解和严格的数学证明 2. **方法创新**:构造性证明方法使得相变分析成为可能 3. **结果深度**:不仅给出了相变条件,还提供了精确的容量公式 4. **写作清晰**:论文结构清晰,数学推导严谨 5. **实用价值**:结果对理解实际通信系统和生物系统具有指导意义 ### 不足 1. **适用范围**:结果限于特定的噪声模型和约束形式 2. **计算复杂性**:对于$r \notin \mathbb{N}$的情况,分析相当复杂 3. **数值验证**:主要依赖理论推导,数值实验相对简单 ### 影响力 1. **理论贡献**:为信息论中的离散性问题提供了新的分析框架 2. **方法论意义**:构造性证明方法可能适用于其他信道模型 3. **跨学科价值**:在神经科学、统计学习等领域具有潜在应用 ### 适用场景 1. **通信系统设计**:在功率或幅度受限的通信系统中优化输入分布 2. **神经编码**:理解生物神经网络中离散信号的最优性 3. **统计推断**:在约束优化问题中选择最优先验分布 ## 参考文献 本文引用了信息论领域的经典文献,包括Shannon的开创性工作、Smith关于高斯信道的研究,以及近年来关于容量达到输入分布离散性的重要研究。特别值得注意的是与Oettli、Tchamkerten等人工作的对比和扩展。 --- **总体评价**:这是一篇高质量的理论信息论论文,通过严格的数学分析解决了一个基础性问题。论文的主要价值在于提供了完整的解析解和深入的相变分析,为理解量化最优性条件提供了重要洞察。虽然结果限于特定模型,但方法论具有一般性意义,可能启发更广泛的研究。