2025-11-15T02:43:10.578367

On Random Sampling of Diffused Graph Signals with Sparse Inputs on Vertex Domain

Lai, Chai, Xu
The sampling of graph signals has recently drawn much attention due to the wide applications of graph signal processing. While a lot of efficient methods and interesting results have been reported to the sampling of band-limited or smooth graph signals, few research has been devoted to non-smooth graph signals, especially to sparse graph signals, which are also of importance in many practical applications. This paper addresses the random sampling of non-smooth graph signals generated by diffusion of sparse inputs. We aim to present a solid theoretical analysis on the random sampling of diffused sparse graph signals, which can be parallel to that of band-limited graph signals, and thus present a sufficient condition to the number of samples ensuring the unique recovery for uniform random sampling. Then, we focus on two classes of widely used binary graph models, and give explicit and tighter estimations on the sampling numbers ensuring unique recovery. We also propose an adaptive variable-density sampling strategy to provide a better performance than uniform random sampling. Finally, simulation experiments are presented to validate the effectiveness of the theoretical results.
academic

On Random Sampling of Diffused Graph Signals with Sparse Inputs on Vertex Domain

基本信息

  • 论文ID: 2412.20041
  • 标题: On Random Sampling of Diffused Graph Signals with Sparse Inputs on Vertex Domain
  • 作者: Yingcheng Lai, Li Chai, Jinming Xu (浙江大学控制科学与工程学院)
  • 分类: eess.SP (电气工程与系统科学 - 信号处理)
  • 发表时间: 2024年12月28日
  • 论文链接: https://arxiv.org/abs/2412.20041

摘要

图信号采样由于图信号处理的广泛应用而备受关注。虽然针对带限或平滑图信号的采样已有许多高效方法和有趣结果,但对非平滑图信号,特别是稀疏图信号的研究较少,而这在许多实际应用中同样重要。本文研究由稀疏输入扩散生成的非平滑图信号的随机采样问题,旨在为扩散稀疏图信号的随机采样提供扎实的理论分析,并给出均匀随机采样确保唯一恢复的采样数量充分条件。文章重点分析了两类广泛使用的二元图模型,给出了确保唯一恢复的采样数量的显式和更紧的估计,还提出了一种自适应变密度采样策略以提供比均匀随机采样更好的性能。

研究背景与动机

问题背景

  1. 图信号处理的重要性:图作为建模非结构化数据及其复杂交互的强大框架,在社交网络、脑网络、交通网络等领域有广泛应用
  2. 采样问题的挑战:现实网络中顶点数量通常巨大,从所有顶点收集信息非常困难,因此采样和恢复问题成为图信号处理的核心问题之一

现有方法的局限性

  1. 研究重点偏向:现有大部分研究集中在平滑图信号(带限图信号)的采样和恢复,假设图信号在图傅里叶基上具有近似带限特性
  2. 非平滑信号研究不足:对由稀疏输入局部扩散生成的非平滑图信号研究较少,这类信号在实际应用中同样重要
  3. 理论保证缺乏:缺乏针对扩散稀疏图信号的明确理论保证,特别是采样数量与网络结构关系的理论分析

研究动机

文章要解决三个关键问题:

  1. 对于给定的图扩散模型,需要采样多少顶点才能确保稀疏输入的准确重构?
  2. 采样数量与网络结构之间的关系是什么?
  3. 是否存在比均匀随机采样具有更高恢复精度的替代采样策略?

核心贡献

  1. 理论保证:提出了确保均匀随机采样下信号重构唯一性的充分条件,揭示了采样数量与不相干参数μ、稀疏条件数κ(Γ)和稀疏度k的关系
  2. 网络结构分析
    • 对于Erdős-Rényi(ER)随机网络,证明了约~log n个样本足够确保恢复唯一性
    • 揭示了连接概率与所需采样数量的关系,发现连接概率为0.5时所需采样数量最少
    • 对于小世界网络,表征了所需采样数量与重连概率的关系
  3. 新采样策略:提出了自适应变密度采样策略,利用变密度采样技术提供比均匀随机采样更少样本的性能保证
  4. 实验验证:通过仿真实验验证了理论结果的有效性

方法详解

任务定义

考虑扩散图信号模型:

x = Hα

其中:

  • H是图扩散矩阵
  • α ∈ Rⁿ是稀疏输入,稀疏度为k(即‖α‖₀ ≤ k)
  • 目标是通过随机采样一定数量的顶点来恢复稀疏输入α

采样模型

设M = {ω₁, ..., ωₘ}为采样集,采样矩阵Cₘ定义为:

[Cₘ]ᵢ,ⱼ = {1, if j = ωᵢ; 0, otherwise}

观测信号为:

y = CₘHα = Hₘα

其中Hₘ = CₘH。

核心理论结果

主要定理(Theorem 1)

在均匀随机采样下,当满足以下条件时,问题(P1)以1-e⁻ᵋ-3/n的概率有唯一最小化解:

m ≥ C(1+ε)μ²kκ(Γ)(log n + log μ)

其中:

  • μ是不相干参数
  • κ(Γ)是稀疏条件数
  • Γ = mEH*ₘHₘ⁻¹

关键定义

  1. 不相干参数(Definition 1):
max₁≤ᵢ,ⱼ≤ₙ{|hᵢ,ⱼ|} ≤ μ, max₁≤ᵢ,ⱼ≤ₙ{|[HΓ]ᵢ,ⱼ|} ≤ μ
  1. 稀疏条件数(Definition 2):
κ(X) = max{cond(k,X), cond(k,X⁻¹)}

特定网络分析

Erdős-Rényi随机网络

对于连接概率为b的ER随机网络,在二元扩散模型H = I + δA下:

m ≥ C(1+ε)k³/²(log n - log δ²(b-b²))/(δ²(b-b²))

关键发现:

  • 当b = 0.5时,所需采样数量最少
  • 当b趋向0或1时,需要采样所有顶点

小世界网络

对于度数为d、重连概率为b的小世界网络:

m ≥ C(1+ε)kμ²·Δκ·(log n + log μ)

其中Δκ与d-正则图的邻接矩阵相关,随重连概率b的增加而减少。

变密度采样策略

定义每个顶点i的权重:

φᵢ = max_{j=1,...,n}{|hᵢ,ⱼ|}
φ̃ᵢ = max_{j=1,...,n}{|[HΓ]ᵢ,ⱼ|}

采样概率为:

pᵢ = √(φᵢφ̃ᵢ)/Σⱼ√(φⱼφ̃ⱼ)

该策略的采样上界为:

m ≥ C(1+ε)φ̄²kκ(Γ)(log n + log φ̄)

其中φ̄是平均权重,总是不大于不相干参数μ。

实验设置

实验配置

  • 使用GSP工具箱生成不同类型的图
  • 采用基追踪算法求解问题(P1)
  • 评价指标:归一化平均恢复误差‖α-α̂‖₂/‖α̂‖₂
  • 每个采样数量进行500次迭代并取平均值

实验场景

  1. Example I:不同图类型(正则图、ER随机图、星形图)的比较
  2. Example II:不同连接概率的ER随机网络
  3. Example III:不同重连概率的小世界网络
  4. Example IV:双随机矩阵扩散模型下的变密度采样

实验结果

主要发现

不同图类型比较

  • ER随机图相比正则图和星形图需要更少的采样数量
  • 这与理论分析一致:ER随机图具有较小的μ和κ(Γ)值

ER随机网络分析

  • 连接概率b = 0.3和b = 0.7时恢复性能相近,符合理论预测的对称性
  • 极端连接概率(接近0或1)需要更多采样数量

小世界网络分析

  • 随着重连概率增加,所需采样数量减少
  • 验证了理论分析中条件数随重连概率降低的结论

变密度采样效果

  • 变密度采样策略相比均匀随机采样能够在一定程度上改善恢复性能

数值结果

实验结果表明:

  • 对于ER随机网络,确实只需要~log n个样本即可确保稀疏信号恢复
  • 网络结构参数(如连接概率、重连概率)显著影响所需采样数量
  • 变密度采样在实际应用中具有优势

相关工作

图信号处理采样理论

  1. 平滑信号采样:Pesenson等人的开创性工作,Anis等人的必要充分条件
  2. 采样策略:确定性采样(贪心优化)和随机采样(变密度概率采样)
  3. 扩展研究:有向图、特殊图信号类型

压缩感知理论

  1. 经典结果:RIP条件、互不相干性条件
  2. 字典学习:冗余字典的压缩感知
  3. 应用领域:MRI重建、信道编码、数据压缩

扩散模型相关工作

  1. 已知扩散模型:Ramírez等人的恢复算法设计
  2. 未知扩散模型:盲辨识问题的联合估计方法
  3. 应用背景:社交网络谣言源识别、生物信号反问题

结论与讨论

主要结论

  1. 理论贡献:建立了扩散稀疏图信号随机采样的完整理论框架
  2. 网络结构洞察:揭示了采样性能与网络拓扑结构的深层关系
  3. 算法改进:提出的变密度采样策略具有理论保证和实际优势

局限性

  1. 假设条件:需要假设EH*ₘHₘ可逆(Assumption 1)
  2. 计算复杂度:稀疏条件数κ(Γ)的计算可能较为复杂
  3. 实际应用:理论结果中的常数C可能在实际应用中需要进一步优化

未来方向

  1. 网络结构探索:如何利用网络结构设计更好的恢复算法
  2. 算法优化:针对特定网络类型的专门算法设计
  3. 应用扩展:在更多实际场景中验证理论结果

深度评价

优点

  1. 理论严谨性:提供了完整的数学证明框架,采用了成熟的压缩感知理论工具
  2. 实用价值:针对两类重要网络模型给出了显式的采样数量估计
  3. 创新性:首次系统性地分析了扩散稀疏图信号的随机采样问题
  4. 实验充分:通过多个实验场景验证了理论结果的有效性

不足

  1. 常数优化:理论结果中的常数C可能不够紧致,实际应用中可能需要更少样本
  2. 计算效率:稀疏条件数的计算复杂度分析不够充分
  3. 网络模型限制:主要分析了二元扩散模型,对其他扩散模型的扩展性有限

影响力

  1. 学术贡献:为图信号处理领域的非平滑信号采样理论填补了重要空白
  2. 实用价值:为大规模网络中的信号采样提供了理论指导
  3. 可复现性:实验设置清晰,理论推导详细,具有良好的可复现性

适用场景

  1. 社交网络分析:谣言传播源识别、意见扩散分析
  2. 流行病学:疫情传播源追踪、传播路径分析
  3. 脑网络研究:神经信号的稀疏表示和采样
  4. 城市感知:智能城市中的传感器网络优化部署

参考文献

论文引用了44篇相关文献,主要包括:

  • 图信号处理基础理论(Ortega et al., Shuman et al.)
  • 压缩感知理论(Candès & Tao, Baraniuk et al.)
  • 图采样理论(Pesenson, Anis et al.)
  • 扩散模型相关工作(Ramírez et al., Segarra et al.)

本论文在图信号处理的理论基础上,针对实际应用中重要的稀疏扩散信号采样问题提供了系统性的理论分析和实用算法,是该领域的重要贡献。