2025-11-23T02:01:16.750653

Multi-product Influence Maximization in Billboard Advertisement

Ali, Islam, Banerjee
Billboard Advertisement has emerged as an effective out-of-home advertisement technique where the goal is to select a limited number of slots and play advertisement content over there with the hope that this will be observed by many people, and effectively, a significant number of them will be influenced towards the brand. Given a trajectory and a billboard database and a positive integer $k$, how can we select $k$ highly influential slots to maximize influence? In this paper, we study a variant of this problem where a commercial house wants to make a promotion of multiple products, and there is an influence demand for each product. We have studied two variants of the problem. In the first variant, our goal is to select $k$ slots such that the respective influence demand of each product is satisfied. In the other variant of the problem, we are given with $\ell$ integers $k_1,k_2, \ldots, k_{\ell}$, the goal here is to search for $\ell$ many set of slots $S_1, S_2, \ldots, S_{\ell}$ such that for all $i \in [\ell]$, $|S_{i}| \leq k_i$ and for all $i \neq j$, $S_i \cap S_j=\emptyset$ and the influence demand of each of the products gets satisfied. We model the first variant of the problem as a multi-submodular cover problem and the second variant as its generalization. For solving the first variant, we adopt the bi-criteria approximation algorithm, and for the other variant, we propose a sampling-based approximation algorithm. Extensive experiments with real-world trajectory and billboard datasets highlight the effectiveness and efficiency of the proposed solution approach.
academic

Multi-product Influence Maximization in Billboard Advertisement

基本信息

  • 论文ID: 2510.09050
  • 标题: Multi-product Influence Maximization in Billboard Advertisement
  • 作者: Dildar Ali (IIT Jammu), Rajibul Islam (Gandhi Institute for Technological Advancement), Suman Banerjee (IIT Jammu)
  • 分类: cs.DS (Data Structures and Algorithms), cs.DB (Databases)
  • 发表时间: 2025年10月10日 (arXiv预印本)
  • 论文链接: https://arxiv.org/abs/2510.09050

摘要

户外广告牌已成为一种有效的户外广告技术,其目标是选择有限数量的时段并在其中播放广告内容,希望能被许多人观察到,并有效地影响相当数量的人对品牌的态度。本文研究了一个变体问题:商业公司希望推广多种产品,每种产品都有影响力需求。研究了两个问题变体:第一个变体的目标是选择k个时段,使每种产品的相应影响力需求得到满足;第二个变体中,给定ℓ个整数k₁,k₂,...,k_ℓ,目标是寻找ℓ个时段集合S₁,S₂,...,S_ℓ,满足互不相交且每种产品的影响力需求都得到满足。

研究背景与动机

问题背景

  1. 户外广告的重要性: 商业公司通常将总收入的7-10%用于广告,户外广告牌因其投资回报保证和易用性成为有效方法
  2. 传统问题的局限性: 现有研究主要关注单一广告商的影响力最大化或多广告商间的遗憾最小化
  3. 实际需求: 商业公司通常需要同时推广多种异构产品,每种产品针对不同的客户群体

研究动机

  • 实践需求: 现实中广告商需要在统一预算内满足多种产品的不同影响力需求
  • 理论空白: 现有文献缺乏针对多产品广告牌时段选择问题的研究
  • 技术挑战: 需要在满足各产品影响力约束的同时最小化总成本

核心贡献

  1. 问题扩展: 将影响力时段选择问题扩展到多产品广告场景,研究了两个相关的问题变体
  2. 理论建模: 将第一个变体建模为多子模覆盖问题,第二个变体建模为其泛化版本
  3. 算法设计:
    • 为第一个变体采用双准则近似算法
    • 为第二个变体提出基于采样的近似算法
  4. 效率优化: 开发了高效的启发式解决方案以解决可扩展性问题
  5. 实验验证: 在真实轨迹和广告牌数据集上进行了广泛实验

方法详解

任务定义

输入:

  • 轨迹数据库D: 包含用户位置-时间信息和产品兴趣
  • 广告牌数据库B: 包含广告牌位置、时段和成本信息
  • 成本函数c: BS → R⁺
  • 产品集合P = {1,2,...,ℓ}

两个问题变体:

  1. Common Multi-Product Slot Selection Problem:
    • 选择单一时段集合S ⊆ BS
    • 最小化总成本∑_{s∈S} c(s)
    • 满足约束: ∀j ∈ , I_j(S) ≥ k_j
  2. Disjoint Multi-Product Slot Selection Problem:
    • 选择ℓ个互不相交的时段集合S₁,S₂,...,S_ℓ
    • 满足: |S_j| ≤ k_j, S_i ∩ S_j = ∅ (i≠j), I_j(S_j) ≥ σ_j

核心技术

1. 影响力函数建模

产品j的影响力函数定义为:

I_j(S) = ∑_{u_i∈U_j} [1 - ∏_{s_j∈S} (1 - Pr(s_j, u_i))]

其中U_j是对产品j感兴趣的用户集合,Pr(s_j, u_i)是时段s_j对用户u_i的影响概率。

2. 子模性质

影响力函数具有子模性质,满足边际递减效应:

f(A ∪ {e}) - f(A) ≥ f(B ∪ {e}) - f(B), ∀A ⊆ B

算法架构

Algorithm 1: Common Slot Selection的双准则近似算法

  1. 标准化: 将每个产品的影响力函数标准化,使I_j(BS) = 1
  2. 连续贪心: 使用多线性扩展在拟阵多面体上求解分数解
  3. 随机舍入: 采样ℓ = ⌈log_{1/(1-ε)}(r)⌉个随机子集
  4. 修复步骤: 对未满足约束的产品贪心添加时段

Algorithm 2: Disjoint Slot Selection的采样算法

  1. 排列采样: 随机采样产品-时段分配的排列
  2. 贪心分配: 按排列顺序为每个产品贪心选择时段
  3. 可行性检查: 验证是否满足所有约束
  4. 最优选择: 返回成本最小的可行解

技术创新点

  1. 多线性扩展应用: 将子模函数的连续扩展技术应用于多产品场景
  2. 采样复杂度分析: 使用Hoeffding不等式分析采样算法的样本复杂度
  3. 双准则近似: 在满足影响力约束的同时提供成本近似保证

实验设置

数据集

  1. New York City (NYC):
    • 227,428个签到记录 (2012年4月-2013年2月)
    • 1,083个独特用户
    • 716个广告牌,1,031,040个时段
  2. Los Angeles (LA):
    • 74,170个签到记录,覆盖15条街道
    • 2,000个独特用户
    • 1,483个广告牌,2,135,520个时段

评价指标

  • 影响力: 各产品达到的总影响力
  • 时段数量: 分配给各产品的时段总数
  • 计算时间: 算法执行时间
  • 成本: 时段选择的总成本

对比方法

  1. Random Allocation (RA): 随机选择时段分配给产品
  2. Top-k Allocation: 按影响力值排序,优先分配高影响力时段

关键参数

  • 需求供给比α: 全局影响力需求与总供给的比例 (40%-120%)
  • 个体需求比β: 平均个体需求与总供给的比例 (1%-20%)
  • 产品数量|P|: 5, 10, 20, 50, 100
  • 距离参数λ: 25m-150m
  • 近似参数ε: 0.01-0.2

实验结果

主要结果

影响力性能

  • NYC数据集: BCA方法比基线方法高20-25%,RA方法表现最佳
  • LA数据集: BCA方法比基线方法高8-10%
  • 当α≥100%且β≥10%时,需求超过供给,BCA方法优于基线但RA方法无可行解

时段分配效率

  • 随着α和β增加,各产品分配的时段数量增加
  • Top-k方法比Random方法分配更少时段
  • BCA方法分配时段数多于RA和基线方法(因为需要满足所有产品需求)

计算复杂度

  • 时间复杂度:
    • BCA算法: O(n²ℓ/ε + nℓ)
    • RA算法: O(|X|·ℓ·B_max/c_min·n·t)
  • RA方法计算时间最长(需考虑大量排列)
  • BCA方法时间适中,随α和β增长缓慢

成本效率

  • RA方法在成本方面表现最优,使用最小成本满足所有产品需求
  • 随着需求增加,所有方法的分配成本都上升

理论保证

BCA算法的近似比

定理: 设r为稀疏度(任一时段最多贡献的函数数),ε > 0。BCA算法以高概率返回集合S满足:

  • 对所有j ∈ : I_j(S) ≥ (1 - 1/e - ε)·k_j
  • 期望成本: Ec(S) = O(1/ε·log r)·OPT

采样复杂度

定理: 对于任意ε,δ ∈ (0,1),如果样本大小≥ ln(2/δ)·c(BS)²/(2ε²·(W_A)²),则计算误差小于ε的概率至少为(1-δ)。

相关工作

影响力时段选择

  • 子模图方法: 基于剪枝子模图的方法
  • 分支定界框架: 精确算法框架
  • 贪心解决方案: 基于边际收益的贪心算法
  • 协作进化方法: Wang等人提出的Co-operative Co-Evolutionary方法

遗憾最小化

  • 局部搜索方法: Zhang等人的局部搜索解决方案
  • 区域约束: Ali等人在区域影响约束下的遗憾最小化研究

理论基础

  • 多子模覆盖问题: Chekuri等人的随机双准则近似算法
  • 连续贪心算法: 单调子模函数的连续扩展技术

结论与讨论

主要结论

  1. 问题建模: 成功将多产品广告牌问题建模为多子模覆盖问题及其泛化
  2. 算法有效性: 提出的算法在理论和实践中都表现良好
  3. 实用价值: 方法适用于任何多产品户外广告场景

局限性

  1. 计算复杂度: RA算法的指数级时间复杂度限制了大规模应用
  2. 假设条件: 假设影响力函数具有子模性质,实际中可能不完全满足
  3. 数据依赖: 需要准确的轨迹数据和用户产品偏好信息
  4. 静态模型: 未考虑动态环境中需求和供给的变化

未来方向

  1. 动态优化: 考虑时变的影响力需求和用户行为
  2. 在线算法: 开发处理实时数据流的在线优化算法
  3. 机器学习集成: 结合深度学习预测用户兴趣和影响力
  4. 多目标优化: 同时考虑成本、覆盖率和公平性等多个目标

深度评价

优点

  1. 问题重要性: 解决了实际商业环境中的重要问题,具有明确的应用价值
  2. 理论严谨: 提供了完整的理论分析,包括近似比和样本复杂度
  3. 算法创新: 巧妙地将连续贪心和随机舍入技术应用于多产品场景
  4. 实验全面: 在真实数据集上进行了充分的实验验证

不足

  1. 扩展性限制: RA算法的指数复杂度限制了其在大规模问题上的应用
  2. 基线方法简单: 对比的基线方法相对简单,缺乏与更先进方法的比较
  3. 参数敏感性: 对关键参数(如距离阈值λ)的敏感性分析不够深入
  4. 实际约束: 未充分考虑实际广告投放中的时间约束和竞争因素

影响力

  1. 学术贡献: 为多产品影响力最大化问题提供了首个系统性研究
  2. 实用价值: 可直接应用于户外广告、数字标牌等多种场景
  3. 理论意义: 扩展了子模优化理论在实际应用中的范围
  4. 可复现性: 提供了详细的算法描述和实验设置

适用场景

  1. 户外广告网络: 传统广告牌网络的多产品投放优化
  2. 数字标牌系统: 购物中心、机场等场所的数字显示屏广告
  3. 交通广告: 公交、地铁等交通工具上的广告位分配
  4. 在线广告: 可扩展到在线广告的多产品竞价和分配问题

参考文献

论文引用了22篇相关文献,主要包括:

  • 影响力最大化的经典工作 (Kempe et al., 2003)
  • 子模优化理论基础 (Calinescu et al., 2007; Vondrák, 2007)
  • 多子模覆盖问题 (Chekuri et al., 2022)
  • 广告牌广告的相关研究 (Zhang et al., 2020, 2021)
  • 概率不等式理论 (Hoeffding, 1963)

该论文在理论和实践层面都做出了重要贡献,为多产品影响力最大化问题提供了系统性的解决方案。尽管存在一些局限性,但其创新性和实用价值使其成为该领域的重要进展。