2025-11-23T02:01:16.750653

Multi-product Influence Maximization in Billboard Advertisement

Ali, Islam, Banerjee

Billboard Advertisement has emerged as an effective out-of-home advertisement technique where the goal is to select a limited number of slots and play advertisement content over there with the hope that this will be observed by many people, and effectively, a significant number of them will be influenced towards the brand. Given a trajectory and a billboard database and a positive integer $k$, how can we select $k$ highly influential slots to maximize influence? In this paper, we study a variant of this problem where a commercial house wants to make a promotion of multiple products, and there is an influence demand for each product. We have studied two variants of the problem. In the first variant, our goal is to select $k$ slots such that the respective influence demand of each product is satisfied. In the other variant of the problem, we are given with $\ell$ integers $k_1,k_2, \ldots, k_{\ell}$, the goal here is to search for $\ell$ many set of slots $S_1, S_2, \ldots, S_{\ell}$ such that for all $i \in [\ell]$, $|S_{i}| \leq k_i$ and for all $i \neq j$, $S_i \cap S_j=\emptyset$ and the influence demand of each of the products gets satisfied. We model the first variant of the problem as a multi-submodular cover problem and the second variant as its generalization. For solving the first variant, we adopt the bi-criteria approximation algorithm, and for the other variant, we propose a sampling-based approximation algorithm. Extensive experiments with real-world trajectory and billboard datasets highlight the effectiveness and efficiency of the proposed solution approach.

academic

Максимизация влияния многопродуктовой рекламы на билбордах

Основная информация

ID статьи: 2510.09050
Название: Multi-product Influence Maximization in Billboard Advertisement
Авторы: Dildar Ali (IIT Jammu), Rajibul Islam (Gandhi Institute for Technological Advancement), Suman Banerjee (IIT Jammu)
Классификация: cs.DS (Структуры данных и алгоритмы), cs.DB (Базы данных)
Дата публикации: 10 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.09050

Аннотация

Наружная реклама на билбордах стала эффективной технологией уличной рекламы, целью которой является выбор ограниченного количества временных слотов для трансляции рекламного контента, рассчитывая на наблюдение большого числа людей и эффективное влияние на отношение значительного количества потребителей к бренду. В данной работе исследуется вариант задачи, при котором коммерческие компании желают продвигать несколько продуктов, каждый из которых имеет требования по влиянию. Изучены два варианта задачи: первый вариант ставит целью выбрать k временных слотов таким образом, чтобы соответствующие требования по влиянию для каждого продукта были удовлетворены; во втором варианте, при наличии ℓ целых чисел k₁,k₂,...,k_ℓ, целью является поиск ℓ непересекающихся множеств временных слотов S₁,S₂,...,S_ℓ, удовлетворяющих условиям взаимной непересекаемости и выполнения требований по влиянию для каждого продукта.

Исследовательский контекст и мотивация

Предпосылки задачи

Значимость наружной рекламы: Коммерческие компании обычно выделяют 7-10% от общих доходов на рекламу; наружные билборды являются эффективным методом благодаря гарантированной окупаемости инвестиций и простоте использования
Ограничения традиционных подходов: Существующие исследования сосредоточены главным образом на максимизации влияния одного рекламодателя или минимизации сожаления между несколькими рекламодателями
Практические требования: Коммерческие компании обычно нуждаются в одновременном продвижении нескольких гетерогенных продуктов, каждый из которых ориентирован на различные группы потребителей

Научная мотивация

Практическая необходимость: В реальности рекламодатели должны удовлетворять различные требования по влиянию нескольких продуктов в рамках единого бюджета
Теоретический пробел: В существующей литературе отсутствуют исследования, посвящённые задаче выбора временных слотов для многопродуктовой рекламы на билбордах
Технические вызовы: Необходимо минимизировать общие затраты при одновременном удовлетворении ограничений по влиянию для каждого продукта

Основные вклады

Расширение задачи: Расширение задачи выбора временных слотов влияния на сценарий многопродуктовой рекламы на билбордах с исследованием двух связанных вариантов задачи
Теоретическое моделирование: Моделирование первого варианта как задачи многосубмодульного покрытия, второго варианта как обобщённой версии
Разработка алгоритмов:
- Применение двукритериального приближённого алгоритма для первого варианта
- Предложение алгоритма на основе выборки для второго варианта
Оптимизация эффективности: Разработка эффективных эвристических решений для решения проблем масштабируемости
Экспериментальная проверка: Проведение обширных экспериментов на реальных наборах данных траекторий и билбордов

Подробное описание методов

Определение задачи

Входные данные:

База данных траекторий D: содержит информацию о местоположении-времени пользователей и интересах к продуктам
База данных билбордов B: содержит информацию о местоположении билбордов, временных слотах и стоимости
Функция стоимости c: BS → R⁺
Множество продуктов P = {1,2,...,ℓ}

Два варианта задачи:

Задача выбора общего многопродуктового временного слота:
- Выбрать единственное множество слотов S ⊆ BS
- Минимизировать общую стоимость ∑_{s∈S} c(s)
- Удовлетворить ограничение: ∀j ∈ ℓ, I_j(S) ≥ k_j
Задача выбора непересекающихся многопродуктовых временных слотов:
- Выбрать ℓ непересекающихся множеств временных слотов S₁,S₂,...,S_ℓ
- Удовлетворить: |S_j| ≤ k_j, S_i ∩ S_j = ∅ (i≠j), I_j(S_j) ≥ σ_j

Основные технологии

1. Моделирование функции влияния

Функция влияния для продукта j определяется как:

I_j(S) = ∑_{u_i∈U_j} [1 - ∏_{s_j∈S} (1 - Pr(s_j, u_i))]

где U_j — множество пользователей, заинтересованных в продукте j, Pr(s_j, u_i) — вероятность влияния временного слота s_j на пользователя u_i.

2. Свойство субмодульности

Функция влияния обладает свойством субмодульности, удовлетворяя эффекту убывающей предельной полезности:

f(A ∪ {e}) - f(A) ≥ f(B ∪ {e}) - f(B), ∀A ⊆ B

Архитектура алгоритма

Алгоритм 1: Двукритериальный приближённый алгоритм для выбора общего слота

Нормализация: Нормализация функции влияния каждого продукта таким образом, чтобы I_j(BS) = 1
Непрерывная жадность: Использование многолинейного расширения для решения дробного решения на матроидном многограннике
Случайное округление: Выборка ℓ = ⌈log_{1/(1-ε)}(r)⌉ случайных подмножеств
Шаг восстановления: Жадное добавление временных слотов для продуктов, не удовлетворяющих ограничениям

Алгоритм 2: Алгоритм выборки для выбора непересекающихся слотов

Выборка перестановок: Случайная выборка перестановок распределения продукт-слот
Жадное распределение: Жадный выбор временных слотов для каждого продукта в порядке перестановки
Проверка допустимости: Проверка удовлетворения всех ограничений
Оптимальный выбор: Возврат допустимого решения с минимальной стоимостью

Технические инновации

Применение многолинейного расширения: Применение техники непрерывного расширения субмодульных функций к многопродуктовому сценарию
Анализ сложности выборки: Использование неравенства Хёффдинга для анализа сложности выборки алгоритма выборки
Двукритериальное приближение: Обеспечение гарантий приближения стоимости при удовлетворении ограничений влияния

Экспериментальная установка

Наборы данных

Нью-Йорк (NYC):
- 227 428 записей регистрации (апрель 2012 г. — февраль 2013 г.)
- 1 083 уникальных пользователя
- 716 билбордов, 1 031 040 временных слотов
Лос-Анджелес (LA):
- 74 170 записей регистрации, охватывающих 15 улиц
- 2 000 уникальных пользователей
- 1 483 билборда, 2 135 520 временных слотов

Метрики оценки

Влияние: Общее влияние, достигнутое каждым продуктом
Количество слотов: Общее количество временных слотов, выделенных продуктам
Время вычисления: Время выполнения алгоритма
Стоимость: Общая стоимость выбора временных слотов

Методы сравнения

Random Allocation (RA): Случайный выбор распределения временных слотов продуктам
Top-k Allocation: Приоритетное распределение временных слотов с высоким значением влияния

Ключевые параметры

Коэффициент спроса-предложения α: Отношение глобального требования влияния к общему предложению (40%-120%)
Коэффициент индивидуального спроса β: Отношение среднего индивидуального требования к общему предложению (1%-20%)
Количество продуктов |P|: 5, 10, 20, 50, 100
Параметр расстояния λ: 25м-150м
Параметр приближения ε: 0.01-0.2

Результаты экспериментов

Основные результаты

Производительность влияния

Набор данных NYC: Метод BCA показывает на 20-25% выше, чем базовые методы; метод RA показывает лучшие результаты
Набор данных LA: Метод BCA показывает на 8-10% выше, чем базовые методы
Когда α≥100% и β≥10%, спрос превышает предложение; метод BCA превосходит базовые методы, но метод RA не имеет допустимого решения

Эффективность распределения слотов

С увеличением α и β увеличивается количество временных слотов, выделяемых каждому продукту
Метод Top-k распределяет меньше слотов, чем метод Random
Метод BCA распределяет больше слотов, чем методы RA и базовые (поскольку должен удовлетворить требования всех продуктов)

Вычислительная сложность

Временная сложность:
- Алгоритм BCA: O(n²ℓ/ε + nℓ)
- Алгоритм RA: O(|X|·ℓ·B_max/c_min·n·t)
Метод RA требует наибольшего времени вычисления (необходимо рассмотрение большого количества перестановок)
Время выполнения метода BCA умеренно и растёт медленно с увеличением α и β

Эффективность затрат

Метод RA показывает оптимальные результаты по стоимости, используя минимальные затраты для удовлетворения требований всех продуктов
С увеличением требований затраты на распределение всех методов возрастают

Теоретические гарантии

Коэффициент приближения алгоритма BCA

Теорема: Пусть r — разреженность (максимальное количество функций, к которым может способствовать один слот), ε > 0. Алгоритм BCA с высокой вероятностью возвращает множество S, удовлетворяющее:

Для всех j ∈ ℓ: I_j(S) ≥ (1 - 1/e - ε)·k_j
Ожидаемая стоимость: Ec(S) = O(1/ε·log r)·OPT

Сложность выборки

Теорема: Для любых ε,δ ∈ (0,1), если размер выборки ≥ ln(2/δ)·c(BS)²/(2ε²·(W_A)²), то вероятность того, что ошибка вычисления меньше ε, составляет не менее (1-δ).

Связанные работы

Выбор временных слотов влияния

Методы субмодульного графа: Методы на основе обрезанного субмодульного графа
Фреймворк ветвей и границ: Фреймворк точного алгоритма
Жадные решения: Жадные алгоритмы на основе предельного выигрыша
Методы кооперативной коэволюции: Метод кооперативной коэволюции, предложенный Wang и др.

Минимизация сожаления

Методы локального поиска: Решение локального поиска, предложенное Zhang и др.
Региональные ограничения: Исследование минимизации сожаления с региональными ограничениями влияния, проведённое Ali и др.

Теоретические основы

Задача многосубмодульного покрытия: Алгоритм случайного двукритериального приближения, предложенный Chekuri и др.
Алгоритм непрерывной жадности: Техника непрерывного расширения для монотонных субмодульных функций

Заключение и обсуждение

Основные выводы

Моделирование задачи: Успешное моделирование задачи многопродуктовой рекламы на билбордах как задачи многосубмодульного покрытия и её обобщения
Эффективность алгоритмов: Предложенные алгоритмы показывают хорошие результаты как в теории, так и на практике
Практическая ценность: Методы применимы к любому сценарию многопродуктовой наружной рекламы

Ограничения

Вычислительная сложность: Экспоненциальная временная сложность алгоритма RA ограничивает его применение в крупномасштабных задачах
Предположения: Предполагается, что функция влияния обладает свойством субмодульности, что может не полностью выполняться на практике
Зависимость от данных: Требуется точная информация о траекториях и предпочтениях пользователей к продуктам
Статическая модель: Не учитываются изменения требований и предложения в динамической среде

Направления будущих исследований

Динамическая оптимизация: Рассмотрение изменяющихся во времени требований по влиянию и поведения пользователей
Онлайн-алгоритмы: Разработка алгоритмов оптимизации в реальном времени для обработки потоков данных
Интеграция машинного обучения: Объединение глубокого обучения для прогнозирования интересов пользователей и влияния
Многокритериальная оптимизация: Одновременное рассмотрение нескольких целей: стоимости, охвата и справедливости

Глубокая оценка

Преимущества

Значимость задачи: Решение важной задачи в реальной коммерческой среде с явной практической ценностью
Теоретическая строгость: Полный теоретический анализ, включая коэффициенты приближения и сложность выборки
Инновация алгоритмов: Умелое применение техник непрерывной жадности и случайного округления к многопродуктовому сценарию
Полнота экспериментов: Достаточная экспериментальная проверка на реальных наборах данных

Недостатки

Ограничения масштабируемости: Экспоненциальная сложность алгоритма RA ограничивает его применение к крупномасштабным задачам
Простота базовых методов: Методы сравнения относительно просты, отсутствует сравнение с более продвинутыми подходами
Недостаточный анализ чувствительности: Анализ чувствительности к ключевым параметрам (например, пороговое расстояние λ) недостаточно глубок
Практические ограничения: Недостаточное учёт временных ограничений и конкурентных факторов в реальной рекламной деятельности

Влияние

Академический вклад: Первое систематическое исследование задачи максимизации влияния многопродуктовой рекламы
Практическая ценность: Может быть непосредственно применено к наружной рекламе, цифровым вывескам и другим сценариям
Теоретическое значение: Расширение области применения теории субмодульной оптимизации в практических приложениях
Воспроизводимость: Предоставление подробного описания алгоритмов и экспериментальной установки

Применимые сценарии

Сети наружной рекламы: Оптимизация многопродуктового размещения в традиционных сетях билбордов
Системы цифровых вывесок: Оптимизация рекламы на цифровых экранах в торговых центрах, аэропортах и других местах
Транспортная реклама: Распределение рекламных мест на общественном транспорте (автобусы, метро)
Онлайн-реклама: Возможность расширения на задачи многопродуктовых торгов и распределения в онлайн-рекламе

Библиография

Статья ссылается на 22 соответствующих источника, включая:

Классические работы по максимизации влияния (Kempe et al., 2003)
Теоретические основы субмодульной оптимизации (Calinescu et al., 2007; Vondrák, 2007)
Задачи многосубмодульного покрытия (Chekuri et al., 2022)
Исследования рекламы на билбордах (Zhang et al., 2020, 2021)
Теория вероятностных неравенств (Hoeffding, 1963)

Данная статья вносит важный вклад как на теоретическом, так и на практическом уровне, предоставляя систематическое решение задачи максимизации влияния многопродуктовой рекламы. Несмотря на некоторые ограничения, её инновационность и практическая ценность делают её значительным прогрессом в данной области.