2025-11-23T02:01:16.750653

Multi-product Influence Maximization in Billboard Advertisement

Ali, Islam, Banerjee
Billboard Advertisement has emerged as an effective out-of-home advertisement technique where the goal is to select a limited number of slots and play advertisement content over there with the hope that this will be observed by many people, and effectively, a significant number of them will be influenced towards the brand. Given a trajectory and a billboard database and a positive integer $k$, how can we select $k$ highly influential slots to maximize influence? In this paper, we study a variant of this problem where a commercial house wants to make a promotion of multiple products, and there is an influence demand for each product. We have studied two variants of the problem. In the first variant, our goal is to select $k$ slots such that the respective influence demand of each product is satisfied. In the other variant of the problem, we are given with $\ell$ integers $k_1,k_2, \ldots, k_{\ell}$, the goal here is to search for $\ell$ many set of slots $S_1, S_2, \ldots, S_{\ell}$ such that for all $i \in [\ell]$, $|S_{i}| \leq k_i$ and for all $i \neq j$, $S_i \cap S_j=\emptyset$ and the influence demand of each of the products gets satisfied. We model the first variant of the problem as a multi-submodular cover problem and the second variant as its generalization. For solving the first variant, we adopt the bi-criteria approximation algorithm, and for the other variant, we propose a sampling-based approximation algorithm. Extensive experiments with real-world trajectory and billboard datasets highlight the effectiveness and efficiency of the proposed solution approach.
academic

빌보드 광고에서의 다중 제품 영향력 최대화

기본 정보

  • 논문 ID: 2510.09050
  • 제목: Multi-product Influence Maximization in Billboard Advertisement
  • 저자: Dildar Ali (IIT Jammu), Rajibul Islam (Gandhi Institute for Technological Advancement), Suman Banerjee (IIT Jammu)
  • 분류: cs.DS (데이터 구조 및 알고리즘), cs.DB (데이터베이스)
  • 발표 시간: 2025년 10월 10일 (arXiv 사전인쇄본)
  • 논문 링크: https://arxiv.org/abs/2510.09050

초록

옥외 광고판은 제한된 수의 시간대를 선택하여 광고 콘텐츠를 방송하고 많은 사람들에게 관찰되어 브랜드에 대한 태도에 효과적으로 영향을 미치는 것을 목표로 하는 효과적인 옥외 광고 기술이 되었습니다. 본 논문은 변형 문제를 연구합니다: 상업 회사가 여러 제품을 홍보하고자 하며, 각 제품은 영향력 요구사항을 가집니다. 두 가지 문제 변형을 연구했습니다: 첫 번째 변형의 목표는 k개의 시간대를 선택하여 각 제품의 해당 영향력 요구사항을 충족시키는 것입니다; 두 번째 변형에서는 ℓ개의 정수 k₁,k₂,...,k_ℓ이 주어졌을 때, ℓ개의 시간대 집합 S₁,S₂,...,S_ℓ을 찾는 것이 목표이며, 이는 서로 겹치지 않고 각 제품의 영향력 요구사항을 모두 충족해야 합니다.

연구 배경 및 동기

문제 배경

  1. 옥외 광고의 중요성: 상업 회사는 일반적으로 총 수익의 7-10%를 광고에 사용하며, 옥외 광고판은 투자 수익 보장 및 사용 용이성으로 인해 효과적인 방법이 됩니다
  2. 기존 문제의 한계: 기존 연구는 주로 단일 광고주의 영향력 최대화 또는 여러 광고주 간의 후회 최소화에 초점을 맞춥니다
  3. 실제 요구사항: 상업 회사는 일반적으로 서로 다른 고객 그룹을 대상으로 하는 여러 이질적 제품을 동시에 홍보해야 합니다

연구 동기

  • 실무 요구사항: 현실에서 광고주는 통일된 예산 내에서 여러 제품의 서로 다른 영향력 요구사항을 충족해야 합니다
  • 이론적 공백: 기존 문헌에는 다중 제품 광고판 시간대 선택 문제에 대한 연구가 부족합니다
  • 기술적 과제: 각 제품의 영향력 제약을 충족하면서 총 비용을 최소화해야 합니다

핵심 기여

  1. 문제 확장: 영향력 시간대 선택 문제를 다중 제품 광고 시나리오로 확장하여 두 가지 관련 문제 변형을 연구합니다
  2. 이론적 모델링: 첫 번째 변형을 다중 부분모듈 커버 문제로, 두 번째 변형을 그 일반화 버전으로 모델링합니다
  3. 알고리즘 설계:
    • 첫 번째 변형에 대해 이중 기준 근사 알고리즘 채택
    • 두 번째 변형에 대해 샘플링 기반 근사 알고리즘 제안
  4. 효율성 최적화: 확장성 문제를 해결하기 위한 효율적인 휴리스틱 솔루션 개발
  5. 실험 검증: 실제 궤적 및 광고판 데이터셋에서 광범위한 실험 수행

방법론 상세 설명

작업 정의

입력:

  • 궤적 데이터베이스 D: 사용자 위치-시간 정보 및 제품 관심도 포함
  • 광고판 데이터베이스 B: 광고판 위치, 시간대 및 비용 정보 포함
  • 비용 함수 c: BS → R⁺
  • 제품 집합 P = {1,2,...,ℓ}

두 가지 문제 변형:

  1. 공통 다중 제품 시간대 선택 문제:
    • 단일 시간대 집합 S ⊆ BS 선택
    • 총 비용 최소화: ∑_{s∈S} c(s)
    • 제약 조건: ∀j ∈ , I_j(S) ≥ k_j
  2. 분리된 다중 제품 시간대 선택 문제:
    • ℓ개의 겹치지 않는 시간대 집합 S₁,S₂,...,S_ℓ 선택
    • 만족: |S_j| ≤ k_j, S_i ∩ S_j = ∅ (i≠j), I_j(S_j) ≥ σ_j

핵심 기술

1. 영향력 함수 모델링

제품 j의 영향력 함수는 다음과 같이 정의됩니다:

I_j(S) = ∑_{u_i∈U_j} [1 - ∏_{s_j∈S} (1 - Pr(s_j, u_i))]

여기서 U_j는 제품 j에 관심 있는 사용자 집합이고, Pr(s_j, u_i)는 시간대 s_j가 사용자 u_i에 미치는 영향 확률입니다.

2. 부분모듈성 속성

영향력 함수는 부분모듈성 속성을 가지며, 한계 감소 효과를 만족합니다:

f(A ∪ {e}) - f(A) ≥ f(B ∪ {e}) - f(B), ∀A ⊆ B

알고리즘 아키텍처

알고리즘 1: 공통 시간대 선택을 위한 이중 기준 근사 알고리즘

  1. 정규화: 각 제품의 영향력 함수를 정규화하여 I_j(BS) = 1이 되도록 합니다
  2. 연속 탐욕법: 다중선형 확장을 사용하여 매트로이드 다면체에서 분수 해를 구합니다
  3. 무작위 반올림: ℓ = ⌈log_{1/(1-ε)}(r)⌉개의 무작위 부분집합을 샘플링합니다
  4. 복구 단계: 제약 조건을 충족하지 않는 제품에 대해 탐욕적으로 시간대를 추가합니다

알고리즘 2: 분리된 시간대 선택을 위한 샘플링 알고리즘

  1. 순열 샘플링: 제품-시간대 할당의 순열을 무작위로 샘플링합니다
  2. 탐욕적 할당: 순열 순서에 따라 각 제품에 대해 탐욕적으로 시간대를 선택합니다
  3. 가능성 검사: 모든 제약 조건을 충족하는지 확인합니다
  4. 최적 선택: 비용이 최소인 가능한 해를 반환합니다

기술적 혁신점

  1. 다중선형 확장 적용: 부분모듈 함수의 연속 확장 기술을 다중 제품 시나리오에 적용합니다
  2. 샘플링 복잡도 분석: Hoeffding 부등식을 사용하여 샘플링 알고리즘의 샘플 복잡도를 분석합니다
  3. 이중 기준 근사: 영향력 제약을 충족하면서 비용 근사 보장을 제공합니다

실험 설정

데이터셋

  1. 뉴욕시 (NYC):
    • 227,428개의 체크인 기록 (2012년 4월-2013년 2월)
    • 1,083명의 고유 사용자
    • 716개의 광고판, 1,031,040개의 시간대
  2. 로스앤젤레스 (LA):
    • 74,170개의 체크인 기록, 15개 거리 포함
    • 2,000명의 고유 사용자
    • 1,483개의 광고판, 2,135,520개의 시간대

평가 지표

  • 영향력: 각 제품이 달성한 총 영향력
  • 시간대 수: 각 제품에 할당된 시간대의 총 수
  • 계산 시간: 알고리즘 실행 시간
  • 비용: 시간대 선택의 총 비용

비교 방법

  1. 무작위 할당 (RA): 제품에 시간대를 무작위로 선택하여 할당
  2. 상위-k 할당: 영향력 값으로 정렬하여 높은 영향력 시간대를 우선 할당

주요 매개변수

  • 요구 공급 비율 α: 전체 영향력 요구사항과 총 공급의 비율 (40%-120%)
  • 개별 요구 비율 β: 평균 개별 요구사항과 총 공급의 비율 (1%-20%)
  • 제품 수 |P|: 5, 10, 20, 50, 100
  • 거리 매개변수 λ: 25m-150m
  • 근사 매개변수 ε: 0.01-0.2

실험 결과

주요 결과

영향력 성능

  • NYC 데이터셋: BCA 방법이 기준선 방법보다 20-25% 높음, RA 방법이 최고 성능
  • LA 데이터셋: BCA 방법이 기준선 방법보다 8-10% 높음
  • α≥100%이고 β≥10%일 때, 요구사항이 공급을 초과하며, BCA 방법이 기준선보다 우수하지만 RA 방법은 가능한 해가 없음

시간대 할당 효율성

  • α와 β가 증가함에 따라 각 제품에 할당된 시간대 수가 증가합니다
  • 상위-k 방법이 무작위 방법보다 더 적은 시간대를 할당합니다
  • BCA 방법은 모든 제품 요구사항을 충족해야 하므로 RA 및 기준선 방법보다 더 많은 시간대를 할당합니다

계산 복잡도

  • 시간 복잡도:
    • BCA 알고리즘: O(n²ℓ/ε + nℓ)
    • RA 알고리즘: O(|X|·ℓ·B_max/c_min·n·t)
  • RA 방법의 계산 시간이 가장 길음 (많은 순열을 고려해야 함)
  • BCA 방법의 시간은 적당하며 α와 β 증가에 따라 천천히 증가합니다

비용 효율성

  • RA 방법이 비용 측면에서 최고 성능을 보이며, 최소 비용으로 모든 제품 요구사항을 충족합니다
  • 요구사항이 증가함에 따라 모든 방법의 할당 비용이 증가합니다

이론적 보장

BCA 알고리즘의 근사 비율

정리: r을 희소도(임의의 시간대가 기여할 수 있는 최대 함수 수)라 하고, ε > 0이라 합시다. BCA 알고리즘은 높은 확률로 집합 S를 반환하여 다음을 만족합니다:

  • 모든 j ∈ 에 대해: I_j(S) ≥ (1 - 1/e - ε)·k_j
  • 예상 비용: Ec(S) = O(1/ε·log r)·OPT

샘플링 복잡도

정리: 임의의 ε,δ ∈ (0,1)에 대해, 샘플 크기가 ≥ ln(2/δ)·c(BS)²/(2ε²·(W_A)²)이면, 계산 오차가 ε보다 작을 확률은 최소 (1-δ)입니다.

관련 연구

영향력 시간대 선택

  • 부분모듈 그래프 방법: 가지치기 부분모듈 그래프 기반 방법
  • 분지 한정 프레임워크: 정확한 알고리즘 프레임워크
  • 탐욕적 솔루션: 한계 수익 기반 탐욕적 알고리즘
  • 협력 공진화 방법: Wang 등이 제안한 협력 공진화 방법

후회 최소화

  • 국소 탐색 방법: Zhang 등의 국소 탐색 솔루션
  • 지역 제약: Ali 등의 지역 영향 제약 하에서의 후회 최소화 연구

이론적 기초

  • 다중 부분모듈 커버 문제: Chekuri 등의 무작위 이중 기준 근사 알고리즘
  • 연속 탐욕법: 단조 부분모듈 함수의 연속 확장 기술

결론 및 논의

주요 결론

  1. 문제 모델링: 다중 제품 광고판 문제를 다중 부분모듈 커버 문제 및 그 일반화로 성공적으로 모델링합니다
  2. 알고리즘 유효성: 제안된 알고리즘은 이론 및 실무에서 모두 우수한 성능을 보입니다
  3. 실용적 가치: 방법은 모든 다중 제품 옥외 광고 시나리오에 적용 가능합니다

한계

  1. 계산 복잡도: RA 알고리즘의 지수 시간 복잡도는 대규모 응용을 제한합니다
  2. 가정 조건: 영향력 함수가 부분모듈성을 가진다고 가정하며, 실제로는 완전히 만족하지 않을 수 있습니다
  3. 데이터 의존성: 정확한 궤적 데이터 및 사용자 제품 선호도 정보가 필요합니다
  4. 정적 모델: 동적 환경에서 요구사항 및 공급의 변화를 고려하지 않습니다

향후 방향

  1. 동적 최적화: 시변 영향력 요구사항 및 사용자 행동 고려
  2. 온라인 알고리즘: 실시간 데이터 스트림을 처리하는 온라인 최적화 알고리즘 개발
  3. 기계학습 통합: 사용자 관심도 및 영향력 예측을 위해 심층 학습 결합
  4. 다목적 최적화: 비용, 커버리지 및 공정성 등 여러 목표를 동시에 고려

심층 평가

장점

  1. 문제의 중요성: 실제 상업 환경의 중요한 문제를 해결하며 명확한 응용 가치를 가집니다
  2. 이론적 엄밀성: 근사 비율 및 샘플 복잡도를 포함한 완전한 이론적 분석을 제공합니다
  3. 알고리즘 혁신: 연속 탐욕법 및 무작위 반올림 기술을 다중 제품 시나리오에 교묘하게 적용합니다
  4. 실험의 완전성: 실제 데이터셋에서 충분한 실험 검증을 수행합니다

부족한 점

  1. 확장성 제한: RA 알고리즘의 지수 복잡도는 대규모 문제에서의 응용을 제한합니다
  2. 기준선 방법의 단순성: 비교 기준선 방법이 상대적으로 단순하며 더 고급 방법과의 비교가 부족합니다
  3. 매개변수 민감도: 주요 매개변수(예: 거리 임계값 λ)에 대한 민감도 분석이 충분하지 않습니다
  4. 실제 제약: 실제 광고 배치의 시간 제약 및 경쟁 요소를 충분히 고려하지 않습니다

영향력

  1. 학술적 기여: 다중 제품 영향력 최대화 문제에 대한 첫 번째 체계적 연구를 제공합니다
  2. 실용적 가치: 옥외 광고, 디지털 사이니지 등 다양한 시나리오에 직접 적용 가능합니다
  3. 이론적 의의: 부분모듈 최적화 이론의 실제 응용 범위를 확장합니다
  4. 재현성: 상세한 알고리즘 설명 및 실험 설정을 제공합니다

적용 시나리오

  1. 옥외 광고 네트워크: 전통 광고판 네트워크의 다중 제품 배치 최적화
  2. 디지털 사이니지 시스템: 쇼핑몰, 공항 등 장소의 디지털 디스플레이 광고
  3. 교통 광고: 버스, 지하철 등 교통 수단의 광고 위치 할당
  4. 온라인 광고: 온라인 광고의 다중 제품 입찰 및 할당 문제로 확장 가능

참고문헌

논문은 22개의 관련 문헌을 인용하며, 주요 내용은 다음을 포함합니다:

  • 영향력 최대화의 고전 연구 (Kempe et al., 2003)
  • 부분모듈 최적화 이론 기초 (Calinescu et al., 2007; Vondrák, 2007)
  • 다중 부분모듈 커버 문제 (Chekuri et al., 2022)
  • 광고판 광고 관련 연구 (Zhang et al., 2020, 2021)
  • 확률 부등식 이론 (Hoeffding, 1963)

본 논문은 이론 및 실무 수준에서 중요한 기여를 하며, 다중 제품 영향력 최대화 문제에 대한 체계적인 솔루션을 제공합니다. 일부 한계가 있지만, 그 혁신성과 실용적 가치는 이를 해당 분야의 중요한 진전으로 만듭니다.