2025-11-18T21:43:12.688378

Exact Matching and Top-k Perfect Matching Parameterized by Neighborhood Diversity or Bandwidth

Maalouly, Lakis

The Exact Matching (EM) problem asks whether there exists a perfect matching which uses a prescribed number of red edges in a red/blue edge-colored graph. While there exists a randomized polynomial-time algorithm for the problem, only some special cases admit a deterministic one so far, making it a natural candidate for testing the P=RP hypothesis. A polynomial-time equivalent problem, Top-k Perfect Matching (TkPM), asks for a perfect matching maximizing the weight of the $k$ heaviest edges. We study the above problems, mainly the latter, in the scenario where the input is a blown-up graph, meaning a graph which had its vertices replaced by cliques or independent sets. We describe an FPT algorithm for TkPM parameterized by $k$ and the neighborhood diversity of the input graph, which is essentially the size of the graph before the blow-up; this graph is also called the prototype. We extend this algorithm into an approximation scheme with a much softer dependency on the aforementioned parameters, time-complexity wise. Moreover, for prototypes with bounded bandwidth but unbounded size, we develop a recursive algorithm that runs in subexponential time. Utilizing another algorithm for EM on bounded neighborhood diversity graphs, we adapt this recursive subexponential algorithm to EM. Our approach is similar to the use of dynamic programming on e.g. bounded treewidth instances for various problems. The main point is that the existence of many disjoint separators is utilized to avoid including in the separator any of a set of ``bad'' vertices during the split phase.

academic

정확 매칭과 Top-k 완벽 매칭: 이웃 다양성 또는 대역폭에 의한 매개변수화

기본 정보

논문 ID: 2510.12552
제목: Exact Matching and Top-k Perfect Matching Parameterized by Neighborhood Diversity or Bandwidth
저자: Nicolas El Maalouly, Kostas Lakis (ETH Zurich)
분류: cs.DS (데이터 구조 및 알고리즘), cs.CC (계산 복잡성)
발표 시간: 2025년 10월 14일 (arXiv 사전인쇄본)
논문 링크: https://arxiv.org/abs/2510.12552

초록

본 논문은 두 가지 관련된 그래프 이론 문제를 연구한다: 정확 매칭(Exact Matching, EM)과 Top-k 완벽 매칭(Top-k Perfect Matching, TkPM). EM 문제는 빨강-파랑 간선 착색 그래프에서 정확히 k개의 빨간 간선을 사용하는 완벽 매칭이 존재하는지 묻는다. TkPM 문제는 k개의 최중 간선의 가중치 합을 최대화하는 완벽 매칭을 찾는 것을 요구한다. EM은 확률적 다항식 시간 알고리즘이 존재하지만, 결정론적 알고리즘은 특수한 경우에만 존재하므로 P=RP 가정을 검증하기 위한 자연스러운 후보 문제가 된다. 본 논문은 주로 팽창 그래프(blown-up graph) 위에서 이러한 문제들의 매개변수화 복잡성을 연구하며, 이웃 다양성과 대역폭 매개변수에 기반한 FPT 알고리즘과 근사 알고리즘을 제시한다.

연구 배경 및 동기

문제의 중요성

이론적 의의: EM 문제는 P=RP 가정을 검증하기에 적합한 몇 안 되는 자연스러운 문제 중 하나로, 중요한 계산 복잡성 이론적 가치를 지닌다
알고리즘적 도전: Schwartz-Zippel 보조정리에 기반한 확률적 다항식 시간 알고리즘이 존재하지만, 결정론적 다항식 시간 알고리즘은 아직 발견되지 않았다
실제 응용: TkPM 문제는 클러스터링 및 부하 균형 등의 최적화 문제에서 중요한 응용을 가진다

기존 방법의 한계

일반 그래프 상의 알고리즘: 일반 그래프에서 TkPM은 0.5 근사비 알고리즘만 존재하며, 이분 그래프에서는 약 0.8에 가까운 근사비를 달성할 수 있다
매개변수화 복잡성: 기존 FPT 알고리즘은 독립 집합 크기 α 또는 이분 독립 집합 크기 β에 의존하는데, 이러한 매개변수는 특정 그래프 클래스에서 매우 클 수 있다
구조화된 그래프의 잠재력: 특수한 구조를 가진 그래프(예: 팽창 그래프)에 대해 기존 알고리즘은 그 구조적 특성을 충분히 활용하지 못한다

연구 동기

본 논문의 핵심 동기는 팽창 그래프의 구조적 특성을 활용하여 더욱 효율적인 알고리즘을 설계하는 것이다. 팽창 그래프는 원래 그래프의 각 정점을 클리크 또는 독립 집합으로 대체하여 얻어지며, 이러한 구조는 실제 응용에서 흔히 나타나고 좋은 알고리즘적 성질을 가진다.

핵심 기여

FPT 알고리즘: k와 이웃 다양성 γ로 매개변수화된 FPT 알고리즘을 제시하며, 시간 복잡도는 O((2k+γ-1 choose γ-1)f(n))이다
근사 알고리즘: (1-ε) 근사 알고리즘을 설계하며, 시간 복잡도는 O((log²k/log²(1/(1-ε)))^γ² f(n))으로 매개변수에 대한 의존성을 크게 완화한다
준지수 알고리즘: 유계 대역폭의 원형 그래프에 대해 시간 복잡도 2^O(φ²√n log² n)의 재귀 알고리즘을 개발한다
EM 알고리즘 적응: 재귀 방법을 EM 문제에 적응시켜 시간 복잡도 2^O(φ²n^(12/13) log² n)의 알고리즘을 얻는다

방법론 상세 설명

작업 정의

정확 매칭(Exact Matching, EM):

입력: 빨강-파랑 간선 착색 그래프 G와 정수 k
출력: 정확히 k개의 빨간 간선을 포함하는 완벽 매칭이 존재하는지 판정

Top-k 완벽 매칭(Top-k Perfect Matching, TkPM):

입력: 간선 가중 그래프 G, 가중치 함수 w, 정수 k
출력: k개의 최중 간선의 가중치 합을 최대화하는 완벽 매칭 M을 찾기

핵심 개념

팽창 그래프(Blown-up Graph)

원형 그래프 P: 초기의 작은 그래프
팽창 과정: P의 각 정점을 클리크 또는 독립 집합으로 대체(blob이라 함)
간선 처리: 원래 그래프의 간선은 완전 이분 그래프의 간선 집합이 됨(band라 함)

이웃 다양성(Neighborhood Diversity)

그래프 G의 이웃 다양성을 γ라 정의하는 것은, 정점들을 γ개의 집합 V₁, V₂, ..., Vγ로 분할할 수 있으며, 임의의 u, u'∈Vᵢ와 임의의 v∉Vᵢ에 대해 (u,v)∈E(G) ⟺ (u',v)∈E(G)를 만족하는 경우이다.

알고리즘 1: 유계 이웃 다양성의 FPT 알고리즘

핵심 아이디어

동일한 유형의 정점들은 이웃 관계에서 동등하므로, 고정된 수의 각 유형 정점을 사용하는 두 매칭은 확장성 측면에서 동등하다.

유형 제약 최대 가중 매칭(TC-MWM)

문제 변환: TkPM을 유형 제약 하의 최대 가중 매칭 문제로 변환
보조 그래프 구성: 각 유형 Vᵢ에 대해 |Vᵢ|-cᵢ개의 "킬러" 정점을 가중치 0으로 추가
알고리즘 흐름: 보조 그래프에서 최대 가중 완벽 매칭 알고리즘 실행

매개변수 열거

c₁+c₂+...+cγ=2k를 만족하는 모든 분포 방식을 열거하며, 총 개수는 (2k+γ-1 choose γ-1)이다.

알고리즘 2: 근사 알고리즘

지수 증가 전략

각 blob의 정확한 정점 수를 고려하지 않고 각 band의 간선 수에 집중
각 bᵢ에 대해 집합 A = {0, 1, ⌈α⌉, ⌈α²⌉, ..., k}의 값만 고려
여기서 α = 1/(1-ε)

복잡도 개선

이 전략을 통해 매개변수 k의 영향을 지수 수준에서 다항식 수준으로 감소시키며, 총 열거 수는 O((log²k/log²(1/(1-ε)))^γ²)가 된다.

알고리즘 3: 재귀 알고리즘(유계 대역폭)

대역폭 정의

그래프 G의 대역폭 φ(G)는 최소 정수로, 정점 순서 v₁, v₂, ..., vₙ이 존재하여 {vᵢ, vⱼ}∈E(G) ⟹ |i-j|≤φ(G)를 만족한다.

타이트/루즈 band 분류

타이트 band: 최적 해에서 ≥√n개의 간선을 포함하는 band
루즈 band: 최적 해에서 <√n개의 간선을 포함하는 band
핵심 관찰: 타이트 band의 개수 ≤ √n

루즈 분리자

루즈 분리자를 어떤 타이트 band도 접하지 않는 작은 분리자로 정의한다. 유계 대역폭 그래프는 여러 개의 서로소인 작은 분리자의 존재를 보장하므로, 항상 루즈 분리자를 찾을 수 있다.

재귀 전략

기저 경우: 타이트 band가 너무 많거나 blob 개수가 매우 적을 때 알고리즘 1 사용
재귀 경우:
- 루즈 분리자 S 찾기
- S 관련 간선의 모든 가능한 선택 열거(각 band당 최대 √n개 간선)
- 분리된 부분 문제 재귀적으로 해결
- 부분 문제 해를 조합하여 전역 해 획득

귀납법: 재귀 알고리즘의 정확성 증명에 사용
분할 분석: 재귀 깊이 및 각 계층의 계산 비용 분석
매개변수화 복잡성 이론: FPT 알고리즘의 매개변수 의존성 분석