We revisit the 3SUM problem in the \emph{preprocessed universes} setting. We present an algorithm that, given three sets $A$, $B$, $C$ of $n$ integers, preprocesses them in quadratic time, so that given any subsets $A' \subseteq A$, $B' \subseteq B$, $C' \subseteq C$, it can decide if there exist $a \in A'$, $b \in B'$, $c \in C'$ with $a+b=c$ in time $O(n^{1.5} \log n)$.
In contrast to both the first subquadratic $\tilde{O}(n^{13/7})$-time algorithm by Chan and Lewenstein (STOC 2015) and the current fastest $\tilde{O}(n^{11/6})$-time algorithm by Chan, Vassilevska Williams, and Xu (STOC 2023), which are based on the Balog--Szemerédi--Gowers theorem from additive combinatorics, our algorithm uses only standard 3SUM-related techniques, namely FFT and linear hashing modulo a prime. It is therefore not only faster but also simpler.
Just as the two previous algorithms, ours not only decides if there is a single 3SUM solution but it actually determines for each $c \in C'$ if there is a solution containing it. We also modify the algorithm to still work in the scenario where the set $C$ is unknown at the time of preprocessing. Finally, even though the simplest version of our algorithm is randomized, we show how to make it deterministic losing only polylogarithmic factors in the running time.
3SUM in Preprocessed Universes: Faster and Simpler
- Paper-ID: 2410.16784
- Titel: 3SUM in Preprocessed Universes: Faster and Simpler
- Autoren: Shashwat Kasliwal (IIT Delhi), Adam Polak (Bocconi University), Pratyush Sharma (IIT Delhi)
- Klassifizierung: cs.DS (Datenstrukturen und Algorithmen)
- Veröffentlichungszeit/Konferenz: TheoretiCS Volume 4 (2025), Article 24 (Eingeladener Artikel von SOSA 2025)
- Paper-Link: https://arxiv.org/abs/2410.16784
Diese Arbeit überprüft das 3SUM-Problem in der Einstellung von vorverarbeiteten Universen neu. Es wird ein Algorithmus vorgestellt, der drei Mengen A, B, C mit jeweils n ganzen Zahlen in quadratischer Zeit vorverarbeitet, sodass für beliebige Teilmengen A' ⊆ A, B' ⊆ B, C' ⊆ C in O(n^1.5 log n) Zeit bestimmt werden kann, ob es a ∈ A', b ∈ B', c ∈ C' gibt, sodass a+b=c. Im Vergleich zum ersten subquadratischen Algorithmus O(n^13/7) von Chan und Lewenstein sowie dem aktuell schnellsten Algorithmus O(n^11/6) von Chan et al. (basierend auf dem Balog-Szemerédi-Gowers-Theorem aus der additiven Kombinatorik) ist der vorliegende Algorithmus nicht nur schneller, sondern auch einfacher, da er nur standardmäßige 3SUM-Techniken (FFT und modulare lineare Hashing) verwendet.
Das 3SUM-Problem ist eines der drei Kernprobleme der Feinkörnigen Komplexitätstheorie (neben APSP und SAT). Gegeben sind drei Mengen A, B, C mit jeweils n ganzen Zahlen; es soll bestimmt werden, ob es ein Tripel (a,b,c) ∈ A × B × C gibt, sodass a + b = c. Die standardmäßige Lehrbuchmethode hat eine Zeitkomplexität von O(n²), und der schnellste bekannte Algorithmus bietet nur eine Verbesserung von log²n/(log log n)².
- Komplexitätstheoretische Bedeutung: Es wird allgemein vermutet, dass es keinen 3SUM-Algorithmus mit Zeitkomplexität O(n^(2-ε)) gibt; viele Probleme basieren auf dieser Annahme als bedingte untere Schranke
- Wert der Variantenforschung: Die Untersuchung von 3SUM-Varianten, für die es tatsächlich starke subquadratische Algorithmen gibt, hilft, die Komplexität von 3SUM besser zu verstehen
- Praktische Überlegungen: Die Variante mit vorverarbeitetem Universum hat wichtige praktische Anwendungen und ermöglicht eine effiziente Verarbeitung mehrerer Abfragen
- Chan-Lewenstein-Algorithmus: Basiert auf dem komplexen Balog-Szemerédi-Gowers-Theorem, schwierig zu implementieren
- Chan-Vassilevska Williams-Xu-Algorithmus: Obwohl schneller, basiert immer noch auf tiefgreifender additiver Kombinatorik
- Beide mangelt es an Einfachheit; die praktische Implementierungskomplexität ist hoch
- Verbesserung der Algorithmuseffizienz: Vorstellung eines Algorithmus mit Abfragezeitaufwand O(n^1.5 log n), deutlich besser als das bisherige O(n^11/6)
- Technische Vereinfachung: Verwendung nur von FFT und linearem Hashing, Vermeidung komplexer additiver Kombinatorik
- Funktionale Vollständigkeit: Nicht nur Bestimmung der Existenz von Lösungen, sondern auch, ob jedes c ∈ C' an einer Lösung beteiligt ist
- Szenarioerweiterung: Behandlung des Falls, in dem die Menge C zur Vorverarbeitungszeit unbekannt ist
- Deterministische Version: Bereitstellung eines deterministischen Algorithmus mit nur polylogarithmischem Overhead
Eingabe: Drei Mengen A, B, C mit jeweils n ganzen Zahlen
Vorverarbeitung: Vorverarbeitung dieser Mengen in O(n²) Zeit
Abfrage: Gegeben Teilmengen A' ⊆ A, B' ⊆ B, C' ⊆ C, Bestimmung in O(n^1.5 log n) Zeit für jedes c ∈ C', ob es a ∈ A', b ∈ B' gibt, sodass a + b = c
Vorverarbeitungsphase:
- Gleichmäßig zufällige Auswahl einer Primzahl p aus dem Intervall [n^1.5, 2n^1.5)
- Berechnung der Menge der Falsch-Positive: B := {(a,b,c) ∈ A × B × C : a + b ≡ c (mod p) ∧ a + b ≠ c}
- Erwartete Anzahl der Falsch-Positive: E|B| ≤ O(n^1.5 log n)
Abfragephase:
- Berechnung der Multimenge (A' + B') mod p in O(p log p) Zeit mittels FFT
- Erstellung einer Hash-Tabelle H, die für jedes c ∈ C' die Anzahl der Lösungen modulo p speichert
- Durchlaufen der Menge der Falsch-Positive B, Subtraktion der Falsch-Positive in der aktuellen Instanz
- Für jedes c ∈ C', Antwort "ja", wenn Hc > 0, sonst "nein"
Vorverarbeitungsphase:
- Berechnung der Summenmenge A + B
- Für jedes x ∈ A + B Speicherung der Zeugenmenge Wx := {(a,b) ∈ A × B : a + b = x}
- Auswahl einer zufälligen Primzahl m ∈ [n^1.5, 2·n^1.5)
- Für jeden Rest r ∈ m Vorbereitung der Liste Lr := {x ∈ A + B : x ≡ r (mod m)}
Abfragephase:
- Berechnung von (A' + B') mod m mittels FFT
- Für jedes c ∈ C':
- Überprüfung, ob c in A + B liegt
- Berechnung der tatsächlichen Lösungsanzahl mittels Identität: Anzahl der Lösungen modulo m minus Anzahl der Falsch-Positive
- Berechnung der Falsch-Positive durch Durchlaufen von Elementen x ≠ c in Lc mod m
- Geschickte Anwendung von Hashing-Techniken: Durch Auswahl einer geeignet großen Primzahl als Modulus wird ein Gleichgewicht zwischen FFT-Effizienz und Falsch-Positive-Anzahl erreicht
- Kontrolle der Falsch-Positive: Verwendung von Lemma 2.2 zur Kontrolle der erwarteten Anzahl der Falsch-Positive auf O(n^1.5 log n)
- FFT-Optimierung: Umwandlung des 3SUM-Problems in Polynommultiplikation, Nutzung der O(m log m) Komplexität von FFT
- Deterministische Umwandlung: Verwendung einer Kombinationsstrategie mehrerer Moduli zur Realisierung einer deterministischen Version
Diese Arbeit führt hauptsächlich theoretische Analysen durch und verwendet standardmäßige Methoden der Feinkörnigen Komplexitätsanalyse:
Rechenmodell:
- Standard-Word-RAM-Modell mit O(log n)-Bit-Wortlänge
- Eingabezahlengrenzen von n^O(1)
- Arithmetische Operationen in konstanter Zeit
Komplexitätsanalyse:
- Zeitkomplexität: Vorverarbeitung O(n²), Abfrage O(n^1.5 log n)
- Raumkomplexität: Bekannte C-Version O(n^1.5 log n), unbekannte C-Version O(n²)
- Randomisierung: Las-Vegas-Algorithmus (erwartete Zeitschranken)
- Chan-Lewenstein (STOC 2015): O(n^13/7) Abfragezeitaufwand
- Chan-Vassilevska Williams-Xu (STOC 2023): O(n^11/6) Abfragezeitaufwand
- Standard-3SUM-Algorithmus: O(n²) Zeit (ohne Vorverarbeitung)
| Algorithmus | Vorverarbeitungszeit | Abfragezeitaufwand | Raumkomplexität | Deterministisch |
|---|
| Chan-Lewenstein | O(n²) | O(n^13/7) ≈ O(n^1.857) | O(n^13/7) | Benötigt O(n^ω) Vorverarbeitung |
| Chan et al. | O(n²) | O(n^11/6) ≈ O(n^1.833) | O(n² log n) | Abfragezeitaufwand O(n^1.891) |
| Diese Arbeit (bekannte C) | O(n²) | O(n^1.5 log n) | O(n^1.5 log n) | Polylogarithmischer Overhead |
| Diese Arbeit (unbekannte C) | O(n²) | O(n^1.5 log n) | O(n²) | Theorem 5.1 |
- Verbesserung des Abfragezeitaufwands: Von O(n^11/6) ≈ O(n^1.833) auf O(n^1.5), exponentielle Reduktion um etwa 0.333
- Implementierungskomplexität: Vermeidung des Balog-Szemerédi-Gowers-Theorems, nur FFT und Hashing erforderlich
- Funktionale Vollständigkeit: Beibehaltung der All-Numbers-3SUM-Fähigkeit
Durch strenge probabilistische Analyse nachgewiesen:
- Falsch-Positive-Erwartungsschranke: E|B| ≤ O(n^1.5 log n) (Lemma 2.2)
- Las-Vegas-Eigenschaft: Garantie bestimmter Laufzeitschranken durch Neustartmechanismus
- Vollständigkeit: Alle echten Lösungen werden korrekt identifiziert
- Klassisches 3SUM: Eingeführt von Gajentaan-Overmars, O(n²) Standardalgorithmus
- Geringfügige Verbesserungen: Baran-Demaine-Pătraşcu realisieren polylogarithmische Faktoren-Verbesserung
- Variantenforschung:
- Kleines-Universum-3SUM: FFT-Methode, O(n + U log U) Zeit
- 3SUM-Indexierung: Unterschiedliche Vorverarbeitungsmodi
- Reelle-RAM-Version: Adaptionsarbeit von Fischer et al.
- Bansal-Williams: Erstmalige Einführung des Konzepts vorverarbeiteter Universen
- Chan-Lewenstein: Erster subquadratischer Algorithmus, basierend auf BSG-Theorem
- Chan et al.: Aktuell schnellster Algorithmus, direkter Beweis der BSG-Folgerung
- FFT-Anwendung in 3SUM: Klassische Methode im Kleines-Universum-Fall
- Lineares Hashing: Standardtechnik zur Kontrolle der Falsch-Positive
- Deterministische Techniken: Derandomisierungswerkzeuge von Fischer-Kaliciak-Polak
- Effizienzdurchbruch: Realisierung von O(n^1.5 log n) Abfragezeitaufwand, deutlich besser als bisherige beste Ergebnisse
- Erfolgreiche Vereinfachung: Vermeidung komplexer additiver Kombinatorik, Verwendung nur grundlegender Werkzeuge
- Verbesserte Praktikabilität: Bereitstellung einer deterministischen Version und Behandlung des Szenarios mit unbekanntem C
- Raumkomplexität: Unbekannte C-Version benötigt O(n²) Speicherplatz für vollständige Summenmenge
- Modellbeschränkungen: Annahme von beschränkten Eingabezahlen, praktische Anwendungen könnten zusätzliche Behandlung erfordern
- Reelle RAM: Unklar, ob Anpassung an das Reelle-RAM-Modell möglich ist
- Konstante Faktoren: Theoretische Analyse berücksichtigt nicht die konstanten Overhead der praktischen Implementierung
- Reelle-RAM-Anpassung: Erkundung der Machbarkeit im Reelle-RAM-Modell
- Raumoptimierung: Reduktion des Speicherbedarfs im Szenario mit unbekanntem C
- Untergrenzenforschung: Erkundung theoretischer Untergrenzen für 3SUM in vorverarbeiteten Universen
- Praktische Implementierung: Entwicklung effizienter praktischer Algorithmusimplementierungen
- Signifikanter theoretischer Beitrag: Verbesserung des Abfragezeitaufwands von O(n^1.833) auf O(n^1.5), großer Verbesserungsumfang
- Geschickte technische Innovation:
- Primzahlauswahlstrategie balanciert FFT-Effizienz und Falsch-Positive-Kontrolle
- Polymodulus-Methode zur deterministischen Umwandlung hat universelle Anwendbarkeit
- Hoher praktischer Wert: Einfacher Algorithmus, leicht zu implementieren, vermeidet komplexe Kombinatorik-Werkzeuge
- Strenge Analyse: Vollständige und zuverlässige probabilistische Analyse und Komplexitätsbeweise
- Klare Darstellung: Präzise technische Beschreibung, leicht verständliche Algorithmusbeschreibung
- Begrenzte Innovationsstufe: Hauptsächlich geschickte Kombination bestehender Techniken, relativ begrenzte Originalität
- Fehlende experimentelle Validierung: Rein theoretische Arbeit, mangelnde praktische Leistungstests
- Anwendungsbereich:
- Annahme beschränkter Eingabezahlen könnte in der Praxis zu restriktiv sein
- Reelle-RAM-Adaptierbarkeit unklar
- Raumeffizienz: O(n²) Speicherbedarf der unbekannten C-Version könnte praktische Anwendungen einschränken
- Akademischer Wert: Bietet neuen technischen Weg für die Feinkörnige Komplexitätstheorie
- Praktisches Potenzial: Vereinfachter Algorithmus lässt sich leichter in praktischen Systemen einsetzen
- Inspirationswert: Beweist, dass Standardtechniken-Kombinationen komplexe theoretische Werkzeuge übertreffen können
- Nachfolgeforschung: Könnte ähnliche Verbesserungen bei anderen geometrischen/kombinatorischen Problemen inspirieren
- Datenbankabfragen: Optimierung von Tripel-Abfragen in großen Datensätzen
- Computergeometrie: Beschleunigung verwandter geometrischer Probleme durch Vorverarbeitung
- Kryptographische Anwendungen: Optimierung bestimmter auf 3SUM-Schwierigkeit basierender Protokolle
- Algorithmische Wettbewerbe: Effiziente Implementierung in praktischen Programmierwettbewerben
Das Papier zitiert 16 verwandte Arbeiten, hauptsächlich:
- 3 Baran, Demaine, Pătraşcu: Klassische 3SUM-Verbesserung
- 5 Chan, Lewenstein: Erster subquadratischer Algorithmus für vorverarbeitete Universen
- 6 Chan, Vassilevska Williams, Xu: Aktuell schnellster Algorithmus
- 8 Fischer, Kaliciak, Polak: Deterministische 3SUM-Techniken
- 16 Vassilevska Williams: Übersicht der Feinkörnigen Komplexität
Gesamtbewertung: Dies ist eine hochwertige Arbeit der theoretischen Informatik, die einen signifikanten theoretischen Durchbruch bei der 3SUM-Variante in vorverarbeiteten Universen erzielt. Obwohl die technische Innovation eher inkrementell ist, hat der Beitrag zur Vereinfachung komplexer Algorithmen und zur Verbesserung der Leistung wichtigen Wert. Die theoretische Analyse der Arbeit ist streng, die Darstellung klar, und sie bietet wertvolle neue Werkzeuge und Einsichten für verwandte Forschungsbereiche.