2025-11-12T12:22:13.745054

3SUM in Preprocessed Universes: Faster and Simpler

Kasliwal, Polak, Sharma

We revisit the 3SUM problem in the \emph{preprocessed universes} setting. We present an algorithm that, given three sets $A$, $B$, $C$ of $n$ integers, preprocesses them in quadratic time, so that given any subsets $A' \subseteq A$, $B' \subseteq B$, $C' \subseteq C$, it can decide if there exist $a \in A'$, $b \in B'$, $c \in C'$ with $a+b=c$ in time $O(n^{1.5} \log n)$. In contrast to both the first subquadratic $\tilde{O}(n^{13/7})$-time algorithm by Chan and Lewenstein (STOC 2015) and the current fastest $\tilde{O}(n^{11/6})$-time algorithm by Chan, Vassilevska Williams, and Xu (STOC 2023), which are based on the Balog--SzemerÃ©di--Gowers theorem from additive combinatorics, our algorithm uses only standard 3SUM-related techniques, namely FFT and linear hashing modulo a prime. It is therefore not only faster but also simpler. Just as the two previous algorithms, ours not only decides if there is a single 3SUM solution but it actually determines for each $c \in C'$ if there is a solution containing it. We also modify the algorithm to still work in the scenario where the set $C$ is unknown at the time of preprocessing. Finally, even though the simplest version of our algorithm is randomized, we show how to make it deterministic losing only polylogarithmic factors in the running time.

academic

প্রি-প্রসেসড ইউনিভার্সে 3SUM: দ্রুততর এবং সহজতর

মৌলিক তথ্য

পেপার আইডি: 2410.16784
শিরোনাম: 3SUM in Preprocessed Universes: Faster and Simpler
লেখক: শশ্বত কাসলিওয়াল (IIT দিল্লি), অ্যাডাম পোলাক (বোকোনি বিশ্ববিদ্যালয়), প্রত্যুষ শর্মা (IIT দিল্লি)
শ্রেণীবিভাগ: cs.DS (ডেটা স্ট্রাকচার এবং অ্যালগরিদম)
প্রকাশনার সময়/সম্মেলন: TheoretiCS ভলিউম 4 (2025), নিবন্ধ 24 (SOSA 2025 থেকে আমন্ত্রিত নিবন্ধ)
পেপার লিঙ্ক: https://arxiv.org/abs/2410.16784

সারসংক্ষেপ

এই পেপারটি প্রি-প্রসেসড ইউনিভার্স সেটিংয়ে 3SUM সমস্যা পুনর্বিবেচনা করে। এটি একটি অ্যালগরিদম প্রস্তাব করে যা তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে) দ্বিঘাত সময়ে প্রি-প্রসেস করে, যাতে যেকোনো সাবসেট A' ⊆ A, B' ⊆ B, C' ⊆ C এর জন্য, a ∈ A', b ∈ B', c ∈ C' এর মধ্যে a+b=c সম্পর্ক বিদ্যমান কিনা তা O(n^1.5 log n) সময়ে নির্ধারণ করা যায়। চ্যান এবং লিউয়েনস্টাইনের প্রথম সাব-কোয়াড্রেটিক O(n^13/7) অ্যালগরিদম এবং চ্যান এবং অন্যদের বর্তমান দ্রুততম O(n^11/6) অ্যালগরিদম (যা যোগজ সমন্বয়বিদ্যার Balog-Szemerédi-Gowers উপপাদ্যের উপর ভিত্তি করে) এর তুলনায়, এই পেপারের অ্যালগরিদম শুধুমাত্র মান 3SUM সম্পর্কিত কৌশল (FFT এবং মডিউলার প্রাইম লিনিয়ার হ্যাশিং) ব্যবহার করে, তাই এটি শুধুমাত্র দ্রুততরই নয় বরং সহজতরও।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

3SUM সমস্যা সূক্ষ্ম-দানাদার জটিলতা তত্ত্বের তিনটি মূল সমস্যার একটি (APSP এবং SAT এর সাথে সমান্তরালে)। তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে) দেওয়া হলে, এমন একটি ত্রিমুখী (a,b,c) ∈ A × B × C খুঁজে বের করতে হবে যেখানে a + b = c। মান পাঠ্যপুস্তক পদ্ধতির সময় জটিলতা O(n²), এবং দ্রুততম পরিচিত অ্যালগরিদম শুধুমাত্র log²n/(log log n)² উন্নতি প্রদান করে।

গবেষণার প্রেরণা

জটিলতা তত্ত্বের তাৎপর্য: ব্যাপক অনুমান যে O(n^(2-ε)) সময় জটিলতার 3SUM অ্যালগরিদম বিদ্যমান নেই, এবং অনেক সমস্যার শর্তসাপেক্ষ নিম্ন সীমা এই অনুমানের উপর ভিত্তি করে
ভেরিয়েন্ট গবেষণার মূল্য: এমন 3SUM ভেরিয়েন্ট অধ্যয়ন করা যেখানে শক্তিশালী সাব-কোয়াড্রেটিক অ্যালগরিদম বাস্তবে বিদ্যমান, 3SUM এর জটিলতা আরও ভালভাবে বুঝতে সাহায্য করে
ব্যবহারিক বিবেচনা: প্রি-প্রসেসড ইউনিভার্স ভেরিয়েন্ট বাস্তব প্রয়োগে গুরুত্বপূর্ণ মূল্য রাখে, একাধিক প্রশ্নের জন্য দক্ষ প্রক্রিয়াকরণ অনুমতি দেয়

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

চ্যান-লিউয়েনস্টাইন অ্যালগরিদম: জটিল Balog-Szemerédi-Gowers উপপাদ্যের উপর ভিত্তি করে, বাস্তবায়ন কঠিন
চ্যান-ভাসিলেভস্কা উইলিয়ামস-জু অ্যালগরিদম: যদিও দ্রুততর কিন্তু উন্নত যোগজ সমন্বয়বিদ্যা তত্ত্বের উপর নির্ভরশীল
উভয়ই সরলতার অভাব রাখে, বাস্তব বাস্তবায়ন জটিলতা উচ্চ

মূল অবদান

অ্যালগরিদম দক্ষতা বৃদ্ধি: O(n^1.5 log n) প্রশ্ন সময়ের অ্যালগরিদম প্রস্তাব করে, যা পূর্ববর্তী O(n^11/6) থেকে উল্লেখযোগ্যভাবে উন্নত
প্রযুক্তি সরলীকরণ: শুধুমাত্র FFT এবং লিনিয়ার হ্যাশিং ব্যবহার করে, জটিল যোগজ সমন্বয়বিদ্যা সরঞ্জাম এড়ায়
কার্যকারিতা সম্পূর্ণতা: শুধুমাত্র সমাধান বিদ্যমান কিনা তা নির্ধারণ করে না, বরং প্রতিটি c ∈ C' কোনো সমাধানে অংশগ্রহণ করে কিনা তাও নির্ধারণ করে
পরিস্থিতি সম্প্রসারণ: সেট C প্রি-প্রসেসিং সময়ে অজানা থাকার ক্ষেত্রে পরিচালনা করে
নির্ধারণবাদী সংস্করণ: নির্ধারণবাদী অ্যালগরিদম প্রদান করে, শুধুমাত্র মাল্টি-লগারিদমিক ফ্যাক্টর হারায়

পদ্ধতির বিস্তারিত বিবরণ

কাজের সংজ্ঞা

ইনপুট: তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে) প্রি-প্রসেসিং: এই সেটগুলি O(n²) সময়ে প্রি-প্রসেস করুন প্রশ্ন: সাবসেট A' ⊆ A, B' ⊆ B, C' ⊆ C দেওয়া হলে, প্রতিটি c ∈ C' এর জন্য a ∈ A', b ∈ B' এমন কিনা যেখানে a + b = c, তা O(n^1.5 log n) সময়ে নির্ধারণ করুন

মূল অ্যালগরিদম আর্কিটেকচার

পরিচিত সেট C এর জন্য র্যান্ডমাইজড অ্যালগরিদম (উপপাদ্য 3.1)

প্রি-প্রসেসিং পর্যায়:

[n^1.5, 2n^1.5) ব্যবধান থেকে সমানভাবে র্যান্ডমলি একটি প্রাইম p নির্বাচন করুন
মিথ্যা ধনাত্মক সেট গণনা করুন: B := {(a,b,c) ∈ A × B × C : a + b ≡ c (mod p) ∧ a + b ≠ c}
প্রত্যাশিত মিথ্যা ধনাত্মক সংখ্যা: E|B| ≤ O(n^1.5 log n)

প্রশ্ন পর্যায়:

O(p log p) সময়ে FFT ব্যবহার করে (A' + B') mod p এর মাল্টিসেট গণনা করুন
হ্যাশ টেবিল H তৈরি করুন, প্রতিটি c ∈ C' এর জন্য mod p সমাধান সংখ্যা সংরক্ষণ করুন
মিথ্যা ধনাত্মক সেট B অতিক্রম করুন, বর্তমান উদাহরণে মিথ্যা ধনাত্মক বিয়োগ করুন
প্রতিটি c ∈ C' এর জন্য, যদি Hc > 0 হয় তবে "হ্যাঁ" উত্তর দিন, অন্যথায় "না"

অজানা সেট C এর জন্য অ্যালগরিদম (উপপাদ্য 4.1)

প্রি-প্রসেসিং পর্যায়:

যোগ সেট A + B গণনা করুন
প্রতিটি x ∈ A + B এর জন্য, সাক্ষী সেট Wx := {(a,b) ∈ A × B : a + b = x} সংরক্ষণ করুন
র্যান্ডম প্রাইম m ∈ [n^1.5, 2·n^1.5) নির্বাচন করুন
প্রতিটি অবশেষ r ∈ m এর জন্য, তালিকা Lr := {x ∈ A + B : x ≡ r (mod m)} প্রস্তুত করুন

প্রশ্ন পর্যায়:

FFT ব্যবহার করে (A' + B') mod m গণনা করুন
প্রতিটি c ∈ C' এর জন্য:
- c যদি A + B তে থাকে তা পরীক্ষা করুন
- পরিচয় ব্যবহার করে প্রকৃত সমাধান সংখ্যা গণনা করুন: mod m সমাধান সংখ্যা বিয়োগ মিথ্যা ধনাত্মক সংখ্যা
- Lc mod m তে x ≠ c উপাদান অতিক্রম করে মিথ্যা ধনাত্মক গণনা করুন

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

হ্যাশিং প্রযুক্তির চতুর প্রয়োগ: উপযুক্ত আকারের প্রাইম মডিউলাস নির্বাচন করে FFT দক্ষতা এবং মিথ্যা ধনাত্মক সংখ্যার ভারসাম্য রাখুন
মিথ্যা ধনাত্মক নিয়ন্ত্রণ: লেমা 2.2 ব্যবহার করে মিথ্যা ধনাত্মক প্রত্যাশা সংখ্যা O(n^1.5 log n) এ নিয়ন্ত্রণ করুন
FFT অপ্টিমাইজেশন: 3SUM সমস্যা বহুপদী গুণনে রূপান্তরিত করুন, FFT এর O(m log m) জটিলতা ব্যবহার করুন
নির্ধারণবাদী রূপান্তর: একাধিক মডিউলাসের সমন্বয় কৌশল ব্যবহার করে নির্ধারণবাদী সংস্করণ বাস্তবায়ন করুন

পরীক্ষামূলক সেটআপ

তাত্ত্বিক বিশ্লেষণ কাঠামো

এই পেপারটি প্রধানত তাত্ত্বিক বিশ্লেষণ পরিচালনা করে, মান সূক্ষ্ম-দানাদার জটিলতা বিশ্লেষণ পদ্ধতি গ্রহণ করে:

গণনা মডেল:

মান শব্দ RAM মডেল, O(log n) বিট শব্দ দৈর্ঘ্য
ইনপুট সংখ্যা সীমা n^O(1)
গাণিতিক ক্রিয়াকলাপ ধ্রুবক সময়

জটিলতা বিশ্লেষণ:

সময় জটিলতা: প্রি-প্রসেসিং O(n²), প্রশ্ন O(n^1.5 log n)
স্থান জটিলতা: পরিচিত C সংস্করণ O(n^1.5 log n), অজানা C সংস্করণ O(n²)
র্যান্ডমনেস: লাস ভেগাস অ্যালগরিদম (প্রত্যাশিত সময় সীমা)

তুলনা বেঞ্চমার্ক

চ্যান-লিউয়েনস্টাইন (STOC 2015): O(n^13/7) প্রশ্ন সময়
চ্যান-ভাসিলেভস্কা উইলিয়ামস-জু (STOC 2023): O(n^11/6) প্রশ্ন সময়
মান 3SUM অ্যালগরিদম: O(n²) সময় (প্রি-প্রসেসিং ছাড়াই)

পরীক্ষার ফলাফল

জটিলতা তুলনা বিশ্লেষণ

অ্যালগরিদম	প্রি-প্রসেসিং সময়	প্রশ্ন সময়	স্থান জটিলতা	নির্ধারণবাদী
চ্যান-লিউয়েনস্টাইন	O(n²)	O(n^13/7) ≈ O(n^1.857)	O(n^13/7)	O(n^ω) প্রি-প্রসেসিং প্রয়োজন
চ্যান এবং অন্যরা	O(n²)	O(n^11/6) ≈ O(n^1.833)	O(n² log n)	প্রশ্ন সময় O(n^1.891)
এই পেপার (পরিচিত C)	O(n²)	O(n^1.5 log n)	O(n^1.5 log n)	মাল্টি-লগারিদমিক ফ্যাক্টর হারায়
এই পেপার (অজানা C)	O(n²)	O(n^1.5 log n)	O(n²)	উপপাদ্য 5.1

কর্মক্ষমতা উন্নতি পরিমাণ

প্রশ্ন সময় উন্নতি: O(n^11/6) ≈ O(n^1.833) থেকে O(n^1.5) এ উন্নীত, সূচক হ্রাস প্রায় 0.333
বাস্তবায়ন জটিলতা: Balog-Szemerédi-Gowers উপপাদ্য এড়ান, শুধুমাত্র FFT এবং হ্যাশিং প্রয়োজন
কার্যকারিতা সম্পূর্ণতা: সমস্ত-সংখ্যা 3SUM ক্ষমতা বজায় রাখুন

অ্যালগরিদম সঠিকতা

কঠোর সম্ভাব্যতা বিশ্লেষণের মাধ্যমে প্রমাণিত:

মিথ্যা ধনাত্মক প্রত্যাশা সীমা: E|B| ≤ O(n^1.5 log n) (লেমা 2.2)
লাস ভেগাস বৈশিষ্ট্য: পুনরায় শুরু করার প্রক্রিয়ার মাধ্যমে নিশ্চিত চলমান সময় সীমা নিশ্চিত করুন
সম্পূর্ণতা: সমস্ত প্রকৃত সমাধান সঠিকভাবে চিহ্নিত করা হয়

উপসংহার এবং আলোচনা

প্রধান উপসংহার

দক্ষতা অগ্রগতি: O(n^1.5 log n) প্রশ্ন সময় অর্জন করে, পূর্ববর্তী সেরা ফলাফল থেকে উল্লেখযোগ্যভাবে উন্নত
সরলীকরণ সাফল্য: জটিল যোগজ সমন্বয়বিদ্যা এড়ান, শুধুমাত্র মৌলিক সরঞ্জাম ব্যবহার করুন
ব্যবহারিকতা বৃদ্ধি: নির্ধারণবাদী সংস্করণ এবং অজানা C পরিস্থিতি পরিচালনা প্রদান করুন

সীমাবদ্ধতা বিশ্লেষণ

স্থান জটিলতা: অজানা C সংস্করণ সম্পূর্ণ যোগ সেট সংরক্ষণের জন্য O(n²) স্থান প্রয়োজন
মডেল সীমাবদ্ধতা: ইনপুট সংখ্যা সীমাবদ্ধ অনুমান করে, বাস্তব প্রয়োগ অতিরিক্ত পরিচালনা প্রয়োজন হতে পারে
বাস্তব RAM: বাস্তব RAM মডেলে অভিযোজন সম্ভব কিনা তা স্পষ্ট নয়
ধ্রুবক ফ্যাক্টর: তাত্ত্বিক বিশ্লেষণ বাস্তব বাস্তবায়নের ধ্রুবক খরচ বিবেচনা করে না

ভবিষ্যত গবেষণা দিকনির্দেশনা

বাস্তব RAM অভিযোজন: বাস্তব RAM মডেলে সম্ভাব্যতা অন্বেষণ করুন
স্থান অপ্টিমাইজেশন: অজানা C পরিস্থিতির স্থান প্রয়োজন হ্রাস করুন
নিম্ন সীমা গবেষণা: প্রি-প্রসেসড ইউনিভার্স 3SUM এর তাত্ত্বিক নিম্ন সীমা অন্বেষণ করুন
বাস্তব বাস্তবায়ন: দক্ষ বাস্তব অ্যালগরিদম বাস্তবায়ন বিকাশ করুন

গভীর মূল্যায়ন

শক্তি

তাত্ত্বিক অবদান উল্লেখযোগ্য: প্রশ্ন সময় O(n^1.833) থেকে O(n^1.5) এ উন্নীত, উন্নতি প্রশস্ত
প্রযুক্তিগত উদ্ভাবন চতুর:
- প্রাইম নির্বাচন কৌশল FFT দক্ষতা এবং মিথ্যা ধনাত্মক নিয়ন্ত্রণের ভারসাম্য রাখে
- নির্ধারণবাদী রূপান্তরের মাল্টি-মডিউলাস পদ্ধতি সর্বজনীন প্রযোজ্যতা রাখে
ব্যবহারিক মূল্য উচ্চ: অ্যালগরিদম সহজ এবং বাস্তবায়ন করা সহজ, জটিল সমন্বয়বিদ্যা সরঞ্জাম এড়ায়
বিশ্লেষণ কঠোর: সম্ভাব্যতা বিশ্লেষণ এবং জটিলতা প্রমাণ সম্পূর্ণ এবং নির্ভরযোগ্য
লেখা স্পষ্ট: প্রযুক্তিগত বর্ণনা সঠিক, অ্যালগরিদম বর্ণনা বোঝা সহজ

অপূর্ণতা

উদ্ভাবন মাত্রা: প্রধানত বিদ্যমান প্রযুক্তির চতুর সমন্বয়, মূল সৃজনশীলতা তুলনামূলকভাবে সীমিত
পরীক্ষামূলক যাচাইকরণ অনুপস্থিত: বিশুদ্ধ তাত্ত্বিক কাজ, বাস্তব কর্মক্ষমতা পরীক্ষা অভাব
প্রয়োগের পরিসীমা:
- ইনপুট সংখ্যা সীমাবদ্ধ অনুমান বাস্তবে অত্যন্ত শক্তিশালী হতে পারে
- বাস্তব RAM অভিযোজন অজানা
স্থান দক্ষতা: অজানা C সংস্করণের O(n²) স্থান প্রয়োজন বাস্তব প্রয়োগ সীমিত করতে পারে

প্রভাব মূল্যায়ন

একাডেমিক মূল্য: সূক্ষ্ম-দানাদার জটিলতা তত্ত্বের জন্য নতুন প্রযুক্তিগত পথ প্রদান করে
ব্যবহারিক সম্ভাবনা: সরলীকৃত অ্যালগরিদম বাস্তব সিস্টেমে স্থাপনা সহজ করে
অনুপ্রেরণামূলক অর্থ: প্রমাণ করে যে মান প্রযুক্তির সমন্বয় জটিল তাত্ত্বিক সরঞ্জাম অতিক্রম করতে পারে
পরবর্তী গবেষণা: অন্যান্য জ্যামিতিক/সমন্বয় সমস্যার অনুরূপ উন্নতি অনুপ্রাণিত করতে পারে

প্রযোজ্য পরিস্থিতি

ডাটাবেস প্রশ্ন: বড় ডেটাসেটের ত্রিমুখী প্রশ্ন অপ্টিমাইজেশন
গণনামূলক জ্যামিতি: সম্পর্কিত জ্যামিতিক সমস্যার প্রি-প্রসেসিং ত্বরণ
ক্রিপ্টোগ্রাফি প্রয়োগ: 3SUM কঠিনতার উপর ভিত্তি করে কিছু প্রোটোকল অপ্টিমাইজেশন
অ্যালগরিদম প্রতিযোগিতা: বাস্তব প্রোগ্রামিং প্রতিযোগিতায় দক্ষ বাস্তবায়ন

সংদর্ভ

পেপারটি 16টি সম্পর্কিত কাজ উদ্ধৃত করে, প্রধানত অন্তর্ভুক্ত:

3 বারান, ডেমেইন, প্যাট্রাশু: ক্লাসিক্যাল 3SUM উন্নতি
5 চ্যান, লিউয়েনস্টাইন: প্রথম প্রি-প্রসেসড ইউনিভার্স সাব-কোয়াড্রেটিক অ্যালগরিদম
6 চ্যান, ভাসিলেভস্কা উইলিয়ামস, জু: বর্তমান দ্রুততম অ্যালগরিদম
8 ফিশার, কালিসিয়াক, পোলাক: নির্ধারণবাদী 3SUM প্রযুক্তি
16 ভাসিলেভস্কা উইলিয়ামস: সূক্ষ্ম-দানাদার জটিলতা সমীক্ষা

সামগ্রিক মূল্যায়ন: এটি তাত্ত্বিক কম্পিউটার বিজ্ঞানের একটি উচ্চ মানের পেপার, যা 3SUM সমস্যার প্রি-প্রসেসড ইউনিভার্স ভেরিয়েন্টে উল্লেখযোগ্য তাত্ত্বিক অগ্রগতি অর্জন করেছে। যদিও প্রযুক্তিগত উদ্ভাবন তুলনামূলকভাবে বৃদ্ধিমূলক, জটিল অ্যালগরিদম সরলীকরণ এবং কর্মক্ষমতা উন্নতির অবদান উল্লেখযোগ্য মূল্য রাখে। পেপারের তাত্ত্বিক বিশ্লেষণ কঠোর, লেখা স্পষ্ট, এবং সম্পর্কিত ক্ষেত্রের জন্য মূল্যবান নতুন সরঞ্জাম এবং অন্তর্দৃষ্টি প্রদান করে।