We revisit the 3SUM problem in the \emph{preprocessed universes} setting. We present an algorithm that, given three sets $A$, $B$, $C$ of $n$ integers, preprocesses them in quadratic time, so that given any subsets $A' \subseteq A$, $B' \subseteq B$, $C' \subseteq C$, it can decide if there exist $a \in A'$, $b \in B'$, $c \in C'$ with $a+b=c$ in time $O(n^{1.5} \log n)$.
In contrast to both the first subquadratic $\tilde{O}(n^{13/7})$-time algorithm by Chan and Lewenstein (STOC 2015) and the current fastest $\tilde{O}(n^{11/6})$-time algorithm by Chan, Vassilevska Williams, and Xu (STOC 2023), which are based on the Balog--Szemerédi--Gowers theorem from additive combinatorics, our algorithm uses only standard 3SUM-related techniques, namely FFT and linear hashing modulo a prime. It is therefore not only faster but also simpler.
Just as the two previous algorithms, ours not only decides if there is a single 3SUM solution but it actually determines for each $c \in C'$ if there is a solution containing it. We also modify the algorithm to still work in the scenario where the set $C$ is unknown at the time of preprocessing. Finally, even though the simplest version of our algorithm is randomized, we show how to make it deterministic losing only polylogarithmic factors in the running time.
- পেপার আইডি: 2410.16784
- শিরোনাম: 3SUM in Preprocessed Universes: Faster and Simpler
- লেখক: শশ্বত কাসলিওয়াল (IIT দিল্লি), অ্যাডাম পোলাক (বোকোনি বিশ্ববিদ্যালয়), প্রত্যুষ শর্মা (IIT দিল্লি)
- শ্রেণীবিভাগ: cs.DS (ডেটা স্ট্রাকচার এবং অ্যালগরিদম)
- প্রকাশনার সময়/সম্মেলন: TheoretiCS ভলিউম 4 (2025), নিবন্ধ 24 (SOSA 2025 থেকে আমন্ত্রিত নিবন্ধ)
- পেপার লিঙ্ক: https://arxiv.org/abs/2410.16784
এই পেপারটি প্রি-প্রসেসড ইউনিভার্স সেটিংয়ে 3SUM সমস্যা পুনর্বিবেচনা করে। এটি একটি অ্যালগরিদম প্রস্তাব করে যা তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে) দ্বিঘাত সময়ে প্রি-প্রসেস করে, যাতে যেকোনো সাবসেট A' ⊆ A, B' ⊆ B, C' ⊆ C এর জন্য, a ∈ A', b ∈ B', c ∈ C' এর মধ্যে a+b=c সম্পর্ক বিদ্যমান কিনা তা O(n^1.5 log n) সময়ে নির্ধারণ করা যায়। চ্যান এবং লিউয়েনস্টাইনের প্রথম সাব-কোয়াড্রেটিক O(n^13/7) অ্যালগরিদম এবং চ্যান এবং অন্যদের বর্তমান দ্রুততম O(n^11/6) অ্যালগরিদম (যা যোগজ সমন্বয়বিদ্যার Balog-Szemerédi-Gowers উপপাদ্যের উপর ভিত্তি করে) এর তুলনায়, এই পেপারের অ্যালগরিদম শুধুমাত্র মান 3SUM সম্পর্কিত কৌশল (FFT এবং মডিউলার প্রাইম লিনিয়ার হ্যাশিং) ব্যবহার করে, তাই এটি শুধুমাত্র দ্রুততরই নয় বরং সহজতরও।
3SUM সমস্যা সূক্ষ্ম-দানাদার জটিলতা তত্ত্বের তিনটি মূল সমস্যার একটি (APSP এবং SAT এর সাথে সমান্তরালে)। তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে) দেওয়া হলে, এমন একটি ত্রিমুখী (a,b,c) ∈ A × B × C খুঁজে বের করতে হবে যেখানে a + b = c। মান পাঠ্যপুস্তক পদ্ধতির সময় জটিলতা O(n²), এবং দ্রুততম পরিচিত অ্যালগরিদম শুধুমাত্র log²n/(log log n)² উন্নতি প্রদান করে।
- জটিলতা তত্ত্বের তাৎপর্য: ব্যাপক অনুমান যে O(n^(2-ε)) সময় জটিলতার 3SUM অ্যালগরিদম বিদ্যমান নেই, এবং অনেক সমস্যার শর্তসাপেক্ষ নিম্ন সীমা এই অনুমানের উপর ভিত্তি করে
- ভেরিয়েন্ট গবেষণার মূল্য: এমন 3SUM ভেরিয়েন্ট অধ্যয়ন করা যেখানে শক্তিশালী সাব-কোয়াড্রেটিক অ্যালগরিদম বাস্তবে বিদ্যমান, 3SUM এর জটিলতা আরও ভালভাবে বুঝতে সাহায্য করে
- ব্যবহারিক বিবেচনা: প্রি-প্রসেসড ইউনিভার্স ভেরিয়েন্ট বাস্তব প্রয়োগে গুরুত্বপূর্ণ মূল্য রাখে, একাধিক প্রশ্নের জন্য দক্ষ প্রক্রিয়াকরণ অনুমতি দেয়
- চ্যান-লিউয়েনস্টাইন অ্যালগরিদম: জটিল Balog-Szemerédi-Gowers উপপাদ্যের উপর ভিত্তি করে, বাস্তবায়ন কঠিন
- চ্যান-ভাসিলেভস্কা উইলিয়ামস-জু অ্যালগরিদম: যদিও দ্রুততর কিন্তু উন্নত যোগজ সমন্বয়বিদ্যা তত্ত্বের উপর নির্ভরশীল
- উভয়ই সরলতার অভাব রাখে, বাস্তব বাস্তবায়ন জটিলতা উচ্চ
- অ্যালগরিদম দক্ষতা বৃদ্ধি: O(n^1.5 log n) প্রশ্ন সময়ের অ্যালগরিদম প্রস্তাব করে, যা পূর্ববর্তী O(n^11/6) থেকে উল্লেখযোগ্যভাবে উন্নত
- প্রযুক্তি সরলীকরণ: শুধুমাত্র FFT এবং লিনিয়ার হ্যাশিং ব্যবহার করে, জটিল যোগজ সমন্বয়বিদ্যা সরঞ্জাম এড়ায়
- কার্যকারিতা সম্পূর্ণতা: শুধুমাত্র সমাধান বিদ্যমান কিনা তা নির্ধারণ করে না, বরং প্রতিটি c ∈ C' কোনো সমাধানে অংশগ্রহণ করে কিনা তাও নির্ধারণ করে
- পরিস্থিতি সম্প্রসারণ: সেট C প্রি-প্রসেসিং সময়ে অজানা থাকার ক্ষেত্রে পরিচালনা করে
- নির্ধারণবাদী সংস্করণ: নির্ধারণবাদী অ্যালগরিদম প্রদান করে, শুধুমাত্র মাল্টি-লগারিদমিক ফ্যাক্টর হারায়
ইনপুট: তিনটি সেট A, B, C (প্রতিটিতে n সংখ্যা রয়েছে)
প্রি-প্রসেসিং: এই সেটগুলি O(n²) সময়ে প্রি-প্রসেস করুন
প্রশ্ন: সাবসেট A' ⊆ A, B' ⊆ B, C' ⊆ C দেওয়া হলে, প্রতিটি c ∈ C' এর জন্য a ∈ A', b ∈ B' এমন কিনা যেখানে a + b = c, তা O(n^1.5 log n) সময়ে নির্ধারণ করুন
প্রি-প্রসেসিং পর্যায়:
- [n^1.5, 2n^1.5) ব্যবধান থেকে সমানভাবে র্যান্ডমলি একটি প্রাইম p নির্বাচন করুন
- মিথ্যা ধনাত্মক সেট গণনা করুন: B := {(a,b,c) ∈ A × B × C : a + b ≡ c (mod p) ∧ a + b ≠ c}
- প্রত্যাশিত মিথ্যা ধনাত্মক সংখ্যা: E|B| ≤ O(n^1.5 log n)
প্রশ্ন পর্যায়:
- O(p log p) সময়ে FFT ব্যবহার করে (A' + B') mod p এর মাল্টিসেট গণনা করুন
- হ্যাশ টেবিল H তৈরি করুন, প্রতিটি c ∈ C' এর জন্য mod p সমাধান সংখ্যা সংরক্ষণ করুন
- মিথ্যা ধনাত্মক সেট B অতিক্রম করুন, বর্তমান উদাহরণে মিথ্যা ধনাত্মক বিয়োগ করুন
- প্রতিটি c ∈ C' এর জন্য, যদি Hc > 0 হয় তবে "হ্যাঁ" উত্তর দিন, অন্যথায় "না"
প্রি-প্রসেসিং পর্যায়:
- যোগ সেট A + B গণনা করুন
- প্রতিটি x ∈ A + B এর জন্য, সাক্ষী সেট Wx := {(a,b) ∈ A × B : a + b = x} সংরক্ষণ করুন
- র্যান্ডম প্রাইম m ∈ [n^1.5, 2·n^1.5) নির্বাচন করুন
- প্রতিটি অবশেষ r ∈ m এর জন্য, তালিকা Lr := {x ∈ A + B : x ≡ r (mod m)} প্রস্তুত করুন
প্রশ্ন পর্যায়:
- FFT ব্যবহার করে (A' + B') mod m গণনা করুন
- প্রতিটি c ∈ C' এর জন্য:
- c যদি A + B তে থাকে তা পরীক্ষা করুন
- পরিচয় ব্যবহার করে প্রকৃত সমাধান সংখ্যা গণনা করুন: mod m সমাধান সংখ্যা বিয়োগ মিথ্যা ধনাত্মক সংখ্যা
- Lc mod m তে x ≠ c উপাদান অতিক্রম করে মিথ্যা ধনাত্মক গণনা করুন
- হ্যাশিং প্রযুক্তির চতুর প্রয়োগ: উপযুক্ত আকারের প্রাইম মডিউলাস নির্বাচন করে FFT দক্ষতা এবং মিথ্যা ধনাত্মক সংখ্যার ভারসাম্য রাখুন
- মিথ্যা ধনাত্মক নিয়ন্ত্রণ: লেমা 2.2 ব্যবহার করে মিথ্যা ধনাত্মক প্রত্যাশা সংখ্যা O(n^1.5 log n) এ নিয়ন্ত্রণ করুন
- FFT অপ্টিমাইজেশন: 3SUM সমস্যা বহুপদী গুণনে রূপান্তরিত করুন, FFT এর O(m log m) জটিলতা ব্যবহার করুন
- নির্ধারণবাদী রূপান্তর: একাধিক মডিউলাসের সমন্বয় কৌশল ব্যবহার করে নির্ধারণবাদী সংস্করণ বাস্তবায়ন করুন
এই পেপারটি প্রধানত তাত্ত্বিক বিশ্লেষণ পরিচালনা করে, মান সূক্ষ্ম-দানাদার জটিলতা বিশ্লেষণ পদ্ধতি গ্রহণ করে:
গণনা মডেল:
- মান শব্দ RAM মডেল, O(log n) বিট শব্দ দৈর্ঘ্য
- ইনপুট সংখ্যা সীমা n^O(1)
- গাণিতিক ক্রিয়াকলাপ ধ্রুবক সময়
জটিলতা বিশ্লেষণ:
- সময় জটিলতা: প্রি-প্রসেসিং O(n²), প্রশ্ন O(n^1.5 log n)
- স্থান জটিলতা: পরিচিত C সংস্করণ O(n^1.5 log n), অজানা C সংস্করণ O(n²)
- র্যান্ডমনেস: লাস ভেগাস অ্যালগরিদম (প্রত্যাশিত সময় সীমা)
- চ্যান-লিউয়েনস্টাইন (STOC 2015): O(n^13/7) প্রশ্ন সময়
- চ্যান-ভাসিলেভস্কা উইলিয়ামস-জু (STOC 2023): O(n^11/6) প্রশ্ন সময়
- মান 3SUM অ্যালগরিদম: O(n²) সময় (প্রি-প্রসেসিং ছাড়াই)
| অ্যালগরিদম | প্রি-প্রসেসিং সময় | প্রশ্ন সময় | স্থান জটিলতা | নির্ধারণবাদী |
|---|
| চ্যান-লিউয়েনস্টাইন | O(n²) | O(n^13/7) ≈ O(n^1.857) | O(n^13/7) | O(n^ω) প্রি-প্রসেসিং প্রয়োজন |
| চ্যান এবং অন্যরা | O(n²) | O(n^11/6) ≈ O(n^1.833) | O(n² log n) | প্রশ্ন সময় O(n^1.891) |
| এই পেপার (পরিচিত C) | O(n²) | O(n^1.5 log n) | O(n^1.5 log n) | মাল্টি-লগারিদমিক ফ্যাক্টর হারায় |
| এই পেপার (অজানা C) | O(n²) | O(n^1.5 log n) | O(n²) | উপপাদ্য 5.1 |
- প্রশ্ন সময় উন্নতি: O(n^11/6) ≈ O(n^1.833) থেকে O(n^1.5) এ উন্নীত, সূচক হ্রাস প্রায় 0.333
- বাস্তবায়ন জটিলতা: Balog-Szemerédi-Gowers উপপাদ্য এড়ান, শুধুমাত্র FFT এবং হ্যাশিং প্রয়োজন
- কার্যকারিতা সম্পূর্ণতা: সমস্ত-সংখ্যা 3SUM ক্ষমতা বজায় রাখুন
কঠোর সম্ভাব্যতা বিশ্লেষণের মাধ্যমে প্রমাণিত:
- মিথ্যা ধনাত্মক প্রত্যাশা সীমা: E|B| ≤ O(n^1.5 log n) (লেমা 2.2)
- লাস ভেগাস বৈশিষ্ট্য: পুনরায় শুরু করার প্রক্রিয়ার মাধ্যমে নিশ্চিত চলমান সময় সীমা নিশ্চিত করুন
- সম্পূর্ণতা: সমস্ত প্রকৃত সমাধান সঠিকভাবে চিহ্নিত করা হয়
- ক্লাসিক্যাল 3SUM: গাজেন্টান-ওভারমার্স দ্বারা প্রবর্তিত, O(n²) মান অ্যালগরিদম
- সামান্য উন্নতি: বারান-ডেমেইন-প্যাট্রাশু পলিলগ ফ্যাক্টর উন্নতি বাস্তবায়ন করে
- ভেরিয়েন্ট গবেষণা:
- ছোট মহাবিশ্ব 3SUM: FFT পদ্ধতি, O(n + U log U) সময়
- 3SUM সূচীকরণ: বিভিন্ন প্রি-প্রসেসিং মোড
- বাস্তব RAM সংস্করণ: ফিশার এবং অন্যদের অভিযোজন কাজ
- বানসাল-উইলিয়ামস: প্রি-প্রসেসড ইউনিভার্স ধারণা প্রথম প্রস্তাব করে
- চ্যান-লিউয়েনস্টাইন: প্রথম সাব-কোয়াড্রেটিক অ্যালগরিদম, BSG উপপাদ্যের উপর ভিত্তি করে
- চ্যান এবং অন্যরা: বর্তমান দ্রুততম অ্যালগরিদম, BSG অনুসিদ্ধান্তের সরাসরি প্রমাণ
- 3SUM তে FFT এর প্রয়োগ: ছোট মহাবিশ্ব ক্ষেত্রে ক্লাসিক্যাল পদ্ধতি
- লিনিয়ার হ্যাশিং: মিথ্যা ধনাত্মক নিয়ন্ত্রণের মান প্রযুক্তি
- নির্ধারণবাদী প্রযুক্তি: ফিশার-কালিসিয়াক-পোলাক এর র্যান্ডমনেস অপসারণ সরঞ্জাম
- দক্ষতা অগ্রগতি: O(n^1.5 log n) প্রশ্ন সময় অর্জন করে, পূর্ববর্তী সেরা ফলাফল থেকে উল্লেখযোগ্যভাবে উন্নত
- সরলীকরণ সাফল্য: জটিল যোগজ সমন্বয়বিদ্যা এড়ান, শুধুমাত্র মৌলিক সরঞ্জাম ব্যবহার করুন
- ব্যবহারিকতা বৃদ্ধি: নির্ধারণবাদী সংস্করণ এবং অজানা C পরিস্থিতি পরিচালনা প্রদান করুন
- স্থান জটিলতা: অজানা C সংস্করণ সম্পূর্ণ যোগ সেট সংরক্ষণের জন্য O(n²) স্থান প্রয়োজন
- মডেল সীমাবদ্ধতা: ইনপুট সংখ্যা সীমাবদ্ধ অনুমান করে, বাস্তব প্রয়োগ অতিরিক্ত পরিচালনা প্রয়োজন হতে পারে
- বাস্তব RAM: বাস্তব RAM মডেলে অভিযোজন সম্ভব কিনা তা স্পষ্ট নয়
- ধ্রুবক ফ্যাক্টর: তাত্ত্বিক বিশ্লেষণ বাস্তব বাস্তবায়নের ধ্রুবক খরচ বিবেচনা করে না
- বাস্তব RAM অভিযোজন: বাস্তব RAM মডেলে সম্ভাব্যতা অন্বেষণ করুন
- স্থান অপ্টিমাইজেশন: অজানা C পরিস্থিতির স্থান প্রয়োজন হ্রাস করুন
- নিম্ন সীমা গবেষণা: প্রি-প্রসেসড ইউনিভার্স 3SUM এর তাত্ত্বিক নিম্ন সীমা অন্বেষণ করুন
- বাস্তব বাস্তবায়ন: দক্ষ বাস্তব অ্যালগরিদম বাস্তবায়ন বিকাশ করুন
- তাত্ত্বিক অবদান উল্লেখযোগ্য: প্রশ্ন সময় O(n^1.833) থেকে O(n^1.5) এ উন্নীত, উন্নতি প্রশস্ত
- প্রযুক্তিগত উদ্ভাবন চতুর:
- প্রাইম নির্বাচন কৌশল FFT দক্ষতা এবং মিথ্যা ধনাত্মক নিয়ন্ত্রণের ভারসাম্য রাখে
- নির্ধারণবাদী রূপান্তরের মাল্টি-মডিউলাস পদ্ধতি সর্বজনীন প্রযোজ্যতা রাখে
- ব্যবহারিক মূল্য উচ্চ: অ্যালগরিদম সহজ এবং বাস্তবায়ন করা সহজ, জটিল সমন্বয়বিদ্যা সরঞ্জাম এড়ায়
- বিশ্লেষণ কঠোর: সম্ভাব্যতা বিশ্লেষণ এবং জটিলতা প্রমাণ সম্পূর্ণ এবং নির্ভরযোগ্য
- লেখা স্পষ্ট: প্রযুক্তিগত বর্ণনা সঠিক, অ্যালগরিদম বর্ণনা বোঝা সহজ
- উদ্ভাবন মাত্রা: প্রধানত বিদ্যমান প্রযুক্তির চতুর সমন্বয়, মূল সৃজনশীলতা তুলনামূলকভাবে সীমিত
- পরীক্ষামূলক যাচাইকরণ অনুপস্থিত: বিশুদ্ধ তাত্ত্বিক কাজ, বাস্তব কর্মক্ষমতা পরীক্ষা অভাব
- প্রয়োগের পরিসীমা:
- ইনপুট সংখ্যা সীমাবদ্ধ অনুমান বাস্তবে অত্যন্ত শক্তিশালী হতে পারে
- বাস্তব RAM অভিযোজন অজানা
- স্থান দক্ষতা: অজানা C সংস্করণের O(n²) স্থান প্রয়োজন বাস্তব প্রয়োগ সীমিত করতে পারে
- একাডেমিক মূল্য: সূক্ষ্ম-দানাদার জটিলতা তত্ত্বের জন্য নতুন প্রযুক্তিগত পথ প্রদান করে
- ব্যবহারিক সম্ভাবনা: সরলীকৃত অ্যালগরিদম বাস্তব সিস্টেমে স্থাপনা সহজ করে
- অনুপ্রেরণামূলক অর্থ: প্রমাণ করে যে মান প্রযুক্তির সমন্বয় জটিল তাত্ত্বিক সরঞ্জাম অতিক্রম করতে পারে
- পরবর্তী গবেষণা: অন্যান্য জ্যামিতিক/সমন্বয় সমস্যার অনুরূপ উন্নতি অনুপ্রাণিত করতে পারে
- ডাটাবেস প্রশ্ন: বড় ডেটাসেটের ত্রিমুখী প্রশ্ন অপ্টিমাইজেশন
- গণনামূলক জ্যামিতি: সম্পর্কিত জ্যামিতিক সমস্যার প্রি-প্রসেসিং ত্বরণ
- ক্রিপ্টোগ্রাফি প্রয়োগ: 3SUM কঠিনতার উপর ভিত্তি করে কিছু প্রোটোকল অপ্টিমাইজেশন
- অ্যালগরিদম প্রতিযোগিতা: বাস্তব প্রোগ্রামিং প্রতিযোগিতায় দক্ষ বাস্তবায়ন
পেপারটি 16টি সম্পর্কিত কাজ উদ্ধৃত করে, প্রধানত অন্তর্ভুক্ত:
- 3 বারান, ডেমেইন, প্যাট্রাশু: ক্লাসিক্যাল 3SUM উন্নতি
- 5 চ্যান, লিউয়েনস্টাইন: প্রথম প্রি-প্রসেসড ইউনিভার্স সাব-কোয়াড্রেটিক অ্যালগরিদম
- 6 চ্যান, ভাসিলেভস্কা উইলিয়ামস, জু: বর্তমান দ্রুততম অ্যালগরিদম
- 8 ফিশার, কালিসিয়াক, পোলাক: নির্ধারণবাদী 3SUM প্রযুক্তি
- 16 ভাসিলেভস্কা উইলিয়ামস: সূক্ষ্ম-দানাদার জটিলতা সমীক্ষা
সামগ্রিক মূল্যায়ন: এটি তাত্ত্বিক কম্পিউটার বিজ্ঞানের একটি উচ্চ মানের পেপার, যা 3SUM সমস্যার প্রি-প্রসেসড ইউনিভার্স ভেরিয়েন্টে উল্লেখযোগ্য তাত্ত্বিক অগ্রগতি অর্জন করেছে। যদিও প্রযুক্তিগত উদ্ভাবন তুলনামূলকভাবে বৃদ্ধিমূলক, জটিল অ্যালগরিদম সরলীকরণ এবং কর্মক্ষমতা উন্নতির অবদান উল্লেখযোগ্য মূল্য রাখে। পেপারের তাত্ত্বিক বিশ্লেষণ কঠোর, লেখা স্পষ্ট, এবং সম্পর্কিত ক্ষেত্রের জন্য মূল্যবান নতুন সরঞ্জাম এবং অন্তর্দৃষ্টি প্রদান করে।