Multi-Way Co-Ranking: Index-Space Partitioning of Sorted Sequences Without Merge
Joshi
We present a merge-free algorithm for multi-way co-ranking, the problem of computing cut indices $i_1,\dots,i_m$ that partition each of the $m$ sorted sequences such that all prefix segments together contain exactly $K$ elements. Our method extends two-list co-ranking to arbitrary $m$, maintaining per-sequence bounds that converge to a consistent global frontier without performing any multi-way merge or value-space search. Rather, we apply binary search to \emph{index-space}. The algorithm runs in $O(\log(\sum_t n_t)\,\log m)$ time and $O(m)$ space, independent of $K$. We prove correctness via an exchange argument and discuss applications to distributed fractional knapsack, parallel merge partitioning, and multi-stream joins.
Keywords: Co-ranking \sep partitioning \sep Merge-free algorithms \sep Index-space optimization \sep Selection and merging \sep Data structures
academic
ترتيب متعدد الاتجاهات المتزامن: تقسيم فضاء الفهرس للتسلسلات المرتبة بدون دمج
تقدم هذه الورقة خوارزمية ترتيب متزامن متعدد الاتجاهات بدون دمج لحساب فهارس القطع i1,…,im التي تقسم m من التسلسلات المرتبة، بحيث تحتوي جميع القطاعات البادئة مجتمعة على K عنصر بالضبط. تمدد هذه الطريقة ترتيب سيبرت وتراف المتزامن ثنائي القائمة إلى أي m-اتجاه، مع الحفاظ على حدود كل تسلسل والتقارب نحو جبهة عالمية متسقة، دون تنفيذ دمج متعدد الاتجاهات أو البحث في فضاء القيم. تطبق الخوارزمية البحث الثنائي في فضاء الفهرس بتعقيد زمني قدره O(log(∑tnt)logm) وتعقيد مكاني قدره O(m)، وهو مستقل عن K. يتم إثبات الصحة من خلال حجج التبديل، وتناقش التطبيقات في حقيبة الكسور الموزعة والتقسيم المتوازي للدمج والربط متعدد التدفقات.
يُعرّف مشكلة الترتيب المتزامن متعدد الاتجاهات على النحو التالي: بمعطيات m من التسلسلات L1,…,Lm المرتبة بترتيب غير تنازلي (مع السماح بالتكرار)، بطول nt لكل منها، والهدف العالمي للترتيب K∈{0,…,N} (حيث N=∑tnt)، يجب إيجاد فهارس القطع i1,…,im بحيث:
∑t=1mit=Kوmaxtℓt≤mintrt
حيث ℓt و rt يمثلان قيم الحد الأيسر والأيمن على التوالي.
إذا كان Φ(i)>0، وليكن p=argmaxtℓt و q=argmintrt. من بين جميع التحويلات اللامتناهية الممكنة التي تحافظ على ∑tit=K، يحقق الزوج (p,q) أقصى تغيير غير متزايد في Φ.
فكرة الإثبات: تقليل ip يقلل ℓp (الحد الأيسر الأقصى محلياً)، وزيادة iq ترفع rq (الحد الأيمن الأدنى محلياً). بما أن ℓp≥ℓu و rq≤rv لجميع u,v، فإن الزوج الحدي (p,q) ينتج أكثر انخفاض حاد في الفجوة maxℓ−minr.
في كل جولة، يتم تقليل المسافة الممكنة للمانح أو المستقبل بمقدار النصف. المسافة Ub[t]−Lb[t] لكل تسلسل تتناقص بحد أقصى O(lognt) مرة. بتجميع جميع m من التسلسلات، يكون إجمالي عدد الجولات:
def water_fill_initialization(K, capacities):
i = [0] * len(capacities)
need = K
for t in range(len(capacities)):
take = min(capacities[t], need)
i[t] = take
need -= take
if need == 0:
break
return i
في مشكلة حقيبة الكسور متعددة المصادر، عندما تكون العناصر مرتبة حسب الكثافة وموزعة على m من الأجزاء، يمكن استخدام الترتيب المتزامن لحساب تقسيم البادئة العالمية K بدون دمج بيانات المصدر.
في خط أنابيب قاعدة البيانات أو معالجة التدفقات، يعتبر التقسيم عند الترتيب العالمي احتياجاً طبيعياً، وتنتج هذه الطريقة مؤشرات لكل تدفق متسقة مع البادئة العالمية.
تدرس طريقة الفاصل الدقيق لسيبرت وولف العمليات في فضاء القيم، وتبحث عن عتبات مفاتيح لتقسيم متوازن. في المقابل، تعمل طريقة هذه الورقة في فضاء الفهرس، وتخرج مباشرة متجه الترتيب المتزامن.
يدرس العمل الكلاسيكي لفريدريكسون-جونسون الاختيار والترتيب على المدخلات المنظمة (مثل اتحاد m من القوائم المرتبة). تعتبر خوارزميتهم بشكل أساسي عملية فضاء قيم، بينما توفر هذه الورقة بدائية فضاء فهرس.
3 Christian Siebert. Simple in-place yet comparison-optimal mergesort, arXiv:2509.24540, 2025.
4 Christian Siebert and Felix Wolf. A scalable parallel sorting algorithm using exact splitting. RWTH Aachen University technical report, 2011.
التقييم الإجمالي: هذه ورقة بحثية قوية من حيث النظرية، تحل بنجاح مشكلة الترتيب المتزامن متعدد الاتجاهات المهمة. على الرغم من افتقارها إلى التحقق التجريبي، فإن التحليل النظري صارم وابتكار الطريقة قوي، مما يوفر أداة نظرية قيمة للمجالات ذات الصلة.