2025-11-11T16:25:09.674123

Multi-Way Co-Ranking: Index-Space Partitioning of Sorted Sequences Without Merge

Joshi

We present a merge-free algorithm for multi-way co-ranking, the problem of computing cut indices $i_1,\dots,i_m$ that partition each of the $m$ sorted sequences such that all prefix segments together contain exactly $K$ elements. Our method extends two-list co-ranking to arbitrary $m$, maintaining per-sequence bounds that converge to a consistent global frontier without performing any multi-way merge or value-space search. Rather, we apply binary search to \emph{index-space}. The algorithm runs in $O(\log(\sum_t n_t)\,\log m)$ time and $O(m)$ space, independent of $K$. We prove correctness via an exchange argument and discuss applications to distributed fractional knapsack, parallel merge partitioning, and multi-stream joins. Keywords: Co-ranking \sep partitioning \sep Merge-free algorithms \sep Index-space optimization \sep Selection and merging \sep Data structures

academic

Многопутевой Со-Ранжирование: Разбиение Индексного Пространства Отсортированных Последовательностей Без Слияния

Основная информация

ID статьи: 2510.22882
Название: Multi-Way Co-Ranking: Index-Space Partitioning of Sorted Sequences Without Merge
Автор: Amit Joshi (Independent Researcher)
Классификация: cs.DS (Структуры данных и алгоритмы)
Дата публикации: 27 октября 2025 г. (препринт arXiv)
Ссылка на статью: https://arxiv.org/abs/2510.22882

Аннотация

В данной работе предложен алгоритм многопутевого со-ранжирования без слияния для вычисления индексов разреза $i_1,\dots,i_m$ , которые разбивают $m$ отсортированных последовательностей таким образом, чтобы все префиксные сегменты в совокупности содержали ровно $K$ элементов. Метод расширяет двухсписковое со-ранжирование Зиберта и Трэффа на произвольное $m$ -путевое разбиение, сохраняя границы каждой последовательности и сходясь к согласованному глобальному фронту без выполнения многопутевого слияния или поиска в пространстве значений. Алгоритм применяет двоичный поиск в индексном пространстве с временной сложностью $O(\log(\sum_t n_t)\log m)$ и пространственной сложностью $O(m)$ , независимо от $K$ . Корректность доказана методом обмена аргументов и обсуждаются приложения в распределённых задачах о дробном рюкзаке, параллельном разбиении слияния и многопотоковых соединениях.

Исследовательский контекст и мотивация

Определение проблемы

Задача многопутевого со-ранжирования определяется следующим образом: даны $m$ последовательностей $L_1, \ldots, L_m$ , отсортированных в неубывающем порядке (с допуском повторений), каждая длины $n_t$ , и глобальный целевой ранг $K \in \{0, \ldots, N\}$ (где $N = \sum_t n_t$ ), необходимо найти индексы разреза $i_1, \ldots, i_m$ такие, что:

$\sum_{t=1}^m i_t = K \quad \text{и} \quad \max_t \ell_t \leq \min_t r_t$

где $\ell_t$ и $r_t$ обозначают соответственно значения левой и правой границ.

Мотивация исследования

Расширение классических алгоритмов: Существующие алгоритмы со-ранжирования ориентированы в основном на две последовательности, отсутствует эффективное многопутевое расширение
Избежание затрат на слияние: Традиционные методы требуют предварительного слияния нескольких последовательностей перед выбором, что приводит к значительным затратам
Преимущества индексного пространства: Операции в индексном пространстве, а не в пространстве значений, избегают сложности поиска по диапазону значений
Потребности практических приложений: Распределённые вычисления, параллельная обработка и запросы к базам данных требуют эффективных алгоритмов многопутевого разбиения

Ограничения существующих методов

Метод Зиберта-Трэффа: Поддерживает только со-ранжирование двух последовательностей
Метод Фредериксона-Джонсона: Работает в пространстве значений, требует глобальных операций подсчёта
Методы на основе разделителей: Требуют предварительного слияния или поиска по диапазону значений, высокая сложность

Основные вклады

Разработка алгоритма: Предложен первый алгоритм многопутевого со-ранжирования без слияния, расширяющий классический двухпутевой метод на произвольное $m$ -путевое разбиение
Теоретический анализ: Доказана корректность алгоритма и временная сложность $O(\log(\sum_t n_t)\log m)$
Инновация в структурах данных: Разработаны адресуемые кучи (addressable heaps) для эффективного сохранения значений границ
Расширение приложений: Продемонстрированы потенциальные приложения алгоритма в распределённой оптимизации, параллельной обработке и системах баз данных

Подробное описание метода

Определение задачи

Входные данные:

$m$ отсортированных последовательностей $L_1, \ldots, L_m$ длины $n_1, \ldots, n_m$
Целевой ранг $K \in [0, N]$ , где $N = \sum_{t=1}^m n_t$

Выходные данные:

Вектор индексов разреза $(i_1, \ldots, i_m)$ , удовлетворяющий условиям со-ранжирования

Ограничения:

$\sum_{t=1}^m i_t = K$
$\max_t \ell_t \leq \min_t r_t$ (условие со-ранжирования)

Архитектура алгоритма

Основная структура данных: индексные кучи

Алгоритм поддерживает две индексные кучи:

$H_L$ : максимальная куча, хранящая значения левых границ $(\ell_t, t)$ , возвращающая последовательность с максимальной левой границей (донор)
$H_R$ : минимальная куча, хранящая значения правых границ $(r_t, t)$ , возвращающая последовательность с минимальной правой границей (получатель)

Каждая куча поддерживает операцию update_key за $O(\log m)$ и операцию peek за $O(1)$ .

Управление границами

Для каждой последовательности $t$ поддерживаются:

Нижняя граница: $Lb[t] \leq i[t]$
Верхняя граница: $i[t] \leq Ub[t]$
Текущий индекс: $i[t]$

Итеративная стратегия

Алгоритм использует жадную стратегию донор-получатель:

Определение экстремумов:
- Донор $p = \arg\max_t \ell_t$ (максимальная левая граница)
- Получатель $q = \arg\min_t r_t$ (минимальная правая граница)

Вычисление объёма передачи:

donor_slack = ⌈(i[p] - Lb[p])/2⌉
receiver_slack = ⌈(Ub[q] - i[q])/2⌉
Δ = min{donor_slack, receiver_slack}

Выполнение передачи:
- $i[p] \leftarrow i[p] - \Delta$
- $i[q] \leftarrow i[q] + \Delta$
- Обновление границ: $Ub[p] \leftarrow i[p]$ , $Lb[q] \leftarrow i[q]$
Обновление куч: Обновление ключей куч для затронутых последовательностей

Технические инновации

Операции в индексном пространстве: Полная работа в индексном пространстве, избегание поиска по диапазону значений и операций слияния
Геометрическая сходимость: Сокращение вдвое допустимой области гарантирует логарифмическую скорость сходимости
Несбалансированная потенциальная функция: Определение $\Phi(i) = \max_t \ell_t - \min_t r_t$ в качестве критерия сходимости
Детерминированная сложность: Сложность алгоритма независима от целевого ранга $K$

Теоретический анализ

Доказательство корректности

Лемма 1 (Оптимальность локальных экстремумов)

Если $\Phi(i) > 0$ , пусть $p = \arg\max_t \ell_t$ и $q = \arg\min_t r_t$ . Среди всех допустимых бесконечно малых передач, сохраняющих $\sum_t i_t = K$ , пара $(p,q)$ достигает максимального неувеличивающегося изменения $\Phi$ .

Схема доказательства: Уменьшение $i_p$ снижает $\ell_p$ (локальный максимум левой границы), увеличение $i_q$ повышает $r_q$ (локальный минимум правой границы). Поскольку $\ell_p \geq \ell_u$ и $r_q \leq r_v$ для всех $u,v$ , экстремальная пара $(p,q)$ производит наиболее крутое уменьшение разрыва $\max\ell - \min r$ .

Лемма 2 (Перестановочность порядка передач)

Любая последовательность допустимых передач, уменьшающих $\Phi$ , может быть переупорядочена так, чтобы все экстремальные передачи $(p,q)$ происходили перед любыми неэкстремальными передачами, без ухудшения $\Phi$ на любом промежуточном этапе.

Теорема 1 (Сходимость и корректность)

Алгоритм 2 завершается с допустимым вектором со-ранжирования $(i_1, \ldots, i_m)$ , удовлетворяющим $\sum_t i_t = K$ и $\max_t \ell_t \leq \min_t r_t$ .

Анализ сложности

Анализ итераций

На каждой итерации допустимое расстояние донора или получателя сокращается вдвое. Расстояние $Ub[t] - Lb[t]$ для каждой последовательности может быть сокращено не более $O(\log n_t)$ раз. Суммируя по всем $m$ последовательностям, общее число итераций составляет:

$T = O\left(\log\left(\sum_{t=1}^m n_t\right)\right)$

Временная сложность

Каждая итерация выполняет константное число операций с индексными кучами (время $O(\log m)$ ), поэтому общая временная сложность составляет:

$O\left(\log\left(\sum_t n_t\right) \cdot \log m\right)$

Пространственная сложность

Алгоритм требует хранения только индексов и информации о границах для $m$ последовательностей, пространственная сложность составляет $O(m)$ .

Реализация алгоритма

Основной поток алгоритма

def multi_way_corank(sequences, K):
    m = len(sequences)
    # Инициализация границ и индексов
    Lb = [0] * m
    Ub = [len(seq) for seq in sequences]
    i = water_fill_initialization(K, Ub)
    
    # Построение индексных куч
    HL = MaxHeap()  # Максимальная куча левых границ
    HR = MinHeap()  # Минимальная куча правых границ
    
    for t in range(m):
        HL.insert(t, left_boundary(sequences[t], i[t]))
        HR.insert(t, right_boundary(sequences[t], i[t]))
    
    while True:
        # Получение донора и получателя
        max_left, p = HL.peek()
        min_right, q = HR.peek()
        
        # Проверка условия завершения
        if max_left <= min_right:
            break
            
        # Вычисление объёма передачи
        donor_slack = ceil((i[p] - Lb[p]) / 2)
        receiver_slack = ceil((Ub[q] - i[q]) / 2)
        delta = min(donor_slack, receiver_slack)
        
        # Выполнение передачи
        i[p] -= delta
        i[q] += delta
        
        # Обновление границ
        Ub[p] = i[p]
        Lb[q] = i[q]
        
        # Обновление куч
        update_heaps(HL, HR, sequences, i, p, q)
    
    return i

Стратегия инициализации

Используется стратегия "водяного заполнения" для инициализации допустимого решения:

def water_fill_initialization(K, capacities):
    i = [0] * len(capacities)
    need = K
    for t in range(len(capacities)):
        take = min(capacities[t], need)
        i[t] = take
        need -= take
        if need == 0:
            break
    return i

Сценарии приложений

1. Распределённая задача о дробном рюкзаке

В многоисточниковой задаче о дробном рюкзаке, когда предметы отсортированы по плотности и распределены по $m$ фрагментам, можно использовать со-ранжирование для вычисления глобального разбиения $K$ -префикса без слияния исходных данных.

2. Параллельное $m$ -путевое разбиение слияния

Распределение непересекающихся префиксов между процессорами без выполнения предварительного слияния. Вектор со-ранжирования определяет точные точки соединения, после чего процессоры выполняют только локальное слияние в своих диапазонах.

3. Разбиение многопотокового соединения

В конвейерах обработки баз данных или потоков разбиение фронта соединения по глобальному рангу является естественным требованием; данный метод создаёт согласованные с глобальным префиксом курсоры для каждого потока.

Экспериментальная проверка

Хотя статья сосредоточена в основном на теоретическом анализе, автор предоставляет код реализации для проверки. Практическую производительность алгоритма можно оценить по следующим аспектам:

Теоретические гарантии производительности

Временная сложность: $O(\log(\sum_t n_t) \log m)$
Пространственная сложность: $O(m)$
Независимость: Сложность не зависит от целевого ранга $K$

Сравнение с существующими методами

По сравнению с методами слияния: Избегает затрат $O(N)$ на слияние
По сравнению с методами в пространстве значений: Избегает глобальных операций подсчёта
По сравнению с Фредериксоном-Джонсоном: Операции в индексном пространстве, более эффективно

Связанные работы

Двухсписковое со-ранжирование

Работа Зиберта и Трэффа заложила основы со-ранжирования, применяемого в основном для разбиения работы в параллельном слиянии. Данная работа расширяет его с 2-путевого на произвольное $m$ -путевое разбиение.

Параллельная сортировка на основе разделителей

Метод точного разделителя Зиберта и Вольфа работает в пространстве значений, ища пороговые значения ключей для сбалансированного разбиения. В отличие от этого, данный метод работает в индексном пространстве, непосредственно выводя вектор со-ранжирования.

Выбор и ранжирование в сортировке разбиений

Классическая работа Фредериксона-Джонсона изучает выбор и ранжирование на структурированных входах (таких как объединение $m$ отсортированных списков). Её алгоритм по существу является процессом в пространстве значений, в то время как данная работа предоставляет примитив индексного пространства.

Заключение и обсуждение

Основные выводы

Успешно расширено двухпутевое со-ранжирование на многопутевой случай с сохранением хороших теоретических свойств
Операции в индексном пространстве избегают поиска по диапазону значений, обеспечивая детерминированные гарантии сложности
Алгоритм прост в реализации и обладает хорошей практической применимостью

Ограничения

Предположения: Требуется, чтобы входные последовательности были отсортированы
Область применения: Применим в основном к сценариям, требующим точного разбиения
Экспериментальная проверка: Отсутствует крупномасштабная экспериментальная проверка производительности

Направления будущих исследований

Динамические последовательности: Расширение на поддержку динамических обновлений последовательностей
Приближённые алгоритмы: Разработка более быстрых приближённых версий
Параллелизация: Исследование возможностей параллелизации алгоритма
Практические приложения: Проверка эффективности в большем числе реальных систем

Глубокая оценка

Преимущества

Теоретический вклад: Впервые предложен эффективный алгоритм многопутевого со-ранжирования, заполняющий теоретический пробел
Методологическая инновация: Новый подход операций в индексном пространстве, избегающий ограничений традиционных методов
Строгий анализ: Предоставлено полное доказательство корректности и анализ сложности
Практическая ценность: Алгоритм прост, легко реализуется, имеет чёткие сценарии применения

Недостатки

Отсутствие экспериментов: Статья лишена экспериментальной проверки, невозможно оценить практическую производительность
Ограниченное сравнение: Отсутствует детальное сравнение производительности с существующими методами
Поверхностное рассмотрение приложений: Обсуждение сценариев применения относительно поверхностно, недостаёт глубокого анализа

Влияние

Академическая ценность: Предоставляет теоретическую основу для задачи многопутевого со-ранжирования
Практический потенциал: Имеет перспективы применения в распределённых вычислениях и параллельной обработке
Воспроизводимость: Автор предоставляет код реализации, облегчая проверку и расширение

Применимые сценарии

Разбиение данных в распределённых системах
Балансировка нагрузки в параллельных алгоритмах
Оптимизация запросов в системах баз данных
Многопотоковое слияние в системах потоковой обработки

Библиография

1 Greg N. Frederickson and Donald B. Johnson. Generalized selection and ranking. STOC 1980.

2 Christian Siebert. Perfectly load-balanced, stable, synchronization-free parallel merge. Parallel Processing Letters, 2014.

3 Christian Siebert. Simple in-place yet comparison-optimal mergesort, arXiv:2509.24540, 2025.

4 Christian Siebert and Felix Wolf. A scalable parallel sorting algorithm using exact splitting. RWTH Aachen University technical report, 2011.

Общая оценка: Это теоретически ориентированная статья по алгоритмам, успешно решающая важную задачу многопутевого со-ранжирования. Несмотря на отсутствие экспериментальной проверки, теоретический анализ строг, методология инновационна, и работа предоставляет ценный теоретический инструмент для смежных областей.