A growing class of applications demands \emph{fair ordering/sequencing} of events which ensures that events generated earlier by one client are processed before later events from other clients. However, achieving such sequencing is fundamentally challenging due to the inherent limitations of clock synchronization. We advocate for an approach that embraces, rather than eliminates, clock variability. Instead of attempting to remove error from a timestamp, Tommy, our proposed system, leverages a statistical model to compare two noisy timestamps probabilistically by learning per-clock offset distributions. Our preliminary statistical model computes the probability that one event precedes another w.r.t. the wall-clock time without access to the wall-clock. This serves as a foundation for a new relation: \emph{likely-happened-before} denoted by $\xrightarrow{p}$ where $p$ represents the probability of an event to have happened before another. The $\xrightarrow{p}$ relation provides a basis for ordering multiple events which are otherwise considered \emph{concurrent} by the typical \emph{happened-before} ($\rightarrow$) relation. We highlight various related challenges including intransitivity of $\xrightarrow{p}$ relation as opposed to the transitive $\rightarrow$ relation. We also outline several research directions: online fair sequencing, stochastically fair total ordering, host-level support for fairness and more.
academic
За пределами Лампорта: К вероятностному справедливому упорядочению
В данной работе предлагается новый подход к решению проблемы справедливого упорядочения (fair ordering) в распределённых системах, который заключается в принятии, а не устранении вариативности часов. Авторы разработали систему Tommy, которая посредством изучения распределения смещений каждых часов использует статистические модели для вероятностного сравнения зашумленных временных меток. Ключевым нововведением является введение отношения "likely-happened-before" (p), где p обозначает вероятность того, что одно событие произошло раньше другого. Это отношение позволяет упорядочить события, которые классическое отношение happened-before (→) считает одновременными, однако вносит новые вызовы, такие как нетранзитивность.
Справедливое упорядочение в распределённых системах требует обеспечения того, чтобы события, созданные одним клиентом раньше, обрабатывались до событий, созданных другими клиентами позже. Это критически важно для конкурентных приложений, таких как финансовые биржи, рекламные биржи и другие, объединённые под термином "auction-apps".
Финансовая справедливость: При финансовых операциях порядок обработки сообщений напрямую влияет на результаты торговли; несправедливое упорядочение может привести к огромным экономическим потерям
Требования облачной миграции: Традиционные финансовые биржи используют специализированную инфраструктуру для обеспечения справедливости, однако миграция в публичное облако требует новых сетевых примитивов
Расширение области применения: Помимо финансовых операций, конкурентные рынки, торговля NFT, распродажи ограниченных товаров и другие сценарии требуют справедливого упорядочения
Предположение о идеальной синхронизации часов: Существующие решения предполагают почти идеальную синхронизацию часов, что невозможно в реальных асинхронных сетях
Зависимость от специальной инфраструктуры: Традиционные решения требуют кабелей одинаковой длины, коммутаторов с низкой дрожанием и другого специализированного оборудования
Связанность с приложением: Некоторые решения тесно связаны с логикой конкретного приложения, что затрудняет их универсализацию
Основное ограничение синхронизации часов: в асинхронных или ограниченно синхронных сетях точность синхронизации часов n процессов не может превышать u(1−1/n), где u обозначает неопределённость задержки канала.
Новое определение отношения: Введение отношения likely-happened-before (p), расширяющего классическое отношение happened-before Лампорта
Статистическая модель: Разработка метода вероятностного сравнения временных меток на основе распределения смещений часов
Система Tommy: Реализация прототипа справедливого упорядочивателя без требования идеальной синхронизации часов
Теоретический анализ: Доказательство транзитивности вероятностного отношения при гауссовом распределении
Направления исследований: Предложение нескольких направлений развития, включая онлайн справедливое упорядочение и случайный справедливый полный порядок
Определение справедливого упорядочения: Порядок, в котором сервер видит сообщения, должен совпадать с порядком, наблюдаемым всеведущим наблюдателем.
Входные данные: Поток сообщений клиентов с локальными временными метками
Выходные данные: Пакеты сообщений, справедливо упорядоченные по времени создания
Ограничения: Отсутствие доступа к глобальным часам; возможность использования только синхронизации часов по принципу "максимум усилий"
Моделирование сообщений как узлов в графе, отношение p как взвешенные направленные рёбра. Для каждой пары узлов сохраняется ребро с более высоким весом.
На рисунке 5 показана производительность Tommy относительно TrueTime:
Низкая ошибка часов: Производительность обеих систем сопоставима
Высокая ошибка часов или малый интервал между сообщениями: Tommy значительно превосходит TrueTime
Экстремально высокая неопределённость: Вероятностная природа Tommy может привести к отрицательному RAS, тогда как TrueTime сохраняет консервативную оценку 0
Инженерные решения, использующие кабели одинаковой длины и коммутаторы с низкой дрожанием, где обработка в порядке поступления эквивалентна обработке в порядке создания.
Предложение 1: Для независимых нормальных случайных величин X∼N(μX,σX2), Y∼N(μY,σY2), Z∼N(μZ,σZ2), определим отношение предпочтения X≻Y⇔Pr[X>Y]>21, тогда ≻ является транзитивным.
Данная работа открывает новое направление в решении проблемы справедливого упорядочения в распределённых системах посредством вероятностного подхода. Хотя существуют определённые теоретические и практические вызовы, основная идея обладает значительной научной ценностью и практическим потенциалом, создавая основу для последующих исследований.