A growing class of applications demands \emph{fair ordering/sequencing} of events which ensures that events generated earlier by one client are processed before later events from other clients. However, achieving such sequencing is fundamentally challenging due to the inherent limitations of clock synchronization. We advocate for an approach that embraces, rather than eliminates, clock variability. Instead of attempting to remove error from a timestamp, Tommy, our proposed system, leverages a statistical model to compare two noisy timestamps probabilistically by learning per-clock offset distributions. Our preliminary statistical model computes the probability that one event precedes another w.r.t. the wall-clock time without access to the wall-clock. This serves as a foundation for a new relation: \emph{likely-happened-before} denoted by $\xrightarrow{p}$ where $p$ represents the probability of an event to have happened before another. The $\xrightarrow{p}$ relation provides a basis for ordering multiple events which are otherwise considered \emph{concurrent} by the typical \emph{happened-before} ($\rightarrow$) relation. We highlight various related challenges including intransitivity of $\xrightarrow{p}$ relation as opposed to the transitive $\rightarrow$ relation. We also outline several research directions: online fair sequencing, stochastically fair total ordering, host-level support for fairness and more.
academic
Au-delà de Lamport, Vers un Ordonnancement Équitable Probabiliste
Cet article aborde les défis de l'ordonnancement équitable (fair ordering) dans les systèmes distribués en proposant une nouvelle approche qui embrasse plutôt qu'elle n'élimine la variabilité des horloges. Les auteurs conçoivent le système Tommy, qui apprend la distribution des décalages de chaque horloge et utilise des modèles statistiques pour effectuer des comparaisons probabilistes d'horodatages bruyants. L'innovation centrale est l'introduction de la relation « likely-happened-before » (p), où p représente la probabilité qu'un événement se soit produit avant un autre. Cette relation permet d'ordonner les événements que la relation happened-before classique (→) considère comme concurrents, mais introduit également de nouveaux défis tels que la non-transitivité.
L'ordonnancement équitable dans les systèmes distribués exige de garantir que les événements générés plus tôt par un client soient traités avant les événements générés plus tard par d'autres clients. Ceci est crucial dans les applications compétitives telles que les bourses financières et les bourses publicitaires, collectivement désignées sous le terme « auction-apps ».
Équité financière: Dans les transactions financières, l'ordre de traitement des messages affecte directement les résultats des transactions, et un ordonnancement inéquitable peut entraîner des pertes économiques massives
Besoins de migration vers le cloud: Les bourses financières traditionnelles utilisent une infrastructure dédiée pour assurer l'équité, mais la migration vers le cloud public nécessite de nouvelles primitives réseau
Élargissement du champ d'application: Au-delà des transactions financières, les marchés compétitifs, les échanges NFT et les achats de produits en quantité limitée nécessitent tous un ordonnancement équitable
Hypothèse de synchronisation d'horloge parfaite: Les solutions existantes supposent une synchronisation d'horloge quasi-parfaite, ce qui n'est pas réalisable dans les réseaux asynchrones réels
Dépendance à une infrastructure spécialisée: Les approches traditionnelles nécessitent des câbles de longueur égale, des commutateurs à faible gigue et d'autres matériels propriétaires
Couplage applicatif: Certaines solutions sont étroitement couplées à la logique applicative spécifique, ce qui rend leur généralisation difficile
Limitation fondamentale de la synchronisation d'horloge: dans un réseau asynchrone ou à synchronisation bornée, la précision de synchronisation d'horloge pour n processus ne peut pas dépasser u(1−1/n), où u représente l'incertitude du délai de liaison.
Nouvelle définition de relation: Introduction de la relation likely-happened-before (p), qui étend la relation happened-before de Lamport
Modèle statistique: Conception d'une méthode de comparaison probabiliste d'horodatages basée sur la distribution des décalages d'horloge
Système Tommy: Implémentation d'un prototype d'ordonnanceur équitable sans nécessiter une synchronisation d'horloge parfaite
Analyse théorique: Preuve de la transitivité de la relation probabiliste sous distribution gaussienne
Directions de recherche: Proposition de plusieurs directions de recherche incluant l'ordonnancement équitable en ligne et l'ordre total équitable aléatoire
Définition de l'ordonnancement équitable: L'ordre dans lequel le serveur voit les messages doit correspondre à l'ordre observé par un observateur omniscient.
Entrée: Flux de messages clients avec horodatages locaux
Sortie: Lots de messages ordonnés équitablement selon leur heure de génération
Contrainte: Pas d'accès à une horloge globale, utilisation uniquement de la synchronisation d'horloge au mieux
Modélisation des messages comme nœuds dans un graphe, avec les relations p comme arêtes dirigées pondérées par p. Pour chaque paire de nœuds, on conserve l'arête avec le poids le plus élevé.
Ligne de base TrueTime: Simulation de Spanner TrueTime, où chaque message se voit attribuer un intervalle d'incertitude [T−3σ,T+3σ], les intervalles qui se chevauchent reçoivent le même classement.
La figure 5 montre les performances de Tommy par rapport à TrueTime:
Faible erreur d'horloge: Les deux systèmes affichent des performances comparables
Erreur d'horloge élevée ou petit intervalle entre messages: Tommy surpasse significativement TrueTime
Incertitude extrêmement élevée: La nature probabiliste de Tommy peut entraîner un RAS négatif, tandis que TrueTime maintient un score conservateur de 0
Solutions d'ingénierie utilisant des câbles de longueur égale et des commutateurs à faible gigue, où le traitement par ordre d'arrivée équivaut à un ordonnancement par heure de génération.
Pompe: Mécanisme de consensus limitant l'influence des nœuds byzantins sur l'ordre des événements, mais incapable d'imposer un ordonnancement équitable.
Proposition 1: Pour les variables aléatoires normales indépendantes X∼N(μX,σX2), Y∼N(μY,σY2), Z∼N(μZ,σZ2), en définissant la relation de préférence X≻Y⇔Pr[X>Y]>21, alors ≻ est transitive.
Points clés de la preuve:
Pr[A>B]>21⇔μA>μB
En raison de la transitivité des moyennes, la relation probabiliste est également transitive.
Pour les distributions arbitraires, la transitivité n'est pas garantie et des cycles du type A≻B, B≻C, C≻A peuvent apparaître, similaires au phénomène « pierre-papier-ciseaux ».
Développement de mécanismes robustes d'apprentissage de la distribution des décalages d'horloge, gestion des conditions anormales comme les variations de température.
Cet article propose de manière novatrice une approche d'ordonnancement équitable probabiliste, offrant une nouvelle direction de résolution pour les problèmes d'équité dans les systèmes distribués. Bien que présentant certains défis théoriques et d'implémentation, son idée centrale possède une valeur académique importante et un potentiel pratique considérable, jetant les bases pour les recherches ultérieures.