A growing class of applications demands \emph{fair ordering/sequencing} of events which ensures that events generated earlier by one client are processed before later events from other clients. However, achieving such sequencing is fundamentally challenging due to the inherent limitations of clock synchronization. We advocate for an approach that embraces, rather than eliminates, clock variability. Instead of attempting to remove error from a timestamp, Tommy, our proposed system, leverages a statistical model to compare two noisy timestamps probabilistically by learning per-clock offset distributions. Our preliminary statistical model computes the probability that one event precedes another w.r.t. the wall-clock time without access to the wall-clock. This serves as a foundation for a new relation: \emph{likely-happened-before} denoted by $\xrightarrow{p}$ where $p$ represents the probability of an event to have happened before another. The $\xrightarrow{p}$ relation provides a basis for ordering multiple events which are otherwise considered \emph{concurrent} by the typical \emph{happened-before} ($\rightarrow$) relation. We highlight various related challenges including intransitivity of $\xrightarrow{p}$ relation as opposed to the transitive $\rightarrow$ relation. We also outline several research directions: online fair sequencing, stochastically fair total ordering, host-level support for fairness and more.
academic
Jenseits von Lamport, Hin zu Probabilistischer Fairer Ordnung
Dieses Paper adressiert die Herausforderung der fairen Ordnung (fair ordering) in verteilten Systemen und schlägt einen neuen Ansatz vor, der Uhrenabweichungen umarmt, anstatt sie zu eliminieren. Die Autoren entwerfen das Tommy-System, das durch das Erlernen der Offset-Verteilung jeder Uhr statistische Modelle zur probabilistischen Vergleichung von verrauschten Zeitstempeln verwendet. Die Kernidee ist die Einführung der „likely-happened-before"-Beziehung (p), wobei p die Wahrscheinlichkeit darstellt, dass ein Ereignis vor einem anderen Ereignis stattgefunden hat. Diese Beziehung ermöglicht die Ordnung von Ereignissen, die die traditionelle happened-before-Beziehung (→) als gleichzeitig einstuft, führt aber auch zu neuen Herausforderungen wie Nicht-Transitivität.
Faire Ordnung in verteilten Systemen erfordert, dass Ereignisse, die von einem Client früher generiert wurden, vor Ereignissen verarbeitet werden, die von anderen Clients später generiert wurden. Dies ist in wettbewerbsintensiven Anwendungen wie Finanzbörsen und Werbebörsen von entscheidender Bedeutung, die kollektiv als „Auktions-Apps" bezeichnet werden.
Finanzielle Fairness: Bei Finanztransaktionen beeinflusst die Reihenfolge der Nachrichtenverarbeitung direkt das Transaktionsergebnis; unfaire Ordnung kann zu enormen wirtschaftlichen Verlusten führen
Cloud-Migrationsbedarf: Traditionelle Finanzbörsen verwenden spezialisierte Infrastruktur zur Gewährleistung von Fairness, aber die Migration zu öffentlichen Clouds erfordert neue Netzwerk-Primitive
Erweiterte Anwendungsbereiche: Neben Finanztransaktionen benötigen wettbewerbsfähige Märkte, NFT-Handel und Schnäppcheneinkäufe faire Ordnung
Annahme perfekter Zeitsynchronisation: Bestehende Lösungen setzen nahezu perfekte Zeitsynchronisation voraus, was in praktischen asynchronen Netzwerken nicht machbar ist
Abhängigkeit von spezialisierter Infrastruktur: Traditionelle Lösungen erfordern gleichlange Kabel, Switches mit niedriger Jitter und andere spezialisierte Hardware
Anwendungskopplung: Einige Lösungen sind eng mit spezifischer Anwendungslogik gekoppelt und lassen sich schwer verallgemeinern
Fundamentale Grenzen der Zeitsynchronisation: In asynchronen oder begrenzt synchronen Netzwerken kann die Zeitsynchronisationsgenauigkeit von n Prozessen u(1−1/n) nicht überschreiten, wobei u die Unsicherheit der Link-Verzögerung darstellt.
Definition fairer Ordnung: Die Reihenfolge, in der der Server Nachrichten sieht, sollte der Reihenfolge entsprechen, die ein allwissender Beobachter beobachtet.
Eingabe: Client-Nachrichtenströme mit lokalen Zeitstempeln
Ausgabe: Nach Generierungszeit fair geordnete Nachrichtenbatches
Einschränkungen: Kein Zugriff auf globale Uhr; nur bestmögliche Zeitsynchronisation
Modellierung von Nachrichten als Knoten in einem Graphen, wobei p-Beziehungen gewichtete gerichtete Kanten darstellen. Für jedes Knotenpaar wird die Kante mit höherem Gewicht beibehalten.
Technische Lösungen mit gleichlangen Kabeln und Switches mit niedriger Jitter, bei denen die Verarbeitung nach Ankunftsreihenfolge der Verarbeitung nach Generierungszeit entspricht.
Proposition 1: Für unabhängige Normalverteilungen X∼N(μX,σX2), Y∼N(μY,σY2), Z∼N(μZ,σZ2), definieren Sie die Präferenzbeziehung X≻Y⇔Pr[X>Y]>21, dann ist ≻ transitiv.
Beweis-Kernpunkte:
Pr[A>B]>21⇔μA>μB
Aufgrund der Transitivität von Mittelwerten ist die probabilistische Beziehung ebenfalls transitiv.
Für beliebige Verteilungen ist Transitivität nicht garantiert; es können Zyklen wie A≻B, B≻C, C≻A auftreten, ähnlich dem „Schere-Stein-Papier"-Phänomen.
Dieses Paper führt einen innovativen Ansatz zur probabilistischen fairen Ordnung ein und bietet eine neue Lösungsrichtung für Fairness-Probleme in verteilten Systemen. Obwohl es theoretische und implementierungstechnische Herausforderungen gibt, hat die Kernidee bedeutenden akademischen Wert und praktisches Potenzial und legt den Grundstein für zukünftige Forschung.