Coagulation-Fragmentation Duality of Infinitely Exchangeable Partitions from Coupled Mixed Poisson Species Sampling Models
James
Jim Pitman's~(1999) celebrated coagulation-fragmentation duality for the PD($α$,$θ$) family of laws of Pitman and Marc Yor~(1997) has resisted generalization beyond its canonical setting. We resolve this by introducing a novel, four-part coupled process built upon the Poisson Hierarchical Indian Buffet Process (PHIBP), a framework developed for modeling microbiome species sampling. This approach yields a tractable generalization of the duality in two fundamental directions: to processes driven by arbitrary subordinators and to the previously uncharacterised multi-group ($J \ge 1$) setting, providing explicit laws for both.
The static, fixed-time partitions are revealed to be a single projection of an inherently dynamic system. This new construction simultaneously defines: (i) the fine-grained partition, (ii) its coagulation operator, (iii) a forward-in-time system of coupled, time-homogeneous fragmentation processes in the sense of Jean Bertoin~(2006), and (iv) a dual, backward-in-time structured coalescent that drives simultaneous, across-group merger events. All four components are governed by a unified compositional structure, yielding their exact compound Poisson representations. The hallmark of this work is its circumvention of direct, and often intractable, analysis on mass and integer partition spaces. By shifting the problem to this transparent framework, the generalized duality emerges as a natural consequence of the architecture itself.
academic
Koagulations-Fragmentierungs-Dualität unendlich austauschbarer Partitionen aus gekoppelten gemischten Poisson-Spezies-Stichprobenmodellen
Dieses Papier löst das berühmte Verallgemeinerungsproblem der Koagulations-Fragmentierungs-Dualität der PD(α,θ)-Verteilungsfamilie von Jim Pitman (1999) über ihre klassische Formulierung hinaus. Der Autor erreicht eine handhabbare Verallgemeinerung dieser Dualität in zwei grundlegenden Richtungen durch Einführung eines neuartigen vierteiligen gekoppelten Prozesses basierend auf dem Poisson-hierarchischen indischen Buffet-Prozess (PHIBP): Erweiterung auf Fälle, die von beliebigen Subordinatoren angetrieben werden, sowie die zuvor nicht charakterisierte Mehrpopulations-Einstellung (J≥1). Die Konstruktion definiert gleichzeitig vier Komponenten: feinkörnige Partitionen, ihren Koagulationsoperator, ein System von Fragmentierungsprozessen mit vorwärts gerichteter Zeit und einen dualen rückwärts gerichteten strukturierten Fusionsprozess.
Das Kernproblem dieses Papiers besteht darin, die klassische Koagulations-Fragmentierungs-Dualität von Pitman von ihrer spezifischen PD(α,θ)-Verteilungsfamilien-Einstellung auf allgemeinere Fälle zu verallgemeinern. Diese Dualität etabliert eine tiefe Strukturbeziehung zwischen zwei verschiedenen Poisson-Dirichlet-Verteilungen, konnte aber über mehr als zwei Jahrzehnte nicht verallgemeinert werden.
Theoretische Bedeutung: Die Koagulations-Fragmentierungs-Dualität ist ein Grundlagenergebnis in der Theorie kombinatorischer Zufallsprozesse; ihre Verallgemeinerung wird den theoretischen Rahmen erheblich erweitern
Anwendungswert: Breite Anwendungen in Populationsgenetik, Bayesscher Statistik, maschinellem Lernen und anderen Bereichen
Mathematische Herausforderung: Beinhaltet komplexe Analysen auf Räumen von Massenpartitionen und ganzzahligen Partitionen, die mit traditionellen Methoden schwer zu handhaben sind
Der Autor wurde durch praktische Anforderungen der Modellierung von Mikrobiom-Spezies-Stichproben inspiriert und entdeckte, dass der PHIBP-Rahmen implizit ein vollständig gekoppeltes dynamisches System definiert, das somit eine neue Perspektive zur Lösung des klassischen Problems bietet.
Einheitlicher Rahmen etablieren: Vorschlag eines vierteiligen gekoppelten Prozesses basierend auf PHIBP, der statische Partitionen als Projektionen eines dynamischen Systems betrachtet
Theoretischen Durchbruch erreichen: Erstmalige Verallgemeinerung der Koagulations-Fragmentierungs-Dualität auf beliebige Subordinatoren und Mehrpopulations-Einstellungen
Explizite Charakterisierung bereitstellen: Genaue zusammengesetzte Poisson-Darstellungen und gemeinsame EPPF für alle vier Komponenten
Dynamische Theorie etablieren: Einbettung der statischen Dualität in einen kontinuierlichen zeitlichen dynamischen Rahmen, der neue Prozessklassen offenbart
Neue Dualitätsbeziehungen entdecken: Beweis der simultanen Dualität zwischen Kingman-Fusionsprozessen und α-stabilen homogenen Fragmentierungsprozessen
Durch den Allokationsprozess Aj als strukturelle Verbindungsvariable werden alle vier Komponenten in einem einheitlichen Wahrscheinlichkeitsraum platziert, was das "Black-Box"-Problem traditioneller Methoden vermeidet.
Verlagerung des Problems in die "Poisson-Welt", in der alle Komponenten explizite Verteilungen haben und komplexe Randabhängigkeitsbeziehungen natürlicherweise durch Integration entstehen.
Bereitstellung von punktweiser Kopplung statt nur Verteilungsäquivalenz, wodurch die Kopplung zwischen Fragmentierungs- und Koagulationsoperatoren unter Partitionswert-Einstellungen handhabbar wird.
Theorem 6.1: Simultane Dualität zwischen Kingman-Fusionsprozessen und α-stabilen homogenen Fragmentierungsprozessen, eine erstmals entdeckte Beziehung dieser Art.
Kreuzvalidierung: Verifikation des stabilen Falls durch zwei unabhängige Wege – Randmaßänderungsmethode (Abschnitt 2) und gekoppelte Poisson-Konstruktion (Abschnitt 5)
Konsistenzprüfung: Beweis, dass der Fall J=1 die klassische Pitman-Dualität wiederherstellt
Grenzverhalten: Verifikation der Konvergenz zum Kingman-HFG-Dualität wenn β→0
Das Papier stellt in begleitender Arbeit 22 detaillierte Berechnungen für die verallgemeinerte Gamma-Familie und Anwendungen auf Mikrobiom-Datensätze bereit, einschließlich:
Das Papier zitiert 55 wichtige Referenzen, hauptsächlich:
Pitman, J. (1999). Coalescents with multiple collisions. Originalarbeit zur klassischen Dualität
Bertoin, J. (2006). Random Fragmentation and Coagulation Processes. Grundlagen der Fragmentierungstheorie
Pitman, J. and Yor, M. (1997). The two-parameter Poisson-Dirichlet distribution. PD-Verteilungstheorie
James, L.F. et al. (2025). Poisson Hierarchical Indian Buffet Processes. PHIBP-Rahmen
Dieses Papier stellt einen bedeutenden Fortschritt in der Theorie kombinatorischer Zufallsprozesse dar. Durch geschickte Konstruktion wird ein langfristiges offenes Problem gelöst und gleichzeitig werden leistungsstarke Werkzeuge für praktische Anwendungen bereitgestellt. Seine theoretische Tiefe und Anwendungsbreite machen es zu einem wichtigen Beitrag auf diesem Gebiet.