Coagulation-Fragmentation Duality of Infinitely Exchangeable Partitions from Coupled Mixed Poisson Species Sampling Models
James
Jim Pitman's~(1999) celebrated coagulation-fragmentation duality for the PD($α$,$θ$) family of laws of Pitman and Marc Yor~(1997) has resisted generalization beyond its canonical setting. We resolve this by introducing a novel, four-part coupled process built upon the Poisson Hierarchical Indian Buffet Process (PHIBP), a framework developed for modeling microbiome species sampling. This approach yields a tractable generalization of the duality in two fundamental directions: to processes driven by arbitrary subordinators and to the previously uncharacterised multi-group ($J \ge 1$) setting, providing explicit laws for both.
The static, fixed-time partitions are revealed to be a single projection of an inherently dynamic system. This new construction simultaneously defines: (i) the fine-grained partition, (ii) its coagulation operator, (iii) a forward-in-time system of coupled, time-homogeneous fragmentation processes in the sense of Jean Bertoin~(2006), and (iv) a dual, backward-in-time structured coalescent that drives simultaneous, across-group merger events. All four components are governed by a unified compositional structure, yielding their exact compound Poisson representations. The hallmark of this work is its circumvention of direct, and often intractable, analysis on mass and integer partition spaces. By shifting the problem to this transparent framework, the generalized duality emerges as a natural consequence of the architecture itself.
academic
Dualité Coagulation-Fragmentation des Partitions Infiniment Échangeables à partir de Modèles d'Échantillonnage d'Espèces Poisson Mixtes Couplés
Cet article résout le problème de généralisation de la dualité coagulation-fragmentation de la célèbre famille de distributions PD(α,θ) de Jim Pitman (1999) au-delà de son cadre classique. L'auteur introduit un nouveau processus couplé en quatre parties basé sur le processus hiérarchique indien du buffet de Poisson (PHIBP), réalisant une généralisation traitable de cette dualité dans deux directions fondamentales : l'extension aux cas pilotés par des processus de subordination arbitraires, et le cadre multi-population (J≥1) précédemment non caractérisé. Cette construction définit simultanément quatre composantes : la partition fine, son opérateur de coagulation, le système de processus de fragmentation homogène couplé en temps direct, et la structure de fusion structurée en temps inverse duale.
L'article s'attaque au problème central de généraliser la dualité coagulation-fragmentation classique de Pitman, définie pour la famille de distributions PD(α,θ) spécifique, à des cadres plus généraux. Cette dualité établit une relation structurelle profonde entre deux distributions de Poisson-Dirichlet différentes, mais n'a pas pu être généralisée pendant plus de vingt ans.
Signification théorique: La dualité coagulation-fragmentation est un résultat fondamental de la théorie des processus aléatoires combinatoires ; sa généralisation élargira considérablement le cadre théorique
Valeur applicative: Applications larges en génétique des populations, statistique bayésienne, apprentissage automatique et autres domaines
Défi mathématique: Implique une analyse complexe sur les espaces de partitions de masse et de partitions entières ; les méthodes traditionnelles sont difficiles à appliquer
L'auteur s'est inspiré par les besoins pratiques de la modélisation d'échantillonnage d'espèces microbiennes, découvrant que le cadre PHIBP définit implicitement un système dynamique complètement couplé, fournissant ainsi une nouvelle perspective pour résoudre le problème classique.
Établir un cadre unifié: Proposer un processus couplé en quatre parties basé sur PHIBP, considérant les partitions statiques comme des projections d'un système dynamique
Réaliser une percée théorique: Généraliser pour la première fois la dualité coagulation-fragmentation à des processus de subordination arbitraires et à des cadres multi-populations
Fournir une caractérisation explicite: Donner des représentations de Poisson composé précises et des EPPF conjoints pour les quatre composantes
Établir une théorie dynamique: Intégrer la dualité statique dans un cadre dynamique en temps continu, révélant de nouvelles classes de processus
Découvrir de nouvelles relations de dualité: Prouver la dualité simultanée du processus de fusion de Kingman avec les processus de fragmentation homogène α-stables
En utilisant le processus d'allocation Aj comme variable de connexion structurelle, placer les quatre composantes dans un espace de probabilité unifié, évitant les problèmes de "boîte noire" des méthodes traditionnelles.
Transférer le problème vers le "monde poissonisé", où dans ce cadre tous les composants ont des distributions explicites, et les relations de dépendance marginale complexes émergent naturellement par intégration.
Fournir un couplage pointwise plutôt que simplement l'équivalence en distribution, rendant le couplage entre les opérateurs de fragmentation et de coagulation traitable dans le cadre des valeurs de partition.
Théorème 6.1: Dualité simultanée du processus de fusion de Kingman avec les processus de fragmentation homogène α-stables, une relation de ce type découverte pour la première fois.
Vérification croisée: Vérifier le cas stable par deux voies indépendantes — la méthode de changement de mesure marginale (Section 2) et la construction de Poisson couplée (Section 5)
Vérification de cohérence: Prouver que le cas J=1 récupère la dualité classique de Pitman
Comportement limite: Vérifier la convergence vers la dualité Kingman-HFG lorsque β→0
L'article fournit dans un travail complémentaire 22 des calculs détaillés pour la famille gamma généralisée et des applications sur des ensembles de données microbiennes, incluant :
Dérivation de règles de prédiction
Vérification sur des ensembles de données à grande échelle
Pitman, J. (1999). Coalescents with multiple collisions. Article original de la dualité classique
Bertoin, J. (2006). Random Fragmentation and Coagulation Processes. Fondations de la théorie de fragmentation
Pitman, J. and Yor, M. (1997). The two-parameter Poisson-Dirichlet distribution. Théorie de la distribution PD
James, L.F. et al. (2025). Poisson Hierarchical Indian Buffet Processes. Cadre PHIBP
Cet article représente un progrès majeur dans la théorie des processus aléatoires combinatoires, résolvant un problème ouvert de longue date par une construction ingénieuse, tout en fournissant des outils puissants pour les applications pratiques. Sa profondeur théorique et son étendue applicative en font une contribution importante à ce domaine.