2025-11-24T23:04:17.128917

Coagulation-Fragmentation Duality of Infinitely Exchangeable Partitions from Coupled Mixed Poisson Species Sampling Models

James
Jim Pitman's~(1999) celebrated coagulation-fragmentation duality for the PD($α$,$θ$) family of laws of Pitman and Marc Yor~(1997) has resisted generalization beyond its canonical setting. We resolve this by introducing a novel, four-part coupled process built upon the Poisson Hierarchical Indian Buffet Process (PHIBP), a framework developed for modeling microbiome species sampling. This approach yields a tractable generalization of the duality in two fundamental directions: to processes driven by arbitrary subordinators and to the previously uncharacterised multi-group ($J \ge 1$) setting, providing explicit laws for both. The static, fixed-time partitions are revealed to be a single projection of an inherently dynamic system. This new construction simultaneously defines: (i) the fine-grained partition, (ii) its coagulation operator, (iii) a forward-in-time system of coupled, time-homogeneous fragmentation processes in the sense of Jean Bertoin~(2006), and (iv) a dual, backward-in-time structured coalescent that drives simultaneous, across-group merger events. All four components are governed by a unified compositional structure, yielding their exact compound Poisson representations. The hallmark of this work is its circumvention of direct, and often intractable, analysis on mass and integer partition spaces. By shifting the problem to this transparent framework, the generalized duality emerges as a natural consequence of the architecture itself.
academic

अनंत विनिमेय विभाजन का संयोजन-विखंडन द्वैत युग्मित मिश्रित पॉइसन प्रजाति नमूनाकरण मॉडल से

मूल जानकारी

  • पेपर ID: 2508.18668
  • शीर्षक: अनंत विनिमेय विभाजन का संयोजन-विखंडन द्वैत युग्मित मिश्रित पॉइसन प्रजाति नमूनाकरण मॉडल से
  • लेखक: लांसलॉट एफ. जेम्स (हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय)
  • वर्गीकरण: math.PR (प्रायिकता सिद्धांत)
  • प्रकाशन समय: 13 अक्टूबर 2025 (arXiv संस्करण 3)
  • पेपर लिंक: https://arxiv.org/abs/2508.18668

सारांश

यह पेपर जिम पिटमैन (1999) द्वारा प्रसिद्ध PD(α,θ) वितरण परिवार के संयोजन-विखंडन द्वैत को उसके शास्त्रीय सेटिंग से परे सामान्यीकृत करने की समस्या को हल करता है। लेखक पॉइसन पदानुक्रमीय भारतीय बुफे प्रक्रिया (PHIBP) पर आधारित एक नई चार-भाग युग्मित प्रक्रिया प्रस्तुत करके, दो मौलिक दिशाओं में इस द्वैत का सुव्यवहार्य सामान्यीकरण प्राप्त करता है: मनमाने अधीनस्थ प्रक्रियाओं द्वारा संचालित स्थितियों तक विस्तार, और पहले से अचिन्हित बहु-जनसंख्या (J≥1) सेटिंग। यह निर्माण एक साथ चार घटकों को परिभाषित करता है: सूक्ष्म-दानेदार विभाजन, इसका संयोजन संचालक, अग्रगामी समय युग्मित सजातीय विखंडन प्रक्रिया प्रणाली, और द्वैत पश्चगामी समय संरचित विलय प्रक्रिया।

अनुसंधान पृष्ठभूमि और प्रेरणा

मूल समस्या

इस पेपर की मूल समस्या पिटमैन के शास्त्रीय संयोजन-विखंडन द्वैत को इसके विशिष्ट PD(α,θ) वितरण परिवार सेटिंग से अधिक सामान्य स्थितियों तक सामान्यीकृत करना है। यह द्वैत दो भिन्न पॉइसन-डिरिचलेट वितरणों के बीच गहरे संरचनात्मक संबंध को स्थापित करता है, लेकिन बीस से अधिक वर्षों से इसे सामान्यीकृत नहीं किया जा सका।

समस्या की महत्ता

  1. सैद्धांतिक महत्व: संयोजन-विखंडन द्वैत संयोजक यादृच्छिक प्रक्रिया सिद्धांत में एक आधारभूत परिणाम है, इसका सामान्यीकरण सैद्धांतिक ढांचे को बहुत विस्तृत करेगा
  2. अनुप्रयोग मूल्य: जनसंख्या आनुवंशिकी, बेयेसियन सांख्यिकी, मशीन लर्निंग आदि क्षेत्रों में व्यापक अनुप्रयोग
  3. गणितीय चुनौती: द्रव्यमान विभाजन और पूर्णांक विभाजन स्थान पर जटिल विश्लेषण शामिल है, पारंपरिक विधियां कठिन हैं

मौजूदा विधियों की सीमाएं

  1. विशेष बीजगणितीय संरचना पर निर्भरता: शास्त्रीय द्वैत स्थिर-बीटा-गामा बीजगणित के विशेष गुणों पर निर्भर करता है
  2. एकल जनसंख्या प्रतिबंध: मौजूदा सिद्धांत केवल J=1 स्थिति के लिए लागू होता है
  3. विश्लेषणात्मक जटिलता: विभाजन स्थान पर सीधा विश्लेषण अक्सर कठिन और अस्पष्ट होता है

अनुसंधान प्रेरणा

लेखक सूक्ष्मजीव समुदाय प्रजाति नमूनाकरण मॉडलिंग की व्यावहारिक आवश्यकता से प्रेरित होकर पाता है कि PHIBP ढांचा निहित रूप से एक पूर्ण युग्मित गतिशील प्रणाली को परिभाषित करता है, जिससे शास्त्रीय समस्या के समाधान के लिए एक नया दृष्टिकोण प्रदान होता है।

मूल योगदान

  1. एकीकृत ढांचा स्थापित करना: PHIBP पर आधारित चार-भाग युग्मित प्रक्रिया प्रस्तावित करना, स्थिर विभाजन को गतिशील प्रणाली के प्रक्षेपण के रूप में देखना
  2. सैद्धांतिक सफलता प्राप्त करना: पहली बार संयोजन-विखंडन द्वैत को मनमाने अधीनस्थ प्रक्रियाओं और बहु-जनसंख्या सेटिंग तक सामान्यीकृत करना
  3. स्पष्ट अभिलक्षणीकरण प्रदान करना: सभी चार घटकों के सटीक समग्र पॉइसन प्रतिनिधित्व और संयुक्त EPPF देना
  4. गतिशील सिद्धांत स्थापित करना: स्थिर द्वैत को सतत समय गतिशील ढांचे में एम्बेड करना, प्रक्रिया के नए वर्गों को प्रकट करना
  5. नए द्वैत संबंध खोजना: किंगमैन विलय प्रक्रिया और α-स्थिर सजातीय विखंडन प्रक्रिया के समवर्ती द्वैत को सिद्ध करना

विधि विवरण

कार्य परिभाषा

एक चार-घटक युग्मित प्रणाली (Ij, Aj, F_j,ℓ, Zj) का निर्माण करना, जो एक साथ परिभाषित करे:

  • सूक्ष्म-दानेदार विभाजन और इसका संयोजन संचालक
  • अग्रगामी विखंडन प्रक्रिया प्रणाली
  • पश्चगामी संरचित विलय प्रक्रिया
  • सभी घटकों का स्पष्ट प्रायिकता वितरण

मूल आर्किटेक्चर

1. अधीनस्थ प्रक्रिया निर्माण

J+1 स्वतंत्र अधीनस्थ प्रक्रियाएं परिभाषित करना:

  • जनसंख्या-विशिष्ट अधीनस्थ प्रक्रिया: σj (j ∈ {1,...,J})
  • वैश्विक लंगर अधीनस्थ प्रक्रिया: σ0

2. चार-भाग युग्मित प्रक्रिया

प्रमेय 3.1 (एकीकृत समग्र पॉइसन प्रतिनिधित्व): प्रत्येक जनसंख्या j के लिए, संयुक्त प्रक्रिया सदिश है:

(Ij(γj,y), Aj(γj,y), (F_j,ℓ^(Hℓ)(γj,y))_ℓ≥1, Zj(γj,y))

जहां:

  • Ij: सूक्ष्म-दानेदार गणना प्रक्रिया
  • Aj: आवंटन प्रक्रिया (संयोजन संचालक की कुंजी)
  • F_j,ℓ: विखंडन प्रक्रिया परिवार
  • Zj: मोटे-दानेदार गणना प्रक्रिया

3. मुख्य वितरण घटक

  • मोटे ब्लॉक संख्या: φ ~ Poisson(Ψ0(∑ψj(γj)))
  • सूक्ष्म ब्लॉक गणना: (Xj,ℓ) ~ MtP(τ0, ∑ψj(γj))
  • व्यक्तिगत गणना: (Cj,k) ~ MtP(τj, γj)

तकनीकी नवाचार बिंदु

1. आर्किटेक्चर नवाचार

आवंटन प्रक्रिया Aj को संरचनात्मक संयोजन चर के रूप में उपयोग करके, चारों घटकों को एकीकृत प्रायिकता स्थान पर रखना, पारंपरिक विधियों में "ब्लैक बॉक्स" समस्या से बचना।

2. पॉइसन दृष्टिकोण

समस्या को "पॉइसन दुनिया" में स्थानांतरित करना, इस ढांचे में सभी घटकों के स्पष्ट वितरण हैं, जटिल सीमांत निर्भरता संबंध एकीकरण के माध्यम से स्वाभाविक रूप से उत्पन्न होते हैं।

3. बिंदुवार युग्मन

केवल वितरण समतुल्यता के बजाय बिंदुवार युग्मन प्रदान करना, विभाजन मूल्य सेटिंग के तहत विखंडन और संयोजन संचालक के बीच युग्मन को सुव्यवहार्य बनाता है।

मूल प्रमेय और परिणाम

मुख्य द्वैत सर्वसमिका

प्रमेय 3.2 (एकीकृत पॉइसन द्वैत सर्वसमिका):

pcoag(π_n^(2)|π_n^(1),γ) · (pfine(π_n^(1)|γ) · fT1,n(γ)) 
= pfrag(π_n^(1)|π_n^(2),γ) · (pcoarse(π_n^(2)|γ) · fT1,n(γ))

स्थिर स्थिति का मुख्य समीकरण

प्रमेय 5.1: स्थिर अधीनस्थ प्रक्रिया सेटिंग में, संयुक्त वितरण संतुष्ट करता है:

p_{β/α}(x1,...,xr) · pα(c1,...,cK) · fG_{K_n^[β]}(ζ) 
= ∏pα,-β(cl) · pβ(n1,...,nr) · fG_{K_n^[β]}(ζ)

गतिशील विस्तार

प्रमेय 6.1: किंगमैन विलय प्रक्रिया और α-स्थिर सजातीय विखंडन प्रक्रिया का समवर्ती द्वैत, यह पहली बार खोजा गया ऐसा संबंध है।

प्रायोगिक सत्यापन और अनुप्रयोग

सैद्धांतिक सत्यापन

  1. क्रॉस-सत्यापन: सीमांत परिवर्तन-माप विधि (अनुभाग 2) और युग्मित पॉइसन निर्माण (अनुभाग 5) के दो स्वतंत्र मार्गों के माध्यम से स्थिर स्थिति का सत्यापन
  2. सामंजस्य परीक्षण: J=1 स्थिति पिटमैन के शास्त्रीय द्वैत को पुनः प्राप्त करती है यह सिद्ध करना
  3. सीमांत व्यवहार: β→0 के समय किंगमैन-HFG द्वैत में अभिसरण का सत्यापन

कम्प्यूटेशनल कार्यान्वयन

पेपर संबंधित कार्य 22 में सामान्यीकृत गामा परिवार की विस्तृत गणना और सूक्ष्मजीव समुदाय डेटा सेट अनुप्रयोग प्रदान करता है, जिसमें शामिल हैं:

  • भविष्यसूचक नियम व्युत्पत्ति
  • बड़े पैमाने पर डेटा सेट सत्यापन
  • कम्प्यूटेशनल दक्षता विश्लेषण

संबंधित कार्य

शास्त्रीय सैद्धांतिक आधार

  1. पिटमैन-योर प्रक्रिया: दो-पैरामीटर पॉइसन-डिरिचलेट वितरण परिवार और इसके गुण
  2. बर्ट्रॉइन विखंडन सिद्धांत: सजातीय विखंडन प्रक्रियाओं का सामान्य सैद्धांतिक ढांचा
  3. किंगमैन रंग-बॉक्स निर्माण: अनंत विनिमेय यादृच्छिक विभाजन का आधार सिद्धांत

आधुनिक विकास

  1. पॉइसन-किंगमैन वितरण: सामान्य अधीनस्थ प्रक्रियाओं द्वारा उत्पन्न वितरण परिवार
  2. संरचित विलय प्रक्रिया: बहु-प्रकार और सूक्ष्म-विभाजित जनसंख्या मॉडल
  3. सूक्ष्मजीव समुदाय मॉडलिंग: जटिल गणना डेटा के लिए प्रायिकता ढांचा

इस पेपर का नवाचार

मौजूदा कार्य की तुलना में, यह पेपर पहली बार:

  • मनमाने अधीनस्थ प्रक्रियाओं के लिए सुव्यवहार्य द्वैत प्रदान करता है
  • बहु-जनसंख्या सेटिंग का पूर्ण सिद्धांत स्थापित करता है
  • स्थिर और गतिशील सिद्धांत के बीच गहरे संबंध को प्रकट करता है

निष्कर्ष और चर्चा

मुख्य निष्कर्ष

  1. सैद्धांतिक सफलता: पिटमैन द्वैत को मनमाने अधीनस्थ प्रक्रियाओं और बहु-जनसंख्या सेटिंग तक सफलतापूर्वक सामान्यीकृत करना
  2. विधि नवाचार: PHIBP ढांचा जटिल विभाजन संरचनाओं के विश्लेषण के लिए एक पारदर्शी उपकरण प्रदान करता है
  3. अनुप्रयोग संभावनाएं: जनसंख्या आनुवंशिकी, सूक्ष्मजीव समुदाय विश्लेषण आदि क्षेत्रों के लिए नए मॉडलिंग उपकरण प्रदान करता है

सीमाएं

  1. तकनीकी जटिलता: एकीकृत ढांचा प्रदान करने के बावजूद, विशिष्ट गणना अभी भी जटिल है
  2. अनुप्रयोग सत्यापन: सैद्धांतिक भविष्यसूचनाओं को सत्यापित करने के लिए अधिक व्यावहारिक अनुप्रयोग सत्यापन की आवश्यकता है
  3. कम्प्यूटेशनल दक्षता: बड़े पैमाने पर अनुप्रयोगों की कम्प्यूटेशनल जटिलता को आगे अनुकूलित करने की आवश्यकता है

भविष्य की दिशाएं

  1. अनुप्रयोग विस्तार: ढांचे को अधिक व्यापक वैज्ञानिक क्षेत्रों में लागू करना
  2. एल्गोरिदम अनुकूलन: अधिक कुशल कम्प्यूटेशनल एल्गोरिदम विकसित करना
  3. सैद्धांतिक गहनता: अन्य यादृच्छिक प्रक्रिया सिद्धांतों के साथ संबंधों की खोज करना

गहन मूल्यांकन

शक्तियां

  1. सैद्धांतिक गहनता: बीस वर्षों की खुली समस्या को हल करना, महत्वपूर्ण सैद्धांतिक मूल्य रखता है
  2. विधि नवाचार: PHIBP ढांचा विश्लेषण के लिए पूरी तरह नया दृष्टिकोण प्रदान करता है
  3. परिणाम पूर्णता: स्पष्ट वितरण अभिलक्षणीकरण और कम्प्यूटेशनल सूत्र प्रदान करता है
  4. अनुप्रयोग संभावनाएं: कई क्षेत्रों में महत्वपूर्ण अनुप्रयोग संभावनाएं

कमियां

  1. तकनीकी दहलीज: गहरे प्रायिकता सिद्धांत और यादृच्छिक प्रक्रिया पृष्ठभूमि की आवश्यकता है
  2. प्रतीक जटिलता: बड़ी संख्या में तकनीकी प्रतीक पठनीयता को प्रभावित कर सकते हैं
  3. कम्प्यूटेशनल चुनौती: व्यावहारिक अनुप्रयोगों में कम्प्यूटेशनल जटिलता अधिक है

प्रभाव

  1. सैद्धांतिक प्रभाव: संयोजक यादृच्छिक प्रक्रिया सिद्धांत के विकास को आगे बढ़ाएगा
  2. अनुप्रयोग मूल्य: जटिल डेटा मॉडलिंग के लिए नए उपकरण प्रदान करता है
  3. पद्धति योगदान: व्यावहारिक समस्याओं से सैद्धांतिक सफलता निकालने का मार्ग दिखाता है

लागू परिदृश्य

  1. जनसंख्या आनुवंशिकी: बहु-जनसंख्या विकास और विलय प्रक्रिया मॉडलिंग
  2. सूक्ष्मजीव समुदाय अनुसंधान: जटिल समुदाय संरचना विश्लेषण
  3. बेयेसियन सांख्यिकी: अनंत-आयामी पैरामीटर स्थान के लिए पूर्व निर्माण
  4. मशीन लर्निंग: पदानुक्रमीय विशेषता सीखना और क्लस्टरिंग

संदर्भ

पेपर 55 महत्वपूर्ण साहित्य का हवाला देता है, मुख्य रूप से:

  • पिटमैन, जे. (1999). कोलेसेंट्स विथ मल्टीपल कोलिजन्स। शास्त्रीय द्वैत मूल पेपर
  • बर्ट्रॉइन, जे. (2006). रैंडम फ्रैग्मेंटेशन एंड कोएगुलेशन प्रोसेसेज। विखंडन सिद्धांत आधार
  • पिटमैन, जे. और योर, एम. (1997). द टू-पैरामीटर पॉइसन-डिरिचलेट डिस्ट्रिब्यूशन। PD वितरण सिद्धांत
  • जेम्स, एल.एफ. एट अल. (2025). पॉइसन हायरार्किकल इंडियन बुफे प्रोसेसेज। PHIBP ढांचा

यह पेपर संयोजक यादृच्छिक प्रक्रिया सिद्धांत में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है, चतुर निर्माण के माध्यम से दीर्घकालीन खुली समस्या को हल करता है, साथ ही व्यावहारिक अनुप्रयोगों के लिए शक्तिशाली उपकरण प्रदान करता है। इसकी सैद्धांतिक गहनता और अनुप्रयोग व्यापकता इसे इस क्षेत्र का एक महत्वपूर्ण योगदान बनाते हैं।