Updating $\textit{a priori}$ information given some observed data is the core tenet of Bayesian inference. Bayesian transfer learning extends this idea by incorporating information from a related dataset to improve the inference on the observed target dataset which may have been collected under slightly different settings. The use of related information can be useful when the target dataset is scarce, for example. There exist various Bayesian transfer learning methods that decide how to incorporate the related data in different ways. Unfortunately, there is no principled approach for comparing Bayesian transfer methods in real data settings. Additionally, some Bayesian transfer learning methods, such as the so-called power prior approaches, rely on conjugacy or costly specialised techniques. In this paper, we find an effective approach to compare Bayesian transfer learning methods is to apply leave-one-out cross validation on the target dataset. Further, we introduce a new framework, $\textit{transfer sequential Monte Carlo}$, that efficiently implements power prior methods in an automated fashion. We demonstrate the performance of our proposed methods in two comprehensive simulation studies.
- पेपर ID: 2502.19796
- शीर्षक: A Principled Approach to Bayesian Transfer Learning
- लेखक: Adam Bretherton, Joshua J. Bon, David J. Warne, Kerrie Mengersen, Christopher Drovandi
- वर्गीकरण: stat.ME (सांख्यिकी - पद्धति), stat.CO (सांख्यिकी - संगणना)
- प्रकाशन समय: 2025 अक्टूबर 14 (arXiv v3)
- पेपर लिंक: https://arxiv.org/abs/2502.19796v3
यह पेपर बेयेसियन ट्रांसफर लर्निंग के सिद्धांतवादी दृष्टिकोण का अध्ययन करता है। बेयेसियन अनुमान का मूल सिद्धांत अवलोकित डेटा के आधार पर पूर्व सूचना को अद्यतन करना है, जबकि बेयेसियन ट्रांसफर लर्निंग इस विचार को संबंधित डेटासेट की जानकारी को एकीकृत करके लक्ष्य डेटासेट के अनुमान में सुधार करने के लिए विस्तारित करता है। जब लक्ष्य डेटासेट दुर्लभ हो, तो संबंधित जानकारी का उपयोग विशेष रूप से मूल्यवान है। मौजूदा बेयेसियन ट्रांसफर लर्निंग विधियां संबंधित डेटा को एकीकृत करने के तरीके में विभिन्न रणनीतियां अपनाती हैं, लेकिन वास्तविक डेटा वातावरण में इन विधियों की तुलना के लिए एक सिद्धांतवादी दृष्टिकोण की कमी है। इसके अलावा, कुछ विधियां (जैसे power prior विधि) संयुग्मता या महंगी विशेष तकनीकों पर निर्भर करती हैं। यह पेपर पाता है कि लीव-वन-आउट क्रॉस-वेलिडेशन बेयेसियन ट्रांसफर लर्निंग विधियों की तुलना के लिए एक प्रभावी मार्ग है, और ट्रांसफर सीक्वेंशियल मोंटे कार्लो (TSMC) फ्रेमवर्क प्रस्तावित करता है, जो power prior विधि को स्वचालित रूप से कुशलतापूर्वक लागू कर सकता है।
बेयेसियन ट्रांसफर लर्निंग का उद्देश्य यह है कि संबंधित स्रोत डेटा का प्रभावी ढंग से उपयोग करके लक्ष्य डेटा के अनुमान में सुधार कैसे किया जाए। व्यावहारिक अनुप्रयोगों में, लक्ष्य डेटा अक्सर दुर्लभ और महंगा होता है, जबकि संबंधित ऐतिहासिक डेटा या समान अनुसंधान का डेटा प्रचुर हो सकता है लेकिन लक्ष्य डेटा से कुछ अंतर रखता है।
- डेटा की कमी: महामारी विज्ञान, नैदानिक परीक्षण आदि क्षेत्रों में नए डेटा प्राप्त करना महंगा और समय लेने वाला है
- सूचना उपयोग की दक्षता: संबंधित स्रोत डेटा को पूरी तरह से त्यागना अक्षम है, लेकिन सीधे विलय से पूर्वाग्रह हो सकता है
- व्यावहारिक आवश्यकता: डेटा समानता की विभिन्न डिग्री के तहत उचित ट्रांसफर निर्णय लेने की आवश्यकता है
- तुलना मानदंड की कमी: वास्तविक डेटा वातावरण में विभिन्न ट्रांसफर लर्निंग विधियों के प्रदर्शन की तुलना के लिए कोई सिद्धांतवादी विधि नहीं है
- संगणनात्मक जटिलता: Power prior विधि संयुग्म पूर्व या विशेष MCMC तकनीकों पर निर्भर करती है, जिसकी संगणनात्मक लागत अधिक है
- पैरामीटर चयन की कठिनाई: निश्चित power prior को ग्रिड खोज की आवश्यकता है, सामान्यीकृत power prior में दोहरी अनुपलब्धता समस्या है
यह पेपर एक एकीकृत फ्रेमवर्क प्रदान करने का लक्ष्य रखता है:
- बेयेसियन ट्रांसफर लर्निंग विधियों की तुलना के लिए सिद्धांतवादी मानदंड स्थापित करना
- Power prior के लिए संगणनात्मक रूप से कुशल कार्यान्वयन विधि विकसित करना
- वास्तविक पैरामीटर मानों की आवश्यकता के बिना विधि प्रदर्शन का मूल्यांकन करना
- पश्च पूर्वानुमान परीक्षण फ्रेमवर्क प्रस्तावित करना: लीव-वन-आउट क्रॉस-वेलिडेशन (LOO-CV) का उपयोग वास्तविक डेटा वातावरण में बेयेसियन ट्रांसफर लर्निंग विधियों की तुलना के लिए सिद्धांतवादी मानदंड के रूप में करना
- TSMC संगणनात्मक फ्रेमवर्क विकसित करना: ट्रांसफर सीक्वेंशियल मोंटे कार्लो विधि प्रस्तावित करना, जो निश्चित power prior (FPP) और सामान्यीकृत power prior (NPP) दोनों को कुशलतापूर्वक लागू कर सकता है
- दोहरी अनुपलब्धता समस्या का समाधान: NPP में पैरामीटर-निर्भर सामान्यीकरण स्थिरांक की संगणनात्मक चुनौती को दूर करने के लिए चतुर अपघटन रणनीति के माध्यम से
- व्यवस्थित मूल्यांकन प्रदान करना: दो व्यापक सिमुलेशन अध्ययनों में प्रस्तावित विधि की प्रभावशीलता को सत्यापित करना
लक्ष्य डेटासेट yT (आकार n) और संबंधित स्रोत डेटासेट yS (आकार m, जहां n<m) दिया गया है, लक्ष्य स्रोत डेटा का उपयोग करके लक्ष्य डेटा के बेयेसियन अनुमान में सुधार करना है, जबकि स्रोत डेटा और लक्ष्य डेटा के अंतर से नकारात्मक प्रभाव से बचना है।
Power prior पैरामीटर α∈(0,1) को समायोजित करके स्रोत डेटा के प्रभाव को नियंत्रित करता है:
π(θ∣yS,α)=CS(α)p(yS∣θ)απ(θ)
जहां CS(α) सामान्यीकरण स्थिरांक है। लक्ष्य पश्च है:
π(θ∣yT,yS,α)=CT,S(α)p(yT∣θ)p(yS∣θ)απ(θ)
- निश्चित Power Prior (FPP): α एक निश्चित मान है, मॉडल चयन मानदंड द्वारा निर्धारित
- सामान्यीकृत Power Prior (NPP): α एक यादृच्छिक चर है, पूर्व वितरण α∼Beta(α0,β0) को सौंपा गया है
अपघटन संबंध CT(α)=CS(α)CT,S(α) का उपयोग करके सामान्यीकरण स्थिरांक का अप्रत्यक्ष अनुमान लगाना, प्रत्यक्ष गणना की कठिनाई से बचना।
शेड्यूल 1: CS(α) का अनुमान लगाना
- लक्ष्य वितरण: πt,S(θ∣yS,αt)∝p(yS∣θ)αtπ(θ)
- व्युत्क्रम तापमान अनुक्रम: 0=α0<α1<⋯<αT=1
शेड्यूल 2: CT,S(α) का अनुमान लगाना
- लक्ष्य वितरण: πt,TSMC(θ∣yS,yT,γt,αt)∝p(yT∣θ)γtp(yS∣θ)αtπ(θ)
- दो-चरणीय डिजाइन: पहले γ का उपयोग करके लक्ष्य डेटा को एकीकृत करना, फिर α का उपयोग करके स्रोत डेटा को एकीकृत करना
TSMC-ME (मॉडल साक्ष्य):
α∗=argmaxα∈[0,1]CT(α)
TSMC-NPP (पूर्ण बेयेसियन):
π(α∣yT,yS)∝CT(α)π(α)
- पूर्वाग्रह: Bias=∣μ^θ−θ∗∣
- माध्य वर्ग त्रुटि: MSE=N1∑i=1N(θi−θ∗)2
- आवृत्ति कवरेज संभावना: FCP0.9
सशर्त लॉग पॉइंटवाइज प्रेडिक्टिव डेंसिटी (CLPPD):
CLPPD=∑i=1nlog(N1∑j=1Np(yT,i∣θj))
लीव-वन-आउट क्रॉस-वेलिडेशन (LOO-CV):
LOO-CV=∑i=1nlog(N1∑j=1Np(yT,i∣θ(−i,j)))
महत्व नमूनाकरण के माध्यम से गणना में तेजी लाना:
W−i(j)=∑k=1Nw−i(k)w−i(j),w−i(j)=p(yT,i∣θj)−1
- मॉडल: y=β0+xβ1+ϵ, ϵ∼N(0,σ2)
- पैरामीटर सेटिंग: θT=(5,3,2), θS=θT+2k⋅s^
- डेटा स्केल: लक्ष्य डेटा n=40, स्रोत डेटा m=80
- अंतर स्तर: k∈{0,1,2,3}
- पृष्ठभूमि: मेलेनोमा नैदानिक परीक्षण E1684 और E1690 पर आधारित
- मॉडल: सहसंयोजकों के साथ Weibull cure model
- पैरामीटर आयाम: 7-आयामी पैरामीटर वेक्टर
- डेटा स्केल: लक्ष्य डेटा n=40, स्रोत डेटा m=300
- आदर्श संकेतक: पूर्वाग्रह, MSE, 90% आवृत्ति कवरेज संभावना
- व्यावहारिक संकेतक: CLPPD, LOO-CV और उनकी रैंकिंग
- तुलना विधियां: लक्ष्य डेटा अकेले अनुमान (BT), स्रोत डेटा अकेले अनुमान (BS), बेयेसियन अपडेट (BU), FPP, NPP, वास्तविक डेटा अनुमान (True)
- कणों की संख्या: N=1000
- प्रभावी नमूना आकार थ्रेशोल्ड: E=N/2=500
- दोहराव की संख्या: प्रत्येक सेटिंग के लिए 100 स्वतंत्र प्रयोग
- पूर्व सेटिंग: α∼Beta(1,1)
तालिका 1 से देखा जा सकता है:
- k=0 (कोई अंतर नहीं): BU और True विधियां सर्वश्रेष्ठ प्रदर्शन करती हैं, LOO-CV सही तरीके से सर्वश्रेष्ठ विधि की पहचान करता है
- k=1 (मामूली अंतर): FPP और NPP लाभ दिखाना शुरू करते हैं, LOO-CV सटीक रैंकिंग करता है
- k=2,3 (मध्यम/गंभीर अंतर): लक्ष्य डेटा विधियां धीरे-धीरे प्रभावशाली हो जाती हैं, power prior विधियां अभी भी प्रतिस्पर्धी हैं
मुख्य निष्कर्ष:
- LOO-CV सभी अंतर स्तरों पर सर्वश्रेष्ठ विधि की सही पहचान कर सकता है
- CLPPD व्यवस्थित रूप से लक्ष्य डेटा विधियों की ओर पूर्वाग्रह करता है, यहां तक कि वास्तविक विधि से भी बेहतर है
तालिका 2 अधिक जटिल मॉडल के तहत सुसंगत परिणाम दिखाती है:
- डेटा जानकारी की कमी और बड़े स्रोत डेटा के कारण, लक्ष्य डेटा विधियां अपेक्षाकृत खराब प्रदर्शन करती हैं
- LOO-CV अभी भी सर्वश्रेष्ठ ट्रांसफर रणनीति की सटीक पहचान करता है
- CLPPD की पूर्वाग्रह समस्या अधिक स्पष्ट है
- LOO-CV लाभ: अति-फिटिंग से बचना, आदर्श संकेतकों के साथ रैंकिंग में उच्च सुसंगतता
- CLPPD समस्या: प्रशिक्षण डेटा पर मूल्यांकन लक्ष्य डेटा विधियों के प्रति पूर्वाग्रह की ओर ले जाता है
- मध्यम अंतर स्थिति में सर्वश्रेष्ठ प्रदर्शन करता है
- स्रोत डेटा प्रभाव को स्वचालित रूप से समायोजित कर सकता है
- TSMC फ्रेमवर्क संगणना को व्यावहार्य बनाता है
- TSMC फ्रेमवर्क मध्यवर्ती परिणामों को संग्रहीत करके दोहराई गई गणना से बचता है
- महत्व नमूनाकरण LOO-CV गणना को कुशल बनाता है
- एकल रन FPP और NPP दोनों परिणाम एक साथ प्राप्त कर सकता है
- Power Prior परिवार: Ibrahim et al. (2003, 2015) द्वारा प्रस्तावित शास्त्रीय विधि
- Commensurate Prior: Hobbs et al. (2011), spike-and-slab पूर्व का उपयोग करते हुए
- Meta-Analytic-Predictive Approach (MAPA): Neuenschwander et al. (2010)
- संयुग्म पूर्व विधि: Carvalho and Ibrahim (2021)
- दोहरी-अनुपलब्धता MCMC: Park and Haran (2018)
- सीक्वेंशियल मोंटे कार्लो: Chopin (2002), Del Moral et al. (2006)
- सूचना मानदंड: DIC, WAIC आदि पारंपरिक विधियां
- क्रॉस-वेलिडेशन: बेयेसियन ट्रांसफर लर्निंग में अनुप्रयोग कम है
- LOO-CV एक प्रभावी मूल्यांकन मानदंड है: वास्तविक पैरामीटर की आवश्यकता के बिना सर्वश्रेष्ठ ट्रांसफर रणनीति की सटीक पहचान कर सकता है
- TSMC फ्रेमवर्क संगणनात्मक चुनौतियों को हल करता है: Power prior विधि को व्यावहारिक अनुप्रयोगों में व्यावहार्य बनाता है
- मध्यम ट्रांसफर का मूल्य: जब स्रोत डेटा और लक्ष्य डेटा मध्यम रूप से संबंधित हों, तो power prior विधि चरम रणनीतियों से काफी बेहतर है
- एकल स्रोत डेटा सीमा: वर्तमान फ्रेमवर्क केवल एक स्रोत डेटासेट पर विचार करता है
- पूर्व चयन संवेदनशीलता: NPP में α के पूर्व चयन को अभी भी आगे के अनुसंधान की आवश्यकता है
- संगणनात्मक लागत: हालांकि पारंपरिक विधियों की तुलना में सुधार हुआ है, लेकिन अभी भी काफी संगणनात्मक संसाधनों की आवश्यकता है
- बहु-स्रोत डेटा विस्तार: कई स्रोत डेटासेट के अनुक्रमिक या समानांतर एकीकरण पर विचार करना
- स्वचालित पूर्व: NPP में α के लिए अधिक उचित पूर्व चयन रणनीति विकसित करना
- अन्य ट्रांसफर विधियां: मूल्यांकन फ्रेमवर्क को commensurate prior और MAPA विधियों तक विस्तारित करना
- विधि नवाचार मजबूत है: TSMC फ्रेमवर्क सामान्यीकरण स्थिरांक गणना समस्या को चतुराई से हल करता है
- मूल्यांकन मानदंड व्यावहारिक है: LOO-CV वास्तविक पैरामीटर के बिना विश्वसनीय मूल्यांकन प्रदान करता है
- प्रयोगात्मक डिजाइन पूर्ण है: दो अलग-अलग जटिलता के सिमुलेशन अध्ययन विधि प्रभावशीलता को व्यापक रूप से सत्यापित करते हैं
- सैद्धांतिक आधार ठोस है: बेयेसियन सिद्धांत पर आधारित, गणितीय व्युत्पत्ति कठोर है
- वास्तविक डेटा सत्यापन की कमी: केवल सिमुलेशन डेटा पर सत्यापित, वास्तविक केस अध्ययन की कमी है
- विधि प्रयोज्यता सीमा: मुख्य रूप से power prior विधि के लिए, अन्य ट्रांसफर लर्निंग विधियों की प्रयोज्यता को आगे सत्यापन की आवश्यकता है
- संगणनात्मक जटिलता: हालांकि पारंपरिक विधियों की तुलना में अधिक कुशल है, लेकिन बड़े पैमाने की समस्याओं के लिए अभी भी चुनौतियों का सामना कर सकता है
- सैद्धांतिक योगदान: बेयेसियन ट्रांसफर लर्निंग के लिए नई संगणनात्मक और मूल्यांकन फ्रेमवर्क प्रदान करता है
- व्यावहारिक मूल्य: TSMC फ्रेमवर्क सीधे व्यावहारिक समस्याओं पर लागू किया जा सकता है
- पुनरुत्पादनीयता: लेखक पूर्ण एल्गोरिथ्म विवरण और कोड प्रदान करते हैं
- चिकित्सा अनुसंधान: नैदानिक परीक्षणों में ऐतिहासिक नियंत्रण डेटा का उपयोग करना
- महामारी विज्ञान: नई महामारी के प्रकोप के समय पूर्व महामारी डेटा का उपयोग करना
- इंजीनियरिंग अनुप्रयोग: डेटा-दुर्लभ नए वातावरण में संबंधित ऐतिहासिक डेटा का उपयोग करना
- सामाजिक विज्ञान: छोटे नमूना अनुसंधान में संबंधित अनुसंधान डेटा का उपयोग करना
यह पेपर इस क्षेत्र के महत्वपूर्ण साहित्य का हवाला देता है, जिसमें शामिल हैं:
- Ibrahim, J.G., Chen, M.-H., Sinha, D. (2003). Power prior की स्थापना कार्य
- Chopin, N. (2002). सीक्वेंशियल मोंटे कार्लो विधि का शास्त्रीय साहित्य
- Vehtari, A., et al. (2024). महत्व नमूनाकरण में नवीनतम प्रगति
- Carvalho, L.M., Ibrahim, J.G. (2021). सामान्यीकृत power prior का सैद्धांतिक विकास
समग्र मूल्यांकन: यह बेयेसियन ट्रांसफर लर्निंग क्षेत्र में एक उच्च गुणवत्ता वाला सांख्यिकीय पद्धति पेपर है, जो महत्वपूर्ण योगदान देता है। पेपर न केवल मौजूदा विधियों की संगणनात्मक समस्याओं को हल करता है, बल्कि व्यावहारिक मूल्यांकन मानदंड भी प्रदान करता है, जिसमें मजबूत सैद्धांतिक महत्व और अनुप्रयोग मूल्य है।