Updating $\textit{a priori}$ information given some observed data is the core tenet of Bayesian inference. Bayesian transfer learning extends this idea by incorporating information from a related dataset to improve the inference on the observed target dataset which may have been collected under slightly different settings. The use of related information can be useful when the target dataset is scarce, for example. There exist various Bayesian transfer learning methods that decide how to incorporate the related data in different ways. Unfortunately, there is no principled approach for comparing Bayesian transfer methods in real data settings. Additionally, some Bayesian transfer learning methods, such as the so-called power prior approaches, rely on conjugacy or costly specialised techniques. In this paper, we find an effective approach to compare Bayesian transfer learning methods is to apply leave-one-out cross validation on the target dataset. Further, we introduce a new framework, $\textit{transfer sequential Monte Carlo}$, that efficiently implements power prior methods in an automated fashion. We demonstrate the performance of our proposed methods in two comprehensive simulation studies.
- معرّف الورقة: 2502.19796
- العنوان: A Principled Approach to Bayesian Transfer Learning
- المؤلفون: Adam Bretherton, Joshua J. Bon, David J. Warne, Kerrie Mengersen, Christopher Drovandi
- التصنيف: stat.ME (الإحصاء - المنهجية)، stat.CO (الإحصاء - الحساب)
- تاريخ النشر: 14 أكتوبر 2025 (arXiv v3)
- رابط الورقة: https://arxiv.org/abs/2502.19796v3
تبحث هذه الورقة في نهج مبدئي للتعلم الانتقالي البايزي. يتمحور الاستدلال البايزي حول تحديث المعلومات السابقة بناءً على البيانات المرصودة، بينما يوسع التعلم الانتقالي البايزي هذه الفكرة من خلال دمج المعلومات من مجموعات البيانات ذات الصلة لتحسين الاستدلال على مجموعة البيانات المستهدفة. يكون استخدام المعلومات ذات الصلة ذا قيمة خاصة عندما تكون مجموعة البيانات المستهدفة نادرة. تعتمد طرق التعلم الانتقالي البايزي الحالية على استراتيجيات مختلفة في دمج البيانات ذات الصلة، لكنها تفتقر إلى نهج مبدئي لمقارنة هذه الطرق في بيئات البيانات الحقيقية. علاوة على ذلك، تعتمد بعض الطرق (مثل طريقة السلطة السابقة) على الاقتران أو تقنيات متخصصة مكلفة. تكتشف هذه الورقة أن التحقق المتقاطع بحذف واحد هو مسار فعال لمقارنة طرق التعلم الانتقالي البايزي، وتقترح إطار عمل سلسلة مونت كارلو الانتقالية (TSMC)، القادر على أتمتة تنفيذ طريقة السلطة السابقة بكفاءة.
يهدف التعلم الانتقالي البايزي إلى حل مشكلة كيفية الاستفادة الفعالة من بيانات المصدر ذات الصلة لتحسين الاستدلال على البيانات المستهدفة. في التطبيقات العملية، غالباً ما تكون البيانات المستهدفة نادرة ومكلفة، بينما قد تكون البيانات التاريخية ذات الصلة أو بيانات الدراسات المماثلة وفيرة لكنها تختلف إلى حد ما عن البيانات المستهدفة.
- ندرة البيانات: في علم الأوبئة والتجارب السريرية وغيرها، يكون الحصول على بيانات جديدة مكلفاً وتستغرق وقتاً طويلاً
- كفاءة استخدام المعلومات: التخلص الكامل من بيانات المصدر ذات الصلة غير فعال، لكن الدمج المباشر قد يؤدي إلى انحياز
- المتطلبات العملية: الحاجة إلى اتخاذ قرارات نقل معقولة تحت مستويات مختلفة من تشابه البيانات
- عدم وجود معايير مقارنة: لا توجد طريقة مبدئية لمقارنة أداء طرق التعلم الانتقالي المختلفة في بيئات البيانات الحقيقية
- التعقيد الحسابي: تعتمد طريقة السلطة السابقة على الأسبقيات المترافقة أو تقنيات MCMC المتخصصة، بتكاليف حسابية عالية
- صعوبة اختيار المعاملات: يتطلب السلطة السابقة الثابتة بحثاً شبكياً، والسلطة السابقة المعايرة تعاني من مشكلة الصعوبة المزدوجة
تهدف هذه الورقة إلى توفير إطار عمل موحد لـ:
- إنشاء معايير مبدئية لمقارنة طرق التعلم الانتقالي البايزي
- تطوير طرق تنفيذ السلطة السابقة فعالة حسابياً
- تقييم أداء الطرق دون الحاجة إلى قيم المعاملات الحقيقية
- اقتراح إطار اختبار التنبؤ اللاحق: استخدام التحقق المتقاطع بحذف واحد (LOO-CV) كمعيار مبدئي لمقارنة طرق التعلم الانتقالي البايزي في بيئات البيانات الحقيقية
- تطوير إطار عمل TSMC الحسابي: اقتراح طريقة سلسلة مونت كارلو الانتقالية، القادرة على تنفيذ السلطة السابقة الثابتة (FPP) والسلطة السابقة المعايرة (NPP) بكفاءة في نفس الوقت
- حل مشكلة الصعوبة المزدوجة: التغلب على التحديات الحسابية لمعاملات NPP التي تعتمد على ثابت التطبيع من خلال استراتيجية تحليل ذكية
- توفير تقييم منهجي: التحقق من فعالية الطرق المقترحة في دراستي محاكاة شاملتين
بالنظر إلى مجموعة البيانات المستهدفة yT (بحجم n) ومجموعة البيانات المصدر ذات الصلة yS (بحجم m، حيث n<m)، الهدف هو الاستفادة من بيانات المصدر لتحسين الاستدلال البايزي على البيانات المستهدفة، مع تجنب التأثيرات السلبية للاختلافات بين بيانات المصدر والبيانات المستهدفة.
تتحكم السلطة السابقة في تأثير بيانات المصدر من خلال معامل التعديل α∈(0,1):
π(θ∣yS,α)=CS(α)p(yS∣θ)απ(θ)
حيث CS(α) هو ثابت التطبيع. اللاحق المستهدف هو:
π(θ∣yT,yS,α)=CT,S(α)p(yT∣θ)p(yS∣θ)απ(θ)
- السلطة السابقة الثابتة (FPP): α قيمة ثابتة، يتم تحديدها من خلال معايير اختيار النموذج
- السلطة السابقة المعايرة (NPP): α متغير عشوائي، مع توزيع سابق α∼Beta(α0,β0)
الاستفادة من العلاقة التحليلية CT(α)=CS(α)CT,S(α) لتقدير ثابت التطبيع بشكل غير مباشر، مما يتجنب صعوبات الحساب المباشر.
الجدول الزمني 1: تقدير CS(α)
- التوزيع المستهدف: πt,S(θ∣yS,αt)∝p(yS∣θ)αtπ(θ)
- سلسلة درجات الحرارة العكسية: 0=α0<α1<⋯<αT=1
الجدول الزمني 2: تقدير CT,S(α)
- التوزيع المستهدف: πt,TSMC(θ∣yS,yT,γt,αt)∝p(yT∣θ)γtp(yS∣θ)αtπ(θ)
- التصميم على مرحلتين: دمج البيانات المستهدفة أولاً باستخدام γ، ثم دمج بيانات المصدر باستخدام α
TSMC-ME (دليل النموذج):
α∗=argmaxα∈[0,1]CT(α)
TSMC-NPP (بايزي كامل):
π(α∣yT,yS)∝CT(α)π(α)
- الانحياز: Bias=∣μ^θ−θ∗∣
- متوسط الخطأ التربيعي: MSE=N1∑i=1N(θi−θ∗)2
- احتمالية التغطية المتكررة: FCP0.9
كثافة التنبؤ اللوغاريتمية النقطية المحسوبة (CLPPD):
CLPPD=∑i=1nlog(N1∑j=1Np(yT,i∣θj))
التحقق المتقاطع بحذف واحد (LOO-CV):
LOO-CV=∑i=1nlog(N1∑j=1Np(yT,i∣θ(−i,j)))
تسريع الحساب من خلال أخذ العينات بالأهمية:
W−i(j)=∑k=1Nw−i(k)w−i(j),w−i(j)=p(yT,i∣θj)−1
- النموذج: y=β0+xβ1+ϵ، ϵ∼N(0,σ2)
- إعدادات المعاملات: θT=(5,3,2)، θS=θT+2k⋅s^
- حجم البيانات: البيانات المستهدفة n=40، بيانات المصدر m=80
- مستويات الاختلاف: k∈{0,1,2,3}
- الخلفية: بناءً على التجارب السريرية للورم الميلاني E1684 و E1690
- النموذج: نموذج علاج Weibull مع متغيرات مشروطة
- بعد المعاملات: متجه معاملات 7 أبعاد
- حجم البيانات: البيانات المستهدفة n=40، بيانات المصدر m=300
- المؤشرات المثالية: الانحياز، MSE، احتمالية التغطية المتكررة بنسبة 90%
- المؤشرات العملية: CLPPD و LOO-CV وتصنيفاتهما
- طرق المقارنة: الاستدلال المستقل على البيانات المستهدفة (BT)، الاستدلال المستقل على بيانات المصدر (BS)، التحديث البايزي (BU)، FPP، NPP، الاستدلال على البيانات الحقيقية (True)
- عدد الجزيئات: N=1000
- عتبة حجم العينة الفعال: E=N/2=500
- عدد التكرارات: 100 تجربة مستقلة لكل إعداد
- إعداد السابق: α∼Beta(1,1)
يمكن ملاحظة ما يلي من الجدول 1:
- k=0 (بدون اختلاف): تُظهر طرق BU و True أفضل أداء، LOO-CV يحدد الطريقة المثلى بشكل صحيح
- k=1 (اختلاف طفيف): تبدأ طرق FPP و NPP في إظهار مزايا، LOO-CV يصنف بدقة
- k=2,3 (اختلاف متوسط/شديد): تتفوق طرق البيانات المستهدفة تدريجياً، طرق السلطة السابقة لا تزال قادرة على المنافسة
النتائج الرئيسية:
- يمكن لـ LOO-CV تحديد أفضل طريقة بشكل صحيح في جميع مستويات الاختلاف
- يميل CLPPD بشكل منهجي نحو طرق البيانات المستهدفة، حتى أفضل من الطريقة الحقيقية
يُظهر الجدول 2 نتائج متسقة تحت نموذج أكثر تعقيداً:
- نظراً لأن كمية المعلومات من البيانات أقل وبيانات المصدر أكبر، تُظهر طرق البيانات المستهدفة أداءً نسبياً أضعف
- LOO-CV لا يزال يحدد استراتيجية النقل المثلى بدقة
- مشكلة انحياز CLPPD أكثر وضوحاً
- مزايا LOO-CV: تجنب الإفراط في التدريب، توافق عالي مع المؤشرات المثالية
- مشاكل CLPPD: التقييم على بيانات التدريب يؤدي إلى الانحياز نحو طرق البيانات المستهدفة
- تُظهر أفضل أداء في حالات الاختلاف المتوسط
- قادرة على تعديل تأثير بيانات المصدر بشكل تكيفي
- يجعل إطار عمل TSMC الحساب ممكناً
- يتجنب إطار عمل TSMC إعادة الحساب من خلال تخزين النتائج الوسيطة
- يجعل أخذ العينات بالأهمية حساب LOO-CV فعالاً
- يمكن الحصول على نتائج FPP و NPP معاً في تشغيل واحد
- عائلة السلطة السابقة: الطريقة الكلاسيكية المقترحة من قبل Ibrahim et al. (2003, 2015)
- السابق المتناسب: Hobbs et al. (2011)، باستخدام سابق spike-and-slab
- نهج Meta-Analytic-Predictive (MAPA): Neuenschwander et al. (2010)
- طرق السابق المترافق: Carvalho and Ibrahim (2021)
- MCMC الصعوبة المزدوجة: Park and Haran (2018)
- سلسلة مونت كارلو: Chopin (2002)، Del Moral et al. (2006)
- معايير المعلومات: DIC و WAIC وطرق تقليدية أخرى
- التحقق المتقاطع: تطبيق أقل في التعلم الانتقالي البايزي
- LOO-CV معيار تقييم فعال: يمكنه تحديد أفضل استراتيجية نقل بدقة دون الحاجة إلى معاملات حقيقية
- إطار عمل TSMC يحل التحديات الحسابية: يجعل طريقة السلطة السابقة قابلة للتطبيق في التطبيقات العملية
- قيمة النقل المعتدل: عندما تكون بيانات المصدر والبيانات المستهدفة ذات صلة معتدلة، تتفوق طرق السلطة السابقة بشكل كبير على الاستراتيجيات القصوى
- قيود بيانات المصدر الفردية: يأخذ الإطار الحالي في الاعتبار مجموعة بيانات مصدر واحدة فقط
- حساسية اختيار السابق: لا يزال اختيار السابق لـ α في NPP يتطلب مزيداً من البحث
- التكلفة الحسابية: على الرغم من التحسن مقارنة بالطرق التقليدية، لا تزال تتطلب موارد حسابية كبيرة
- توسيع بيانات المصادر المتعددة: النظر في الدمج المتسلسل أو المتوازي لمجموعات بيانات مصدر متعددة
- السابق التكيفي: تطوير استراتيجيات اختيار سابق أكثر معقولية لـ α في NPP
- طرق نقل أخرى: توسيع إطار التقييم ليشمل طرق السابق المتناسب و MAPA
- الابتكار الطريقة قوي: يحل إطار عمل TSMC مشكلة حساب ثابت التطبيع بذكاء
- معايير التقييم عملية: يوفر LOO-CV طريقة تقييم موثوقة دون الحاجة إلى معاملات حقيقية
- تصميم التجارب شامل: تتحقق دراستا المحاكاة من مستويات تعقيد مختلفة من فعالية الطريقة
- الأساس النظري متين: بناءً على المبادئ البايزية، الاشتقاقات الرياضية دقيقة
- نقص التحقق من البيانات الحقيقية: التحقق فقط على بيانات المحاكاة، يفتقد دراسات الحالات الحقيقية
- نطاق تطبيق الطريقة: موجهة بشكل أساسي نحو طريقة السلطة السابقة، تحتاج إلى التحقق من قابلية التطبيق على طرق نقل أخرى
- التعقيد الحسابي: على الرغم من الكفاءة مقارنة بالطرق التقليدية، قد تواجه تحديات في المشاكل الكبيرة الحجم
- المساهمة النظرية: توفر إطار عمل حسابي وتقييم جديد للتعلم الانتقالي البايزي
- القيمة العملية: يمكن تطبيق إطار عمل TSMC مباشرة على المشاكل العملية
- قابلية إعادة الإنتاج: يوفر المؤلفون وصفاً كاملاً للخوارزمية والكود
- البحث الطبي: استخدام بيانات التحكم التاريخية في التجارب السريرية
- علم الأوبئة: استخدام بيانات الأوبئة السابقة عند ظهور وباء جديد
- التطبيقات الهندسية: استخدام البيانات التاريخية ذات الصلة في بيئات جديدة نادرة البيانات
- العلوم الاجتماعية: الاستفادة من بيانات الدراسات ذات الصلة في الدراسات الصغيرة الحجم
تستشهد هذه الورقة بالأدبيات المهمة في هذا المجال، بما في ذلك:
- Ibrahim, J.G., Chen, M.-H., Sinha, D. (2003). العمل الأساسي لطريقة السلطة السابقة
- Chopin, N. (2002). الأدبيات الكلاسيكية لطريقة سلسلة مونت كارلو
- Vehtari, A., et al. (2024). التطورات الأخيرة في أخذ العينات بالأهمية
- Carvalho, L.M., Ibrahim, J.G. (2021). التطور النظري للسلطة السابقة المعايرة
التقييم الشامل: هذه ورقة عالية الجودة في منهجية الإحصاء، تقدم مساهمات مهمة في مجال التعلم الانتقالي البايزي. لا تحل الورقة فقط التحديات الحسابية للطرق الموجودة، بل توفر أيضاً معايير تقييم عملية، مع أهمية نظرية وقيمة تطبيقية قوية.