2025-11-25T21:58:18.737394

A Principled Approach to Bayesian Transfer Learning

Bretherton, Bon, Warne et al.
Updating $\textit{a priori}$ information given some observed data is the core tenet of Bayesian inference. Bayesian transfer learning extends this idea by incorporating information from a related dataset to improve the inference on the observed target dataset which may have been collected under slightly different settings. The use of related information can be useful when the target dataset is scarce, for example. There exist various Bayesian transfer learning methods that decide how to incorporate the related data in different ways. Unfortunately, there is no principled approach for comparing Bayesian transfer methods in real data settings. Additionally, some Bayesian transfer learning methods, such as the so-called power prior approaches, rely on conjugacy or costly specialised techniques. In this paper, we find an effective approach to compare Bayesian transfer learning methods is to apply leave-one-out cross validation on the target dataset. Further, we introduce a new framework, $\textit{transfer sequential Monte Carlo}$, that efficiently implements power prior methods in an automated fashion. We demonstrate the performance of our proposed methods in two comprehensive simulation studies.
academic

نهج مبدئي للتعلم الانتقالي البايزي

المعلومات الأساسية

  • معرّف الورقة: 2502.19796
  • العنوان: A Principled Approach to Bayesian Transfer Learning
  • المؤلفون: Adam Bretherton, Joshua J. Bon, David J. Warne, Kerrie Mengersen, Christopher Drovandi
  • التصنيف: stat.ME (الإحصاء - المنهجية)، stat.CO (الإحصاء - الحساب)
  • تاريخ النشر: 14 أكتوبر 2025 (arXiv v3)
  • رابط الورقة: https://arxiv.org/abs/2502.19796v3

الملخص

تبحث هذه الورقة في نهج مبدئي للتعلم الانتقالي البايزي. يتمحور الاستدلال البايزي حول تحديث المعلومات السابقة بناءً على البيانات المرصودة، بينما يوسع التعلم الانتقالي البايزي هذه الفكرة من خلال دمج المعلومات من مجموعات البيانات ذات الصلة لتحسين الاستدلال على مجموعة البيانات المستهدفة. يكون استخدام المعلومات ذات الصلة ذا قيمة خاصة عندما تكون مجموعة البيانات المستهدفة نادرة. تعتمد طرق التعلم الانتقالي البايزي الحالية على استراتيجيات مختلفة في دمج البيانات ذات الصلة، لكنها تفتقر إلى نهج مبدئي لمقارنة هذه الطرق في بيئات البيانات الحقيقية. علاوة على ذلك، تعتمد بعض الطرق (مثل طريقة السلطة السابقة) على الاقتران أو تقنيات متخصصة مكلفة. تكتشف هذه الورقة أن التحقق المتقاطع بحذف واحد هو مسار فعال لمقارنة طرق التعلم الانتقالي البايزي، وتقترح إطار عمل سلسلة مونت كارلو الانتقالية (TSMC)، القادر على أتمتة تنفيذ طريقة السلطة السابقة بكفاءة.

السياق البحثي والدافع

تعريف المشكلة

يهدف التعلم الانتقالي البايزي إلى حل مشكلة كيفية الاستفادة الفعالة من بيانات المصدر ذات الصلة لتحسين الاستدلال على البيانات المستهدفة. في التطبيقات العملية، غالباً ما تكون البيانات المستهدفة نادرة ومكلفة، بينما قد تكون البيانات التاريخية ذات الصلة أو بيانات الدراسات المماثلة وفيرة لكنها تختلف إلى حد ما عن البيانات المستهدفة.

أهمية المشكلة

  1. ندرة البيانات: في علم الأوبئة والتجارب السريرية وغيرها، يكون الحصول على بيانات جديدة مكلفاً وتستغرق وقتاً طويلاً
  2. كفاءة استخدام المعلومات: التخلص الكامل من بيانات المصدر ذات الصلة غير فعال، لكن الدمج المباشر قد يؤدي إلى انحياز
  3. المتطلبات العملية: الحاجة إلى اتخاذ قرارات نقل معقولة تحت مستويات مختلفة من تشابه البيانات

قيود الطرق الموجودة

  1. عدم وجود معايير مقارنة: لا توجد طريقة مبدئية لمقارنة أداء طرق التعلم الانتقالي المختلفة في بيئات البيانات الحقيقية
  2. التعقيد الحسابي: تعتمد طريقة السلطة السابقة على الأسبقيات المترافقة أو تقنيات MCMC المتخصصة، بتكاليف حسابية عالية
  3. صعوبة اختيار المعاملات: يتطلب السلطة السابقة الثابتة بحثاً شبكياً، والسلطة السابقة المعايرة تعاني من مشكلة الصعوبة المزدوجة

الدافع البحثي

تهدف هذه الورقة إلى توفير إطار عمل موحد لـ:

  1. إنشاء معايير مبدئية لمقارنة طرق التعلم الانتقالي البايزي
  2. تطوير طرق تنفيذ السلطة السابقة فعالة حسابياً
  3. تقييم أداء الطرق دون الحاجة إلى قيم المعاملات الحقيقية

المساهمات الأساسية

  1. اقتراح إطار اختبار التنبؤ اللاحق: استخدام التحقق المتقاطع بحذف واحد (LOO-CV) كمعيار مبدئي لمقارنة طرق التعلم الانتقالي البايزي في بيئات البيانات الحقيقية
  2. تطوير إطار عمل TSMC الحسابي: اقتراح طريقة سلسلة مونت كارلو الانتقالية، القادرة على تنفيذ السلطة السابقة الثابتة (FPP) والسلطة السابقة المعايرة (NPP) بكفاءة في نفس الوقت
  3. حل مشكلة الصعوبة المزدوجة: التغلب على التحديات الحسابية لمعاملات NPP التي تعتمد على ثابت التطبيع من خلال استراتيجية تحليل ذكية
  4. توفير تقييم منهجي: التحقق من فعالية الطرق المقترحة في دراستي محاكاة شاملتين

شرح الطريقة

تعريف المهمة

بالنظر إلى مجموعة البيانات المستهدفة yTy_T (بحجم nn) ومجموعة البيانات المصدر ذات الصلة ySy_S (بحجم mm، حيث n<mn < m)، الهدف هو الاستفادة من بيانات المصدر لتحسين الاستدلال البايزي على البيانات المستهدفة، مع تجنب التأثيرات السلبية للاختلافات بين بيانات المصدر والبيانات المستهدفة.

طريقة السلطة السابقة

الشكل الأساسي

تتحكم السلطة السابقة في تأثير بيانات المصدر من خلال معامل التعديل α(0,1)\alpha \in (0,1):

π(θyS,α)=p(ySθ)απ(θ)CS(α)\pi(\theta|y_S, \alpha) = \frac{p(y_S|\theta)^\alpha \pi(\theta)}{C_S(\alpha)}

حيث CS(α)C_S(\alpha) هو ثابت التطبيع. اللاحق المستهدف هو:

π(θyT,yS,α)=p(yTθ)p(ySθ)απ(θ)CT,S(α)\pi(\theta|y_T, y_S, \alpha) = \frac{p(y_T|\theta)p(y_S|\theta)^\alpha \pi(\theta)}{C_{T,S}(\alpha)}

متغيرتان

  1. السلطة السابقة الثابتة (FPP): α\alpha قيمة ثابتة، يتم تحديدها من خلال معايير اختيار النموذج
  2. السلطة السابقة المعايرة (NPP): α\alpha متغير عشوائي، مع توزيع سابق αBeta(α0,β0)\alpha \sim \text{Beta}(\alpha_0, \beta_0)

إطار عمل سلسلة مونت كارلو الانتقالية (TSMC)

الفكرة الأساسية

الاستفادة من العلاقة التحليلية CT(α)=CT,S(α)CS(α)C_T(\alpha) = \frac{C_{T,S}(\alpha)}{C_S(\alpha)} لتقدير ثابت التطبيع بشكل غير مباشر، مما يتجنب صعوبات الحساب المباشر.

خوارزمية SMC ثنائية الجدول الزمني

الجدول الزمني 1: تقدير CS(α)C_S(\alpha)

  • التوزيع المستهدف: πt,S(θyS,αt)p(ySθ)αtπ(θ)\pi_{t,S}(\theta|y_S, \alpha_t) \propto p(y_S|\theta)^{\alpha_t}\pi(\theta)
  • سلسلة درجات الحرارة العكسية: 0=α0<α1<<αT=10 = \alpha_0 < \alpha_1 < \cdots < \alpha_T = 1

الجدول الزمني 2: تقدير CT,S(α)C_{T,S}(\alpha)

  • التوزيع المستهدف: πt,TSMC(θyS,yT,γt,αt)p(yTθ)γtp(ySθ)αtπ(θ)\pi_{t,TSMC}(\theta|y_S, y_T, \gamma_t, \alpha_t) \propto p(y_T|\theta)^{\gamma_t}p(y_S|\theta)^{\alpha_t}\pi(\theta)
  • التصميم على مرحلتين: دمج البيانات المستهدفة أولاً باستخدام γ\gamma، ثم دمج بيانات المصدر باستخدام α\alpha

استراتيجية اختيار النموذج

TSMC-ME (دليل النموذج): α=argmaxα[0,1]CT(α)\alpha^* = \arg\max_{\alpha \in [0,1]} C_T(\alpha)

TSMC-NPP (بايزي كامل): π(αyT,yS)CT(α)π(α)\pi(\alpha|y_T, y_S) \propto C_T(\alpha)\pi(\alpha)

طريقة اختبار التنبؤ اللاحق

المؤشرات المثالية (تتطلب معاملات حقيقية)

  • الانحياز: Bias=μ^θθ\text{Bias} = |\hat{\mu}_\theta - \theta^*|
  • متوسط الخطأ التربيعي: MSE=1Ni=1N(θiθ)2\text{MSE} = \frac{1}{N}\sum_{i=1}^N (\theta_i - \theta^*)^2
  • احتمالية التغطية المتكررة: FCP0.9\text{FCP}_{0.9}

المؤشرات العملية (لا تتطلب معاملات حقيقية)

كثافة التنبؤ اللوغاريتمية النقطية المحسوبة (CLPPD): CLPPD=i=1nlog(1Nj=1Np(yT,iθj))\text{CLPPD} = \sum_{i=1}^n \log\left(\frac{1}{N}\sum_{j=1}^N p(y_{T,i}|\theta_j)\right)

التحقق المتقاطع بحذف واحد (LOO-CV): LOO-CV=i=1nlog(1Nj=1Np(yT,iθ(i,j)))\text{LOO-CV} = \sum_{i=1}^n \log\left(\frac{1}{N}\sum_{j=1}^N p(y_{T,i}|\theta_{(-i,j)})\right)

تسريع الحساب من خلال أخذ العينات بالأهمية: Wi(j)=wi(j)k=1Nwi(k),wi(j)=p(yT,iθj)1W_{-i}^{(j)} = \frac{w_{-i}^{(j)}}{\sum_{k=1}^N w_{-i}^{(k)}}, \quad w_{-i}^{(j)} = p(y_{T,i}|\theta_j)^{-1}

إعداد التجارب

مجموعات البيانات

نموذج الانحدار الخطي

  • النموذج: y=β0+xβ1+ϵy = \beta_0 + x\beta_1 + \epsilon، ϵN(0,σ2)\epsilon \sim N(0, \sigma^2)
  • إعدادات المعاملات: θT=(5,3,2)\theta_T = (5, 3, 2)، θS=θT+2ks^\theta_S = \theta_T + 2k \cdot \hat{s}
  • حجم البيانات: البيانات المستهدفة n=40n=40، بيانات المصدر m=80m=80
  • مستويات الاختلاف: k{0,1,2,3}k \in \{0, 1, 2, 3\}

نموذج البقاء Weibull

  • الخلفية: بناءً على التجارب السريرية للورم الميلاني E1684 و E1690
  • النموذج: نموذج علاج Weibull مع متغيرات مشروطة
  • بعد المعاملات: متجه معاملات 7 أبعاد
  • حجم البيانات: البيانات المستهدفة n=40n=40، بيانات المصدر m=300m=300

مؤشرات التقييم

  • المؤشرات المثالية: الانحياز، MSE، احتمالية التغطية المتكررة بنسبة 90%
  • المؤشرات العملية: CLPPD و LOO-CV وتصنيفاتهما
  • طرق المقارنة: الاستدلال المستقل على البيانات المستهدفة (BT)، الاستدلال المستقل على بيانات المصدر (BS)، التحديث البايزي (BU)، FPP، NPP، الاستدلال على البيانات الحقيقية (True)

تفاصيل التنفيذ

  • عدد الجزيئات: N=1000N = 1000
  • عتبة حجم العينة الفعال: E=N/2=500E = N/2 = 500
  • عدد التكرارات: 100 تجربة مستقلة لكل إعداد
  • إعداد السابق: αBeta(1,1)\alpha \sim \text{Beta}(1,1)

نتائج التجارب

النتائج الرئيسية

تجارب الانحدار الخطي

يمكن ملاحظة ما يلي من الجدول 1:

  • k=0k=0 (بدون اختلاف): تُظهر طرق BU و True أفضل أداء، LOO-CV يحدد الطريقة المثلى بشكل صحيح
  • k=1k=1 (اختلاف طفيف): تبدأ طرق FPP و NPP في إظهار مزايا، LOO-CV يصنف بدقة
  • k=2,3k=2,3 (اختلاف متوسط/شديد): تتفوق طرق البيانات المستهدفة تدريجياً، طرق السلطة السابقة لا تزال قادرة على المنافسة

النتائج الرئيسية:

  • يمكن لـ LOO-CV تحديد أفضل طريقة بشكل صحيح في جميع مستويات الاختلاف
  • يميل CLPPD بشكل منهجي نحو طرق البيانات المستهدفة، حتى أفضل من الطريقة الحقيقية

تجارب نموذج البقاء Weibull

يُظهر الجدول 2 نتائج متسقة تحت نموذج أكثر تعقيداً:

  • نظراً لأن كمية المعلومات من البيانات أقل وبيانات المصدر أكبر، تُظهر طرق البيانات المستهدفة أداءً نسبياً أضعف
  • LOO-CV لا يزال يحدد استراتيجية النقل المثلى بدقة
  • مشكلة انحياز CLPPD أكثر وضوحاً

تحليل مقارنة الطرق

LOO-CV مقابل CLPPD

  • مزايا LOO-CV: تجنب الإفراط في التدريب، توافق عالي مع المؤشرات المثالية
  • مشاكل CLPPD: التقييم على بيانات التدريب يؤدي إلى الانحياز نحو طرق البيانات المستهدفة

أداء طرق السلطة السابقة

  • تُظهر أفضل أداء في حالات الاختلاف المتوسط
  • قادرة على تعديل تأثير بيانات المصدر بشكل تكيفي
  • يجعل إطار عمل TSMC الحساب ممكناً

تحليل الكفاءة الحسابية

  • يتجنب إطار عمل TSMC إعادة الحساب من خلال تخزين النتائج الوسيطة
  • يجعل أخذ العينات بالأهمية حساب LOO-CV فعالاً
  • يمكن الحصول على نتائج FPP و NPP معاً في تشغيل واحد

الأعمال ذات الصلة

طرق التعلم الانتقالي البايزي

  1. عائلة السلطة السابقة: الطريقة الكلاسيكية المقترحة من قبل Ibrahim et al. (2003, 2015)
  2. السابق المتناسب: Hobbs et al. (2011)، باستخدام سابق spike-and-slab
  3. نهج Meta-Analytic-Predictive (MAPA): Neuenschwander et al. (2010)

الطرق الحسابية

  • طرق السابق المترافق: Carvalho and Ibrahim (2021)
  • MCMC الصعوبة المزدوجة: Park and Haran (2018)
  • سلسلة مونت كارلو: Chopin (2002)، Del Moral et al. (2006)

اختيار النموذج

  • معايير المعلومات: DIC و WAIC وطرق تقليدية أخرى
  • التحقق المتقاطع: تطبيق أقل في التعلم الانتقالي البايزي

الخلاصة والمناقشة

الاستنتاجات الرئيسية

  1. LOO-CV معيار تقييم فعال: يمكنه تحديد أفضل استراتيجية نقل بدقة دون الحاجة إلى معاملات حقيقية
  2. إطار عمل TSMC يحل التحديات الحسابية: يجعل طريقة السلطة السابقة قابلة للتطبيق في التطبيقات العملية
  3. قيمة النقل المعتدل: عندما تكون بيانات المصدر والبيانات المستهدفة ذات صلة معتدلة، تتفوق طرق السلطة السابقة بشكل كبير على الاستراتيجيات القصوى

القيود

  1. قيود بيانات المصدر الفردية: يأخذ الإطار الحالي في الاعتبار مجموعة بيانات مصدر واحدة فقط
  2. حساسية اختيار السابق: لا يزال اختيار السابق لـ α\alpha في NPP يتطلب مزيداً من البحث
  3. التكلفة الحسابية: على الرغم من التحسن مقارنة بالطرق التقليدية، لا تزال تتطلب موارد حسابية كبيرة

الاتجاهات المستقبلية

  1. توسيع بيانات المصادر المتعددة: النظر في الدمج المتسلسل أو المتوازي لمجموعات بيانات مصدر متعددة
  2. السابق التكيفي: تطوير استراتيجيات اختيار سابق أكثر معقولية لـ α\alpha في NPP
  3. طرق نقل أخرى: توسيع إطار التقييم ليشمل طرق السابق المتناسب و MAPA

التقييم العميق

المزايا

  1. الابتكار الطريقة قوي: يحل إطار عمل TSMC مشكلة حساب ثابت التطبيع بذكاء
  2. معايير التقييم عملية: يوفر LOO-CV طريقة تقييم موثوقة دون الحاجة إلى معاملات حقيقية
  3. تصميم التجارب شامل: تتحقق دراستا المحاكاة من مستويات تعقيد مختلفة من فعالية الطريقة
  4. الأساس النظري متين: بناءً على المبادئ البايزية، الاشتقاقات الرياضية دقيقة

أوجه القصور

  1. نقص التحقق من البيانات الحقيقية: التحقق فقط على بيانات المحاكاة، يفتقد دراسات الحالات الحقيقية
  2. نطاق تطبيق الطريقة: موجهة بشكل أساسي نحو طريقة السلطة السابقة، تحتاج إلى التحقق من قابلية التطبيق على طرق نقل أخرى
  3. التعقيد الحسابي: على الرغم من الكفاءة مقارنة بالطرق التقليدية، قد تواجه تحديات في المشاكل الكبيرة الحجم

التأثير

  1. المساهمة النظرية: توفر إطار عمل حسابي وتقييم جديد للتعلم الانتقالي البايزي
  2. القيمة العملية: يمكن تطبيق إطار عمل TSMC مباشرة على المشاكل العملية
  3. قابلية إعادة الإنتاج: يوفر المؤلفون وصفاً كاملاً للخوارزمية والكود

السيناريوهات المعمول بها

  1. البحث الطبي: استخدام بيانات التحكم التاريخية في التجارب السريرية
  2. علم الأوبئة: استخدام بيانات الأوبئة السابقة عند ظهور وباء جديد
  3. التطبيقات الهندسية: استخدام البيانات التاريخية ذات الصلة في بيئات جديدة نادرة البيانات
  4. العلوم الاجتماعية: الاستفادة من بيانات الدراسات ذات الصلة في الدراسات الصغيرة الحجم

المراجع

تستشهد هذه الورقة بالأدبيات المهمة في هذا المجال، بما في ذلك:

  • Ibrahim, J.G., Chen, M.-H., Sinha, D. (2003). العمل الأساسي لطريقة السلطة السابقة
  • Chopin, N. (2002). الأدبيات الكلاسيكية لطريقة سلسلة مونت كارلو
  • Vehtari, A., et al. (2024). التطورات الأخيرة في أخذ العينات بالأهمية
  • Carvalho, L.M., Ibrahim, J.G. (2021). التطور النظري للسلطة السابقة المعايرة

التقييم الشامل: هذه ورقة عالية الجودة في منهجية الإحصاء، تقدم مساهمات مهمة في مجال التعلم الانتقالي البايزي. لا تحل الورقة فقط التحديات الحسابية للطرق الموجودة، بل توفر أيضاً معايير تقييم عملية، مع أهمية نظرية وقيمة تطبيقية قوية.