2025-11-11T07:10:11.815577

"Within-trial" prognostic score adjustment is targeted maximum likelihood estimation

Højbjerre-Frandsen, Schuler
Adjustment for ``super'' or ``prognostic'' composite covariates has become more popular in randomized trials recently. These prognostic covariates are often constructed from historical data by fitting a predictive model of the outcome on the raw covariates. A natural question that we have been asked by applied researchers is whether this can be done without the historical data: can the prognostic covariate be constructed or derived from the trial data itself, possibly using different folds of the data, before adjusting for it? Here we clarify that such ``within-trial'' prognostic adjustment is nothing more than a form of targeted maximum likelihood estimation (TMLE), a well-studied procedure for optimal inference. We demonstrate the equivalence with a simulation study and discuss the pros and cons of within-trial prognostic adjustment (standard efficient estimation) relative to standard TMLE and standard prognostic adjustment with historical data.
academic

"Within-trial" تعديل درجة التنبؤ هو تقدير الاحتمالية الأقصى الموجه

المعلومات الأساسية

  • معرّف الورقة: 2507.23446
  • العنوان: "Within-trial" تعديل درجة التنبؤ هو تقدير الاحتمالية الأقصى الموجه
  • المؤلفون: Emilie Højbjerre-Frandsen, Alejandro Schuler
  • التصنيف: stat.ME (الإحصاء - المنهجية)
  • تاريخ النشر: 6 نوفمبر 2025 (نسخة arXiv المسبقة)
  • رابط الورقة: https://arxiv.org/abs/2507.23446v2

الملخص

أصبح تعديل المتغيرات المساعدة "الفائقة" أو "التنبؤية" في التجارب العشوائية شائعاً بشكل متزايد في السنوات الأخيرة. عادة ما يتم بناء هذه المتغيرات التنبؤية من البيانات التاريخية من خلال ملاءمة نماذج تنبؤية للنتائج على المتغيرات الأصلية. السؤال الطبيعي الذي يطرحه الباحثون التطبيقيون هو: هل يمكن إجراء ذلك بدون بيانات تاريخية؟ هل يمكن بناء أو اشتقاق المتغيرات التنبؤية من بيانات التجربة نفسها، ربما باستخدام طيات مختلفة من البيانات، ثم إجراء التعديل؟ توضح هذه الورقة أن تعديل درجة التنبؤ "داخل التجربة" ليس سوى شكل من أشكال تقدير الاحتمالية الأقصى الموجه (TMLE)، وهو إجراء استدلالي محسّن تم دراسته بشكل شامل. يثبت المؤلفون التكافؤ من خلال دراسات محاكاة ويناقشون مزايا وعيوب تعديل درجة التنبؤ داخل التجربة بالنسبة إلى TMLE القياسي والتعديل التنبؤي القياسي باستخدام البيانات التاريخية.

السياق البحثي والدافع

خلفية المشكلة

  1. ظهور تعديل المتغيرات التنبؤية: أصبح استخدام "المتغيرات المساعدة الفائقة" أو "المتغيرات التنبؤية" لتعديل المتغيرات المساعدة في التجارب السريرية العشوائية (RCT) طريقة شائعة لتحسين الكفاءة الإحصائية. يعود هذا المفهوم إلى Tukey (1993) ويهدف إلى الاستفادة من البيانات التاريخية لتطوير متغير تنبؤي واحد يحسّن الكفاءة مع تقليل خطر الإفراط في الملاءمة.
  2. مشكلة الاعتماد على البيانات التاريخية: تعتمد طرق تعديل درجة التنبؤ التقليدية (مثل طريقة PROCOVA™) على البيانات التاريخية من التجارب السريرية السابقة أو الدراسات المسجلة. ومع ذلك، في التطبيقات العملية، يواجه الباحثون غالباً حالات تكون فيها البيانات التاريخية غير متاحة أو غير موثوقة.
  3. الحاجة إلى التعديل داخل التجربة: يتساءل الباحثون التطبيقيون بشكل طبيعي: هل يمكن بناء متغيرات تنبؤية دون استخدام البيانات التاريخية؟ هل يمكن اشتقاق المتغيرات التنبؤية مباشرة من بيانات التجربة نفسها (ربما باستخدام تقنيات التحقق المتقاطع)، ثم إجراء التعديل؟

دافع البحث

يتمثل الدافع الأساسي لهذا البحث في توضيح طبيعة تعديل درجة التنبؤ "داخل التجربة" والكشف عن علاقتها بالطرق الإحصائية الموجودة، لتجنب "إعادة اختراع العجلة".

المساهمات الأساسية

  1. إثبات التكافؤ النظري: إثبات واضح لأول مرة بأن تعديل درجة التنبؤ داخل التجربة هو في الأساس شكل من أشكال تقدير الاحتمالية الأقصى الموجه (TMLE).
  2. توضيح منهجي: توضيح أن تعديل درجة التنبؤ داخل التجربة ليس طريقة جديدة، بل هو تطبيق TMLE تحت نموذج فرعي معين، وبالتالي يجب أن يُسمى مباشرة TMLE وليس إعادة تسمية.
  3. تحليل مقارن: مقارنة منهجية لمزايا وعيوب تعديل درجة التنبؤ داخل التجربة و TMLE القياسي والتعديل التنبؤي القياسي القائم على البيانات التاريخية.
  4. التحقق التجريبي: التحقق من التكافؤ النظري من خلال دراسات محاكاة وعرض أداء الطرق المختلفة في سيناريوهات متنوعة.

شرح الطريقة

تعريف المهمة

تقدير متوسط تأثير العلاج (ATE) في تجربة عشوائية ثنائية الذراع:

  • الإدخال: بيانات مرصودة لـ n من المشاركين Oi=(Wi,Ai,Yi)O_i = (W_i, A_i, Y_i)
  • الإخراج: متوسط التأثير السببي للعلاج Ψ=E[Y(1)Y(0)]\Psi^* = E[Y(1) - Y(0)]
  • القيود: افتراض التعشية البسيطة، احتمالية توزيع العلاج معروفة

حيث:

  • YY: متغير نقطة النهاية الأساسية المستمرة
  • WW: متجه المتغيرات المساعدة الأساسية ذو البعد p
  • AA: مؤشر العلاج (1 للعلاج الجديد، 0 للمراقبة)

البنية الأساسية للطريقة

1. مقدّر ANCOVA (طريقة الاستكمال)

باستخدام صيغة G-computation:

  1. تقدير دالة المتوسط الشرطي μ(a,w)=E[YA=a,W=w]\mu(a,w) = E[Y|A=a,W=w] باستخدام MLE
  2. استخراج التنبؤات المضادة للواقع: Ψ^a=1ni=1nμ^(a,Wi)\hat{\Psi}_a = \frac{1}{n}\sum_{i=1}^n \hat{\mu}(a,W_i)
  3. الحصول على تقدير ATE: Ψ^=Ψ^1Ψ^0\hat{\Psi} = \hat{\Psi}_1 - \hat{\Psi}_0
  4. حساب التباين المقارب باستخدام دالة التأثير

2. تعديل درجة التنبؤ

تعريف درجة التنبؤ كـ:

ρD(W,A):=E[YW,A,D]\rho_D(W,A) := E[Y|W,A,D]

حيث D يشير إلى مصدر البيانات (D=1 للتجربة الجديدة، D=0 للبيانات التاريخية).

عملية التعديل التنبؤي القياسي:

  1. تدريب نموذج التنبؤ باستخدام البيانات التاريخية ρ^0(W,A)\hat{\rho}_0(W,A)
  2. إضافة التنبؤات التنبؤية كمتغيرات مساعدة إضافية في تحليل ANCOVA
  3. تحقيق الكفاءة تحت افتراض تأثير العلاج المتجانس

3. طريقة TMLE

تعالج TMLE مشكلة الانحياز في نماذج التعلم الآلي من خلال الخطوات التالية:

  1. التقدير الأولي: الحصول على تقدير أولي للمتوسط الشرطي باستخدام طرق التعلم الآلي μ^\hat{\mu}
  2. النموذج الفرعي الموجه: تحديث MLE في عائلة النموذج البارامتري {pϵ(YA,W)N(μ^(A,W)+ϵA±,1):ϵR}\{p_\epsilon(Y|A,W) \sim N(\hat{\mu}(A,W) + \epsilon A_{\pm}, 1) : \epsilon \in \mathbb{R}\} حيث A±=2A1A_{\pm} = 2A - 1
  3. خطوة التحديث: إيجاد حل MLE ϵ\epsilon^* وتحديث دالة التنبؤ μ^(a,w)=μ^(a,w)+ϵa±\hat{\mu}^*(a,w) = \hat{\mu}(a,w) + \epsilon^* a_{\pm}
  4. شرط إزالة الانحياز: يرضي النموذج المحدّث E[μ^(1,W)μ^(0,W)]=Ψ~E[\hat{\mu}^*(1,W) - \hat{\mu}^*(0,W)] = \tilde{\Psi} حيث Ψ~\tilde{\Psi} هو تقدير التأثير غير المعدّل

النتيجة النظرية الرئيسية: إثبات التكافؤ

النظرية: تعديل درجة التنبؤ داخل التجربة مكافئ لـ TMLE باستخدام نموذج فرعي معين.

خطوط الإثبات:

  1. يستخدم تعديل درجة التنبؤ داخل التجربة نموذج الانحدار: Y=β1A±+β2μ^(A,W)+Xβ3+N(0,1)Y = \beta_1 A_{\pm} + \beta_2 \hat{\mu}(A,W) + X\beta_3 + N(0,1)
  2. هذا هو بالضبط نموذج فرعي موجه صحيح لـ TMLE، يرضي:
    • الشرط 1: عند β=(0,1,0)\beta = (0,1,0) يسترجع الانحدار الأولي
    • الشرط 2: المشتقة بالنسبة إلى β1\beta_1 تعطي اتجاه إزالة الانحياز A±(Yμ^(A,W))A_{\pm}(Y - \hat{\mu}(A,W))
  3. لذلك فإن خطوة ANCOVA في تعديل درجة التنبؤ داخل التجربة تتوافق بدقة مع خطوة تحديث TMLE

إعداد التجربة

عملية توليد البيانات

توليد بيانات المحاكاة بناءً على نموذج السبب الهيكلي:

توليد المتغيرات المساعدة:

  • W1,W2Unif(2,1)W_1, W_2 \sim \text{Unif}(-2,1)
  • W3N(0,3)W_3 \sim N(0,3)
  • W4Exp(0.8)W_4 \sim \text{Exp}(0.8)
  • W5Γ(5,10)W_5 \sim \Gamma(5,10)
  • W6,W7Unif(1,2)W_6, W_7 \sim \text{Unif}(1,2)

توليد النتائج:

  • سيناريو التأثير المتجانس: m1(W)=ATE+m0(W)m_1(W) = \text{ATE} + m_0(W)
  • سيناريو التأثير غير المتجانس: يتضمن m1(W)m_1(W) حدود تفاعل غير خطية معقدة

حيث ATE = 0.84، و m0(W)m_0(W) يتضمن مزيجاً معقداً من دوال الجيب والدوال المؤشرة.

تصميم التجربة

  • حجم العينة: التجربة الرئيسية n=200، تحليل الحساسية n∈50,400
  • عدد المحاكاة: N=250 تكرار
  • طرق التعلم الآلي: Super Learner المنفصل (Discrete Super Learner)
  • مؤشرات التقييم: تقدير الخطأ المعياري، القوة الإحصائية التجريبية، معدل التغطية

الطرق المقارنة

  1. تعديل درجة التنبؤ داخل التجربة
  2. TMLE القياسي
  3. مقدّر غير معدّل (كخط أساس)

نتائج التجربة

النتائج الرئيسية

1. التحقق من التكافؤ النظري

تؤكد نتائج المحاكاة التنبؤات النظرية:

  • تعديل درجة التنبؤ داخل التجربة و TMLE متسقان بدرجة عالية في تقدير الخطأ المعياري
  • تقديرات النقاط وفترات الثقة للطريقتين متطابقة تقريباً
  • الاختلافات الطفيفة تنشأ من حقيقة أن طريقة داخل التجربة تتضمن حدود متغيرات مساعدة خطية في النموذج الفرعي المحدّث

2. مقارنة الأداء

أداء الخطأ المعياري:

  • السيناريو المتجانس: تقديرات الخطأ المعياري للطريقتين متطابقة تقريباً (حوالي 0.21-0.22)
  • السيناريو غير المتجانس: الحفاظ على أداء ممتازة متسقة
  • الخطأ المعياري التجريبي والتقدير النظري متطابقان بدرجة عالية

القوة الإحصائية ومعدل التغطية:

  • منحنيات القوة الإحصائية للطريقتين متطابقة تماماً مع زيادة حجم العينة
  • معدل تغطية فترات الثقة 95% يبقى مستقراً بالقرب من المستوى الاسمي
  • الأداء مستقرة عبر نطاق من العينات الصغيرة (n=50) إلى العينات الكبيرة (n=400)

3. النتائج الرقمية

من جداول ورسوم بيانية المحاكاة يتضح:

  • متوسط تقديرات الخطأ المعياري (النقاط الصلبة) متطابق بدرجة عالية مع الخطأ المعياري التجريبي (النجوم)
  • القوة الإحصائية تزداد بشكل رتيب مع حجم العينة، وفقاً للتوقعات النظرية
  • معدل التغطية يتذبذب في نطاق 94%-96%، قريب من المستوى الاسمي 95%

النتائج التجريبية

  1. التكافؤ الجوهري: تعديل درجة التنبؤ داخل التجربة و TMLE يظهران أداءً متطابقة تقريباً في التطبيقات العملية، مما يؤكد التكافؤ النظري.
  2. دليل الزيادة: تضمين حدود متغيرات مساعدة خطية إضافية في النموذج الفرعي المحدّث له تأثير ضئيل على النتائج، لأن درجة التنبؤ قد التقطت بالفعل هذه الاتجاهات الخطية.
  3. الاستقرار: تظهر الطريقتان استقراراً جيداً عبر سيناريوهات توليد البيانات المختلفة وأحجام العينات.

الأعمال ذات الصلة

تطور تعديل درجة التنبؤ

  • الأصول التاريخية: Tukey (1993) طرح الأفكار ذات الصلة في الأصل
  • التطور الحديث: Schuler et al. (2022) صاغ رسمياً طريقة PROCOVA™
  • نظرية الكفاءة: تحقيق حد الكفاءة شبه البارامترية تحت افتراض تأثير العلاج المتجانس

نظام طريقة TMLE

  • النظرية الأساسية: van der Laan and Rubin (2006) أسس الإطار النظري لـ TMLE
  • توسيع التحقق المتقاطع: طورت عدة دراسات متغيرات TMLE القائمة على التحقق المتقاطع
  • خصائص الكفاءة: تحقيق الكفاءة شبه البارامترية المحلية تحت شروط ضعيفة

طرق التقدير ذات الصلة

  • التعلم الآلي المزدوج: طريقة إزالة انحياز مكافئة بشكل مقارب لـ TMLE
  • IPW المعزز: مقدّر ثنائي القوة آخر
  • G-computation: طريقة الاستكمال التقليدية

الخلاصات والمناقشة

الخلاصات الرئيسية

  1. توضيح منهجي: تعديل درجة التنبؤ داخل التجربة هو في الأساس TMLE، ولا يجب إعادة تسميته كطريقة جديدة.
  2. التوصيات العملية: يجب استخدام حزم TMLE الموجودة مباشرة بدلاً من إعادة تطبيق تعديل درجة التنبؤ داخل التجربة.
  3. التوحيد النظري: يوفر هذا التكافؤ فهماً نظرياً أعمق لطرق تعديل درجة التنبؤ.

القيود

  1. متطلبات التحقق المتقاطع: يتطلب التطبيق العملي استخدام التحقق المتقاطع لتجنب الإفراط في الملاءمة، مما يزيد من تعقيد التطبيق.
  2. صعوبات التحديد المسبق: على عكس الطرق القائمة على البيانات التاريخية، يمكن لـ TMLE فقط تحديد مكتبات النماذج المرشحة مسبقاً وليس المعاملات المحددة.
  3. الاعتبارات التنظيمية: قد تُعتبر القدرة على تحديد المعاملات مسبقاً ميزة عند التعاون مع الهيئات التنظيمية.

الاتجاهات المستقبلية

  1. الطرق الهجينة: يمكن دمج درجة التنبؤ المبنية من البيانات التاريخية مع TMLE، كما اقترح Liao et al. (2025).
  2. تحسين العينات الصغيرة: في التجارب ذات حجم العينة الصغير، تكون قيمة البيانات التاريخية أكثر بروزاً.
  3. معالجة انحراف التوزيع: طرق قوية عندما توجد اختلافات توزيع بين البيانات التاريخية والتجربة الحالية.

التقييم المتعمق

المزايا

  1. المساهمة النظرية: إنشاء الرابط النظري بين طريقتين تبدوان مختلفتين لأول مرة، بقيمة منهجية مهمة.
  2. القيمة العملية: تجنب التطوير المكرر، وتوجيه الباحثين لاستخدام أدوات TMLE الناضجة.
  3. الإثبات الصارم: إثبات التكافؤ من خلال الاشتقاق الجبري بأساس نظري متين.
  4. التحقق الشامل: تغطي دراسات المحاكاة سيناريوهات متعددة مع دعم تجريبي كافٍ.
  5. الكتابة الواضحة: هيكل الورقة واضح، والتفاصيل التقنية موضحة بشكل شامل، وسهلة الفهم.

أوجه القصور

  1. الابتكار المحدود: يتعلق الأمر بشكل أساسي بالكشف عن تكافؤ الطرق الموجودة، مع افتقار إلى الابتكار المنهجي الجوهري.
  2. نطاق التطبيق: يقتصر التحليل على إعدادات التجارب العشوائية 1:1، وليس واضحاً كيفية التعميم على التصاميم الأكثر تعقيداً.
  3. تجاهل الاختلافات العملية: على الرغم من التكافؤ النظري، قد تؤثر الاختلافات في تفاصيل التطبيق في بعض الحالات.
  4. المقارنة غير الشاملة: نقص المقارنة المنهجية مع طرق تعديل المتغيرات المساعدة المتقدمة الأخرى.

التأثير

  1. القيمة الأكاديمية: توفير توضيح نظري مهم لمجال منهجية الإحصاء، يساعد على تجنب الالتباس المفاهيمي.
  2. التوجيه العملي: توفير إرشادات واضحة لاختيار الطريقة لإحصائيي التجارب السريرية.
  3. الأهمية التعليمية: المساعدة في فهم العلاقات بين طرق التقدير المختلفة في التعليم الإحصائي.

السيناريوهات المناسبة

  1. اختيار الطريقة: عندما تكون البيانات التاريخية غير متاحة، يمكن للباحثين استخدام TMLE مباشرة بدلاً من تطوير طريقة جديدة داخل التجربة.
  2. البحث النظري: توفير أساس نظري لمزيد من البحث في طرق تعديل المتغيرات المساعدة.
  3. التطبيقات التنظيمية: في البيئات التنظيمية التي تتطلب تحديداً مسبقاً لخطط التحليل، يتطلب الأمر الموازنة بين مزايا وعيوب الطرق المختلفة.

المراجع

تستشهد هذه الورقة بعدد كبير من الأدبيات المهمة في المجالات ذات الصلة، بما في ذلك:

  • Schuler et al. (2022): الورقة الأصلية لطريقة PROCOVA
  • van der Laan and Rubin (2006): العمل التأسيسي لـ TMLE
  • Tukey (1993): المصدر المبكر لأفكار تعديل درجة التنبؤ
  • أدبيات حديثة متعددة حول التحقق المتقاطع والتقديرات ثنائية القوة

التقييم الإجمالي: هذه ورقة منهجية عالية الجودة، على الرغم من أن الابتكار نسبياً محدود، إلا أنها ذات قيمة مهمة في التوضيح النظري والتوجيه العملي. تثبت الورقة بصرامة نتيجة تكافؤ مهمة، مما يساعد على الفهم الصحيح والتطبيق الفعال للطرق ذات الصلة في المجتمع الإحصائي.