Quantifying Uncertainty: All We Need is the Bootstrap?
Zrimšek, Štrumbelj
A critical literature review and comprehensive simulation study is used to show that (a) non-parametric bootstrap is a viable alternative to commonly taught and used methods in basic estimation tasks (mean, variance, quartiles, correlation) and (b), contrary to recommendations in most related work, double bootstrap performs better than BCa. Quantifying uncertainty through standard errors, confidence intervals, hypothesis tests, and related measures is a fundamental aspect of statistical practice. However, these techniques involve a variety of methods, mathematical formulas, and underlying concepts, which can be complex. Could the non-parametric bootstrap, known for its simplicity and general applicability, serve as a universal alternative? This paper addresses this question through a review of the existing literature and a simulation analysis of one- and two-sided confidence intervals across varying sample sizes, confidence levels, data-generating processes, and statistical functionals. Results show that the double bootstrap consistently performs best and is a promising alternative to traditional methods used for common statistical tasks. These results suggest that the bootstrap, particularly the double bootstrap, could simplify statistical education and practice without compromising effectiveness.
academic
تحديد عدم اليقين: هل كل ما نحتاجه هو الطريقة الإحصائية المعاد عينتها؟
تُظهر هذه الدراسة من خلال مراجعة نقدية للأدبيات ودراسة محاكاة شاملة أن: (أ) طريقة إعادة العينة غير البارامترية (Bootstrap) هي بديل قابل للتطبيق للطرق الشائعة في المهام الأساسية للتقدير (المتوسط، التباين، الكميات، الارتباط)؛ (ب) على عكس ما توصي به معظم الدراسات ذات الصلة، تتفوق طريقة إعادة العينة المزدوجة (Double Bootstrap) على طريقة BCa. تستكشف الدراسة من خلال مراجعة الأدبيات والتحليل المحاكاة ما إذا كانت طريقة إعادة العينة غير البارامترية يمكن أن تكون حلاً عاماً لتحديد عدم اليقين، وتُظهر النتائج أن طريقة إعادة العينة المزدوجة تحقق أفضل أداء وتستطيع تبسيط التعليم الإحصائي والممارسة العملية دون فقدان الفعالية.
التحديات التعليمية الواقعية: الممارسون في العلوم الاجتماعية والطب والعلوم الحياتية عادة ما يتلقون فقط 1-2 دورات إحصائية تطبيقية، لكنهم يحتاجون إلى إجراء تحليلات إحصائية واسعة النطاق
تعقيد الطرق: تتضمن طرق تحديد عدم اليقين التقليدية صيغاً رياضية معقدة ومفاهيم متعددة، مما يؤدي بسهولة إلى التطبيق الآلي والأخطاء
الأزمة العلمية: الاستخدام غير الصحيح للطرق الإحصائية هو عامل مهم في أزمة قابلية تكرار النتائج العلمية
تستشهد الورقة بـ 54 مرجعاً مهماً، تغطي الأسس النظرية لطريقة إعادة العينة والدراسات التجريبية وحالات التطبيق، مما يوفر أساساً متيناً للبحث. تشمل المراجع الرئيسية الورقة الأصلية لـ Efron حول طريقة إعادة العينة والكتاب المرجعي الكلاسيكي لـ Davison & Hinkley والدراسات المقارنة التجريبية الحديثة.
التقييم الشامل: هذه ورقة بحثية عالية الجودة في منهجية إحصائية، تطعن في المعتقدات التقليدية في المجتمع الإحصائي من خلال تجارب محاكاة واسعة النطاق، وتوفر دعماً قوياً لتطبيق طريقة إعادة العينة في التعليم الإحصائي والممارسة العملية. يتمتع البحث بتصميم صارم واستنتاجات ذات أهمية نظرية وعملية كبيرة، لكن لا تزال هناك مجالات للتحسين في التفسير النظري وتوسيع الطرق.