Robert Cousins has posted a comment on my manuscript on ``Confidence intervals for the Poisson distribution''. His key point is that one should not include in the likelihood non-physical parameter values, even for frequency statistics. This is my response, in which I contend that it can be useful to do so when discussing such descriptive statistics.
- معرّف الورقة: 2510.25162
- العنوان: الرد على تعليق روبرت كوزينز حول فترات الثقة لتوزيع بواسون
- المؤلف: فرانك سي. بورتر (معهد كاليفورنيا للتكنولوجيا)
- التصنيف: physics.data-an (تحليل البيانات الفيزيائية)
- تاريخ النشر: 3 نوفمبر 2025 (الإصدار الثاني)
- رابط الورقة: https://arxiv.org/abs/2510.25162
هذه ورقة رد على تعليق روبرت كوزينز. يتمحور النقاش الأساسي حول ما إذا كان يجب أن تتضمن دالة الاحتمالية قيم معاملات غير فيزيائية (مثل شدة إشارة سالبة) في إطار الإحصائيات التكرارية. يرى كوزينز أنه لا يجب تضمينها، بينما يؤيد بورتر أن هذا مفيد عند مناقشة الإحصائيات الوصفية.
عند بناء فترات الثقة لتوزيع بواسون، عندما تكون القيمة المرصودة n أصغر من الخلفية المعروفة b، تظهر قيم سالبة لمعامل شدة الإشارة θ = n - b. يثير هذا سؤالاً أساسياً: هل يجب أن تُعرّف دالة الاحتمالية في إطار الإحصائيات التكرارية في منطقة معاملات غير فيزيائية (θ < 0)؟
- على المستوى النظري: يتعلق بالفروقات الأساسية بين الإحصائيات التكرارية والإحصائيات البايزية، ويؤثر على أسس الاستدلال الإحصائي
- على المستوى العملي: في تجارب الفيزياء عالية الطاقة، تظهر قيم تقدير إشارة سالبة بسبب تقلبات الخلفية بشكل متكرر، وكيفية الإبلاغ الصحيح عن هذه القياسات مسألة عملية
- على المستوى المنهجي: يؤثر على تعريف الإحصائيات الكافية وتطبيق تقدير الاحتمالية العظمى
- وجهة نظر كوزينز: يجب أن تُعتبر دالة الاحتمالية غير معرّفة في المناطق غير الفيزيائية، لأن النموذج الفيزيائي غير موجود في تلك المنطقة
- وجهة نظر بورتر: عند وصف نتائج القياس، من المفيد السماح بامتداد دالة الاحتمالية إلى المناطق غير الفيزيائية، وهذا لا ينتهك القيود الفيزيائية
تحافظ معظم كتب الإحصائيات التقليدية على الصمت حول هذه المسألة، وتفتقر إلى مبادئ توجيهية واضحة. يؤدي هذا إلى التباس في الممارسة العملية، وحتى يعتقد البعض خطأً أن طرق الإحصائيات التكرارية "خاطئة".
- توضيح الطبيعة الوصفية للإحصائيات التكرارية: التأكيد على أن الإحصائيات التكرارية توفر وصفاً للقياس، وليس بيان معتقد حول المعامل
- الحجة لصالح تعريف دالة الاحتمالية في المناطق غير الفيزيائية: إثبات من خلال مفهوم الإحصائيات الكافية أن θ̂ = n - b يحتوي على معلومات أكثر من max(n - b, 0)
- توضيح العلاقة بين الإحصائيات الوصفية والاستدلالية: الإحصائيات الوصفية يمكن أن توفر معلومات للاستدلال، لكنها بحد ذاتها لا تشكل بيان درجة معتقد
- توفير إرشادات منهجية عملية: دعم الإبلاغ عن قيم تقدير إشارة سالبة في التجارب (مثل θ̂ = -2 ± 1)
ضع في الاعتبار أخذ عينات من متغير عشوائي N = 0, 1, 2, ... من توزيع بواسون، حيث يساوي متوسطه μ مجموع شدة الإشارة θ ≥ 0 والخلفية المعروفة b (≥ 0):
f(n;θ,b)=n!μne−μ=n!(θ+b)ne−θ−b
حيث n هي القيم الممكنة لـ N.
تُعرّف دالة الاحتمالية التي يقدمها بورتر كالتالي:
L(θ;n)=n!μne−μ=n!(θ+b)ne−θ−b
النقطة الأساسية: هذه الدالة معرّفة رياضياً لأي μ ≥ 0، حتى عندما يكون θ = μ - b < 0.
يستند الحجة الأساسية لبورتر إلى مفهوم الإحصائيات الكافية:
- N - b هي إحصائية كافية لـ θ: تحتوي على جميع المعلومات في البيانات حول θ
- max(N - b, 0) ليست إحصائية كافية: عند فرض قيمة تقدير غير سالبة، يتم فقدان المعلومات
- لذلك: θ̂ = n - b كإحصائية وصفية أكثر إفادة من النسخة المقطوعة
الموقف الذي يتمسك به بورتر هو:
- نتائج الإحصائيات التكرارية وصفية: تصف القياس نفسه، وليس القيمة الحقيقية للمعامل
- لا يجب تفسيرها كبيانات درجة معتقد: بيانات الاحتمالية تشير فقط إلى خصائص التكرار على المدى الطويل
- يمكن أن توفر معلومات للاستدلال: عند ملاحظة θ̂ = -2، يمكن الاستدلال (بمعنى درجة المعتقد) أن θ "من المحتمل" أن يكون صغيراً جداً
في الإطار البايزي، لا يوجد نزاع:
- يقيد التوزيع السابق بشكل طبيعي المعامل في المنطقة الفيزيائية
- المعتقد في المنطقة غير الفيزيائية يساوي صفراً
- يتم تحقيق القيود الفيزيائية من خلال التوزيع السابق وليس دالة الاحتمالية
التمييز بين "توزيع العينة" و"مجال تعريف دالة الاحتمالية":
- توزيع العينة يفترض دائماً θ ≥ 0 (القيد الفيزيائي)
- دالة الاحتمالية كموضوع رياضي يمكن تعريفها على نطاق أوسع
- يسمح هذا التمييز باستخدام جميع الأدوات الرياضية دون انتهاك النموذج الفيزيائي
يقترح بورتر أنه إذا منعت السلطات الإحصائية تعريف "الاحتمالية" في المناطق غير الفيزيائية، يمكن تسميتها "درجة الوصف" و"أقصى درجة وصف"، مع التأكيد على طبيعتها كأداة وصفية.
تحافظ هذه الطريقة على الاتساق عبر التوزيعات المختلفة:
- توزيع بواسون: θ̂ = n - b يمكن أن يكون سالباً
- التوزيع الطبيعي: تم مناقشة اعتبارات مماثلة في المرجع 4
- الحفاظ على العمومية والاتساق في الطرق الإحصائية
يستشهد بورتر بالأعمال الكلاسيكية لكندال وآخرين (المجلد 2A، الأقسام 26.58-26.78)، وخاصة البيان في القسم 26.69:
"فشل الأسلوب التكراري في توفير بيانات حول مصداقية الفرضية يكاد يكون بديهياً، لأن التكراريين غير مستعدين لقبول أي مفهوم احتمالي يفتقر إلى تفسير تكراري."
هنا "الاحتمالية₁" تشير إلى احتمالية درجة المعتقد.
يشير بورتر إلى أن سوء فهم الإحصائيات التكرارية كبيانات استدلالية أدى إلى التباس كبير:
حالة نموذجية: في عام 2015، أعلن محرر مجلة علم النفس Basic and Applied Social Psychology أن قيم p "غير صالحة" وحظر استخدامها، وهذا هو بالضبط نتيجة الالتباس حول طبيعة الإحصائيات التكرارية.
بينما يؤكد بورتر على أن الإحصائيات التكرارية وصفية، يعترف بأن:
- عند الحصول على قياس θ̂ = n - b، من المعقول الاستدلال بأن θ "من المحتمل" أن يكون قريباً من θ̂
- يدخل هذا الاستدلال مجال درجة المعتقد
- عند ملاحظة θ̂ سالب، يمكن الاستدلال بأن θ "من المحتمل" أن يكون صغيراً جداً (لكن ليس سالباً)
على الرغم من عدم وجود نتائج تجريبية محددة في النص، تأتي الخلفية من الفيزياء عالية الطاقة:
- البحث عن إشارات نادرة (مثل جزيئات جديدة)
- عدد أحداث الخلفية المعروفة b
- إجمالي عدد الأحداث المرصودة n
- الحاجة إلى تقدير شدة الإشارة θ
عندما تؤدي تقلبات الخلفية إلى n < b:
- الممارسة التقليدية المحتملة: الإبلاغ عن θ̂ = 0 أو عدم الإبلاغ
- ما يدعو إليه بورتر: الإبلاغ عن θ̂ = n - b (قيمة سالبة)، مع فترة ثقة
- الميزة: الحفاظ على جميع المعلومات من الإحصائية الكافية
يعتقد بورتر أنه يمكن الإبلاغ بشكل كامل عن:
"نتيجة القياس هي θ̂ = -2 ± 1، على الرغم من أن θ > 0 معروف"
هذا النوع من الإبلاغ:
- يصف القياس بشكل كامل
- يسمح للقارئ بالاستدلال بأن θ قد يكون قريباً من الصفر
- لا يدعي أن θ سالب فعلاً
- شاو (2003): كتاب Mathematical Statistics يحتوي على أمثلة تدعم وجهة نظر كوزينز، لكنها تظهر في فصول تحتوي على محتوى بايزي أكثر، دون شرح السياق بالتفصيل
- كندال وآخرون (1999): Kendall's Advanced Theory of Statistics يعترف بمشاكل وخلافات في طرق التقدير المختلفة، وآراؤه متسقة مع موقف بورتر
- نارسكي وبورتر (2014): ناقشا مشكلة مماثلة في حالة التوزيع الطبيعي
- للنقاش الفلسفي بين الإحصائيات التكرارية والبايزية تاريخ طويل
- بخصوص مسألة مجال تعريف دالة الاحتمالية، غالباً ما تتجنب كتب الإحصائيات هذا الموضوع
- الالتباس في الممارسة العملية يؤدي إلى سوء فهم وإساءة استخدام الطرق الإحصائية
- في إطار الإحصائيات التكرارية، من المفيد والمعقول السماح بتعريف دالة الاحتمالية في مناطق معاملات غير فيزيائية
- هذا لا ينتهك النموذج الفيزيائي: توزيع العينة يفترض دائماً القيود الفيزيائية
- اعتبار الإحصائيات الكافية يدعم هذا النهج: N - b يحتوي على معلومات أكثر من max(N - b, 0)
- يجب اعتبار الإحصائيات التكرارية وصفية: توفر وصفاً للقياس وليس معتقداً حول المعامل
- يعترف بأن موقفه قد يكون أكثر تطرفاً من السوابق التاريخية
- لكنه يعتقد أن هذا الموقف يساعد في الحفاظ على الوضوح المفاهيمي
- لا يوجد خلاف في الإطار البايزي، والنزاع يقتصر على تفسير الإحصائيات التكرارية
هذه المنهجية:
- تسمح بالإبلاغ الأكثر اكتمالاً عن نتائج التجارب
- تتجنب فقدان المعلومات
- تحافظ على اتساق الطرق الإحصائية
- تساعد في التحليلات البايزية اللاحقة أو تحليلات ما وراء البيانات
لم يتم تقديم اتجاهات مستقبلية صريحة في النص، لكن الاتجاهات الضمنية تشمل:
- توضيح إضافي للعلاقة بين الإحصائيات التكرارية والبايزية
- نشر ممارسات إبلاغ إحصائية معقولة في الفيزياء التجريبية
- تثقيف مستخدمي الإحصائيات لتجنب سوء الفهم الشائع
- الوضوح المفاهيمي:
- التمييز الواضح بين الإحصائيات الوصفية والاستدلالية
- تحديد دقيق لطبيعة الإحصائيات التكرارية وحدودها
- الحجة القائمة على الإحصائيات الكافية مقنعة
- التوجه العملي:
- معالجة مشاكل حقيقية في التجارب العملية
- توفير إرشادات منهجية قابلة للتطبيق
- تجنب فقدان المعلومات
- أساس نظري متين:
- الاستشهاد بالأدبيات الإحصائية الكلاسيكية لدعم الآراء
- الحجة الرياضية للإحصائيات الكافية دقيقة
- المقارنة مع الطريقة البايزية مناسبة
- الكتابة الواضحة:
- البنية المنطقية واضحة
- الاعتراف بمعقولية وجهات النظر المختلفة
- النبرة احترافية وملائمة
- قد يكون هناك نزاع فلسفي:
- مسألة كيفية "يجب" تعريف دالة الاحتمالية لها مكون فلسفي أساسي
- قد يكون هناك اختلافات لا يمكن التوفيق بينها بين المدارس الإحصائية المختلفة
- يعترف بورتر بأنه قد يكون من المستحيل التوصل إلى اتفاق
- التباس محتمل في الممارسة:
- السماح بقيم تقدير سالبة قد يُساء فهمها من قبل غير المتخصصين
- يتطلب شرحاً وتعليماً إضافياً
- قد يثير التباساً في بعض مجالات التطبيق
- الأدلة التجريبية محدودة:
- في الأساس حجج مفاهيمية ونظرية
- تفتقد دراسات حالة لتحليل البيانات الفعلية
- لم تُعرض تأثيرات التطبيق في تجارب محددة
- النقاش حول وجهة نظر كوزينز ليس عميقاً بما يكفي:
- يركز بشكل أساسي على عرض الموقف الخاص به
- الرد على الحجج المحددة للمعارضة أقل
- قد لا يفهم بشكل كامل الاهتمامات الأساسية للطرف الآخر
الجوانب الإيجابية:
- توفير دعم نظري لممارسات إحصائية في الفيزياء عالية الطاقة والمجالات ذات الصلة
- المساعدة في توضيح طبيعة الإحصائيات التكرارية
- قد يؤثر على معايير الإبلاغ عن نتائج التجارب
القيود:
- قد يكون التأثير المباشر محدوداً على مجالات معينة (مثل فيزياء الجزيئات)
- قد يستمر الاختلاف في المجتمع الإحصائي
- يتطلب التعليم والترويج لتغيير الممارسات
- هذه ورقة نظرية/منهجية، لا تتعلق بقابلية التكرار التجريبية
- المفاهيم والحجج واضحة وسهلة الفهم والتطبيق
- الاشتقاقات الرياضية بسيطة ومباشرة
السيناريوهات الأنسب:
- تجارب الفيزياء عالية الطاقة: البحث عن الإشارات، تقدير الخلفية
- التجارب ذات معدل العد المنخفض: حيث تسيطر الإحصائيات التكرارية
- الحالات التي تتطلب الإبلاغ عن الإحصائيات الكافية: عندما تكون نقل المعلومات الكاملة مهماً
السيناريوهات الأقل ملاءمة:
- التواصل العلمي مع الجمهور: قد تثير قيم الإشارة السالبة التباساً
- بيئات القرار التنظيمي: قد تتطلب طرق إبلاغ أكثر تحفظاً
- الجماهير غير المألوفة بالإحصائيات: تتطلب شرحاً إضافياً
تكمن المساهمات الأساسية لبورتر في:
- توضيح الحدود بين "الوصف" و"الاستدلال" في الإحصائيات التكرارية
- توفير دعم نظري قائم على الإحصائيات الكافية لتعريف دالة الاحتمالية في المناطق غير الفيزيائية
- توفير إرشادات عملية للإبلاغ: السماح بالإبلاغ عن قيم معاملات سالبة
- توضيح العلاقة مع الطريقة البايزية: لا يوجد نزاع في الإطار البايزي
هذه ورقة منهجية مهمة توفر منظوراً قيماً لمشاكل عملية في الممارسة الإحصائية. على الرغم من أنها قد لا تقنع الجميع، فإن حجتها القائمة على الإحصائيات الكافية وتوضيحها الواضح لطبيعة الإحصائيات التكرارية توفر إرشادات مهمة لفيزيائيي التجارب. تكمن القيمة الرئيسية للورقة في توضيح المفاهيم وتوفير إرشادات منهجية، وليس في حل مشكلة تقنية لها إجابة محددة.
1 Robert D. Cousins. Comment on Frank Porter, "Confidence intervals for the Poisson distribution", 2025. arXiv:2509.17339
2 Frank C. Porter. Confidence intervals for the Poisson distribution, 2025. arXiv:2509.02852
3 Jun Shao. Mathematical Statistics, 2nd edition. Springer-Verlag, 2003
4 I. Narsky and F. C. Porter. Statistical analysis techniques in particle physics, 2014
5 Alan Stuart et al. Kendall's Advanced Theory of Statistics, Volume 2A, 1999
6 David Trafimow and Michael Marks. Editorial. Basic and Applied Social Psychology, 37(1):1–2, 2015
التقييم الإجمالي: هذه ورقة منهجية ذات مفاهيم واضحة وحجج قوية، توفر منظوراً قيماً لمشاكل عملية في الممارسة الإحصائية. على الرغم من أنها قد لا تقنع الجميع، فإن حجتها القائمة على الإحصائيات الكافية وتوضيحها الواضح لطبيعة الإحصائيات التكرارية توفر إرشادات مهمة لفيزيائيي التجارب. تكمن القيمة الرئيسية للورقة في توضيح المفاهيم وتوفير إرشادات منهجية، وليس في حل مشكلة تقنية لها إجابة محددة.