2025-11-11T17:58:09.979705

Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution

Porter
Robert Cousins has posted a comment on my manuscript on ``Confidence intervals for the Poisson distribution''. His key point is that one should not include in the likelihood non-physical parameter values, even for frequency statistics. This is my response, in which I contend that it can be useful to do so when discussing such descriptive statistics.
academic

الرد على تعليق روبرت كوزينز حول فترات الثقة لتوزيع بواسون

المعلومات الأساسية

  • معرّف الورقة: 2510.25162
  • العنوان: الرد على تعليق روبرت كوزينز حول فترات الثقة لتوزيع بواسون
  • المؤلف: فرانك سي. بورتر (معهد كاليفورنيا للتكنولوجيا)
  • التصنيف: physics.data-an (تحليل البيانات الفيزيائية)
  • تاريخ النشر: 3 نوفمبر 2025 (الإصدار الثاني)
  • رابط الورقة: https://arxiv.org/abs/2510.25162

الملخص

هذه ورقة رد على تعليق روبرت كوزينز. يتمحور النقاش الأساسي حول ما إذا كان يجب أن تتضمن دالة الاحتمالية قيم معاملات غير فيزيائية (مثل شدة إشارة سالبة) في إطار الإحصائيات التكرارية. يرى كوزينز أنه لا يجب تضمينها، بينما يؤيد بورتر أن هذا مفيد عند مناقشة الإحصائيات الوصفية.

خلفية البحث والدافع

المشكلة الأساسية

عند بناء فترات الثقة لتوزيع بواسون، عندما تكون القيمة المرصودة n أصغر من الخلفية المعروفة b، تظهر قيم سالبة لمعامل شدة الإشارة θ = n - b. يثير هذا سؤالاً أساسياً: هل يجب أن تُعرّف دالة الاحتمالية في إطار الإحصائيات التكرارية في منطقة معاملات غير فيزيائية (θ < 0)؟

أهمية المشكلة

  1. على المستوى النظري: يتعلق بالفروقات الأساسية بين الإحصائيات التكرارية والإحصائيات البايزية، ويؤثر على أسس الاستدلال الإحصائي
  2. على المستوى العملي: في تجارب الفيزياء عالية الطاقة، تظهر قيم تقدير إشارة سالبة بسبب تقلبات الخلفية بشكل متكرر، وكيفية الإبلاغ الصحيح عن هذه القياسات مسألة عملية
  3. على المستوى المنهجي: يؤثر على تعريف الإحصائيات الكافية وتطبيق تقدير الاحتمالية العظمى

جوهر النزاع

  • وجهة نظر كوزينز: يجب أن تُعتبر دالة الاحتمالية غير معرّفة في المناطق غير الفيزيائية، لأن النموذج الفيزيائي غير موجود في تلك المنطقة
  • وجهة نظر بورتر: عند وصف نتائج القياس، من المفيد السماح بامتداد دالة الاحتمالية إلى المناطق غير الفيزيائية، وهذا لا ينتهك القيود الفيزيائية

حدود الطرق الموجودة

تحافظ معظم كتب الإحصائيات التقليدية على الصمت حول هذه المسألة، وتفتقر إلى مبادئ توجيهية واضحة. يؤدي هذا إلى التباس في الممارسة العملية، وحتى يعتقد البعض خطأً أن طرق الإحصائيات التكرارية "خاطئة".

المساهمات الأساسية

  1. توضيح الطبيعة الوصفية للإحصائيات التكرارية: التأكيد على أن الإحصائيات التكرارية توفر وصفاً للقياس، وليس بيان معتقد حول المعامل
  2. الحجة لصالح تعريف دالة الاحتمالية في المناطق غير الفيزيائية: إثبات من خلال مفهوم الإحصائيات الكافية أن θ̂ = n - b يحتوي على معلومات أكثر من max(n - b, 0)
  3. توضيح العلاقة بين الإحصائيات الوصفية والاستدلالية: الإحصائيات الوصفية يمكن أن توفر معلومات للاستدلال، لكنها بحد ذاتها لا تشكل بيان درجة معتقد
  4. توفير إرشادات منهجية عملية: دعم الإبلاغ عن قيم تقدير إشارة سالبة في التجارب (مثل θ̂ = -2 ± 1)

شرح الطريقة

الصيغة الرياضية للمشكلة

ضع في الاعتبار أخذ عينات من متغير عشوائي N = 0, 1, 2, ... من توزيع بواسون، حيث يساوي متوسطه μ مجموع شدة الإشارة θ ≥ 0 والخلفية المعروفة b (≥ 0):

f(n;θ,b)=μnn!eμ=(θ+b)nn!eθbf(n; θ, b) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

حيث n هي القيم الممكنة لـ N.

تعريف دالة الاحتمالية

تُعرّف دالة الاحتمالية التي يقدمها بورتر كالتالي:

L(θ;n)=μnn!eμ=(θ+b)nn!eθbL(θ; n) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

النقطة الأساسية: هذه الدالة معرّفة رياضياً لأي μ ≥ 0، حتى عندما يكون θ = μ - b < 0.

حجة الإحصائيات الكافية

يستند الحجة الأساسية لبورتر إلى مفهوم الإحصائيات الكافية:

  1. N - b هي إحصائية كافية لـ θ: تحتوي على جميع المعلومات في البيانات حول θ
  2. max(N - b, 0) ليست إحصائية كافية: عند فرض قيمة تقدير غير سالبة، يتم فقدان المعلومات
  3. لذلك: θ̂ = n - b كإحصائية وصفية أكثر إفادة من النسخة المقطوعة

التفسير الوصفي للإحصائيات التكرارية

الموقف الذي يتمسك به بورتر هو:

  • نتائج الإحصائيات التكرارية وصفية: تصف القياس نفسه، وليس القيمة الحقيقية للمعامل
  • لا يجب تفسيرها كبيانات درجة معتقد: بيانات الاحتمالية تشير فقط إلى خصائص التكرار على المدى الطويل
  • يمكن أن توفر معلومات للاستدلال: عند ملاحظة θ̂ = -2، يمكن الاستدلال (بمعنى درجة المعتقد) أن θ "من المحتمل" أن يكون صغيراً جداً

المقارنة مع الطريقة البايزية

في الإطار البايزي، لا يوجد نزاع:

  • يقيد التوزيع السابق بشكل طبيعي المعامل في المنطقة الفيزيائية
  • المعتقد في المنطقة غير الفيزيائية يساوي صفراً
  • يتم تحقيق القيود الفيزيائية من خلال التوزيع السابق وليس دالة الاحتمالية

نقاط الابتكار التقني

1. الابتكار على المستوى المفاهيمي

التمييز بين "توزيع العينة" و"مجال تعريف دالة الاحتمالية":

  • توزيع العينة يفترض دائماً θ ≥ 0 (القيد الفيزيائي)
  • دالة الاحتمالية كموضوع رياضي يمكن تعريفها على نطاق أوسع
  • يسمح هذا التمييز باستخدام جميع الأدوات الرياضية دون انتهاك النموذج الفيزيائي

2. المرونة في المصطلحات

يقترح بورتر أنه إذا منعت السلطات الإحصائية تعريف "الاحتمالية" في المناطق غير الفيزيائية، يمكن تسميتها "درجة الوصف" و"أقصى درجة وصف"، مع التأكيد على طبيعتها كأداة وصفية.

3. الاتساق المنهجي

تحافظ هذه الطريقة على الاتساق عبر التوزيعات المختلفة:

  • توزيع بواسون: θ̂ = n - b يمكن أن يكون سالباً
  • التوزيع الطبيعي: تم مناقشة اعتبارات مماثلة في المرجع 4
  • الحفاظ على العمومية والاتساق في الطرق الإحصائية

التحليل النظري

جوهر الإحصائيات التكرارية

يستشهد بورتر بالأعمال الكلاسيكية لكندال وآخرين (المجلد 2A، الأقسام 26.58-26.78)، وخاصة البيان في القسم 26.69:

"فشل الأسلوب التكراري في توفير بيانات حول مصداقية الفرضية يكاد يكون بديهياً، لأن التكراريين غير مستعدين لقبول أي مفهوم احتمالي يفتقر إلى تفسير تكراري."

هنا "الاحتمالية₁" تشير إلى احتمالية درجة المعتقد.

أضرار الالتباس

يشير بورتر إلى أن سوء فهم الإحصائيات التكرارية كبيانات استدلالية أدى إلى التباس كبير:

حالة نموذجية: في عام 2015، أعلن محرر مجلة علم النفس Basic and Applied Social Psychology أن قيم p "غير صالحة" وحظر استخدامها، وهذا هو بالضبط نتيجة الالتباس حول طبيعة الإحصائيات التكرارية.

مكانة الاستدلال

بينما يؤكد بورتر على أن الإحصائيات التكرارية وصفية، يعترف بأن:

  • عند الحصول على قياس θ̂ = n - b، من المعقول الاستدلال بأن θ "من المحتمل" أن يكون قريباً من θ̂
  • يدخل هذا الاستدلال مجال درجة المعتقد
  • عند ملاحظة θ̂ سالب، يمكن الاستدلال بأن θ "من المحتمل" أن يكون صغيراً جداً (لكن ليس سالباً)

السيناريوهات التجريبية/التطبيقية

تجارب الفيزياء عالية الطاقة

على الرغم من عدم وجود نتائج تجريبية محددة في النص، تأتي الخلفية من الفيزياء عالية الطاقة:

  • البحث عن إشارات نادرة (مثل جزيئات جديدة)
  • عدد أحداث الخلفية المعروفة b
  • إجمالي عدد الأحداث المرصودة n
  • الحاجة إلى تقدير شدة الإشارة θ

الحالة العملية

عندما تؤدي تقلبات الخلفية إلى n < b:

  • الممارسة التقليدية المحتملة: الإبلاغ عن θ̂ = 0 أو عدم الإبلاغ
  • ما يدعو إليه بورتر: الإبلاغ عن θ̂ = n - b (قيمة سالبة)، مع فترة ثقة
  • الميزة: الحفاظ على جميع المعلومات من الإحصائية الكافية

مثال على الإبلاغ

يعتقد بورتر أنه يمكن الإبلاغ بشكل كامل عن:

"نتيجة القياس هي θ̂ = -2 ± 1، على الرغم من أن θ > 0 معروف"

هذا النوع من الإبلاغ:

  • يصف القياس بشكل كامل
  • يسمح للقارئ بالاستدلال بأن θ قد يكون قريباً من الصفر
  • لا يدعي أن θ سالب فعلاً

الأعمال ذات الصلة

الأدبيات الإحصائية

  1. شاو (2003): كتاب Mathematical Statistics يحتوي على أمثلة تدعم وجهة نظر كوزينز، لكنها تظهر في فصول تحتوي على محتوى بايزي أكثر، دون شرح السياق بالتفصيل
  2. كندال وآخرون (1999): Kendall's Advanced Theory of Statistics يعترف بمشاكل وخلافات في طرق التقدير المختلفة، وآراؤه متسقة مع موقف بورتر
  3. نارسكي وبورتر (2014): ناقشا مشكلة مماثلة في حالة التوزيع الطبيعي

السياق التاريخي للنزاع

  • للنقاش الفلسفي بين الإحصائيات التكرارية والبايزية تاريخ طويل
  • بخصوص مسألة مجال تعريف دالة الاحتمالية، غالباً ما تتجنب كتب الإحصائيات هذا الموضوع
  • الالتباس في الممارسة العملية يؤدي إلى سوء فهم وإساءة استخدام الطرق الإحصائية

الخلاصات والمناقشة

الاستنتاجات الرئيسية

  1. في إطار الإحصائيات التكرارية، من المفيد والمعقول السماح بتعريف دالة الاحتمالية في مناطق معاملات غير فيزيائية
  2. هذا لا ينتهك النموذج الفيزيائي: توزيع العينة يفترض دائماً القيود الفيزيائية
  3. اعتبار الإحصائيات الكافية يدعم هذا النهج: N - b يحتوي على معلومات أكثر من max(N - b, 0)
  4. يجب اعتبار الإحصائيات التكرارية وصفية: توفر وصفاً للقياس وليس معتقداً حول المعامل

موقف بورتر

  • يعترف بأن موقفه قد يكون أكثر تطرفاً من السوابق التاريخية
  • لكنه يعتقد أن هذا الموقف يساعد في الحفاظ على الوضوح المفاهيمي
  • لا يوجد خلاف في الإطار البايزي، والنزاع يقتصر على تفسير الإحصائيات التكرارية

القيمة العملية

هذه المنهجية:

  • تسمح بالإبلاغ الأكثر اكتمالاً عن نتائج التجارب
  • تتجنب فقدان المعلومات
  • تحافظ على اتساق الطرق الإحصائية
  • تساعد في التحليلات البايزية اللاحقة أو تحليلات ما وراء البيانات

الاتجاهات المستقبلية

لم يتم تقديم اتجاهات مستقبلية صريحة في النص، لكن الاتجاهات الضمنية تشمل:

  • توضيح إضافي للعلاقة بين الإحصائيات التكرارية والبايزية
  • نشر ممارسات إبلاغ إحصائية معقولة في الفيزياء التجريبية
  • تثقيف مستخدمي الإحصائيات لتجنب سوء الفهم الشائع

التقييم المتعمق

المميزات

  1. الوضوح المفاهيمي:
    • التمييز الواضح بين الإحصائيات الوصفية والاستدلالية
    • تحديد دقيق لطبيعة الإحصائيات التكرارية وحدودها
    • الحجة القائمة على الإحصائيات الكافية مقنعة
  2. التوجه العملي:
    • معالجة مشاكل حقيقية في التجارب العملية
    • توفير إرشادات منهجية قابلة للتطبيق
    • تجنب فقدان المعلومات
  3. أساس نظري متين:
    • الاستشهاد بالأدبيات الإحصائية الكلاسيكية لدعم الآراء
    • الحجة الرياضية للإحصائيات الكافية دقيقة
    • المقارنة مع الطريقة البايزية مناسبة
  4. الكتابة الواضحة:
    • البنية المنطقية واضحة
    • الاعتراف بمعقولية وجهات النظر المختلفة
    • النبرة احترافية وملائمة

أوجه القصور

  1. قد يكون هناك نزاع فلسفي:
    • مسألة كيفية "يجب" تعريف دالة الاحتمالية لها مكون فلسفي أساسي
    • قد يكون هناك اختلافات لا يمكن التوفيق بينها بين المدارس الإحصائية المختلفة
    • يعترف بورتر بأنه قد يكون من المستحيل التوصل إلى اتفاق
  2. التباس محتمل في الممارسة:
    • السماح بقيم تقدير سالبة قد يُساء فهمها من قبل غير المتخصصين
    • يتطلب شرحاً وتعليماً إضافياً
    • قد يثير التباساً في بعض مجالات التطبيق
  3. الأدلة التجريبية محدودة:
    • في الأساس حجج مفاهيمية ونظرية
    • تفتقد دراسات حالة لتحليل البيانات الفعلية
    • لم تُعرض تأثيرات التطبيق في تجارب محددة
  4. النقاش حول وجهة نظر كوزينز ليس عميقاً بما يكفي:
    • يركز بشكل أساسي على عرض الموقف الخاص به
    • الرد على الحجج المحددة للمعارضة أقل
    • قد لا يفهم بشكل كامل الاهتمامات الأساسية للطرف الآخر

التأثير

الجوانب الإيجابية:

  • توفير دعم نظري لممارسات إحصائية في الفيزياء عالية الطاقة والمجالات ذات الصلة
  • المساعدة في توضيح طبيعة الإحصائيات التكرارية
  • قد يؤثر على معايير الإبلاغ عن نتائج التجارب

القيود:

  • قد يكون التأثير المباشر محدوداً على مجالات معينة (مثل فيزياء الجزيئات)
  • قد يستمر الاختلاف في المجتمع الإحصائي
  • يتطلب التعليم والترويج لتغيير الممارسات

القابلية للتكرار

  • هذه ورقة نظرية/منهجية، لا تتعلق بقابلية التكرار التجريبية
  • المفاهيم والحجج واضحة وسهلة الفهم والتطبيق
  • الاشتقاقات الرياضية بسيطة ومباشرة

السيناريوهات المناسبة

السيناريوهات الأنسب:

  1. تجارب الفيزياء عالية الطاقة: البحث عن الإشارات، تقدير الخلفية
  2. التجارب ذات معدل العد المنخفض: حيث تسيطر الإحصائيات التكرارية
  3. الحالات التي تتطلب الإبلاغ عن الإحصائيات الكافية: عندما تكون نقل المعلومات الكاملة مهماً

السيناريوهات الأقل ملاءمة:

  1. التواصل العلمي مع الجمهور: قد تثير قيم الإشارة السالبة التباساً
  2. بيئات القرار التنظيمي: قد تتطلب طرق إبلاغ أكثر تحفظاً
  3. الجماهير غير المألوفة بالإحصائيات: تتطلب شرحاً إضافياً

ملخص المساهمات المنهجية

تكمن المساهمات الأساسية لبورتر في:

  1. توضيح الحدود بين "الوصف" و"الاستدلال" في الإحصائيات التكرارية
  2. توفير دعم نظري قائم على الإحصائيات الكافية لتعريف دالة الاحتمالية في المناطق غير الفيزيائية
  3. توفير إرشادات عملية للإبلاغ: السماح بالإبلاغ عن قيم معاملات سالبة
  4. توضيح العلاقة مع الطريقة البايزية: لا يوجد نزاع في الإطار البايزي

هذه ورقة منهجية مهمة توفر منظوراً قيماً لمشاكل عملية في الممارسة الإحصائية. على الرغم من أنها قد لا تقنع الجميع، فإن حجتها القائمة على الإحصائيات الكافية وتوضيحها الواضح لطبيعة الإحصائيات التكرارية توفر إرشادات مهمة لفيزيائيي التجارب. تكمن القيمة الرئيسية للورقة في توضيح المفاهيم وتوفير إرشادات منهجية، وليس في حل مشكلة تقنية لها إجابة محددة.

المراجع

1 Robert D. Cousins. Comment on Frank Porter, "Confidence intervals for the Poisson distribution", 2025. arXiv:2509.17339

2 Frank C. Porter. Confidence intervals for the Poisson distribution, 2025. arXiv:2509.02852

3 Jun Shao. Mathematical Statistics, 2nd edition. Springer-Verlag, 2003

4 I. Narsky and F. C. Porter. Statistical analysis techniques in particle physics, 2014

5 Alan Stuart et al. Kendall's Advanced Theory of Statistics, Volume 2A, 1999

6 David Trafimow and Michael Marks. Editorial. Basic and Applied Social Psychology, 37(1):1–2, 2015


التقييم الإجمالي: هذه ورقة منهجية ذات مفاهيم واضحة وحجج قوية، توفر منظوراً قيماً لمشاكل عملية في الممارسة الإحصائية. على الرغم من أنها قد لا تقنع الجميع، فإن حجتها القائمة على الإحصائيات الكافية وتوضيحها الواضح لطبيعة الإحصائيات التكرارية توفر إرشادات مهمة لفيزيائيي التجارب. تكمن القيمة الرئيسية للورقة في توضيح المفاهيم وتوفير إرشادات منهجية، وليس في حل مشكلة تقنية لها إجابة محددة.