2025-11-11T17:58:09.979705

Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution

Porter
Robert Cousins has posted a comment on my manuscript on ``Confidence intervals for the Poisson distribution''. His key point is that one should not include in the likelihood non-physical parameter values, even for frequency statistics. This is my response, in which I contend that it can be useful to do so when discussing such descriptive statistics.
academic

ロバート・カズンズのコメントへの応答:ポアソン分布の信頼区間

基本情報

  • 論文ID: 2510.25162
  • タイトル: Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution
  • 著者: Frank C. Porter(カリフォルニア工科大学)
  • 分類: physics.data-an(物理データ分析)
  • 発表日: 2025年11月3日(v2版)
  • 論文リンク: https://arxiv.org/abs/2510.25162

要約

本論文はロバート・カズンズのコメントに対する応答論文である。核心的な争点は、頻度主義統計の枠組みにおいて、尤度関数が非物理的パラメータ値(例えば負の信号強度)を含むべきかどうかという点にある。カズンズは含むべきではないと主張し、ポーターは記述統計を論じる際には有用であると主張している。

研究背景と動機

核心的問題

ポアソン分布の信頼区間構築において、観測値nが既知背景bより小さい場合、信号強度パラメータθ = n - bが負の値を示す。これは根本的な問題を引き起こす:頻度主義統計の枠組みにおいて、尤度関数は物理的に不可能なパラメータ領域(θ < 0)で定義されるべきか?

問題の重要性

  1. 理論的側面:頻度主義統計とベイズ統計の本質的な違いに関わり、統計推論の基礎理論に関係する
  2. 実践的側面:高エネルギー物理実験において、背景変動に起因する負の信号推定値が頻繁に発生し、このような測定結果を正しく報告することは実際的な問題である
  3. 方法論的側面:十分統計量の定義と最尤推定の適用に影響を与える

争点の中核

  • カズンズの見解:尤度関数は非物理領域では未定義と見なすべきである。なぜなら物理モデルがその領域に存在しないからである
  • ポーターの見解:測定結果を記述する際に、尤度関数を非物理領域に拡張することは有用であり、物理的制約に違反しない

既存方法の限界

従来の統計学教科書は、この問題についてほぼ沈黙を保ち、明確な指導原則を欠いている。これにより実践上の混乱が生じ、頻度主義統計手法が「誤っている」と誤解する者さえいる。

核心的貢献

  1. 頻度主義統計の記述的性質を明確化:頻度主義統計が提供するのは測定の記述であり、パラメータに関する信念陳述ではないことを強調
  2. 非物理領域での尤度関数定義の合理性を論証:十分統計量の概念を通じて、θ̂ = n - bが max(n - b, 0) より多くの情報を含むことを証明
  3. 記述統計と推論統計の関係を明確化:記述統計は推論に情報を提供できるが、それ自体は信念度陳述を構成しない
  4. 実用的な方法論指導を提供:実験において負の信号推定値(例:θ̂ = -2 ± 1)を報告することを支持

方法の詳細

問題の数学的表現

ポアソン分布からサンプリングされた確率変数 N = 0, 1, 2, ... を考える。その平均μは信号強度θ ≥ 0と既知背景b (≥ 0)の合計に等しい:

f(n;θ,b)=μnn!eμ=(θ+b)nn!eθbf(n; θ, b) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

ここでnはNの可能な値である。

尤度関数の定義

ポーターが定義する尤度関数は:

L(θ;n)=μnn!eμ=(θ+b)nn!eθbL(θ; n) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

重要な点:この関数は数学的には任意のμ ≥ 0に対して定義されており、θ = μ - b < 0 であっても成立する。

十分統計量の論証

ポーターの核心的な論証は十分統計量の概念に基づいている:

  1. N - bはθの十分統計量である:データに含まれるθに関するすべての情報を含む
  2. max(N - b, 0)は十分統計量ではない:推定値を非負に強制すると情報が失われる
  3. したがって:記述統計量としてのθ̂ = n - bは切り詰められたバージョンより情報量が多い

頻度主義統計の記述的解釈

ポーターが主張する立場は:

  • 頻度主義統計の結果は記述的である:測定そのものを記述し、パラメータの真の値ではない
  • 信念度陳述として解釈されるべきではない:確率陳述は長期的な頻度特性のみを指す
  • 推論に情報を提供できる:θ̂ = -2を観測したとき、(信念度の意味で)θが「おそらく」非常に小さいと推論できる

ベイズ方法との比較

ベイズの枠組みでは、争点がない:

  • 事前分布は自然に物理領域にパラメータを制限する
  • 非物理領域の信念はゼロである
  • 物理的制約は尤度関数ではなく事前分布を通じて実現される

技術的革新点

1. 概念レベルの革新

「サンプリング分布」と「尤度関数の定義域」の区別

  • サンプリング分布は常にθ ≥ 0を仮定する(物理的制約)
  • 尤度関数は数学的対象として、より広い範囲で定義できる
  • この区別により、物理モデルに違反することなく、すべての数学的ツールを使用できる

2. 用語上の柔軟性

ポーターは、統計学の権威が非物理領域での「尤度」の定義を禁止する場合、これを「記述度」(descriptionhood)および「最大記述度」(maximum descriptionhood)と呼ぶことを提案し、その記述ツールとしての本質を強調する。

3. 方法論の一貫性

この方法は異なる分布間で一貫性を保つ:

  • ポアソン分布:θ̂ = n - bは負になり得る
  • 正規分布:参考文献4で同様の考察が議論されている
  • 統計手法の普遍性と一貫性を維持する

理論的分析

頻度主義統計の本質

ポーターはケンドール等の古典的著作(第2A巻、セクション26.58-26.78)を引用し、特に第26.69節の陳述を参照している:

「頻度主義者が周波数解釈を持たない確率概念を受け入れることを望まないため、頻度主義方法が仮説の信頼性に関する陳述を提供できないことはほぼ公理的である。」

ここで「確率₁」は信念度確率を指す。

混乱の害

ポーターは、頻度主義統計を推論的陳述として誤解することが大きな混乱をもたらしたことを指摘する:

典型的な事例:2015年、心理学誌Basic and Applied Social Psychologyの編集者がp値は「無効」であり使用を禁止すると宣言した。これは頻度主義統計の性質を混乱させた結果である。

推論の地位

ポーターは頻度主義統計が記述的であることを強調する一方で、以下を認める:

  • 測定がθ̂ = n - bを得たとき、θが「より可能性が高く」θ̂に近いと推論することは合理的である
  • この推論は信念度領域に入る
  • 負のθ̂を観測したとき、θが「おそらく」非常に小さい(ただし負ではない)と推論できる

実験/応用シナリオ

高エネルギー物理実験

文中に具体的な実験結果はないが、背景は高エネルギー物理にある:

  • 稀な信号の探索(新粒子など)
  • 既知の背景事例数b
  • 観測された総事例数n
  • 信号強度θの推定が必要

実際の状況

背景変動がn < bをもたらす場合:

  • 従来の方法:θ̂ = 0を報告するか、報告しない可能性がある
  • ポーターの主張:θ̂ = n - b(負の値)を信頼区間とともに報告する
  • 利点:十分統計量のすべての情報を保持する

報告例

ポーターは完全に報告することが可能であると考える:

「測定結果はθ̂ = -2 ± 1であり、θ > 0であることが既知である」

このような報告は:

  • 測定を完全に記述する
  • 読者がθがおそらくゼロに近いと推論することを許可する
  • θが実際に負であると主張しない

関連研究

統計学文献

  1. Shao (2003):Mathematical Statistics教科書にはカズンズの見解を支持する例があるが、ベイズ内容が多い章に現れ、文脈が詳しく説明されていない
  2. Kendall等 (1999):Kendall's Advanced Theory of Statisticsは様々な推定方法の問題と争点を認識しており、その見解はポーターの立場と一致している
  3. Narsky & Porter (2014):正規分布の場合に同様の問題を議論している

争点の歴史的背景

  • 頻度主義統計とベイズ統計の哲学的争論は長い歴史を持つ
  • 尤度関数の定義域に関する問題は、統計学教科書でしばしば回避される
  • 実践上の混乱は統計手法に対する誤解と誤用をもたらす

結論と議論

主要な結論

  1. 頻度主義統計の枠組みにおいて、非物理パラメータ領域での尤度関数の定義を許可することは有用かつ合理的である
  2. これは物理モデルに違反しない:サンプリング分布は常に物理的制約を仮定する
  3. 十分統計量の考慮がこのアプローチを支持する:N - bは max(N - b, 0) より多くの情報を含む
  4. 頻度主義統計は記述的と見なされるべき:測定の記述を提供し、パラメータの信念ではない

ポーターの立場

  • 自分の立場が歴史的先例より極端である可能性を認める
  • しかし、この立場は概念の明確性を保つのに役立つと考える
  • ベイズの枠組みでは異議がなく、争点は頻度主義統計の解釈に限定される

実用的価値

この方法論は:

  • より完全な実験結果の報告を許可する
  • 情報損失を回避する
  • 統計手法の一貫性を保つ
  • 後続のベイズ分析またはメタ分析に役立つ

将来の方向

文中で明示的には述べられていないが、暗示される方向には以下が含まれる:

  • 頻度主義統計とベイズ統計の関係をさらに明確化する
  • 実験物理における合理的な統計報告実践を推進する
  • 統計ユーザーを一般的な誤解から教育する

深い評価

利点

  1. 概念の明確性
    • 記述統計と推論統計を明確に区別する
    • 頻度主義統計の性質と限界を明確に定義する
    • 十分統計量の論証は説得力がある
  2. 実用指向
    • 実際の実験における真の問題に対応する
    • 実行可能な方法論的指導を提供する
    • 情報損失を回避する
  3. 理論的基礎が堅実
    • 古典的統計文献を引用して見解を支持する
    • 十分統計量の数学的論証は厳密である
    • ベイズ方法との比較は適切である
  4. 執筆が明確
    • 論理構造が明確である
    • 異なる見解の合理性を認める
    • 専門的で適切な語調である

不足点

  1. 哲学的争点の可能性
    • 尤度関数を「どのように」定義すべきかという問題は本質的に哲学的成分を持つ
    • 異なる統計学派は調和不可能な相違を持つ可能性がある
    • ポーターは合意に達することができない可能性があることを認める
  2. 実践における潜在的な混乱
    • 負の値の推定を許可することは、非専門家によって誤解される可能性がある
    • 追加の説明と教育が必要である
    • 特定の応用分野で混乱を引き起こす可能性がある
  3. 経験的証拠が限定的
    • 主に概念的および理論的論証である
    • 実際のデータ分析の事例が不足している
    • 具体的な実験での応用効果を示していない
  4. カズンズの見解に対する議論が十分ではない
    • 主に自分の立場を述べている
    • 反対意見への具体的な論証への応答が少ない
    • 相手の深層的な関心を十分に理解していない可能性がある

影響力

肯定的側面

  • 高エネルギー物理および関連分野の統計実践に理論的支持を提供する
  • 頻度主義統計の性質を明確化するのに役立つ
  • 実験結果の報告規範に影響を与える可能性がある

限界

  • 特定の分野(粒子物理など)にのみ直接的な影響を与える可能性がある
  • 統計学界では引き続き相違が存在する可能性がある
  • 実践を変更するには教育と推進が必要である

再現性

  • これは理論/方法論文であり、実験的再現性に関わらない
  • 概念と論証は明確で理解しやすい
  • 数学的導出は単純で直接的である

適用シナリオ

最も適切なシナリオ

  1. 高エネルギー物理実験:信号探索、背景推定
  2. 低計数率実験:ポアソン統計が支配的
  3. 十分統計量の報告が必要な場合:完全な情報伝達が重要

あまり適切ではないシナリオ

  1. 科学の一般向け伝達:負の信号強度は誤解を招く可能性がある
  2. 規制決定環境:より保守的な報告方法が必要な場合がある
  3. 統計に不慣れな対象者:追加の説明が必要である

方法論的貢献の要約

ポーターの核心的な貢献は:

  1. 頻度主義統計における「記述」と「推論」の境界を明確化した
  2. 非物理領域での尤度関数定義に対する十分統計量の理論的支持を提供した
  3. 実用的な報告ガイドラインを提供した:負のパラメータ推定値の報告を許可する
  4. ベイズ方法との関係を明確化した:後者の枠組みでは争点がない

これは重要な方法論文であり、争点を終わらせることはないが、統計実践に価値のある視点を提供する。

参考文献

1 Robert D. Cousins. Comment on Frank Porter, "Confidence intervals for the Poisson distribution", 2025. arXiv:2509.17339

2 Frank C. Porter. Confidence intervals for the Poisson distribution, 2025. arXiv:2509.02852

3 Jun Shao. Mathematical Statistics, 2nd edition. Springer-Verlag, 2003

4 I. Narsky and F. C. Porter. Statistical analysis techniques in particle physics, 2014

5 Alan Stuart et al. Kendall's Advanced Theory of Statistics, Volume 2A, 1999

6 David Trafimow and Michael Marks. Editorial. Basic and Applied Social Psychology, 37(1):1–2, 2015


総合評価:これは概念が明確で、論証が有力な方法論文であり、統計実践における実際の問題に対して価値のある視点を提供する。すべての人を説得することはできないかもしれないが、十分統計量に基づく論証と頻度主義統計の性質に関する明確な説明は、実験物理学者に重要な指導を提供する。本論文の主な価値は、概念を明確化し、実用的な方法論を提供することにあり、確定的な答えを持つ技術的問題を解決することではない。