2025-11-11T17:58:09.979705

Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution

Porter
Robert Cousins has posted a comment on my manuscript on ``Confidence intervals for the Poisson distribution''. His key point is that one should not include in the likelihood non-physical parameter values, even for frequency statistics. This is my response, in which I contend that it can be useful to do so when discussing such descriptive statistics.
academic

Risposta al Commento di Robert Cousins su Intervalli di Confidenza per la Distribuzione di Poisson

Informazioni Fondamentali

  • ID Articolo: 2510.25162
  • Titolo: Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution
  • Autore: Frank C. Porter (California Institute of Technology)
  • Classificazione: physics.data-an (Analisi Dati Fisica)
  • Data di Pubblicazione: 3 novembre 2025 (versione v2)
  • Link Articolo: https://arxiv.org/abs/2510.25162

Riassunto

Questo è un articolo di risposta al commento di Robert Cousins. La controversia centrale riguarda se, nel quadro della statistica frequentista, la funzione di verosimiglianza debba includere valori di parametri non fisici (come l'intensità del segnale negativa). Cousins sostiene che non dovrebbe, mentre Porter sostiene che nel contesto della statistica descrittiva, ciò è utile.

Contesto di Ricerca e Motivazione

Problema Centrale

Nella costruzione di intervalli di confidenza per la distribuzione di Poisson, quando il valore osservato n è minore dello sfondo noto b, il parametro di intensità del segnale θ = n - b assume valori negativi. Questo solleva una questione fondamentale: Nel quadro della statistica frequentista, la funzione di verosimiglianza dovrebbe essere definita in regioni di parametri fisicamente impossibili (θ < 0)?

Importanza del Problema

  1. Livello teorico: Riguarda le differenze essenziali tra statistica frequentista e bayesiana, toccando i fondamenti dell'inferenza statistica
  2. Livello pratico: Negli esperimenti di fisica dell'alta energia, le fluttuazioni di sfondo producono frequentemente stime di segnale negativo; come riportare correttamente questi risultati è un problema concreto
  3. Livello metodologico: Influenza la definizione di statistiche sufficienti e l'applicazione della stima di massima verosimiglianza

Nucleo della Controversia

  • Punto di vista di Cousins: La funzione di verosimiglianza dovrebbe essere considerata non definita in regioni non fisiche, poiché il modello fisico non esiste in quella regione
  • Punto di vista di Porter: Nel descrivere i risultati di misura, è utile permettere alla funzione di verosimiglianza di estendersi in regioni non fisiche, il che non viola i vincoli fisici

Limitazioni dei Metodi Esistenti

I manuali di statistica tradizionali rimangono per lo più silenziosi su questo problema, mancando di principi guida espliciti. Ciò causa confusione nella pratica, con alcuni che erroneamente concludono che i metodi frequentisti sono "sbagliati".

Contributi Fondamentali

  1. Ha chiarito la natura descrittiva della statistica frequentista: Sottolinea che la statistica frequentista fornisce una descrizione della misura, non un'affermazione di credenza sul parametro
  2. Ha argomentato la razionalità di definire la funzione di verosimiglianza in regioni non fisiche: Attraverso il concetto di statistica sufficiente, dimostra che θ̂ = n - b contiene più informazioni di max(n - b, 0)
  3. Ha chiarito la relazione tra statistica descrittiva e inferenziale: La statistica descrittiva può fornire informazioni per l'inferenza, ma non costituisce di per sé un'affermazione di grado di credenza
  4. Ha fornito linee guida metodologiche pratiche: Supporta la segnalazione di stime di segnale negative negli esperimenti (come θ̂ = -2 ± 1)

Spiegazione Dettagliata del Metodo

Formulazione Matematica del Problema

Si consideri il campionamento di una variabile casuale N = 0, 1, 2, ... da una distribuzione di Poisson, la cui media μ è uguale all'intensità del segnale θ ≥ 0 più lo sfondo noto b (≥ 0):

f(n;θ,b)=μnn!eμ=(θ+b)nn!eθbf(n; θ, b) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

dove n è un possibile valore di N.

Definizione della Funzione di Verosimiglianza

La funzione di verosimiglianza definita da Porter è:

L(θ;n)=μnn!eμ=(θ+b)nn!eθbL(θ; n) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

Punto chiave: Questa funzione è matematicamente definita per qualsiasi μ ≥ 0, anche quando θ = μ - b < 0.

Argomento della Statistica Sufficiente

L'argomento centrale di Porter si basa sul concetto di statistica sufficiente:

  1. N - b è una statistica sufficiente per θ: Contiene tutte le informazioni nei dati riguardanti θ
  2. max(N - b, 0) non è una statistica sufficiente: Quando si forza la stima ad essere non negativa, si perde informazione
  3. Pertanto: θ̂ = n - b come statistica descrittiva è più informativa della versione troncata

Interpretazione Descrittiva della Statistica Frequentista

La posizione sostenuta da Porter è:

  • I risultati della statistica frequentista sono descrittivi: Descrivono la misura stessa, non il valore vero del parametro
  • Non dovrebbero essere interpretati come affermazioni di grado di credenza: Le affermazioni probabilistiche si riferiscono solo alle proprietà di frequenza a lungo termine
  • Possono fornire informazioni per l'inferenza: Quando si osserva θ̂ = -2, si può inferire (nel senso di grado di credenza) che θ sia "probabilmente" molto piccolo

Confronto con il Metodo Bayesiano

Nel quadro bayesiano non c'è controversia:

  • La distribuzione a priori limita naturalmente il parametro alla regione fisica
  • La credenza nella regione non fisica è zero
  • I vincoli fisici sono implementati attraverso il priore, non la funzione di verosimiglianza

Innovazioni Tecniche

1. Innovazione a Livello Concettuale

Distinzione tra "distribuzione di campionamento" e "dominio di definizione della funzione di verosimiglianza":

  • La distribuzione di campionamento assume sempre θ ≥ 0 (vincolo fisico)
  • La funzione di verosimiglianza come oggetto matematico può essere definita su un intervallo più ampio
  • Questa distinzione permette di utilizzare tutti gli strumenti matematici senza violare il modello fisico

2. Flessibilità Terminologica

Porter propone che, se le autorità statistiche vietano di definire "verosimiglianza" in regioni non fisiche, si potrebbe usare "descrizionevolezza" e "massima descrizionevolezza", sottolineando la natura descrittiva dello strumento.

3. Coerenza Metodologica

Questo approccio rimane coerente attraverso diverse distribuzioni:

  • Distribuzione di Poisson: θ̂ = n - b può essere negativo
  • Distribuzione normale: considerazioni simili sono discusse nella referenza 4
  • Mantiene l'universalità e la coerenza del metodo statistico

Analisi Teorica

Essenza della Statistica Frequentista

Porter cita l'opera classica di Kendall et al. (Volume 2A, sezioni 26.58-26.78), in particolare l'affermazione della sezione 26.69:

"È quasi assiomatico che il metodo frequentista non fornisca affermazioni sulla credibilità di ipotesi, poiché i frequentisti rifiutano di accettare qualsiasi concetto di probabilità che non abbia un'interpretazione frequentista."

Qui "probabilità₁" si riferisce alla probabilità come grado di credenza.

Pericoli della Confusione

Porter sottolinea che fraintendere la statistica frequentista come affermazione inferenziale ha causato notevole confusione:

Caso tipico: Nel 2015, l'editore della rivista di psicologia Basic and Applied Social Psychology ha dichiarato i valori p "invalidi" e ne ha vietato l'uso, conseguenza diretta della confusione sulla natura della statistica frequentista.

Posizione dell'Inferenza

Sebbene Porter sottolinei che la statistica frequentista è descrittiva, riconosce:

  • Quando la misura produce θ̂ = n - b, è ragionevole inferire che θ sia "più probabilmente" vicino a θ̂
  • Questa inferenza entra nel dominio del grado di credenza
  • Quando si osserva un θ̂ negativo, è ragionevole inferire che θ sia "probabilmente" molto piccolo (ma non negativo)

Scenari Sperimentali/Applicativi

Esperimenti di Fisica dell'Alta Energia

Sebbene l'articolo non presenti risultati sperimentali specifici, lo sfondo proviene dalla fisica dell'alta energia:

  • Ricerca di segnali rari (come nuove particelle)
  • Numero di eventi di sfondo noto b
  • Numero totale di eventi osservati n
  • Necessità di stimare l'intensità del segnale θ

Situazione Pratica

Quando le fluttuazioni di sfondo portano a n < b:

  • Pratica tradizionale possibile: Segnalare θ̂ = 0 o non segnalare
  • Posizione di Porter: Segnalare θ̂ = n - b (valore negativo), con intervallo di confidenza
  • Vantaggio: Conserva tutte le informazioni della statistica sufficiente

Esempio di Segnalazione

Porter sostiene che è completamente accettabile segnalare:

"Il risultato della misura è θ̂ = -2 ± 1, sebbene sia noto che θ > 0"

Una segnalazione di questo tipo:

  • Descrive completamente la misura
  • Permette ai lettori di inferire che θ sia probabilmente vicino a zero
  • Non sostiene che θ sia effettivamente negativo

Lavori Correlati

Letteratura Statistica

  1. Shao (2003): Nel manuale Mathematical Statistics ci sono esempi che supportano il punto di vista di Cousins, ma appaiono in capitoli con contenuti bayesiani più ampi, senza discussione dettagliata del contesto
  2. Kendall et al. (1999): Kendall's Advanced Theory of Statistics riconosce i problemi e le controversie di vari metodi di stima, con posizioni coerenti con quella di Porter
  3. Narsky & Porter (2014): Discute problemi simili nel caso della distribuzione normale

Contesto Storico della Controversia

  • La disputa filosofica tra statistica frequentista e bayesiana ha una lunga storia
  • La questione del dominio di definizione della funzione di verosimiglianza è spesso evitata nei manuali di statistica
  • La confusione nella pratica ha portato a fraintendimenti e usi scorretti dei metodi statistici

Conclusioni e Discussione

Conclusioni Principali

  1. Nel quadro della statistica frequentista, è utile e razionale permettere alla funzione di verosimiglianza di essere definita in regioni di parametri non fisici
  2. Questo non viola il modello fisico: La distribuzione di campionamento assume sempre vincoli fisici
  3. Le considerazioni sulla statistica sufficiente supportano questo approccio: N - b contiene più informazioni di max(N - b, 0)
  4. La statistica frequentista dovrebbe essere considerata descrittiva: Fornisce una descrizione della misura, non della credenza nel parametro

Posizione di Porter

  • Riconosce che la sua posizione potrebbe essere più estrema rispetto ai precedenti storici
  • Tuttavia, ritiene che questa posizione aiuti a mantenere la chiarezza concettuale
  • Nel quadro bayesiano non c'è disaccordo; la controversia è limitata all'interpretazione della statistica frequentista

Valore Pratico

Questo approccio metodologico:

  • Permette di segnalare i risultati sperimentali in modo più completo
  • Evita la perdita di informazioni
  • Mantiene la coerenza del metodo statistico
  • Facilita l'analisi bayesiana successiva o meta-analisi

Direzioni Future

Sebbene non esplicitamente enunciate, le direzioni implicite includono:

  • Ulteriore chiarimento della relazione tra statistica frequentista e bayesiana
  • Promozione di pratiche razionali di segnalazione statistica nella fisica sperimentale
  • Educazione degli utenti di statistica per evitare fraintendimenti comuni

Valutazione Approfondita

Punti di Forza

  1. Chiarezza Concettuale:
    • Distingue chiaramente la statistica descrittiva da quella inferenziale
    • Definisce precisamente la natura e i limiti della statistica frequentista
    • L'argomento della statistica sufficiente è convincente
  2. Orientamento Pratico:
    • Affronta problemi reali negli esperimenti
    • Fornisce linee guida metodologiche operative
    • Evita la perdita di informazioni
  3. Fondamenti Teorici Solidi:
    • Cita letteratura statistica classica a supporto
    • L'argomento matematico della statistica sufficiente è rigoroso
    • Il confronto con il metodo bayesiano è appropriato
  4. Scrittura Chiara:
    • La struttura logica è trasparente
    • Riconosce la ragionevolezza di diversi punti di vista
    • Il tono è professionale e misurato

Limitazioni

  1. Possibili Controversie Filosofiche:
    • La questione di come "dovrebbe" essere definita la funzione di verosimiglianza ha componenti filosofiche
    • Diverse scuole statistiche potrebbero avere disaccordi irriconciliabili
    • Porter riconosce che potrebbe non essere possibile raggiungere un consenso
  2. Potenziale Confusione nella Pratica:
    • Permettere stime negative potrebbe essere frainteso da non specialisti
    • Richiede spiegazioni e educazione aggiuntive
    • Potrebbe causare confusione in alcuni campi applicativi
  3. Evidenza Empirica Limitata:
    • Principalmente argomenti concettuali e teorici
    • Mancano casi di analisi dati effettivi
    • Non mostra gli effetti dell'applicazione in esperimenti concreti
  4. Discussione Insufficiente del Punto di Vista di Cousins:
    • Principalmente espone la propria posizione
    • Risponde meno dettagliatamente agli argomenti specifici dell'opposizione
    • Potrebbe non aver compreso pienamente le preoccupazioni sottostanti dell'altro

Impatto

Aspetti Positivi:

  • Fornisce supporto teorico per la pratica statistica nella fisica dell'alta energia e campi correlati
  • Aiuta a chiarire la natura della statistica frequentista
  • Potrebbe influenzare le norme di segnalazione dei risultati sperimentali

Limitazioni:

  • Potrebbe avere impatto diretto solo in campi specifici (come la fisica delle particelle)
  • La comunità statistica potrebbe continuare a dissentire
  • Richiede educazione e promozione per cambiare la pratica

Riproducibilità

  • Questo è un articolo teorico/metodologico, non coinvolge riproducibilità sperimentale
  • I concetti e gli argomenti sono chiari e facili da comprendere e applicare
  • Le derivazioni matematiche sono semplici e dirette

Scenari Applicabili

Scenari più appropriati:

  1. Esperimenti di Fisica dell'Alta Energia: Ricerca di segnali, stima dello sfondo
  2. Esperimenti a Basso Tasso di Conteggio: La statistica di Poisson è dominante
  3. Situazioni che Richiedono Segnalazione di Statistiche Sufficienti: La trasmissione completa di informazioni è importante

Scenari meno appropriati:

  1. Comunicazione Scientifica al Pubblico: L'intensità di segnale negativa potrebbe causare fraintendimenti
  2. Ambienti di Decisione Normativa: Potrebbe essere necessario un approccio più conservatore
  3. Pubblico Non Familiare con la Statistica: Richiede spiegazioni aggiuntive

Sintesi dei Contributi Metodologici

Il contributo centrale di Porter consiste in:

  1. Aver chiarito il confine tra "descrizione" e "inferenza" nella statistica frequentista
  2. Aver fornito supporto teorico basato sulla statistica sufficiente per definire la funzione di verosimiglianza in regioni non fisiche
  3. Aver fornito linee guida pratiche di segnalazione: Permettere la segnalazione di stime di parametri negative
  4. Aver chiarito la relazione con il metodo bayesiano: Nel cui quadro non c'è controversia

Questo è un articolo metodologico importante che, sebbene non risolverà la controversia, fornisce una prospettiva preziosa per la pratica statistica.

Riferimenti Bibliografici

1 Robert D. Cousins. Comment on Frank Porter, "Confidence intervals for the Poisson distribution", 2025. arXiv:2509.17339

2 Frank C. Porter. Confidence intervals for the Poisson distribution, 2025. arXiv:2509.02852

3 Jun Shao. Mathematical Statistics, 2nd edition. Springer-Verlag, 2003

4 I. Narsky and F. C. Porter. Statistical analysis techniques in particle physics, 2014

5 Alan Stuart et al. Kendall's Advanced Theory of Statistics, Volume 2A, 1999

6 David Trafimow and Michael Marks. Editorial. Basic and Applied Social Psychology, 37(1):1–2, 2015


Valutazione Complessiva: Questo è un articolo metodologico concettualmente chiaro e ben argomentato che fornisce una prospettiva preziosa su problemi pratici nella statistica. Sebbene potrebbe non convincere tutti, i suoi argomenti basati sulla statistica sufficiente e la sua chiara esposizione della natura della statistica frequentist forniscono una guida importante per i fisici sperimentali. Il valore principale dell'articolo risiede nel chiarimento dei concetti e nella fornitura di linee guida metodologiche pratiche, piuttosto che nella risoluzione di un problema tecnico con una risposta definitiva.