2025-11-11T17:58:09.979705

Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution

Porter
Robert Cousins has posted a comment on my manuscript on ``Confidence intervals for the Poisson distribution''. His key point is that one should not include in the likelihood non-physical parameter values, even for frequency statistics. This is my response, in which I contend that it can be useful to do so when discussing such descriptive statistics.
academic

Respuesta al Comentario de Robert Cousins sobre Intervalos de Confianza para la Distribución de Poisson

Información Básica

  • ID del Artículo: 2510.25162
  • Título: Response to Comment from Robert Cousins on Confidence intervals for the Poisson distribution
  • Autor: Frank C. Porter (Instituto de Tecnología de California)
  • Clasificación: physics.data-an (Análisis de Datos en Física)
  • Fecha de Publicación: 3 de noviembre de 2025 (versión v2)
  • Enlace del Artículo: https://arxiv.org/abs/2510.25162

Resumen

Este es un artículo de respuesta al comentario de Robert Cousins. La controversia central radica en si la función de verosimilitud debe incluir valores de parámetros no físicos (como intensidades de señal negativas) dentro del marco de la estadística frecuentista. Cousins sostiene que no debería incluirlos, mientras que Porter argumenta que es útil hacerlo al discutir estadística descriptiva.

Antecedentes de Investigación y Motivación

Problema Central

En la construcción de intervalos de confianza para la distribución de Poisson, cuando el valor observado n es menor que el fondo conocido b, el parámetro de intensidad de señal θ = n - b adquiere valores negativos. Esto plantea una cuestión fundamental: ¿Debería la función de verosimilitud definirse en regiones de parámetros físicamente imposibles (θ < 0) dentro del marco frecuentista?

Importancia del Problema

  1. Nivel Teórico: Implica las diferencias esenciales entre estadística frecuentista y bayesiana, relacionándose con los fundamentos de la inferencia estadística
  2. Nivel Práctico: En experimentos de física de altas energías, las estimaciones de señal negativa causadas por fluctuaciones de fondo ocurren frecuentemente; cómo reportar correctamente estos resultados de medición es un problema real
  3. Nivel Metodológico: Afecta la definición de estadísticas suficientes y la aplicación de estimación de máxima verosimilitud

Núcleo de la Controversia

  • Punto de vista de Cousins: La función de verosimilitud debería considerarse indefinida en regiones no físicas, porque el modelo físico no existe en esa región
  • Punto de vista de Porter: Al describir resultados de medición, es útil permitir que la función de verosimilitud se extienda a regiones no físicas, lo cual no viola las restricciones físicas

Limitaciones de los Métodos Existentes

La mayoría de los libros de texto de estadística tradicionales guardan silencio sobre este problema, careciendo de principios directrices explícitos. Esto conduce a confusión en la práctica, e incluso algunos han llegado a creer erróneamente que los métodos frecuentistas son "incorrectos".

Contribuciones Centrales

  1. Aclaró la naturaleza descriptiva de la estadística frecuentista: Enfatiza que la estadística frecuentista proporciona una descripción de la medición, no una declaración de creencia sobre los parámetros
  2. Argumentó la racionalidad de definir la función de verosimilitud en regiones no físicas: Mediante el concepto de estadística suficiente, demuestra que θ̂ = n - b contiene más información que max(n - b, 0)
  3. Aclaró la relación entre estadística descriptiva e inferencial: La estadística descriptiva puede proporcionar información para la inferencia, pero en sí misma no constituye una declaración de grado-de-creencia
  4. Proporcionó orientación metodológica práctica: Apoya reportar valores negativos de estimación de señal en experimentos (como θ̂ = -2 ± 1)

Explicación Detallada del Método

Formulación Matemática del Problema

Considérese una variable aleatoria N = 0, 1, 2, ... muestreada de una distribución de Poisson, cuya media μ es igual a la suma de la intensidad de señal θ ≥ 0 y el fondo conocido b (≥ 0):

f(n;θ,b)=μnn!eμ=(θ+b)nn!eθbf(n; θ, b) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

donde n es un valor posible de N.

Definición de la Función de Verosimilitud

La función de verosimilitud definida por Porter es:

L(θ;n)=μnn!eμ=(θ+b)nn!eθbL(θ; n) = \frac{μ^n}{n!}e^{-μ} = \frac{(θ + b)^n}{n!}e^{-θ-b}

Punto Clave: Esta función está definida matemáticamente para cualquier μ ≥ 0, incluso cuando θ = μ - b < 0.

Argumento de Estadística Suficiente

El argumento central de Porter se basa en el concepto de estadística suficiente:

  1. N - b es una estadística suficiente para θ: Contiene toda la información en los datos sobre θ
  2. max(N - b, 0) no es una estadística suficiente: Cuando se fuerza que la estimación sea no negativa, se pierde información
  3. Por lo tanto: θ̂ = n - b como estadística descriptiva es más informativa que la versión truncada

Interpretación Descriptiva de la Estadística Frecuentista

La posición que Porter sostiene es:

  • Los resultados frecuentistas son descriptivos: Describen la medición en sí, no el valor verdadero del parámetro
  • No deben interpretarse como declaraciones de grado-de-creencia: Las declaraciones de probabilidad solo se refieren a propiedades de frecuencia a largo plazo
  • Pueden proporcionar información para la inferencia: Cuando se observa θ̂ = -2, se puede inferir (en el sentido de grado-de-creencia) que θ "probablemente" es muy pequeño

Contraste con el Método Bayesiano

En el marco bayesiano, no hay controversia:

  • La distribución a priori restringe naturalmente los parámetros a la región física
  • La creencia en regiones no físicas es cero
  • Las restricciones físicas se implementan mediante la distribución a priori, no la función de verosimilitud

Puntos de Innovación Técnica

1. Innovación a Nivel Conceptual

Distinción entre "distribución de muestreo" y "dominio de definición de la función de verosimilitud":

  • La distribución de muestreo siempre asume θ ≥ 0 (restricción física)
  • La función de verosimilitud como objeto matemático puede definirse en un rango más amplio
  • Esta distinción permite usar todas las herramientas matemáticas sin violar el modelo físico

2. Flexibilidad Terminológica

Porter propone que, si las autoridades estadísticas prohíben definir "verosimilitud" en regiones no físicas, puede llamarse "verosimilitud descriptiva" (descriptionhood) y "máxima verosimilitud descriptiva" (maximum descriptionhood), enfatizando su naturaleza como herramienta descriptiva.

3. Consistencia Metodológica

Este enfoque mantiene consistencia entre diferentes distribuciones:

  • Distribución de Poisson: θ̂ = n - b puede ser negativo
  • Distribución Normal: consideraciones similares se discuten en la referencia 4
  • Preserva la universalidad y consistencia del método estadístico

Análisis Teórico

Naturaleza de la Estadística Frecuentista

Porter cita obras clásicas de Kendall et al. (Volumen 2A, secciones 26.58-26.78), particularmente la declaración de la sección 26.69:

"Es casi axiomático que el método frecuentista no proporciona declaraciones sobre la credibilidad de hipótesis, porque los frecuentistas no están dispuestos a aceptar ningún concepto de probabilidad que carezca de interpretación frecuentista."

Aquí "probabilidad₁" se refiere a la probabilidad de grado-de-creencia.

Daño de la Confusión

Porter señala que malinterpretar la estadística frecuentista como una declaración inferencial ha causado considerable confusión:

Caso Típico: En 2015, el editor de la revista de psicología Basic and Applied Social Psychology declaró que los valores p eran "inválidos" y prohibió su uso, lo cual es una consecuencia directa de confundir la naturaleza de la estadística frecuentista.

Estatus de la Inferencia

Aunque Porter enfatiza que la estadística frecuentista es descriptiva, reconoce que:

  • Cuando la medición produce θ̂ = n - b, es razonable inferir que θ "probablemente" está cerca de θ̂
  • Esta inferencia entra en el dominio del grado-de-creencia
  • Al observar θ̂ negativo, se puede inferir que θ "probablemente" es muy pequeño (pero no negativo)

Escenarios Experimentales/Aplicados

Experimentos de Física de Altas Energías

Aunque el artículo no presenta resultados experimentales específicos, el contexto proviene de la física de altas energías:

  • Búsqueda de señales raras (como nuevas partículas)
  • Número de eventos de fondo conocido b
  • Número total de eventos observados n
  • Necesidad de estimar la intensidad de señal θ

Situación Práctica

Cuando las fluctuaciones de fondo resultan en n < b:

  • Práctica tradicional posible: Reportar θ̂ = 0 o no reportar
  • Propuesta de Porter: Reportar θ̂ = n - b (valor negativo), con intervalo de confianza
  • Ventaja: Retiene toda la información de la estadística suficiente

Ejemplo de Reporte

Porter sostiene que es completamente posible reportar:

"El resultado de la medición es θ̂ = -2 ± 1, aunque se sabe que θ > 0"

Este tipo de reporte:

  • Describe completamente la medición
  • Permite a los lectores inferir que θ probablemente está cerca de cero
  • No afirma que θ sea realmente negativo

Trabajos Relacionados

Literatura Estadística

  1. Shao (2003): El libro de texto Mathematical Statistics contiene ejemplos que apoyan el punto de vista de Cousins, pero aparecen en capítulos con más contenido bayesiano, sin explicar completamente el contexto
  2. Kendall et al. (1999): Kendall's Advanced Theory of Statistics reconoce los problemas y controversias de varios métodos de estimación, cuyo punto de vista es consistente con la posición de Porter
  3. Narsky & Porter (2014): Discute problemas similares en el caso de la distribución normal

Contexto Histórico de la Controversia

  • La disputa filosófica entre estadística frecuentista y bayesiana tiene una larga historia
  • Los libros de texto de estadística frecuentemente evitan la cuestión de cómo definir el dominio de la función de verosimilitud
  • La confusión en la práctica ha conducido a malinterpretaciones y mal uso de métodos estadísticos

Conclusiones y Discusión

Conclusiones Principales

  1. Dentro del marco frecuentista, es útil y racional permitir que la función de verosimilitud se defina en regiones de parámetros no físicos
  2. Esto no viola el modelo físico: La distribución de muestreo siempre asume restricciones físicas
  3. Las consideraciones de estadística suficiente apoyan este enfoque: N - b contiene más información que max(N - b, 0)
  4. La estadística frecuentista debe considerarse descriptiva: Proporciona una descripción de la medición, no una creencia sobre los parámetros

Posición de Porter

  • Reconoce que su posición puede ser más extrema que los precedentes históricos
  • Pero cree que esta posición ayuda a mantener la claridad conceptual
  • En el marco bayesiano no hay desacuerdo; la controversia se limita a la interpretación de la estadística frecuentista

Valor Práctico

Esta metodología:

  • Permite reportar resultados experimentales de manera más completa
  • Evita la pérdida de información
  • Mantiene la consistencia del método estadístico
  • Facilita análisis bayesianos posteriores o meta-análisis

Direcciones Futuras

El artículo no propone explícitamente direcciones futuras, pero las direcciones implícitas incluyen:

  • Aclaración adicional de la relación entre estadística frecuentista y bayesiana
  • Promoción de prácticas racionales de reporte estadístico en física experimental
  • Educación de usuarios de estadística para evitar malinterpretaciones comunes

Evaluación Profunda

Fortalezas

  1. Claridad Conceptual:
    • Distingue claramente entre estadística descriptiva e inferencial
    • Define bien la naturaleza y limitaciones de la estadística frecuentista
    • El argumento de estadística suficiente es convincente
  2. Orientación Práctica:
    • Aborda problemas reales en experimentos prácticos
    • Proporciona orientación metodológica operativa
    • Evita la pérdida de información
  3. Fundamentos Teóricos Sólidos:
    • Cita literatura estadística clásica para apoyar los argumentos
    • La demostración matemática de estadística suficiente es rigurosa
    • La comparación con el método bayesiano es apropiada
  4. Escritura Clara:
    • La estructura lógica es clara
    • Reconoce la racionalidad de diferentes puntos de vista
    • El tono es profesional y moderado

Limitaciones

  1. Posible Controversia Filosófica:
    • La cuestión de cómo "debería" definirse la función de verosimilitud tiene componentes filosóficas
    • Diferentes escuelas estadísticas pueden tener desacuerdos irreconciliables
    • Porter reconoce que puede ser imposible llegar a un consenso
  2. Confusión Potencial en la Práctica:
    • Permitir estimaciones negativas puede ser malinterpretado por no especialistas
    • Requiere explicación y educación adicionales
    • Puede causar confusión en ciertos campos de aplicación
  3. Evidencia Empírica Limitada:
    • Principalmente argumentos conceptuales y teóricos
    • Carece de casos de análisis de datos reales
    • No demuestra el efecto de aplicación en experimentos específicos
  4. Discusión Insuficiente del Punto de Vista de Cousins:
    • Principalmente expone su propia posición
    • Responde menos a los argumentos específicos de la oposición
    • Puede no haber comprendido completamente las preocupaciones subyacentes del otro lado

Influencia

Aspectos Positivos:

  • Proporciona apoyo teórico para la práctica estadística en física de altas energías y campos relacionados
  • Ayuda a aclarar la naturaleza de la estadística frecuentista
  • Puede influir en las normas de reporte de resultados experimentales

Limitaciones:

  • Puede tener impacto directo solo en campos específicos (como física de partículas)
  • La comunidad estadística puede continuar teniendo desacuerdos
  • Se requiere educación y promoción para cambiar la práctica

Reproducibilidad

  • Este es un artículo teórico/metodológico, no implica reproducibilidad experimental
  • Los conceptos y argumentos son claros y fáciles de entender y aplicar
  • Las derivaciones matemáticas son simples y directas

Escenarios Aplicables

Escenarios Más Apropiados:

  1. Experimentos de Física de Altas Energías: Búsqueda de señales, estimación de fondo
  2. Experimentos de Baja Tasa de Conteo: La estadística de Poisson es dominante
  3. Situaciones que Requieren Reportar Estadísticas Suficientes: Cuando la transmisión completa de información es importante

Escenarios Menos Apropiados:

  1. Comunicación Científica al Público: Las intensidades de señal negativas pueden causar malinterpretación
  2. Entornos de Decisión Regulatoria: Puede requerirse un enfoque más conservador
  3. Audiencias Poco Familiarizadas con Estadística: Requiere explicación adicional

Resumen de Contribuciones Metodológicas

La contribución central de Porter es:

  1. Aclaró el límite entre "descripción" e "inferencia" en estadística frecuentista
  2. Proporcionó apoyo teórico de estadística suficiente para definir la función de verosimilitud en regiones no físicas
  3. Proporcionó una guía de reporte práctica: Permite reportar valores negativos de estimación de parámetros
  4. Aclaró la relación con el método bayesiano: En cuyo marco no hay controversia

Este es un artículo metodológico importante que, aunque no resolverá la controversia, proporciona una perspectiva valiosa para la práctica estadística.

Referencias

1 Robert D. Cousins. Comment on Frank Porter, "Confidence intervals for the Poisson distribution", 2025. arXiv:2509.17339

2 Frank C. Porter. Confidence intervals for the Poisson distribution, 2025. arXiv:2509.02852

3 Jun Shao. Mathematical Statistics, 2nd edition. Springer-Verlag, 2003

4 I. Narsky and F. C. Porter. Statistical analysis techniques in particle physics, 2014

5 Alan Stuart et al. Kendall's Advanced Theory of Statistics, Volume 2A, 1999

6 David Trafimow and Michael Marks. Editorial. Basic and Applied Social Psychology, 37(1):1–2, 2015


Evaluación General: Este es un artículo metodológico conceptualmente claro y con argumentos sólidos que proporciona una perspectiva valiosa sobre problemas prácticos en la estadística. Aunque puede no convencer a todos, sus argumentos basados en estadística suficiente y su aclaración de la naturaleza de la estadística frecuentista proporcionan orientación importante para físicos experimentales. El valor principal del artículo radica en aclarar conceptos y proporcionar orientación metodológica, más que en resolver un problema técnico con una respuesta definitiva.