A finite-horizon variant of the quickest change detection (QCD) problem that is of relevance to learning in non-stationary environments is studied. The metric characterizing false alarms is the probability of a false alarm occurring before the horizon ends. The metric that characterizes the delay is \emph{latency}, which is the smallest value such that the probability that detection delay exceeds this value is upper bounded to a predetermined latency level. The objective is to minimize the latency (at a given latency level), while maintaining a low false alarm probability. Under the pre-specified latency and false alarm levels, a universal lower bound on the latency, which any change detection procedure needs to satisfy, is derived. Change detectors are then developed, which are order-optimal in terms of the horizon. The case where the pre- and post-change distributions are known is considered first, and then the results are generalized to the non-parametric case when they are unknown except that they are sub-Gaussian with different means. Simulations are provided to validate the theoretical results.
Detección de Cambios Rápida en Horizonte Finito Equilibrando Latencia con Probabilidad de Falsa Alarma
- ID del Artículo: 2511.12803
- Título: Finite-Horizon Quickest Change Detection Balancing Latency with False Alarm Probability
- Autores: Yu-Han Huang y Venugopal V. Veeravalli (University of Illinois Urbana-Champaign)
- Clasificación: cs.IT, math.IT, stat.ML
- Fecha de Compilación: 18 de noviembre de 2025
- Enlace del Artículo: https://arxiv.org/abs/2511.12803
Este artículo investiga una variante del problema de detección rápida de cambios (QCD) en horizonte finito relacionada con el aprendizaje en entornos no estacionarios. El artículo adopta la probabilidad de falsa alarma como indicador de falsas alarmas y la latencia (latency) como indicador de retraso de detección—es decir, la probabilidad de que el retraso de detección exceda este valor se limita a un nivel predeterminado. El objetivo es minimizar la latencia manteniendo una baja probabilidad de falsa alarma. Bajo niveles predeterminados de latencia y falsa alarma, el artículo deriva límites inferiores universales que cualquier procedimiento de detección de cambios debe satisfacer, y desarrolla detectores de cambios óptimos en orden de tiempo. Primero se considera el caso donde se conocen las distribuciones antes y después del cambio, luego se generaliza al caso no paramétrico—conociendo solo que la distribución es sub-gaussiana con diferentes medias. Los resultados teóricos se verifican mediante simulación.
Este artículo investiga el problema de detección rápida de cambios en horizonte finito, equilibrando el desempeño de detección bajo el siguiente sistema de indicadores:
- Indicador de Falsa Alarma: Probabilidad de que ocurra una falsa alarma dentro del horizonte de tiempo P∞(τ ≤ T)
- Indicador de Latencia: Latencia ℓ, definida como el valor mínimo tal que la probabilidad de que el retraso de detección exceda este valor no supere un nivel predeterminado δD
Los problemas QCD tradicionales generalmente asumen:
- Horizonte Infinito: No se ajusta a escenarios de horizonte finito en aplicaciones prácticas
- Minimización de Retraso Esperado: En lugar de controlar la probabilidad de que el retraso exceda un umbral
- Tiempo Promedio de Falsa Alarma: En lugar de probabilidad de falsa alarma
La nueva formulación del problema es más crítica en las siguientes aplicaciones:
- Aprendizaje en Línea en Entornos Parcialmente Estacionarios: Como problemas de bandidos parcialmente estacionarios, procesos de decisión de Markov episódicos parcialmente estacionarios en horizonte finito
- Algoritmos que Requieren Reinicio: Después de detectar un cambio ambiental, es necesario reiniciar, lo que requiere controlar simultáneamente la probabilidad de falsa alarma y la probabilidad de retraso de detección
- Pruebas CuSum y SR Clásicas: Utilizan umbrales constantes, la probabilidad de falsa alarma tiende a 1 en horizontes de tiempo grandes
- Trabajo de Lai (1998): Solo resuelve parcialmente el problema de probabilidad de falsa alarma, el tamaño de la ventana no cubre todo el horizonte de tiempo y depende del nivel de falsa alarma
- Falta de Límites Teóricos: Para el problema de controlar simultáneamente la probabilidad de falsa alarma y la probabilidad de latencia, faltan límites inferiores de desempeño y algoritmos óptimos en orden
- Proporcionar fundamentos teóricos para el aprendizaje en entornos parcialmente estacionarios
- Establecer puntos de referencia de desempeño (límites inferiores) bajo la nueva formulación del problema
- Desarrollar algoritmos de detección prácticos y óptimos en orden
- Nueva Formalización del Problema: Se propone el problema QCD en horizonte finito que equilibra la probabilidad de falsa alarma y la latencia (Ecuación 3), donde la latencia se define como el valor mínimo tal que la probabilidad de que el retraso de detección exceda este valor no supere δD
- Límite Inferior Universal: Se deriva el límite inferior universal que cualquier detector de cambios debe satisfacer (Teorema 1):
ℓ≥(K1+o(1))[log(T)+log(δF1)+log(1−δF−δD)+o(1)]
donde K=log(Ef1[f0(X)f1(X)])
- Detector Óptimo en Orden para Distribuciones Conocidas: Se proponen las pruebas CuSum con Umbral Variable en Tiempo (TVT-CuSum) y SR con Umbral Variable en Tiempo (TVT-SR), demostrando que su latencia es O(log T), coincidiendo con el orden del límite inferior (Teorema 2)
- Detector No Paramétrico: Se generaliza el método al caso de distribuciones desconocidas, proponiendo pruebas de Razón de Verosimilitud Generalizada (GLR) y Shiryaev-Roberts Generalizado (GSR), alcanzando latencia O(log T) bajo el supuesto sub-gaussiano (Teorema 3, Corolario 1)
- Verificación Experimental: Se verifican los resultados teóricos mediante simulación, demostrando la optimalidad en orden del algoritmo
Formulación del Problema:
- Secuencia de Observaciones: {Xn : n ∈ T}, observadas secuencialmente dentro del horizonte finito T
- Punto de Cambio: ν ∈ m+1, T, donde m es la ventana pre-cambio (utilizada para estimar la distribución pre-cambio)
- Cambio de Distribución:
Xn∼{f0,f1,n∈[ν−1]n∈[ν,T]
Indicadores de Desempeño:
- Latencia (Ecuación 2):
ℓ:=min{d∈[T]:Pν(τ≥ν+d)≤δD,∀ν∈[m+1,T−d]}
- Probabilidad de Falsa Alarma: P∞(τ ≤ T)
Objetivo de Optimización (Ecuación 3):
minτℓs.t.P∞(τ≤T)≤δF
Estadístico CuSum (forma recursiva):
Cn=max{Cn−1,0}+log(f0(Xn)f1(Xn)),C0=0
Umbral Variable en Tiempo:
βC(n,δF,r):=log(nrδFζ(r)),ζ(r)=∑i=1∞i−r
Tiempo de Parada (Ecuación 12):
τC,r:=inf{n∈N:Cn≥βC(n,δF,r)}
Características Clave:
- Complejidad Computacional: O(1) por paso de tiempo
- El umbral crece logarítmicamente con el tiempo, controlando la probabilidad de falsa alarma
Estadístico SR (forma recursiva):
Sn=(Sn−1+1)f0(Xn)f1(Xn),S0=0
Umbral Variable en Tiempo:
βS(n,δF,r):=βC(n,δF,r)+logn
Tiempo de Parada (Ecuación 14):
τS,r:=inf{n∈N:logSn≥βS(n,δF,r)}
Estadístico GLR (Ecuación 21):
Gn=supk∈[n]kD(μ^1:k;μ^1:n)+(n−k)D(μ^k+1:n;μ^1:n)
donde D(x;y):=(x−y)2/(2σ2) es la divergencia KL para distribuciones gaussianas, μ^m:n es la media empírica.
Función de Umbral (Ecuación 23):
βGLR(n,δF):=6log(1+log(n))+25log(δF4n3/2)+11
Tiempo de Parada:
τGLR:=inf{n∈N:Gn≥βGLR(n,δF)}
Requisito de Longitud de Ventana Pre-cambio (Ecuación 29):
m≥Δ28σ2β(T,δF)
Estadístico GSR (Ecuación 25):
Wn=∑k=1nexp(kD(μ^1:k;μ^1:n)+(n−k)D(μ^k+1:n;μ^1:n))
Umbral:
βGSR(n,δF):=βGLR(n,δF)+logn
Innovación: El umbral crece logarítmicamente con el tiempo, en lugar de ser un umbral constante
- Problema Resuelto: Los umbrales constantes hacen que la probabilidad de falsa alarma tienda a 1 en horizontes de tiempo grandes
- Fundamento Teórico: Utiliza la desigualdad de Ville y propiedades de supermartingalas
Lema Clave 2 (Apéndice A): La secuencia {(j+k)r1∏i=jj+kf0(Xi)f1(Xi)}k=0∞ es una supermartingala no negativa bajo P∞
Innovación: Reemplaza la razón de verosimilitud con la razón de verosimilitud generalizada
- Estadístico GLR: Maximiza la verosimilitud para estimar parámetros desconocidos
- Lema 1: Expresa el estadístico GLR como función de medias empíricas, facilitando el uso de propiedades sub-gaussianas
Innovación: Combina técnicas de martingalas mixtas (Kaufmann & Koolen, 2021)
- Lema 5: Para secuencias i.i.d. sub-gaussianas, establece desigualdades de concentración para divergencia KL empírica
- Lema 6: Construye martingalas mixtas no negativas para acotar eventos anómalos mediante valores de martingalas
Innovación: Descompone eventos de latencia en tres eventos disjuntos
- Evento A: Detección temprana pero razón de log-verosimilitud grande
- Evento B: Detección temprana pero razón de log-verosimilitud pequeña
- Utiliza cambio de medida e desigualdad de Markov para acotar cada uno por separado
Datos Sintéticos:
- Distribución Pre-cambio: N(0, 1) (distribución gaussiana con media 0, varianza 1)
- Distribución Post-cambio: N(1, 1) (distribución gaussiana con media 1, varianza 1)
- Intervalo de Cambio: ∆ = 1
- Rango de Horizonte de Tiempo: T ∈ {5000, 10000, 20000, 50000, 100000}
Cálculo de Latencia Empírica:
- Para cada punto de cambio en el conjunto de candidatos M ⊆ m+1, T-ℓ
- Se realizan 2×10⁵ ensayos
- Se registra el retraso de detección τ - ν
- Se toma el máximo del percentil 100(1-δD) en todos los puntos de cambio
- Conjunto de candidatos: M = {m+1+nT/10 : n ∈ ℕ, m+1+nT/10 ≤ T}
- Prueba TVT-CuSum (configuración del parámetro r)
- Prueba TVT-SR (configuración del parámetro r)
- Prueba GLR (implementación con submuestreo)
- Límite Inferior Teórico (Teorema 1)
- Límite Superior Teórico (Teoremas 2 y 3)
- Nivel de Falsa Alarma: δF = 0.01
- Nivel de Latencia: δD = 0.01
- Ventana Pre-cambio: m = T - 1000 (para prueba GLR)
- Ventana de Submuestreo GLR: 700 pasos de tiempo (Ecuación 34)
Gn′:=supk∈[n−700,n]logsupμ∏i=1nfμ(Xi)supμ0′∏i=1kfμ0′(Xi)supμ1′∏i=k+1nfμ1′(Xi)
Hallazgos Clave Mostrados en Figura 1:
- Verificación de Optimalidad en Orden: La latencia empírica de todas las pruebas muestra una relación lineal con log T, verificando la optimalidad en orden O(log T)
- Orden de Desempeño:
- TVT-CuSum < TVT-SR < GLR (latencia de menor a mayor)
- Las pruebas para distribuciones conocidas superan a las de distribuciones desconocidas
- Ajuste de Límites:
- Límite Inferior Más Suelto: Existe una brecha notable entre el límite inferior teórico y los valores empíricos
- Límite Superior GLR Más Suelto: El límite superior del Teorema 3 tiene la mayor brecha con los valores empíricos de GLR
- Límites Superiores TVT-CuSum y TVT-SR Más Ajustados: El límite superior del Teorema 2 tiene una brecha menor con los valores empíricos
Para T = 100000:
- Límite Inferior Teórico: aproximadamente 35
- Valor Empírico TVT-CuSum: aproximadamente 55
- Valor Empírico TVT-SR: aproximadamente 60
- Valor Empírico GLR: aproximadamente 75
- Límite Superior Teórico GLR: aproximadamente 200+
La latencia de todas las pruebas presenta la forma ℓ = a·log(T) + b, donde:
- La pendiente a refleja la eficiencia del algoritmo
- TVT-CuSum tiene la pendiente más pequeña (más óptimo)
- La latencia de la prueba GLR es aproximadamente 1.4 veces la de TVT-CuSum
- Indica que la pérdida de desempeño por distribución desconocida es aceptable
- La prueba GLR mantiene la optimalidad en orden O(log T)
Posibles Razones de Holgura en Límite Inferior:
- La prueba no impone la condición de que el test sea ignorante del horizonte de tiempo T
- TVT-CuSum puede tener espacio de mejora adicional
Razones de Holgura en Límite Superior GLR:
- Las técnicas de prueba son más conservadoras
- Las desigualdades de concentración utilizadas pueden no ser suficientemente ajustadas
- Todas las pruebas controlan exitosamente la probabilidad de falsa alarma por debajo de δF
- La latencia se mantiene dentro de rangos aceptables
- La complejidad computacional es razonable (TVT-CuSum y TVT-SR son O(1) por paso)
- Criterio de Lorden (Lorden, 1971): Retraso esperado en el peor caso
- Criterio de Pollak (Pollak, 1985): Retraso esperado condicional
- Prueba CuSum (Page, 1954; Moustakides, 1986): Exactamente óptima bajo el criterio de Lorden
- Prueba SR (Shiryaev, 1961): Asintóticamente óptima bajo criterios de Pollak y Lorden
- Lai (1998): Considera probabilidad de falsa alarma dentro de ventana, pero la ventana no cubre todo el horizonte de tiempo
- Diferencia de este Artículo: La probabilidad de falsa alarma cubre todo el horizonte de tiempo, la latencia se define por límite de probabilidad en lugar de esperanza
- Lai & Xing (2010): Detección de cambio secuencial con distribuciones desconocidas
- Método GLR: Generalización común de pruebas de razón de verosimilitud
- Contribución de este Artículo: Método no paramétrico bajo horizonte finito y nuevo sistema de indicadores
- Bandidos Parcialmente Estacionarios (Auer et al., 2019; Wei & Luo, 2021; Besson et al., 2022)
- Estrategia de Detección y Reinicio (Huang et al., 2025): Requiere controlar simultáneamente probabilidad de falsa alarma y probabilidad de latencia
- Aplicación de este Artículo: Proporciona fundamentos teóricos y herramientas de detección para estos algoritmos
- Desigualdad de Ville (Ville, 1939): Desigualdad de máximo de supermartingalas
- Límite de Chernoff (Chernoff, 1952): Límite de probabilidad de cola de sumas
- Martingalas Mixtas (Kaufmann & Koolen, 2021): Desigualdades de concentración uniformes en tiempo
- Límite Inferior Teórico: Se establece el límite inferior de latencia Ω(log T) para el problema QCD en horizonte finito, proporcionando un punto de referencia de desempeño para cualquier detector
- Algoritmos Óptimos en Orden:
- Distribuciones Conocidas: TVT-CuSum y TVT-SR alcanzan latencia O(log T)
- Distribuciones Desconocidas: GLR y GSR alcanzan latencia O(log T) bajo supuesto sub-gaussiano
- Valor Práctico:
- Algoritmos computacionalmente eficientes (implementación recursiva)
- Controlan exitosamente la probabilidad de falsa alarma y la probabilidad de latencia
- Aplicables al aprendizaje en entornos parcialmente estacionarios
- Generalización: Los resultados pueden generalizarse a ruido sub-gaussiano independiente pero no idénticamente distribuido (Observación 2)
- Límite Inferior Más Suelto: Brecha de aproximadamente 1.5 veces con valores empíricos
- Límite Superior GLR Muy Suelto: Brecha superior a 2.5 veces con valores empíricos
- Análisis de Causas:
- La prueba del límite inferior no considera la restricción de ignorancia del horizonte de tiempo
- El análisis de GLR utiliza desigualdades de concentración más conservadoras
- Supuesto Sub-gaussiano: Excluye distribuciones de cola pesada
- Parámetro Conocido: Requiere conocer σ²
- Cambio de Media: Solo considera cambios de media, no cambios de varianza u otros parámetros
- Generalización: Limita el rango de aplicaciones
- Estadístico GLR: Sin estructura recursiva, cálculo directo es O(n²)
- Compensación de Submuestreo: Se utiliza ventana de 700 pasos en experimentos, puede afectar el desempeño
- Estadístico GSR: Más difícil de calcular, no se reportan resultados en experimentos
- La teoría actual se dirige a un único punto de cambio
- Los entornos parcialmente estacionarios tienen múltiples puntos de cambio, requieren aplicación repetida
- Ajustar Límite Inferior: Considerar restricción de ignorancia del horizonte de tiempo
- Ajustar Límite Superior GLR: Utilizar desigualdades de concentración más precisas
- Posibles Direcciones: Métodos de teoría de información, análisis asintótico exacto
- Diseño de Umbral Más Ajustado: Reducir brecha de desempeño con TVT-CuSum
- Cálculo Eficiente: Explorar algoritmos recursivos aproximados
- Ventana Adaptativa: Ajustar dinámicamente el tamaño de ventana de submuestreo
- Familias de Distribución Más Generales: Más allá de sub-gaussiano
- Parámetros Desconocidos: Sin necesidad de conocer σ²
- Cambios Multi-parámetro: Varianza, parámetros de forma, etc.
- Análisis Teórico: Latencia acumulada y falsa alarma para múltiples puntos de cambio
- Reinicio Óptimo: Cómo reiniciar óptimamente después de detección
- Estimación de Número de Puntos de Cambio
- Bandidos Parcialmente Estacionarios: Integración en algoritmos reales
- Aprendizaje por Refuerzo: MDP parcialmente estacionario
- Otros Campos: Finanzas, procesamiento de señales biomédicas, etc.
- Sistema de Indicadores Novedoso: Probabilidad de falsa alarma + probabilidad de latencia, más adecuado para aplicaciones prácticas que indicadores de esperanza tradicionales
- Configuración de Horizonte Finito: Más cercana a escenarios de aplicación real
- Motivación de Aplicación Clara: Estrechamente vinculada al aprendizaje parcialmente estacionario
- Límite Inferior: Proporciona punto de referencia de desempeño
- Límite Superior: Proporciona algoritmos alcanzables
- Coincidencia de Orden: Demuestra optimalidad en orden del algoritmo
- De Conocido a Desconocido: Ruta de generalización completa
- Construcción de Supermartingala (Lema 2): Uso ingenioso de desigualdad de Ville
- Descomposición de Eventos (Apéndice B): Descompone eventos complejos en partes manejables
- Técnica de Martingalas Mixtas (Lema 6): Introduce técnicas de vanguardia
- Cambio de Medida: Herramienta clásica pero efectiva de análisis
- Eficiencia Computacional: TVT-CuSum y TVT-SR son O(1) por paso
- Fácil Implementación: Forma recursiva simple
- Selección de Parámetros: Función de umbral explícita, sin necesidad de ajuste
- Robustez: Método GLR aplicable a distribuciones desconocidas
- Múltiples Escalas de Horizonte de Tiempo: T de 5000 a 100000
- Repeticiones Suficientes: 2×10⁵ ensayos por configuración
- Comparación Teórica: Comparación con límites teóricos
- Visualización Clara: Figura 1 muestra claramente la relación lineal logarítmica
- Brecha Límite Inferior-Valores Empíricos: Aproximadamente 1.5 veces
- Límite Superior GLR Muy Suelto: Brecha superior a 2.5 veces
- Impacto: Limita el valor orientador de la teoría
- Mejora: Los autores ya lo reconocen y discuten en el artículo
- Sin Estructura Recursiva: Cálculo directo O(n²)
- Esquema de Submuestreo: Se utiliza en experimentos pero carece de análisis teórico
- GSR No Implementado: Solo se reportan resultados de GLR
- Impacto en Practicidad: Limita aplicaciones a gran escala
- Familia de Distribución Única: Solo prueba distribución gaussiana
- Parámetros Fijos: δF = δD = 0.01, no explora sensibilidad de parámetros
- Muestreo de Puntos de Cambio Candidatos: M solo incluye puntos con intervalo T/10
- Falta de Comparación: No compara con otros métodos de horizonte finito (posiblemente porque faltan tales métodos)
- Supuesto Sub-gaussiano: Excluye distribuciones de cola pesada
- σ² Conocido: Puede ser desconocido en práctica
- Cambio de Media: Solo considera cambios de media, no otros cambios de parámetro
- Generalización: Limita rango de aplicaciones
- Resultados Principales Claros: Pero detalles de prueba están todos en apéndice
- Símbolos Numerosos: Requiere seguimiento cuidadoso
- Detalles Experimentales: Descripción de implementación de submuestreo insuficientemente detallada
- Claridad General: Estructura razonable, lógica fluida
- Nuevo Paradigma de Problema: Establece nuevo marco teórico para QCD en horizonte finito
- Punto de Referencia de Desempeño: Proporciona estándar de comparación para otros investigadores
- Herramienta Técnica: Las técnicas de prueba pueden aplicarse a problemas relacionados
- Valor a Largo Plazo: Contribución fundamental
- Aprendizaje Parcialmente Estacionario: Aplicación directa a bandidos, aprendizaje por refuerzo
- Plug and Play: Los algoritmos pueden integrarse directamente
- Garantía de Desempeño: Las garantías teóricas reducen riesgo de aplicación
- Limitación: La complejidad computacional de GLR necesita resolverse
- Algoritmo Explícito: Fórmulas recursivas claras
- Función de Umbral: Completamente especificada
- Configuración Experimental: Parámetros y métodos suficientemente descritos
- Código No Publicado: Pero la implementación no debería ser difícil
- Mejora de Límites Teóricos: Dirección de investigación clara
- Algoritmo GLR Eficiente: Necesidad práctica
- Generalización a Otras Distribuciones: Extensión natural
- Teoría de Múltiples Puntos de Cambio: Dirección futura importante
- Bandidos Parcialmente Estacionarios: Requiere detectar cambios ambientales y reiniciar
- Decisión en Horizonte Finito: Límite de tiempo claro
- Observaciones Sub-gaussianas: Como recompensas acotadas
- Cambio de Media: Cambio ambiental manifestado como desplazamiento de media
- Horizonte Infinito: Puede requerir modificación de función de umbral
- Distribución de Cola Pesada: Requiere herramientas teóricas diferentes
- Cambio de Varianza: Requiere modificación de estadístico
- Múltiples Puntos de Cambio: Requiere aplicación repetida y análisis acumulativo
- Cambio Continuo: En lugar de cambio abrupto
- Horizonte de Tiempo Desconocido: El algoritmo asume existencia de T (aunque no lo utiliza)
- Requisito de Tiempo Real Extremo: O(n²) de GLR puede ser demasiado lento
- Observaciones No Independientes: Como correlación de serie temporal
- Moustakides (1986): Optimalidad exacta de prueba CuSum
- Pollak (1985) & Lorden (1971): Criterios QCD clásicos
- Lai (1998): Control de probabilidad de falsa alarma dentro de ventana
- Kaufmann & Koolen (2021): Martingalas mixtas y desigualdades de concentración uniformes en tiempo
- Besson et al. (2022): Detección de cambio en bandidos parcialmente estacionarios
- Ville (1939): Desigualdad de Ville (límite de máximo de supermartingala)
Este artículo realiza contribuciones teóricas importantes al problema de detección rápida de cambios en horizonte finito, proponiendo un nuevo sistema de indicadores más adecuado para aplicaciones prácticas (probabilidad de falsa alarma + latencia), estableciendo límites inferiores de desempeño y desarrollando algoritmos de detección óptimos en orden. La teoría es rigurosa, las técnicas de prueba son ingeniosas, y la verificación experimental es suficiente. Las principales insuficiencias radican en límites teóricos más sueltos y complejidad computacional alta de GLR, pero estos también proporcionan direcciones claras para investigación posterior. Este trabajo proporciona fundamentos teóricos sólidos para el aprendizaje en entornos parcialmente estacionarios, con importante valor académico y potencial de aplicación.
Índice de Recomendación: ⭐⭐⭐⭐⭐ (5/5)
- Recomendado para investigadores interesados en análisis de secuencias, detección estadística, aprendizaje en línea
- Lectura esencial para académicos que trabajan en problemas parcialmente estacionarios
- Proporciona orientación teórica y herramientas prácticas para diseñadores de sistemas reales