We develop a version of variational inference for Bayesian count response regression-type models that possesses attractive attributes such as convexity and closed form updates. The convex solution aspect entails numerically stable fitting algorithms, whilst the closed form aspect makes the methodology fast and easy to implement. The essence of the approach is the use of Pólya-Gamma augmentation of a Negative Binomial likelihood, a finite-valued prior on the shape parameter and the structured mean field variational Bayes paradigm. The approach applies to general count response situations. For concreteness, we focus on generalized linear mixed models within the semiparametric regression class of models. Real-time fitting is also described.
- ID Articolo: 2510.12356
- Titolo: Variational Inference for Count Response Semiparametric Regression: A Convex Solution
- Autori: Virginia Murru (Università di Padova), Matt P. Wand (University of Technology Sydney)
- Classificazione: stat.ME (Statistica - Metodologia)
- Data di Pubblicazione: 14 ottobre 2025
- Link Articolo: https://arxiv.org/abs/2510.12356
Questo articolo sviluppa un metodo di inferenza variazionale per modelli bayesiani di regressione con risposta di conteggio, caratterizzato da proprietà di convessità e aggiornamenti in forma chiusa. La convessità garantisce un algoritmo di adattamento numericamente stabile, mentre gli aggiornamenti in forma chiusa rendono il metodo veloce e facile da implementare. Il nucleo del metodo utilizza la verosimiglianza binomiale negativa aumentata con Pólya-Gamma, priori a valore finito per il parametro di forma e un paradigma variazionale bayesiano a campo medio strutturato. Il metodo si applica a situazioni generali di risposta di conteggio ed è specificamente orientato ai modelli lineari generalizzati misti nella categoria della regressione semiparametrica. L'articolo descrive inoltre un algoritmo di adattamento in tempo reale.
Questa ricerca affronta principalmente il problema dell'inferenza bayesiana nella regressione semiparametrica con risposta di conteggio. I metodi tradizionali di Markov Chain Monte Carlo (MCMC) presentano colli di bottiglia in termini di velocità e scalabilità, mentre i metodi di inferenza variazionale esistenti soffrono di problemi di instabilità numerica causati dalla non-convessità.
- Problemi di Stabilità Numerica: Sebbene il metodo variazionale a forma fissa di Luts & Wand (2015) presenti buona precisione, la non-convessità può causare problemi numerici. Negli studi di simulazione, il metodo variazionale a forma fissa per la regressione non parametrica di Poisson non converge correttamente nel 13,6% delle repliche.
- Esigenza di Efficienza Computazionale: I metodi esistenti comportano passaggi di integrazione numerica, mentre il metodo proposto in questo articolo dispone di aggiornamenti completamente in forma chiusa, consentendo un algoritmo veloce e stabile.
- Esigenza di Applicazioni in Tempo Reale: Nelle applicazioni su dati in streaming, è necessario un metodo che possa aggiornare i parametri del modello online senza necessità di memorizzare tutti i dati storici.
- Propone un Framework di Inferenza Variazionale Convessa: Sviluppa un metodo di inferenza variazionale in cui tutti i problemi di ottimizzazione dei componenti sono convessi, garantendo stabilità numerica.
- Implementa Aggiornamenti in Forma Chiusa: Attraverso la tecnica di aumento Pólya-Gamma, tutti i passaggi di aggiornamento dispongono di soluzioni in forma chiusa, evitando l'integrazione numerica.
- Costruisce uno Schema Variazionale Bayesiano a Campo Medio Strutturato: Attraverso la discretizzazione del parametro di forma κ, combinato con la media del modello variazionale bayesiano per affrontare il difficile problema dell'inferenza del parametro di forma della distribuzione binomiale negativa.
- Sviluppa un Algoritmo Puramente Online in Tempo Reale: Propone un algoritmo in tempo reale che richiede solo l'aggiornamento e l'archiviazione di statistiche sufficienti, potendo scartare i dati di streaming dopo l'elaborazione.
Considerare il seguente modello bayesiano di regressione semiparametrica con risposta di conteggio:
yi∣β,u,κ∼ind.Negative-Binomial(exp{(Xβ+Zu)i},κ),1≤i≤n
dove yi è la variabile di risposta di conteggio, X e Z sono rispettivamente le matrici di progettazione per gli effetti fissi e gli effetti casuali.
Introdurre variabili ausiliarie Pólya-Gamma:
αi∣yi,β,u,κ∼ind.Poˊlya-Gamma(yi+κ,(Xβ+Zu)i+log(κ))
- Coefficienti di regressione: β∼N(0,σβ2Ip)
- Effetti casuali: u∣σ12,…,σr2∼N(0,blockdiag(σ12IK1,…,σr2IKr))
- Parametri di varianza: σj∼ind.Half-Cauchy(sσ)
- Parametro di forma: κ ha una distribuzione a priori discreta con insieme di atomi K e probabilità p(κ)
Utilizzare la seguente forma di densità prodotto con restrizioni:
q(β,u,κ,α,σ2,a)=q(β,u,a∣κ)q(σ2,α∣κ)q(κ)
Algoritmo 1: I passaggi di aggiornamento chiave dell'algoritmo variazionale bayesiano a campo medio strutturato includono:
- Aggiornamento dei Parametri Pólya-Gamma:
μq(α∣κ)←2(y+κ1)⊙λJJ(cq(α∣κ))
- Aggiornamento dei Parametri di Regressione:
Σq(β,u∣κ)←{CTdiag(μq(α∣κ))C+Mq(1/σ2∣κ)}−1
- Aggiornamento dei Parametri di Varianza: Aggiornamento attraverso le statistiche sufficienti della distribuzione Gamma inversa
dove λJJ(x)=4xtanh(x/2) è la funzione Jaakkola-Jordan.
- Garanzia di Convessità: Ogni singolo problema di ottimizzazione a campo medio (per κ∈K) è convesso, garantendo la soluzione globalmente ottimale.
- Aggiornamenti in Forma Chiusa: Attraverso le proprietà speciali dell'aumento Pólya-Gamma, si evita l'integrazione numerica e tutti gli aggiornamenti hanno soluzioni analitiche.
- Strategia di Discretizzazione: Il parametro di forma continuo κ viene discretizzato in un insieme finito, gestito attraverso la media del modello variazionale bayesiano.
- Dati Simulati:
- Dimensione del campione: n=500
- Modello additivo binomiale negativo: ηtrue,1(x)=cos(4πx)+2x, ηtrue,2(x)=0.4ϕ(x;0.38,0.08)−1.02x+0.018x2+0.08ϕ(x;0.75,0.03)
- Parametro di forma vero: κtrue=3.8
- Dati Reali: Dati di conteggio del polline di ambrosia della città di Kalamazoo, USA, 1991-1994 (n=334)
Utilizzare il punteggio di precisione definito come:
accuracy(q∗)=100(1−21∫−∞∞∣q∗(θ)−p(θ∣y)∣dθ)%
- Benchmark MCMC: Utilizzo del motore di inferenza bayesiana JAGS, lunghezza della catena 10000, burn-in 5000, fattore di rarefazione 5
- Metodo Variazionale Esistente: Metodo variazionale bayesiano a campo medio semiparametrico di Luts & Wand (2015)
- Insieme di atomi K: 50 punti in sequenza geometrica, intervallo [κtrue/10,10κtrue]
- Criterio di convergenza: variazione relativa inferiore a 10−10
- Funzioni di base spline: Utilizzo di basi spline O'Sullivan, numero di funzioni di base K1=K2=17
Gli studi di simulazione mostrano che questo metodo raggiunge una precisione soddisfacente su tutti gli indicatori:
- Precisione della stima della funzione: La precisione della stima dei valori della funzione in diversi quantili è tra l'89% e il 94%
- Stima dei parametri di varianza: La precisione di σ12 e σ22 è rispettivamente dell'80% e del 73%
- Stima del parametro di forma: La precisione di κ raggiunge il 99%
Rispetto al metodo di Luts & Wand (2015), il metodo di questo articolo mostra miglioramenti su tutti i parametri, con il miglioramento più significativo per κ.
L'efficienza computazionale è significativamente migliorata:
- Metodo MCMC: Media 117,8 secondi (deviazione standard 1,876 secondi)
- Metodo di questo articolo: Media 2,088 secondi (deviazione standard 0,1440 secondi)
Miglioramento di velocità di circa 56 volte, mantenendo al contempo buona precisione inferenziale.
I risultati dell'adattamento in tempo reale dell'Algoritmo 2 indicano:
- Durante il processo di crescita della dimensione del campione da 100 a 1000, le stime in tempo reale sono altamente coerenti con le stime batch
- Per diversi valori di κtrue (5, 10, 20, 40), l'algoritmo mostra prestazioni stabili
- L'inferenza in tempo reale si concentra principalmente sulla struttura media, mentre l'inferenza in tempo reale per il parametro κ è relativamente difficile
L'applicazione sui dati di conteggio del polline di ambrosia mostra:
- Tutti i coefficienti di effetto lineare sono significativamente diversi da zero
- La distribuzione a posteriori del parametro di forma κ è concentrata tra 2-5, supportando l'applicabilità del modello di risposta binomiale negativa
- Le curve di tendenza dei quattro anni mostrano comportamenti simili: raggiungono il picco intorno al giorno 20 della stagione, seguito da una tendenza al ribasso
- Metodi di Inferenza Variazionale: Metodi per modelli di risposta binaria di Jaakkola & Jordan (2000), Durante & Rigon (2019)
- Aumento Pólya-Gamma: Metodi di aumento della verosimiglianza binomiale negativa di Polson et al. (2013), Zhou et al. (2012), Miao et al. (2020)
- Regressione Semiparametrica: Inferenza variazionale per regressione semiparametrica con risposta di conteggio di Luts & Wand (2015)
- Rispetto a Zhou et al. (2012) e Miao et al. (2020): Il metodo di questo articolo si basa sulla divergenza KL minima di una singola distribuzione congiunta, con fondamenti teorici più solidi
- Rispetto a Luts & Wand (2015): Risolve il problema della non-convessità, fornendo aggiornamenti completamente in forma chiusa
- Rispetto all'MCMC tradizionale: Velocità computazionale significativamente migliorata, mantenendo al contempo ragionevole precisione
- Sviluppo con successo di un metodo di inferenza variazionale per regressione semiparametrica con risposta di conteggio con convessità e aggiornamenti in forma chiusa
- Attraverso l'aumento Pólya-Gamma e la variazionale bayesiana a campo medio strutturato, realizzazione di un algoritmo numericamente stabile
- Fornitura di un algoritmo di adattamento puramente online in tempo reale, applicabile a applicazioni su dati in streaming
- Perdita di Precisione: L'approssimazione variazionale presenta una certa perdita di precisione rispetto all'MCMC, in particolare nella stima della larghezza della distribuzione a posteriori
- Effetto della Discretizzazione: La discretizzazione del parametro di forma κ potrebbe influenzare la precisione inferenziale
- Riduzione dell'Insieme di Atomi nell'Algoritmo Online: Nell'algoritmo online è necessario regolare dinamicamente l'insieme di atomi, il meccanismo richiede ulteriore ricerca
- Estensione a modelli di effetti casuali con parametri di matrice di covarianza
- Miglioramento della qualità inferenziale del parametro κ nell'algoritmo in tempo reale
- Ricerca delle basi teoriche del meccanismo di riduzione dell'insieme di atomi
- Innovazione Teorica: Combinazione dell'aumento Pólya-Gamma con la variazionale bayesiana a campo medio strutturato, risolvendo difficili problemi tecnici nella regressione con risposta di conteggio
- Stabilità Numerica: La convessità garantisce la stabilità e l'affidabilità dell'algoritmo
- Efficienza Computazionale: Gli aggiornamenti in forma chiusa e l'algoritmo in tempo reale migliorano significativamente l'efficienza computazionale
- Valore Pratico: Il metodo ha un ampio ambito di applicazione ed è facile da implementare
- Analisi Teorica Insufficiente: Mancanza di analisi teorica dell'errore di approssimazione variazionale
- Guida nella Scelta dei Parametri: Mancanza di guida sistematica nella scelta dell'insieme di atomi K
- Ambito Sperimentale: Gli scenari degli esperimenti di simulazione sono relativamente limitati
- Contributo Accademico: Fornisce un nuovo percorso tecnico per l'inferenza variazionale nei modelli con risposta di conteggio
- Valore Pratico: Ha importanza significativa nelle applicazioni di big data e dati in streaming
- Riproducibilità: La descrizione dell'algoritmo è dettagliata e facile da riprodurre e implementare
- Analisi di dati di conteggio che richiedono inferenza bayesiana veloce
- Modellazione in tempo reale in ambienti con dati in streaming
- Problemi di regressione semiparametrica con risposta di conteggio su larga scala
- Scenari applicativi con elevati requisiti di stabilità numerica
La bibliografia principale include:
- Luts, J. and Wand, M.P. (2015). Variational inference for count response semiparametric regression. Bayesian Analysis, 10, 991–1023.
- Polson, N.G., Scott, J.G. & Windle, J. (2013). Bayesian inference for logistic models using Pólya-Gamma latent variables. Journal of the American Statistical Association, 108, 1339–1349.
- Durante, D. & Rigon, T. (2019). Conditionally conjugate mean-field variational Bayes for logistic models. Statistical Science, 34, 472–485.
Questo articolo fornisce un contributo importante nel campo dell'inferenza variazionale per regressione semiparametrica con risposta di conteggio, risolvendo i problemi chiave dei metodi esistenti attraverso una combinazione ingegnosa di tecniche, fornendo una nuova direzione per lo sviluppo di questo campo.