2025-11-12T06:37:10.076735

A Generalized Notion of Completeness and Its Application

Singh, Sahoo, Hazra

From the perspective of data reduction, the notions of minimal sufficient and complete statistics together play an important role in determining optimal statistics (estimators). The classical notion of sufficiency and completeness are not adequate in many robust estimations that are based on different divergences. Recently, the notion of generalized sufficiency based on a generalized likelihood function was introduced in the literature. It is important to note that the concept of sufficiency alone does not necessarily produce optimal statistics (estimators). Thus, in line with the generalized sufficiency, we introduce a generalized notion of completeness with respect to a generalized likelihood function. We then characterize the family of probability distributions that possesses completeness with respect to the generalized likelihood function associated with the density power divergence (DPD). Moreover, we show that the family of distributions associated with the logarithmic density power divergence (LDPD) is not complete. Further, we extend the Lehmann-ScheffÃ© theorem and the Basu's theorem for the generalized likelihood estimation. Subsequently, we obtain the generalized uniformly minimum variance unbiased estimator (UMVUE) for the $\mathcal{B^{(Î±)}}$-family. Further, we derive an formula of the asymptotic expected deficiency (AED) that is used to compare the performance between the minimum density power divergence estimator (MDPDE) and the generalized UMVUE for $\mathcal{B^{(Î±)}}$-family. Finally, we provide an application of the developed results in stress-strength reliability model.

academic

Una Nozione Generalizzata di Completezza e Sua Applicazione

Informazioni Fondamentali

ID Articolo: 2510.13174
Titolo: A Generalized Notion of Completeness and Its Application
Autori: Himanshi Singh (IIT Jodhpur), Tanmay Sahoo (IIT Palakkad), Nil Kamal Hazra (IIT Jodhpur)
Classificazione: math.ST stat.TH (Teoria Statistica)
Data di Presentazione: 15 ottobre 2025
Link Articolo: https://arxiv.org/abs/2510.13174

Riassunto

Dal punto di vista della riduzione dei dati, i concetti di statistiche sufficienti minimali e statistiche complete svolgono un ruolo cruciale nel determinare statistiche ottimali (stimatori). I concetti classici di sufficienza e completezza non sono applicabili nella stima robusta basata su diverse divergenze. Recentemente, la letteratura ha introdotto il concetto di sufficienza generalizzata basato su funzioni di verosimiglianza generalizzate. È importante notare che il solo concetto di sufficienza non produce necessariamente statistiche ottimali. Pertanto, in coerenza con la sufficienza generalizzata, questo articolo introduce il concetto di completezza generalizzata rispetto a funzioni di verosimiglianza generalizzate e caratterizza le famiglie di distribuzioni di probabilità che possiedono completezza sotto funzioni di verosimiglianza generalizzate correlate alla divergenza di potenza di densità (DPD). Inoltre, dimostra che le famiglie di distribuzioni correlate alla divergenza di potenza di densità logaritmica (LDPD) non possiedono completezza, estende i teoremi di Lehmann-Scheffé e Basu alla stima di verosimiglianza generalizzata, e ottiene gli stimatori uniformemente di varianza minima imparziali (UMVUE) generalizzati per la famiglia B(α).

Contesto di Ricerca e Motivazione

Contesto del Problema

Importanza della riduzione dei dati: Nell'inferenza statistica, quando la dimensione del campione è grande, l'interpretazione diretta dei dati campionari diventa difficile e richiede la riduzione dei dati attraverso statistiche. La riduzione ideale dei dati dovrebbe soddisfare due proprietà chiave: (i) non perdere informazioni importanti sul parametro; (ii) scartare informazioni ridondanti non correlate al parametro.
Limitazioni della teoria classica: Il concetto di statistica sufficiente introdotto da Fisher si basa sulla funzione di verosimiglianza classica e funziona bene nel quadro della stima di massima verosimiglianza. Tuttavia, in applicazioni pratiche come l'inferenza robusta, è necessario andare oltre i metodi basati sulla verosimiglianza, e i concetti classici di sufficienza e completezza non sono più applicabili.
Necessità di un quadro generalizzato: I metodi di stima basati su divergenze sviluppati di recente (come MDPDE, MLDPDE, ecc.) utilizzano funzioni di verosimiglianza generalizzate e richiedono una teoria corrispondente di sufficienza e completezza generalizzate.

Motivazione della Ricerca

Il concetto di sufficienza da solo non può produrre statistiche ottimali; è necessario combinarlo con il concetto di completezza per ottenere UMVUE
Le definizioni esistenti di completezza non sono più applicabili nel quadro della stima di verosimiglianza generalizzata
È necessario stabilire una teoria di completezza generalizzata che corrisponda alla sufficienza generalizzata

Contributi Principali

Introduzione dei concetti di completezza generalizzata e ausiliaria: Definisce i concetti di statistiche complete generalizzate e statistiche ausiliarie generalizzate basati su funzioni di verosimiglianza generalizzate
Caratterizzazione della completezza della famiglia B(α): Dimostra che la famiglia B(α) possiede completezza generalizzata sotto funzioni di verosimiglianza generalizzate correlate a DPD
Dimostrazione dell'incompletezza della famiglia M(α): Attraverso un controesempio, dimostra che la famiglia M(α) non possiede completezza sotto funzioni di verosimiglianza generalizzate correlate a LDPD
Estensione dei teoremi classici: Estende i teoremi di Lehmann-Scheffé e Basu al quadro della stima di verosimiglianza generalizzata
Ottenimento di UMVUE generalizzati: Deriva gli stimatori uniformemente di varianza minima imparziali generalizzati per la famiglia B(α)
Analisi della perdita attesa asintotica: Deriva la formula della perdita attesa asintotica (AED) di MDPDE rispetto a UMVUE generalizzato
Esempi di applicazione: Dimostra l'applicazione dei risultati teorici nel modello di affidabilità stress-resistenza

Spiegazione Dettagliata dei Metodi

Definizione del Compito

Il compito principale di questo articolo è stabilire la teoria della completezza nel quadro della stima di verosimiglianza generalizzata, includendo specificamente:

Input: famiglia di distribuzioni di probabilità P = {fλ : λ ∈ Λ} e funzione di verosimiglianza generalizzata LG
Output: criteri di giudizio e metodi di costruzione per statistiche complete generalizzate
Vincoli: la funzione di verosimiglianza generalizzata deve soddisfare specifiche condizioni di regolarità

Concetti e Definizioni Fondamentali

1. Statistica Completa Generalizzata

Definizione 3.2: Sia P = {fλ : λ ∈ Λ} una famiglia di distribuzioni di probabilità e LG una funzione di verosimiglianza generalizzata. Una statistica T è detta statistica completa generalizzata di P se per qualsiasi funzione h,

$\tilde{E}_λ[h(T)] = \int h(T(y_1^n)) \frac{\exp[L_G(y_1^n;λ)]}{\int \exp[L_G(r_1^n;λ)]dr_1^n} dy_1^n = 0, \forall λ ∈ Λ$

implica

$\tilde{P}_λ\{h(T) = 0\} = 1, \forall λ ∈ Λ$

2. Distribuzione di Probabilità Deformata

Definizione 2.3: La distribuzione di probabilità deformata correlata alla funzione di verosimiglianza generalizzata LG è:

$\tilde{f}_λ(y_1^n) = \frac{\exp[L_G(y_1^n;λ)]}{\int \exp[L_G(r_1^n;λ)]dr_1^n}$

3. Famiglia B(α) e Famiglia M(α)

Famiglia B(α) (Definizione 2.8): $f_λ(y) = [h(y) + Z(λ) + w(λ)^T f(y)]^{\frac{1}{α-1}}$

Famiglia M(α) (Definizione 2.9): $f_λ(y) = N(λ)[h(y) + w(λ)^T f(y)]^{\frac{1}{α-1}}$

Teoremi Principali

Teorema di Lehmann-Scheffé Generalizzato

Teorema 3.1: Sia T una statistica sufficiente completa generalizzata di P, allora ogni funzione generalizzata stimabile τ̃(λ) ha uno e un solo stimatore della forma h(T) generalizzato imparziale, e h(T) è l'unico UMVUE generalizzato di τ̃(λ).

Teorema di Basu Generalizzato

Teorema 3.3: Sia T una statistica sufficiente completa generalizzata di P, allora qualsiasi statistica ausiliaria generalizzata A è indipendente da T.

Completezza della Famiglia B(α)

Teorema 4.2: Per la famiglia B(α), se l'immagine di w(λ) contiene un rettangolo d-dimensionale, allora $\bar{f}_d = [\bar{f}_1, ..., \bar{f}_d]^T$ è una statistica sufficiente completa generalizzata, dove $\bar{f}_i = \frac{1}{n}\sum_{j=1}^n f_i(y_j)$ .

Configurazione Sperimentale

Verifica Teorica

L'articolo verifica principalmente i risultati attraverso analisi teorica e prove matematiche, includendo:

Dimostrazione della completezza della famiglia B(α): Attraverso la costruzione di distribuzioni di probabilità deformate e l'applicazione dei risultati classici di Lehmann
Dimostrazione dell'incompletezza della famiglia M(α): Attraverso un controesempio con la distribuzione di Bernoulli
Derivazione della formula AED: Basata su espansione di Taylor e analisi asintotica

Caso di Applicazione

Modello di affidabilità stress-resistenza:

Sia la resistenza Y che lo stress X seguono una distribuzione t di Student
Parametro di affidabilità: $R = P(Y > X) = Φ(\frac{μ}{\sqrt{2}σ^*})$
Confronto delle prestazioni tra MDPDE e UMVUE generalizzato

Risultati Sperimentali

Risultati Teorici Principali

Completezza della famiglia B(α): Dimostra che, in condizioni appropriate, $\bar{f}_d$ è una statistica sufficiente completa generalizzata della famiglia B(α)
Incompletezza della famiglia M(α): Attraverso un esempio specifico con la distribuzione di Bernoulli, dimostra che la famiglia M(α) non possiede completezza generalizzata
Formula AED: Per la famiglia B(α), l'AED di MDPDE rispetto a UMVUE generalizzato è:

$AED[\tilde{τ}(T), \tilde{U}(T)] = \frac{1}{\frac{d}{dλ}w^*(λ)}\left[\frac{\frac{d^3}{dλ^3}\tilde{τ}(λ)}{\frac{d}{dλ}\tilde{τ}(λ)} + \frac{1}{4}\left(\frac{\frac{d^2}{dλ^2}\tilde{τ}(λ)}{\frac{d}{dλ}\tilde{τ}(λ)}\right)^2 - \frac{\frac{d^2}{dλ^2}w^*(λ)}{(\frac{d}{dλ}w^*(λ))^2}\frac{\frac{d^2}{dλ^2}\tilde{τ}(λ)}{\frac{d}{dλ}\tilde{τ}(λ)}\right]$

Risultati di Applicazione

Nel modello di affidabilità stress-resistenza:

Quando $|μ| < \sqrt{\frac{8σ^*}{4+σ^*}}$ , MDPDE è superiore a UMVUE generalizzato
Quando $|μ| > \sqrt{\frac{8σ^*}{4+σ^*}}$ , UMVUE generalizzato è superiore a MDPDE
Per applicazioni pratiche di affidabilità (affidabilità prossima a 1), UMVUE generalizzato generalmente funziona meglio

Scoperte Importanti

La statistica sufficiente minima generalizzata non è necessariamente completa: L'esempio della famiglia M(α) dimostra questo punto, che differisce dal caso classico
Relazione tra completezza e struttura della famiglia di distribuzioni: La famiglia B(α) possiede completezza mentre la famiglia M(α) non la possiede, rivelando le differenze essenziali tra diverse famiglie di distribuzioni generalizzate
Dipendenza dal parametro delle prestazioni dello stimatore: L'analisi AED mostra che le prestazioni relative dello stimatore dipendono fortemente dal valore del parametro

Lavori Correlati

Fondamenti della Teoria Classica

Fisher (1922): Concetto di statistica sufficiente
Lehmann & Scheffé (1950): Teoria della completezza e UMVUE
Basu (1955): Indipendenza tra statistiche ausiliarie e statistiche sufficienti complete

Sviluppo della Teoria Generalizzata

Gayen & Kumar (2016, 2023): Concetto di sufficienza generalizzata e teorema generalizzato di Fisher-Darmois-Koopman-Pitman
Basu et al. (1998, 2011): Divergenza di potenza di densità e metodi di stima robusta correlati

Teoria delle Divergenze

Kullback & Leibler (1951): Divergenza KL
Tsallis (1988): Divergenza di Tsallis
Rényi (1961): Divergenza di Rényi

Conclusioni e Discussione

Conclusioni Principali

Stabilimento riuscito della teoria della completezza generalizzata: Fornisce un quadro teorico completo per la stima di verosimiglianza generalizzata, colmando il vuoto teorico in questo campo
Caratterizzazione della completezza di importanti famiglie di distribuzioni: Dimostra che la famiglia B(α) possiede completezza generalizzata mentre la famiglia M(α) non la possiede, fornendo orientamenti teorici per applicazioni pratiche
Estensione dei teoremi classici: Estende con successo i teoremi di Lehmann-Scheffé e Basu al quadro generalizzato
Fornitura di strumenti di confronto degli stimatori: La formula AED fornisce uno strumento quantitativo per confrontare diversi stimatori

Limitazioni

Condizioni di regolarità: I risultati teorici richiedono il soddisfacimento di una serie di condizioni di regolarità, che devono essere verificate nelle applicazioni pratiche
Complessità computazionale: Il calcolo delle distribuzioni di probabilità deformate potrebbe essere relativamente complesso in alcuni casi
Proprietà a campione finito: I risultati principali si basano sulla teoria asintotica; le proprietà a campione finito richiedono ulteriori ricerche
Ambito di applicazione: Attualmente focalizzato su famiglie di distribuzioni specifiche; l'estensione a casi più generali richiede ulteriori ricerche

Direzioni Future

Inferenza bayesiana: Estensione della teoria della completezza generalizzata al quadro bayesiano
Teoria a campione finito: Studio delle proprietà della completezza generalizzata con campioni finiti
Famiglie di distribuzioni più generali: Esplorazione della completezza di altre famiglie di distribuzioni generalizzate
Metodi computazionali: Sviluppo di metodi numerici efficienti per il calcolo

Valutazione Approfondita

Punti di Forza

Innovazione teorica: Primo stabilimento sistematico della teoria della completezza generalizzata, fornendo una base teorica solida per la stima di verosimiglianza generalizzata
Rigore matematico: I processi di dimostrazione sono rigorosi, le definizioni sono chiare e la struttura logica è completa
Valore pratico: I risultati teorici si applicano direttamente all'ottenimento di UMVUE generalizzati, con importante valore pratico
Completezza: Non solo stabilisce risultati positivi (completezza della famiglia B(α)), ma dimostra anche risultati negativi attraverso controesempi (incompletezza della famiglia M(α))
Orientamento all'applicazione: Dimostra l'applicazione pratica della teoria attraverso il modello di affidabilità stress-resistenza

Insufficienze

Soglia tecnica elevata: Richiede una profonda base di teoria statistica matematica per una comprensione completa
Verifica sperimentale insufficiente: Principalmente analisi teorica, mancano esperimenti numerici su larga scala
Casi di applicazione limitati: Sebbene fornisca l'applicazione del modello stress-resistenza, i casi sono relativamente pochi
Analisi insufficiente della complessità computazionale: Discussione limitata sui problemi di complessità nel calcolo pratico

Impatto

Contributo teorico: Fornisce importanti strumenti teorici per la teoria statistica, in particolare per la statistica robusta
Valore metodologico: Fornisce supporto teorico per metodi di stima basati su divergenze
Prospettive di applicazione: Ha potenziale valore di applicazione in ingegneria dell'affidabilità, gestione del rischio e altri campi
Ricerca successiva: Pone le basi per ulteriori ricerche in campi correlati

Scenari Applicabili

Inferenza statistica robusta: Quando i dati contengono valori anomali, i metodi basati su divergenze sono più robusti dei metodi ML tradizionali
Analisi di affidabilità: Particolarmente adatto per problemi di affidabilità di tipo stress-resistenza
Gestione del rischio: Ha valore di applicazione in scenari che richiedono stima robusta come il rischio finanziario
Apprendimento automatico: Fornisce base teorica per algoritmi di apprendimento automatico robusti

Riferimenti Bibliografici

L'articolo cita 42 importanti riferimenti, coprendo lavori classici della teoria statistica e sviluppi recenti della teoria delle divergenze, includendo principalmente:

Fisher (1922): Teoria fondamentale della statistica
Lehmann & Scheffé (1950): Teoria della completezza
Basu (1955, 1998): Indipendenza statistica e stima robusta
Gayen & Kumar (2016, 2023): Teoria della sufficienza generalizzata
Kullback & Leibler (1951): Fondamenti della teoria dell'informazione

Valutazione complessiva: Questo è un articolo di alta qualità di teoria statistica che stabilisce un sistema teorico completo nel quadro della stima di verosimiglianza generalizzata. Sebbene la soglia tecnica sia elevata, il contributo teorico è significativo e rappresenta un importante progresso nello sviluppo della teoria statistica e dei metodi statistici robusti. La rigore matematico e la completezza teorica dell'articolo meritano lodi ed è un importante progresso in questo campo.