Aus der Perspektive der Datenverdichtung spielen die Konzepte der minimalen suffizienten Statistik und der vollständigen Statistik eine wichtige Rolle bei der Bestimmung optimaler statistischer Schätzer. Die klassischen Konzepte der Suffizienz und Vollständigkeit sind bei robusten Schätzungen auf der Grundlage verschiedener Divergenzen nicht anwendbar. In der Literatur wurde kürzlich ein verallgemeinertes Suffizienzkonzept auf der Grundlage verallgemeinerter Likelihoodfunktionen eingeführt. Es ist zu beachten, dass das Suffizienzkonzept allein nicht notwendigerweise zu optimalen Statistiken führt. Daher wird in diesem Artikel, in Übereinstimmung mit der verallgemeinerten Suffizienz, ein verallgemeinertes Vollständigkeitskonzept bezüglich verallgemeinerter Likelihoodfunktionen eingeführt und die Wahrscheinlichkeitsverteilungsfamilien charakterisiert, die unter der mit der Dichtepotenz-Divergenz (DPD) verbundenen verallgemeinerten Likelihoodfunktion vollständig sind. Darüber hinaus wird nachgewiesen, dass Verteilungsfamilien, die mit der logarithmischen Dichtepotenz-Divergenz (LDPD) verbunden sind, nicht vollständig sind. Das Lehmann-Scheffé-Theorem und das Basu-Theorem werden auf verallgemeinerte Likelihoodschätzung erweitert, und verallgemeinerte gleichmäßig minimale Varianz-unverzerrte Schätzer (UMVUE) für die B(α)-Familie werden erhalten.
Bedeutung der Datenverdichtung: In der statistischen Inferenz wird es schwierig, Beispieldaten direkt zu interpretieren, wenn die Stichprobengröße sehr groß ist. Eine ideale Datenverdichtung sollte zwei Schlüsseleigenschaften erfüllen: (i) keine Verluste von wichtigen Informationen über Parameter; (ii) Beseitigung von redundanten Informationen, die nicht mit Parametern zusammenhängen.
Einschränkungen der klassischen Theorie: Das von Fisher eingeführte Konzept der suffizienten Statistik basiert auf der klassischen Likelihoodfunktion und funktioniert gut im Maximum-Likelihood-Schätzungsrahmen. In praktischen Anwendungen wie robuster Inferenz ist es jedoch notwendig, über likelihoodbasierte Methoden hinauszugehen, wobei die klassischen Konzepte der Suffizienz und Vollständigkeit nicht mehr anwendbar sind.
Bedarf an verallgemeinertem Rahmen: Die in den letzten Jahren entwickelten divergenzbasierten Schätzmethoden (wie MDPDE, MLDPDE usw.) verwenden verallgemeinerte Likelihoodfunktionen und benötigen entsprechende Theorien der verallgemeinerten Suffizienz und Vollständigkeit.
Das Suffizienzkonzept allein kann keine optimalen Statistiken erzeugen; es muss mit dem Vollständigkeitskonzept kombiniert werden, um UMVUE zu erhalten
Die bestehenden Vollständigkeitsdefinitionen sind im Rahmen der verallgemeinerten Likelihoodschätzung nicht mehr anwendbar
Es ist notwendig, eine verallgemeinerte Vollständigkeitstheorie zu etablieren, die mit der verallgemeinerten Suffizienz übereinstimmt
Einführung verallgemeinerter Vollständigkeit und Hilfsstatistiken: Definition von verallgemeinerten vollständigen Statistiken und verallgemeinerten Hilfsstatistiken auf der Grundlage verallgemeinerter Likelihoodfunktionen
Charakterisierung der Vollständigkeit der B(α)-Familie: Nachweis, dass die B(α)-Familie unter der mit DPD verbundenen verallgemeinerten Likelihoodfunktion verallgemeinerte Vollständigkeit besitzt
Nachweis der Unvollständigkeit der M(α)-Familie: Beweis durch Gegenbeispiel, dass die M(α)-Familie unter der mit LDPD verbundenen verallgemeinerten Likelihoodfunktion nicht vollständig ist
Erweiterung klassischer Theoreme: Erweiterung des Lehmann-Scheffé-Theorems und des Basu-Theorems auf den Rahmen der verallgemeinerten Likelihoodschätzung
Erhalten verallgemeinerter UMVUE: Ableitung von verallgemeinerten gleichmäßig minimalen Varianz-unverzerrten Schätzern für die B(α)-Familie
Asymptotische Verlustanalyse: Ableitung von Formeln für den asymptotischen erwarteten Verlust (AED) von MDPDE relativ zu verallgemeinertem UMVUE
Anwendungsbeispiele: Demonstration der Anwendung von Theoremeergebnissen im Stress-Stärke-Zuverlässigkeitsmodell
Die Kernaufgabe dieses Artikels besteht darin, eine Vollständigkeitstheorie im Rahmen der verallgemeinerten Likelihoodschätzung zu etablieren, einschließlich:
Eingabe: Wahrscheinlichkeitsverteilungsfamilie P = {fλ : λ ∈ Λ} und verallgemeinerte Likelihoodfunktion LG
Ausgabe: Bestimmungskriterien und Konstruktionsmethoden für verallgemeinerte vollständige Statistiken
Einschränkungen: Die verallgemeinerte Likelihoodfunktion muss bestimmte Regularitätsbedingungen erfüllen
Definition 3.2: Sei P = {fλ : λ ∈ Λ} eine Wahrscheinlichkeitsverteilungsfamilie und LG eine verallgemeinerte Likelihoodfunktion. Eine Statistik T heißt verallgemeinerte vollständige Statistik von P, wenn für jede Funktion h,
Theorem 3.1: Sei T eine verallgemeinerte vollständige suffiziente Statistik von P. Dann hat jede verallgemeinerte schätzbare Funktion τ̃(λ) genau einen unverzerrten Schätzer der Form h(T), und h(T) ist der eindeutige verallgemeinerte UMVUE von τ̃(λ).
Theorem 4.2: Für die B(α)-Familie gilt: Wenn der Wertebereich von w(λ) ein d-dimensionales Rechteck enthält, dann ist fˉd=[fˉ1,...,fˉd]T eine verallgemeinerte vollständige suffiziente Statistik, wobei fˉi=n1∑j=1nfi(yj).
Das Papier verifiziert die Ergebnisse hauptsächlich durch theoretische Analyse und mathematische Beweise, einschließlich:
Beweis der Vollständigkeit der B(α)-Familie: Durch Konstruktion verformter Wahrscheinlichkeitsverteilungen und Anwendung klassischer Lehmann-Ergebnisse
Beweis der Unvollständigkeit der M(α)-Familie: Durch Gegenbeispiel mit Bernoulli-Verteilung
AED-Formelableitung: Basierend auf Taylor-Entwicklung und asymptotischer Analyse
Vollständigkeit der B(α)-Familie: Nachweis, dass fˉd unter geeigneten Bedingungen eine verallgemeinerte vollständige suffiziente Statistik der B(α)-Familie ist
Unvollständigkeit der M(α)-Familie: Beweis durch spezifisches Beispiel mit Bernoulli-Verteilung, dass die M(α)-Familie keine verallgemeinerte Vollständigkeit besitzt
AED-Formel: Für die B(α)-Familie ist der AED von MDPDE relativ zu verallgemeinertem UMVUE:
Verallgemeinerte minimale suffiziente Statistiken sind nicht notwendigerweise vollständig: Dies wird durch das Beispiel der M(α)-Familie demonstriert, was sich vom klassischen Fall unterscheidet
Beziehung zwischen Vollständigkeit und Struktur der Verteilungsfamilie: Die B(α)-Familie besitzt Vollständigkeit, während die M(α)-Familie dies nicht tut, was die wesentlichen Unterschiede zwischen verschiedenen verallgemeinerten Verteilungsfamilien offenbart
Parameterabhängigkeit der Schätzleistung: Die AED-Analyse zeigt, dass die relative Leistung von Schätzern stark vom Parameterwert abhängt
Erfolgreiche Etablierung einer verallgemeinerten Vollständigkeitstheorie: Bereitstellung eines vollständigen theoretischen Rahmens für verallgemeinerte Likelihoodschätzung und Schließung einer theoretischen Lücke in diesem Bereich
Charakterisierung der Vollständigkeit wichtiger Verteilungsfamilien: Nachweis, dass die B(α)-Familie verallgemeinerte Vollständigkeit besitzt, während die M(α)-Familie dies nicht tut, was theoretische Anleitung für praktische Anwendungen bietet
Erweiterung klassischer Theoreme: Erfolgreiche Verallgemeinerung des Lehmann-Scheffé-Theorems und des Basu-Theorems auf den verallgemeinerten Rahmen
Bereitstellung von Vergleichswerkzeugen für Schätzer: Die AED-Formel bietet quantitative Werkzeuge zum Vergleich verschiedener Schätzer
Regularitätsbedingungen: Theoretische Ergebnisse erfordern eine Reihe von Regularitätsbedingungen, die in praktischen Anwendungen überprüft werden müssen
Rechenkomplexität: Die Berechnung verformter Wahrscheinlichkeitsverteilungen kann in bestimmten Fällen relativ komplex sein
Endliche Stichprobeneigenschaften: Hauptergebnisse basieren auf asymptotischer Theorie; endliche Stichprobeneigenschaften erfordern weitere Forschung
Anwendungsbereich: Derzeit hauptsächlich auf spezifische Verteilungsfamilien ausgerichtet; Erweiterung auf allgemeinere Fälle erfordert weitere Forschung
Theoretische Innovation: Erste systematische Etablierung einer verallgemeinerten Vollständigkeitstheorie, die eine solide theoretische Grundlage für verallgemeinerte Likelihoodschätzung bietet
Mathematische Strenge: Rigorose Beweise, klare Definitionen und vollständige logische Struktur
Praktischer Wert: Theoretische Ergebnisse werden direkt auf die Erlangung verallgemeinerter UMVUE angewendet und haben wichtigen praktischen Wert
Vollständigkeit: Nicht nur positive Ergebnisse (Vollständigkeit der B(α)-Familie), sondern auch negative Ergebnisse durch Gegenbeispiele (Unvollständigkeit der M(α)-Familie)
Anwendungsorientierung: Demonstration der praktischen Anwendung der Theorie durch das Stress-Stärke-Zuverlässigkeitsmodell
Das Papier zitiert 42 wichtige Referenzen, die klassische Arbeiten der Statistiktheorie und neuere Entwicklungen der Divergenztheorie abdecken, hauptsächlich einschließlich:
Fisher (1922): Grundlagen der Statistiktheorie
Lehmann & Scheffé (1950): Vollständigkeitstheorie
Basu (1955, 1998): Statistische Unabhängigkeit und robuste Schätzung
Gesamtbewertung: Dies ist ein hochqualitatives theoretisches Statistikpapier, das ein vollständiges theoretisches System im Rahmen der verallgemeinerten Likelihoodschätzung etabliert. Obwohl die technischen Anforderungen hoch sind, sind die theoretischen Beiträge erheblich und tragen wichtig zur Entwicklung der Statistiktheorie und robuster statistischer Methoden bei. Die mathematische Strenge und theoretische Vollständigkeit des Papiers sind lobenswert und stellen einen wichtigen Fortschritt in diesem Bereich dar.