2025-11-19T14:28:14.187449

On estimation of weighted cumulative residual Tsallis entropy

Chakraborty, Nanda
Recently, weighted cumulative residual Tsallis entropy has been introduced in the literature as a generalization of weighted cumulative residual entropy. We study some new properties of weighted cumulative residual Tsallis entropy measure. Next, we propose some non-parametric estimators of this measure. Asymptotic properties of these estimators are discussed. Performance of these estimators are compared by mean squared error. Non-parametric estimators for weighted cumulative residual entropy measure are also discussed. Two uniformity tests are proposed based on an estimator of these two measures and power of the tests are compared with some popular tests. The tests perform reasonably well.
academic

Zur Schätzung der gewichteten kumulativen residualen Tsallis-Entropie

Grundinformationen

  • Papier-ID: 2510.12442
  • Titel: On estimation of weighted cumulative residual Tsallis entropy
  • Autoren: Siddhartha Chakraborty, Asok K. Nanda (Indian Institute of Science Education and Research Kolkata)
  • Klassifizierung: math.ST stat.TH (Statistiktheorie)
  • Veröffentlichungsdatum: 14. Oktober 2025
  • Papierlink: https://arxiv.org/abs/2510.12442

Zusammenfassung

Dieses Papier untersucht die gewichtete kumulative residuale Tsallis-Entropie (WCRTE) als Verallgemeinerung der gewichteten kumulativen residualen Entropie. Der Artikel erörtert neue Eigenschaften des WCRTE-Maßes, schlägt mehrere nichtparametrische Schätzer für dieses Maß vor und diskutiert deren asymptotische Eigenschaften. Die Leistung der Schätzer wird durch Vergleich des mittleren quadratischen Fehlers verglichen, während auch die nichtparametrische Schätzung des gewichteten kumulativen residualen Entropie-Maßes (WCRE) erörtert wird. Basierend auf Schätzern dieser beiden Maße werden zwei Uniformitätstests vorgeschlagen und deren Teststärke mit einigen populären Testmethoden verglichen.

Forschungshintergrund und Motivation

Problemhintergrund

  1. Informationstheoretische Grundlagen: Die Shannon-Entropie als Kernkonzept der Informationstheorie hat wichtige Anwendungen in mehreren Bereichen, aber ihre differentielle Entropieform hat Einschränkungen (kann negativ sein, kann nicht auf Verteilungen ohne Dichte definiert werden, etc.)
  2. Entwicklung der kumulativen residualen Entropie: Die von Rao et al. (2004) eingeführte kumulative residuale Entropie (CRE) überwindet die Mängel der differentiellen Entropie, indem sie die Überlebensfunktion anstelle der Dichtefunktion verwendet und bessere Eigenschaften aufweist
  3. Verallgemeinerung der Tsallis-Entropie: Die von Tsallis (1988) eingeführte verallgemeinerte Entropie ist eine wichtige Verallgemeinerung der Shannon-Entropie mit Parameter α, der sich zur Shannon-Entropie degeneriert, wenn α→1
  4. Bedarf an gewichteten Informationsmaßen: In praktischen Anwendungen ist es notwendig, nicht nur die Wahrscheinlichkeitsinformation von Ereignissen zu berücksichtigen, sondern auch deren Nutzen oder Bedeutung, daher werden Gewichtungsfunktionen eingeführt

Forschungsmotivation

Die Hauptmotivationen dieses Papiers sind:

  1. Tiefgehende Untersuchung der theoretischen Eigenschaften des WCRTE-Maßes
  2. Entwicklung effektiver nichtparametrischer Schätzmethoden
  3. Bereitstellung praktischer Werkzeuge für statistische Inferenz (z.B. Uniformitätstests)

Kernbeiträge

  1. Theoretische Beiträge:
    • Beweis hinreichender Bedingungen für die Existenz von WCRTE (wenn α>1, ist das zweite Moment erforderlich)
    • Bereitstellung von Untergrenzen für WCRTE
    • Äquivalente Darstellungsformen von WCRTE
  2. Schätzmethoden:
    • Vorschlag von vier nichtparametrischen Schätzern für WCRTE
    • Entwicklung entsprechender Schätzer für WCRE
    • Beweis der Konsistenz und asymptotischen Normalität der Schätzer
  3. Statistische Anwendungen:
    • Konstruktion von Uniformitätstests basierend auf WCRTE und WCRE
    • Vergleich der Leistung verschiedener Schätzer durch Simulation
    • Validierung der Effektivität neuer Testmethoden

Methodische Details

Definitionen von Kernkonzepten

Gewichtete kumulative residuale Tsallis-Entropie (WCRTE) ist definiert als:

ξ^w_α(X) = 1/(α-1) ∫₀^∞ x[F̄(x) - F̄^α(x)]dx, 0 < α ≠ 1

wobei F̄(x) die Überlebensfunktion ist und x die lineare Gewichtungsfunktion ist.

Schlüsseleigenschaften:

  • Degeneriert zur gewichteten kumulativen residualen Entropie (WCRE), wenn α→1
  • Bezieht sich auf die Gini-Mitteldifferenz, wenn α=2
  • Besitzt Skalentransformationseigenschaft: ξ^w_α(θX) = θ²ξ^w_α(X)

Schätzerkonstruktion

1. Basis-Schätzer

Schätzer basierend auf der empirischen Verteilungsfunktion:

ξ̂^w_α(X) = 1/(2(α-1)) Σᵢ₌₁^(n-1) (X²₍ᵢ₊₁₎ - X²₍ᵢ₎)[(1-i/n) - (1-i/n)^α]

2. Vasicek-Typ-Schätzer

ξ^w_αV = 1/(4m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)[1-i/n - (1-i/n)^α]

3. Ebrahimi-Typ-Schätzer

Einführung einer Gewichtungsfunktion Cᵢ zur Verbesserung der Schätzung extremer Punkte:

ξ^w_αE = 1/(2m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/Cᵢ [1-i/n - (1-i/n)^α]

4. Verbesserter Schätzer

ξ^w_αN = 1/(m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/C²ᵢ [1-i/n - (1-i/n)^α]

5. Linearer Kombinationsschätzer

ξ^w_αL = 1/(2(α-1)) · 1/n Σᵢ₌₁ⁿ X²₍ᵢ₎[1 - α(1-i/n)^(α-1)]

Asymptotische Eigenschaften

Konsistenz: Alle vorgeschlagenen Schätzer sind unter angemessenen Bedingungen konsistent.

Asymptotische Normalität: Für den Schätzer ξ^w_αL gilt:

√n(ξ^w_αL - ξ^w_α(X)) →ᵈ N(0, σ²)

wobei der Ausdruck für σ² gegeben ist und ein konsistenter Schätzer bereitgestellt wird.

Experimentelle Einrichtung

Datensätze

Simulationsdaten werden aus den folgenden theoretischen Verteilungen generiert:

  1. Exponentialverteilung: Exp(1), Exp(2)
  2. Gleichverteilung: U(0,1)
  3. Weibull-Verteilung: WE(2,1) (d.h. Rayleigh-Verteilung)

Bewertungsmetriken

  • Verzerrung (Bias): Eθ̂ - θ
  • Mittlerer quadratischer Fehler (MSE): E(θ̂ - θ)²

Experimentelle Parameter

  • Stichprobengröße: n = 10, 20, 30
  • Tsallis-Parameter: α = 2 (Hauptwahl, da WCRTE-Existenzbedingungen schwächer sind, wenn α>1)
  • Fenstergröße: m = 1, 2, ..., ⌊n/2⌋-1
  • Simulationen: 10.000 Durchläufe

Experimentelle Ergebnisse

Hauptergebnisse

1. Vergleich von Basis-Schätzern

Für Schätzer, die keinen Fensterparameter benötigen, ξ̂^w_α(X) und ξ^w_αL:

  • Bei Exp(1)- und Exp(2)-Verteilungen zeigt ξ^w_αL bessere Leistung
  • Bei U(0,1)- und WE(2,1)-Verteilungen ist ξ̂^w_α(X) leicht überlegen, aber der Unterschied ist gering
  • Mit zunehmender Stichprobengröße sinken Verzerrung und MSE deutlich

2. Leistung fensterabhängiger Schätzer

Aus den Simulationsergebnissen ist ersichtlich:

  • ξ^w_αN zeigt die beste Leistung: In den meisten Fällen mit minimalem MSE
  • ξ^w_αV zeigt die schlechteste Leistung: Ist aber am wenigsten empfindlich gegenüber Fenstergröße m
  • ξ^w_αE liegt in der Mitte: Leistung liegt zwischen den beiden

3. Richtlinien zur Fenstergrößenauswahl

Basierend auf Simulationsergebnissen werden Empfehlungen zur Fenstergrößenauswahl gegeben:

  • Für ξ^w_αV und ξ^w_αE: Wählen Sie m=n/2-1, wenn n≤20; wählen Sie m=n/3, wenn n=30
  • Für ξ^w_αN: Wählen Sie m=n/4+1

Uniformitätstestergebnisse

Teststatistiken

Basierend auf WCRTE- und WCRE-Schätzern wurden Uniformitätstests konstruiert und mit den folgenden Methoden verglichen:

  • Kolmogorov-Smirnov (KS)-Test
  • Cramer-von Mises (CvM)-Test
  • Anderson-Darling (AD)-Test
  • Vasicek-Entropie-Test (ENT)

Vergleich der Teststärke

Die Teststärke unter 7 Arten von Alternativverteilungen zeigt:

  • Für Aⱼ-Typ-Alternativen (Mittelwertversatz) zeigt der vorgeschlagene Test die beste Leistung
  • Für Bⱼ-Typ-Alternativen (Varianzreduktion) ist der ENT-Test überlegen
  • Für Cⱼ-Typ-Alternativen (Varianzerhöhung) ist der vorgeschlagene Test deutlich besser als andere Methoden
  • Der WCRTE-Test (α=2) ist insgesamt dem WCRE-Test (α→1) überlegen

Verwandte Arbeiten

Entwicklungsverlauf von Entropiemaßen

  1. Shannon-Entropie (1948): Grundlagen der Informationstheorie
  2. Tsallis-Entropie (1988): Verallgemeinerung der nichtadditiven statistischen Mechanik
  3. Kumulative residuale Entropie (Rao et al. 2004): Überwindung der Einschränkungen der differentiellen Entropie
  4. Gewichtete Entropie (Belis & Guiasu 1968): Berücksichtigung des Ereignisnutzens
  5. WCRTE (Chakraborty & Pradhan 2023): Forschungsobjekt dieses Papiers

Entwicklung von Schätzmethoden

  • Vasicek-Methode (1976): Entropieschätzung basierend auf Steigungsschätzung
  • Ebrahimi-Verbesserung (1994): Einführung von Gewichtungsfunktionen zur Verbesserung der Schätzung extremer Punkte
  • Dieses Papier schlägt neue Verbesserungsmethoden auf dieser Grundlage vor

Schlussfolgerungen und Diskussion

Hauptschlussfolgerungen

  1. Theoretische Vervollständigung: Etablierung eines vollständigen theoretischen Rahmens für WCRTE, einschließlich Existenzbedingungen, Grenzschätzungen, etc.
  2. Schätzmethoden: Vorschlag mehrerer effektiver nichtparametrischer Schätzer, wobei ξ^w_αN die beste Gesamtleistung aufweist
  3. Statistische Anwendungen: Der entwickelte Uniformitätstest zeigt unter bestimmten Alternativtypen hervorragende Leistung

Einschränkungen

  1. Parameterauswahl: Die Auswahl der Fenstergröße m muss immer noch je nach Verteilungstyp und Stichprobengröße angepasst werden
  2. Rechenkomplexität: Einige Schätzer sind relativ empfindlich gegenüber dem Fensterparameter
  3. Theoretische Analyse: Nur für einen Schätzer wird eine vollständige asymptotische Verteilung gegeben

Zukünftige Richtungen

  1. Entwicklung adaptiver Fensterauswahlmethoden
  2. Erweiterung auf mehrdimensionale Fälle
  3. Untersuchung von Anwendungen bei anderen statistischen Inferenzproblemen

Tiefgehende Bewertung

Stärken

  1. Solide theoretische Beiträge: Bereitstellung vollständiger theoretischer Analysen, einschließlich Existenz, Konsistenz, asymptotische Normalität
  2. Starke methodische Innovation: Substantielle Verbesserungen auf Grundlage klassischer Vasicek- und Ebrahimi-Methoden
  3. Umfassende Experimentalplanung: Umfassende Bewertung der Methodenleistung durch Simulationen mit mehreren Verteilungen und Stichprobengrößen
  4. Klare Anwendungswerte: Uniformitätstests haben praktische statistische Bedeutung
  5. Klare und strenge Darstellung: Detaillierte mathematische Ableitungen und ausreichende Darstellung von Experimentiergebnissen

Mängel

  1. Unausgewogene theoretische Analyse: Nur für ξ^w_αL wird die asymptotische Verteilung gegeben, die theoretische Analyse anderer Schätzer ist relativ schwach
  2. Begrenzte Rechenhilfe: Obwohl empirische Formeln für die Fensterauswahl gegeben werden, fehlt die theoretische Grundlage
  3. Einzelne Anwendungsszenarien: Nur Uniformitätstests werden berücksichtigt, andere statistische Inferenzprobleme werden nicht untersucht
  4. Begrenzte Vergleichsgrundlagen: Bei Schätzvergleichen fehlt der Vergleich mit anderen Entropieschätzmethoden

Einfluss

  1. Akademischer Wert: Bereitstellung neuer theoretischer Werkzeuge für das Schnittstellengebiet von Informationstheorie und Statistik
  2. Praktischer Wert: Die vorgeschlagenen Schätzer und Testmethoden können direkt auf Datenanalyse angewendet werden
  3. Reproduzierbarkeit: Experimentelle Einrichtung ist klar, Ergebnisse sind leicht zu reproduzieren

Anwendungsszenarien

  1. Zuverlässigkeitsanalyse: Nutzung der Gewichtungseigenschaften zur Analyse von Schwanzrisiken
  2. Qualitätskontrolle: Uniformitätstests haben wichtige Anwendungen bei der Validierung der Zufallszahlengenerierung
  3. Informationsmessung: In Szenarien, in denen die Bedeutung von Beobachtungswerten berücksichtigt werden muss

Literaturverzeichnis

Das Papier zitiert 28 verwandte Literaturquellen, die wichtige Arbeiten in Informationstheorie, Statistik und Zuverlässigkeitstheorie abdecken und eine solide theoretische Grundlage für die Forschung bieten. Wichtige Literaturquellen umfassen Shannons (1948) grundlegende Arbeiten zur Informationstheorie, Tsallis' (1988) Entropieverallgemeinerung, Raos et al. (2004) Theorie der kumulativen residualen Entropie, etc.


Gesamtbewertung: Dies ist ein hochqualitatives statistiktheoretisches Papier, das substantielle Beiträge zum Gebiet der gewichteten Informationsmaße leistet. Die theoretische Analyse ist streng, die Experimentalplanung ist umfassend und es hat gute akademische Werte und Anwendungsperspektiven.