2025-11-19T14:28:14.187449

On estimation of weighted cumulative residual Tsallis entropy

Chakraborty, Nanda
Recently, weighted cumulative residual Tsallis entropy has been introduced in the literature as a generalization of weighted cumulative residual entropy. We study some new properties of weighted cumulative residual Tsallis entropy measure. Next, we propose some non-parametric estimators of this measure. Asymptotic properties of these estimators are discussed. Performance of these estimators are compared by mean squared error. Non-parametric estimators for weighted cumulative residual entropy measure are also discussed. Two uniformity tests are proposed based on an estimator of these two measures and power of the tests are compared with some popular tests. The tests perform reasonably well.
academic

Sur l'estimation de l'entropie de Tsallis résiduelle cumulative pondérée

Informations fondamentales

  • ID de l'article : 2510.12442
  • Titre : On estimation of weighted cumulative residual Tsallis entropy
  • Auteurs : Siddhartha Chakraborty, Asok K. Nanda (Indian Institute of Science Education and Research Kolkata)
  • Classification : math.ST stat.TH (Théorie statistique)
  • Date de publication : 14 octobre 2025
  • Lien de l'article : https://arxiv.org/abs/2510.12442

Résumé

Cet article étudie l'entropie de Tsallis résiduelle cumulative pondérée (WCRTE) comme généralisation de l'entropie résiduelle cumulative pondérée. L'article explore les nouvelles propriétés de la mesure WCRTE, propose plusieurs estimateurs non paramétriques de cette mesure et discute des propriétés asymptotiques de ces estimateurs. Les performances des estimateurs sont comparées par l'erreur quadratique moyenne, tandis que l'estimation non paramétrique de la mesure d'entropie résiduelle cumulative pondérée (WCRE) est également discutée. Deux tests d'uniformité basés sur les estimateurs de ces deux mesures sont proposés et leur puissance est comparée avec plusieurs méthodes de test populaires.

Contexte et motivation de la recherche

Contexte du problème

  1. Fondements de la théorie de l'information : L'entropie de Shannon, concept fondamental de la théorie de l'information, a des applications importantes dans plusieurs domaines, mais sa forme d'entropie différentielle présente des limitations (peut être négative, ne peut pas être définie pour les distributions sans densité, etc.)
  2. Développement de l'entropie résiduelle cumulative : L'entropie résiduelle cumulative (CRE) proposée par Rao et al. (2004) surmonte les défauts de l'entropie différentielle en utilisant la fonction de survie au lieu de la fonction de densité, avec de meilleures propriétés
  3. Généralisation de l'entropie de Tsallis : L'entropie généralisée proposée par Tsallis (1988) est une généralisation importante de l'entropie de Shannon, avec un paramètre α qui dégénère en entropie de Shannon lorsque α→1
  4. Besoin de mesures d'information pondérées : Dans les applications pratiques, il est nécessaire de considérer non seulement l'information probabiliste des événements, mais aussi l'utilité ou l'importance des événements, d'où l'introduction de fonctions de poids

Motivation de la recherche

Les principales motivations de cet article sont :

  1. Étudier en profondeur les propriétés théoriques de la mesure WCRTE
  2. Développer des méthodes d'estimation non paramétriques efficaces
  3. Fournir des outils pratiques pour l'inférence statistique (comme les tests d'uniformité)

Contributions principales

  1. Contributions théoriques :
    • Établissement des conditions suffisantes d'existence de WCRTE (existence du moment d'ordre deux lorsque α>1)
    • Fourniture d'estimations de bornes inférieures pour WCRTE
    • Présentation de formes de représentation équivalentes de WCRTE
  2. Méthodes d'estimation :
    • Proposition de quatre estimateurs non paramétriques de WCRTE
    • Développement des estimateurs correspondants pour WCRE
    • Preuve de la cohérence et de la normalité asymptotique des estimateurs
  3. Applications statistiques :
    • Construction de tests d'uniformité basés sur les estimateurs WCRTE et WCRE
    • Comparaison des performances de différents estimateurs par simulation
    • Validation de l'efficacité des nouvelles méthodes de test

Explication détaillée des méthodes

Définitions des concepts fondamentaux

L'entropie de Tsallis résiduelle cumulative pondérée (WCRTE) est définie comme :

ξ^w_α(X) = 1/(α-1) ∫₀^∞ x[F̄(x) - F̄^α(x)]dx, 0 < α ≠ 1

où F̄(x) est la fonction de survie et x est la fonction de poids linéaire.

Propriétés clés :

  • Dégénère en entropie résiduelle cumulative pondérée (WCRE) lorsque α→1
  • Liée à la différence moyenne de Gini lorsque α=2
  • Possède la propriété de transformation d'échelle : ξ^w_α(θX) = θ²ξ^w_α(X)

Conception des estimateurs

1. Estimateur fondamental

Estimateur basé sur la fonction de distribution empirique :

ξ̂^w_α(X) = 1/(2(α-1)) Σᵢ₌₁^(n-1) (X²₍ᵢ₊₁₎ - X²₍ᵢ₎)[(1-i/n) - (1-i/n)^α]

2. Estimateur de type Vasicek

ξ^w_αV = 1/(4m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)[1-i/n - (1-i/n)^α]

3. Estimateur de type Ebrahimi

Introduction d'une fonction de poids Cᵢ pour améliorer l'estimation des points extrêmes :

ξ^w_αE = 1/(2m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/Cᵢ [1-i/n - (1-i/n)^α]

4. Estimateur amélioré

ξ^w_αN = 1/(m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/C²ᵢ [1-i/n - (1-i/n)^α]

5. Estimateur de combinaison linéaire

ξ^w_αL = 1/(2(α-1)) · 1/n Σᵢ₌₁ⁿ X²₍ᵢ₎[1 - α(1-i/n)^(α-1)]

Propriétés asymptotiques

Cohérence : Tous les estimateurs proposés sont cohérents sous des conditions appropriées.

Normalité asymptotique : Pour l'estimateur ξ^w_αL, on a :

√n(ξ^w_αL - ξ^w_α(X)) →ᵈ N(0, σ²)

où l'expression de σ² est donnée et un estimateur cohérent est fourni.

Configuration expérimentale

Ensembles de données

Les données de simulation sont générées à partir des distributions théoriques suivantes :

  1. Distribution exponentielle : Exp(1), Exp(2)
  2. Distribution uniforme : U(0,1)
  3. Distribution de Weibull : WE(2,1) (c'est-à-dire distribution de Rayleigh)

Indicateurs d'évaluation

  • Biais (Bias) : Eθ̂ - θ
  • Erreur quadratique moyenne (MSE) : E(θ̂ - θ)²

Paramètres expérimentaux

  • Taille d'échantillon : n = 10, 20, 30
  • Paramètre de Tsallis : α = 2 (choix principal, car la condition d'existence de WCRTE est plus faible lorsque α>1)
  • Taille de fenêtre : m = 1, 2, ..., ⌊n/2⌋-1
  • Nombre de simulations : 10 000

Résultats expérimentaux

Résultats principaux

1. Comparaison des estimateurs fondamentaux

Pour les estimateurs ne nécessitant pas de paramètre de fenêtre ξ̂^w_α(X) et ξ^w_αL :

  • Sous les distributions Exp(1) et Exp(2), ξ^w_αL montre de meilleures performances
  • Sous les distributions U(0,1) et WE(2,1), ξ̂^w_α(X) est légèrement supérieur, mais la différence est mineure
  • Avec l'augmentation de la taille d'échantillon, le biais et l'EQM diminuent significativement

2. Performance des estimateurs dépendant de la fenêtre

Les résultats de simulation montrent :

  • ξ^w_αN présente les meilleures performances : possède l'EQM minimal dans la plupart des cas
  • ξ^w_αV présente les pires performances : mais est le moins sensible à la taille de fenêtre m
  • ξ^w_αE se situe au milieu : les performances sont intermédiaires

3. Recommandations pour le choix de la taille de fenêtre

Basées sur les résultats de simulation, des recommandations pour le choix de la taille de fenêtre sont fournies :

  • Pour ξ^w_αV et ξ^w_αE : choisir m=n/2-1 lorsque n≤20 ; choisir m=n/3 lorsque n=30
  • Pour ξ^w_αN : choisir m=n/4+1

Résultats des tests d'uniformité

Statistiques de test

Des tests d'uniformité basés sur les estimateurs WCRTE et WCRE ont été construits et comparés avec les méthodes suivantes :

  • Test de Kolmogorov-Smirnov (KS)
  • Test de Cramer-von Mises (CvM)
  • Test d'Anderson-Darling (AD)
  • Test d'entropie de Vasicek (ENT)

Comparaison de la puissance

La puissance de test sous sept distributions alternatives montre :

  • Pour les alternatives de type Aⱼ (décalage de moyenne), les tests proposés présentent les meilleures performances
  • Pour les alternatives de type Bⱼ (réduction de variance), le test ENT est supérieur
  • Pour les alternatives de type Cⱼ (augmentation de variance), les tests proposés surpassent significativement les autres méthodes
  • Le test WCRTE (α=2) est globalement supérieur au test WCRE (α→1)

Travaux connexes

Évolution des mesures d'entropie

  1. Entropie de Shannon (1948) : Fondements de la théorie de l'information
  2. Entropie de Tsallis (1988) : Généralisation de la mécanique statistique non-additive
  3. Entropie résiduelle cumulative (Rao et al. 2004) : Surmonte les limitations de l'entropie différentielle
  4. Entropie pondérée (Belis & Guiasu 1968) : Considère l'utilité des événements
  5. WCRTE (Chakraborty & Pradhan 2023) : Objet d'étude du présent article

Évolution des méthodes d'estimation

  • Méthode de Vasicek (1976) : Estimation d'entropie basée sur l'estimation de pente
  • Amélioration d'Ebrahimi (1994) : Introduction de fonctions de poids pour améliorer l'estimation des points extrêmes
  • Le présent article propose de nouvelles méthodes d'amélioration sur cette base

Conclusions et discussion

Conclusions principales

  1. Perfectionnement théorique : Établissement d'un cadre théorique complet pour WCRTE, incluant les conditions d'existence et les estimations de bornes
  2. Méthodes d'estimation : Proposition de plusieurs estimateurs non paramétriques efficaces, parmi lesquels ξ^w_αN présente les meilleures performances globales
  3. Applications statistiques : Les tests d'uniformité développés présentent des performances excellentes sous certains types d'alternatives

Limitations

  1. Sélection de paramètres : Le choix de la taille de fenêtre m nécessite toujours un ajustement selon le type de distribution et la taille d'échantillon
  2. Complexité de calcul : Certains estimateurs sont relativement sensibles au paramètre de fenêtre
  3. Analyse théorique : Seul un estimateur bénéficie d'une analyse complète de la distribution asymptotique

Directions futures

  1. Développement de méthodes de sélection de fenêtre adaptatives
  2. Extension au cas multidimensionnel
  3. Étude des applications à d'autres problèmes d'inférence statistique

Évaluation approfondie

Points forts

  1. Contributions théoriques solides : Fourniture d'une analyse théorique complète, incluant l'existence, la cohérence et la normalité asymptotique
  2. Forte innovativité des méthodes : Propositions d'améliorations substantielles basées sur les méthodes classiques de Vasicek et Ebrahimi
  3. Conception expérimentale complète : Évaluation complète des performances des méthodes par simulation sur plusieurs distributions et tailles d'échantillon
  4. Valeur d'application claire : Les tests d'uniformité possèdent une signification statistique pratique
  5. Rédaction claire et rigoureuse : Dérivations mathématiques détaillées et présentation suffisante des résultats expérimentaux

Insuffisances

  1. Analyse théorique déséquilibrée : Seul ξ^w_αL bénéficie d'une distribution asymptotique, l'analyse théorique des autres estimateurs est relativement faible
  2. Orientation de calcul limitée : Bien que des formules empiriques pour le choix de fenêtre soient fournies, elles manquent de justification théorique
  3. Scénarios d'application uniques : Seuls les tests d'uniformité sont considérés, sans exploration d'autres problèmes d'inférence statistique
  4. Comparaisons de référence limitées : Dans la comparaison des estimateurs, manque de comparaison avec d'autres méthodes d'estimation d'entropie

Impact

  1. Valeur académique : Fourniture de nouveaux outils théoriques pour le domaine d'intersection entre la théorie de l'information et la statistique
  2. Valeur pratique : Les estimateurs et méthodes de test proposés peuvent être directement appliqués à l'analyse de données
  3. Reproductibilité : Configuration expérimentale claire, résultats faciles à reproduire

Scénarios d'application

  1. Analyse de fiabilité : Utilisation des caractéristiques pondérées pour analyser les risques de queue lourde
  2. Contrôle de qualité : Les tests d'uniformité ont des applications importantes dans la vérification de la génération de nombres aléatoires
  3. Mesure d'information : Dans les scénarios de mesure d'information nécessitant de considérer l'importance des valeurs observées

Références bibliographiques

L'article cite 28 références connexes, couvrant les travaux importants en théorie de l'information, statistique et théorie de la fiabilité, fournissant une base théorique solide à la recherche. Les références clés incluent les travaux fondateurs de Shannon (1948) en théorie de l'information, la généralisation d'entropie de Tsallis (1988), la théorie d'entropie résiduelle cumulative de Rao et al. (2004), etc.


Évaluation globale : Cet article est un travail théorique statistique de haute qualité qui apporte des contributions substantielles dans le domaine des mesures d'information pondérées. L'analyse théorique est rigoureuse, la conception expérimentale est complète, et il possède une bonne valeur académique et des perspectives d'application prometteuses.