2025-11-19T14:28:14.187449

On estimation of weighted cumulative residual Tsallis entropy

Chakraborty, Nanda
Recently, weighted cumulative residual Tsallis entropy has been introduced in the literature as a generalization of weighted cumulative residual entropy. We study some new properties of weighted cumulative residual Tsallis entropy measure. Next, we propose some non-parametric estimators of this measure. Asymptotic properties of these estimators are discussed. Performance of these estimators are compared by mean squared error. Non-parametric estimators for weighted cumulative residual entropy measure are also discussed. Two uniformity tests are proposed based on an estimator of these two measures and power of the tests are compared with some popular tests. The tests perform reasonably well.
academic

О оценке взвешенной кумулятивной остаточной энтропии Цаллиса

Основная информация

  • ID статьи: 2510.12442
  • Название: On estimation of weighted cumulative residual Tsallis entropy
  • Авторы: Siddhartha Chakraborty, Asok K. Nanda (Indian Institute of Science Education and Research Kolkata)
  • Классификация: math.ST stat.TH (Теория статистики)
  • Дата публикации: 14 октября 2025 г.
  • Ссылка на статью: https://arxiv.org/abs/2510.12442

Аннотация

В данной работе исследуется взвешенная кумулятивная остаточная энтропия Цаллиса (WCRTE) как обобщение взвешенной кумулятивной остаточной энтропии. Статья рассматривает новые свойства меры WCRTE, предлагает несколько непараметрических оценок этой меры и обсуждает асимптотические свойства этих оценок. Производительность оценок сравнивается через среднеквадратическую ошибку, а также обсуждается непараметрическая оценка меры взвешенной кумулятивной остаточной энтропии (WCRE). На основе оценок этих двух мер предложены два теста на однородность и сравнена мощность тестов с некоторыми популярными методами.

Исследовательский контекст и мотивация

Предпосылки проблемы

  1. Основы теории информации: Энтропия Шеннона как центральное понятие теории информации имеет важные приложения в различных областях, но её дифференциальная форма имеет ограничения (может быть отрицательной, не определена для распределений без плотности и т.д.)
  2. Развитие кумулятивной остаточной энтропии: Кумулятивная остаточная энтропия (CRE), предложенная Рао и др. (2004), преодолевает недостатки дифференциальной энтропии, используя функцию выживания вместо функции плотности и обладает лучшими свойствами
  3. Обобщение энтропии Цаллиса: Обобщённая энтропия, предложенная Цаллисом (1988), является важным расширением энтропии Шеннона с параметром α, который вырождается в энтропию Шеннона при α→1
  4. Необходимость взвешенных информационных мер: В практических приложениях необходимо учитывать не только вероятностную информацию событий, но и их полезность или важность, что требует введения весовых функций

Исследовательская мотивация

Основная мотивация данной работы:

  1. Глубокое изучение теоретических свойств меры WCRTE
  2. Разработка эффективных непараметрических методов оценки
  3. Предоставление практических инструментов для статистического вывода (например, тестов на однородность)

Основные вклады

  1. Теоретические вклады:
    • Доказаны достаточные условия существования WCRTE (при α>1 требуется существование второго момента)
    • Предоставлены нижние границы оценки WCRTE
    • Даны эквивалентные представления WCRTE
  2. Методы оценки:
    • Предложены четыре непараметрические оценки WCRTE
    • Разработаны соответствующие оценки для WCRE
    • Доказаны состоятельность и асимптотическая нормальность оценок
  3. Статистические приложения:
    • Построены тесты на однородность на основе оценок WCRTE и WCRE
    • Проведено сравнение производительности различных оценок через моделирование
    • Проверена эффективность новых методов тестирования

Подробное описание методов

Определение основных концепций

Взвешенная кумулятивная остаточная энтропия Цаллиса (WCRTE) определяется как:

ξ^w_α(X) = 1/(α-1) ∫₀^∞ x[F̄(x) - F̄^α(x)]dx, 0 < α ≠ 1

где F̄(x) — функция выживания, x — линейная весовая функция.

Ключевые свойства:

  • При α→1 вырождается в взвешенную кумулятивную остаточную энтропию (WCRE)
  • При α=2 связана с коэффициентом различия Джини
  • Обладает свойством масштабного преобразования: ξ^w_α(θX) = θ²ξ^w_α(X)

Конструкция оценок

1. Базовая оценка

Оценка на основе эмпирической функции распределения:

ξ̂^w_α(X) = 1/(2(α-1)) Σᵢ₌₁^(n-1) (X²₍ᵢ₊₁₎ - X²₍ᵢ₎)[(1-i/n) - (1-i/n)^α]

2. Оценка типа Васичека

ξ^w_αV = 1/(4m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)[1-i/n - (1-i/n)^α]

3. Оценка типа Эбрахими

Введение весовой функции Cᵢ для улучшения оценки экстремальных точек:

ξ^w_αE = 1/(2m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/Cᵢ [1-i/n - (1-i/n)^α]

4. Улучшенная оценка

ξ^w_αN = 1/(m(α-1)) Σᵢ₌₁ⁿ (X²₍ᵢ₊ₘ₎ - X²₍ᵢ₋ₘ₎)/C²ᵢ [1-i/n - (1-i/n)^α]

5. Линейная комбинированная оценка

ξ^w_αL = 1/(2(α-1)) · 1/n Σᵢ₌₁ⁿ X²₍ᵢ₎[1 - α(1-i/n)^(α-1)]

Асимптотические свойства

Состоятельность: Все предложенные оценки являются состоятельными при надлежащих условиях.

Асимптотическая нормальность: Для оценки ξ^w_αL имеет место:

√n(ξ^w_αL - ξ^w_α(X)) →ᵈ N(0, σ²)

где выражение для σ² дано, и предоставлена его состоятельная оценка.

Экспериментальная установка

Наборы данных

Данные моделирования генерируются из следующих теоретических распределений:

  1. Экспоненциальное распределение: Exp(1), Exp(2)
  2. Равномерное распределение: U(0,1)
  3. Распределение Вейбулла: WE(2,1) (т.е. распределение Рэлея)

Показатели оценки

  • Смещение (Bias): Eθ̂ - θ
  • Среднеквадратическая ошибка (MSE): E(θ̂ - θ)²

Параметры эксперимента

  • Размер выборки: n = 10, 20, 30
  • Параметр Цаллиса: α = 2 (основной выбор, так как при α>1 условия существования WCRTE менее строгие)
  • Размер окна: m = 1, 2, ..., ⌊n/2⌋-1
  • Количество повторений моделирования: 10 000

Результаты экспериментов

Основные результаты

1. Сравнение базовых оценок

Для оценок, не требующих параметра окна ξ̂^w_α(X) и ξ^w_αL:

  • На распределениях Exp(1) и Exp(2) оценка ξ^w_αL показывает лучшие результаты
  • На распределениях U(0,1) и WE(2,1) оценка ξ̂^w_α(X) немного лучше, но различия незначительны
  • С увеличением размера выборки смещение и MSE значительно снижаются

2. Производительность оценок, зависящих от окна

Из результатов моделирования видно:

  • ξ^w_αN показывает лучшую производительность: в большинстве случаев имеет минимальное значение MSE
  • ξ^w_αV показывает худшую производительность: но наименее чувствительна к размеру окна m
  • ξ^w_αE занимает промежуточное положение: производительность находится между двумя предыдущими

3. Рекомендации по выбору размера окна

На основе результатов моделирования предоставлены рекомендации по выбору размера окна:

  • Для ξ^w_αV и ξ^w_αE: выбирать m=n/2-1 при n≤20; выбирать m=n/3 при n=30
  • Для ξ^w_αN: выбирать m=n/4+1

Результаты теста на однородность

Статистика теста

На основе оценок WCRTE и WCRE построены тесты на однородность, сравненные со следующими методами:

  • Тест Колмогорова-Смирнова (KS)
  • Тест Крамера-фон Мизеса (CvM)
  • Тест Андерсона-Дарлинга (AD)
  • Тест энтропии Васичека (ENT)

Сравнение мощности

Мощность тестов при семи типах альтернативных гипотез показывает:

  • Для альтернатив типа Aⱼ (сдвиг среднего) предложенный тест показывает лучшие результаты
  • Для альтернатив типа Bⱼ (уменьшение дисперсии) тест ENT более эффективен
  • Для альтернатив типа Cⱼ (увеличение дисперсии) предложенный тест значительно превосходит другие методы
  • Тест WCRTE (α=2) в целом превосходит тест WCRE (α→1)

Связанные работы

Развитие мер энтропии

  1. Энтропия Шеннона (1948): Основание теории информации
  2. Энтропия Цаллиса (1988): Обобщение неаддитивной статистической механики
  3. Кумулятивная остаточная энтропия (Рао и др. 2004): Преодоление ограничений дифференциальной энтропии
  4. Взвешенная энтропия (Белис и Гиасу 1968): Учёт полезности событий
  5. WCRTE (Чакраборти и Прадхан 2023): Объект исследования данной работы

Развитие методов оценки

  • Метод Васичека (1976): Оценка энтропии на основе наклона
  • Улучшение Эбрахими (1994): Введение весовой функции для улучшения оценки экстремальных точек
  • Данная работа предлагает новые улучшенные методы на этой основе

Заключение и обсуждение

Основные выводы

  1. Теоретическое совершенствование: Установлена полная теоретическая база WCRTE, включая условия существования, оценки границ и т.д.
  2. Методы оценки: Предложены различные эффективные непараметрические оценки, среди которых ξ^w_αN показывает лучшую комплексную производительность
  3. Статистические приложения: Разработанный тест на однородность показывает отличные результаты при определённых типах альтернативных гипотез

Ограничения

  1. Выбор параметров: Выбор размера окна m всё ещё требует корректировки в зависимости от типа распределения и размера выборки
  2. Вычислительная сложность: Некоторые оценки довольно чувствительны к параметру окна
  3. Теоретический анализ: Полное асимптотическое распределение дано только для одной оценки

Направления будущих исследований

  1. Разработка методов адаптивного выбора размера окна
  2. Расширение на многомерный случай
  3. Исследование приложений к другим задачам статистического вывода

Глубокая оценка

Преимущества

  1. Прочная теоретическая база: Предоставлен полный теоретический анализ, включая существование, состоятельность и асимптотическую нормальность
  2. Сильная методологическая новизна: На основе классических методов Васичека и Эбрахими предложены существенные улучшения
  3. Полный план экспериментов: Всесторонняя оценка производительности методов через моделирование на различных распределениях и размерах выборок
  4. Ясная практическая ценность: Тест на однородность имеет практическое статистическое значение
  5. Ясное и строгое изложение: Детальные математические выводы и полное представление результатов экспериментов

Недостатки

  1. Неравномерный теоретический анализ: Асимптотическое распределение дано только для ξ^w_αL, теоретический анализ других оценок относительно слаб
  2. Ограниченные вычислительные рекомендации: Хотя даны эмпирические формулы для выбора окна, им не хватает теоретического обоснования
  3. Узкий спектр приложений: Рассмотрен только тест на однородность, другие задачи статистического вывода не исследованы
  4. Ограниченная база сравнения: При сравнении оценок отсутствует сравнение с другими методами оценки энтропии

Влияние

  1. Академическая ценность: Предоставляет новые теоретические инструменты для пересечения теории информации и статистики
  2. Практическая ценность: Предложенные оценки и методы тестирования могут быть непосредственно применены в анализе данных
  3. Воспроизводимость: Экспериментальная установка ясна, результаты легко воспроизводятся

Сценарии применения

  1. Анализ надёжности: Использование взвешенных характеристик для анализа рисков тяжёлых хвостов
  2. Контроль качества: Тест на однородность имеет важное применение при проверке генераторов случайных чисел
  3. Измерение информации: Сценарии измерения информации, где необходимо учитывать важность наблюдаемых значений

Библиография

Статья цитирует 28 соответствующих работ, охватывающих важные исследования в теории информации, статистике и теории надёжности, обеспечивая прочную теоретическую базу. Ключевые цитируемые работы включают основополагающую работу Шеннона (1948) по теории информации, обобщение энтропии Цаллисом (1988), теорию кумулятивной остаточной энтропии Рао и др. (2004) и другие.


Общая оценка: Это высококачественная статья по теории статистики, которая вносит существенный вклад в область взвешенных информационных мер. Теоретический анализ строг, план экспериментов полон, работа имеет хорошую академическую ценность и перспективы применения.