The Pitfalls of Continuous Heavy-Tailed Distributions in High-Frequency Data Analysis
Holý
We address the challenges of modeling high-frequency integer price changes in financial markets using continuous distributions, particularly the Student's t-distribution. We demonstrate that traditional GARCH models, which rely on continuous distributions, are ill-suited for high-frequency data due to the discreteness of price changes. We propose a modification to the maximum likelihood estimation procedure that accounts for the discrete nature of observations while still using continuous distributions. Our approach involves modeling the log-likelihood in terms of intervals corresponding to the rounding of continuous price changes to the nearest integer. The findings highlight the importance of adjusting for discreteness in volatility analysis and provide a framework for incroporating any continuous distribution for modeling high-frequency prices.
academic
Ловушки непрерывных распределений с тяжелыми хвостами в анализе высокочастотных данных
В данной работе исследуются проблемы использования непрерывных распределений (в частности, распределения Стьюдента) для моделирования высокочастотных целочисленных изменений цен на финансовых рынках. Автор доказывает, что традиционные модели GARCH непригодны для анализа высокочастотных данных из-за дискретности изменений цен. В статье предложен модифицированный метод максимального правдоподобия, который учитывает дискретный характер наблюдений при использовании непрерывных распределений. Метод моделирует функцию логарифма правдоподобия путем округления непрерывных изменений цен до интервалов, соответствующих ближайшему целому числу. Результаты исследования подчеркивают важность корректировки дискретности при анализе волатильности и предоставляют основу для применения любого непрерывного распределения к моделированию высокочастотных цен.
Основная проблема: Традиционные модели GARCH, использующие непрерывные распределения (такие как распределение Стьюдента) для моделирования высокочастотных финансовых данных, имеют фундаментальные недостатки
Конкретные проявления: Когда изменения цен являются целыми числами и нулевые значения часто встречаются, распределение Стьюдента вырождается в форму ⊥, с плотностью, сосредоточенной в единственной точке 0, с чрезвычайно тяжелыми хвостами
Практическое влияние: Это вырождение приводит к взрыву функции правдоподобия, отказу оценки параметров и бессмысленным или даже вводящим в заблуждение результатам модели
Традиционные модели GARCH: Предполагают непрерывность изменений цен, игнорируя дискретный характер высокочастотных данных
Существующие дискретные модели: Основаны главным образом на распределении Скеллама, что ограничивает гибкость выбора распределения
Проблемы с программным обеспечением: Несколько пакетов R устанавливают искусственные нижние границы для параметра степеней свободы, скрывая истинные проблемы оптимизации
Предупреждающая функция: Четко указывает на непригодность стандартных моделей GARCH с распределениями с тяжелыми хвостами для высокочастотных данных
Теоретическое новшество: Предлагает метод интервального максимального правдоподобия, рассматривая целочисленные наблюдения как округленные непрерывные значения
Методологическая основа: Устанавливает основу для моделирования высокочастотных цен, применимую к любому непрерывному распределению
Эмпирическая проверка: Проверяет эффективность метода на эмпирическом анализе нескольких акций
Рассматривать целочисленное наблюдение y как результат округления непрерывного значения до ближайшего целого числа, то есть y соответствует интервалу (y-0.5, y+0.5].
Теоретический вывод: Распределение Стьюдента непригодно для моделирования целочисленных изменений цен с частыми нулевыми значениями
Методологический вывод: Интервальное максимальное правдоподобие эффективно решает проблему моделирования дискретных данных с непрерывными распределениями
Практический вывод: Метод показывает отличную производительность на относительно низкочастотных (1 минута) данных; высокочастотные данные требуют более сложных распределений
В статье цитируются важные работы в области финансовой эконометрики, анализа высокочастотных данных и моделирования временных рядов, включая:
Engle (1982, 2000, 2002) — основы моделей GARCH и анализа высокочастотных данных
Creal et al. (2013) — теория моделей, управляемых оценками
Koopman et al. (2017, 2018) — динамическое моделирование дискретных изменений цен
Holý (2024) — связанные исследования дискретных моделей GARCH
Общая оценка: Данная работа предоставляет простое и эффективное решение для важной, но упущенной практической проблемы и обладает высокой практической ценностью. Хотя она имеет некоторые недостатки в глубине теоретического анализа, ее эмпирическое исследование достаточно полно, выводы надежны, и она вносит значительный вклад в область анализа высокочастотных финансовых данных.