The Pitfalls of Continuous Heavy-Tailed Distributions in High-Frequency Data Analysis
Holý
We address the challenges of modeling high-frequency integer price changes in financial markets using continuous distributions, particularly the Student's t-distribution. We demonstrate that traditional GARCH models, which rely on continuous distributions, are ill-suited for high-frequency data due to the discreteness of price changes. We propose a modification to the maximum likelihood estimation procedure that accounts for the discrete nature of observations while still using continuous distributions. Our approach involves modeling the log-likelihood in terms of intervals corresponding to the rounding of continuous price changes to the nearest integer. The findings highlight the importance of adjusting for discreteness in volatility analysis and provide a framework for incroporating any continuous distribution for modeling high-frequency prices.
academic
Die Fallstricke kontinuierlicher Heavy-Tailed-Verteilungen in der Hochfrequenzdatenanalyse
Dieses Papier untersucht die Herausforderungen bei der Modellierung von hochfrequenten ganzzahligen Preisänderungen auf Finanzmärkten unter Verwendung kontinuierlicher Verteilungen, insbesondere der Student's t-Verteilung. Der Autor zeigt, dass traditionelle GARCH-Modelle aufgrund der Diskretheit von Preisänderungen für die Hochfrequenzdatenanalyse ungeeignet sind. Das Papier schlägt eine modifizierte Maximum-Likelihood-Schätzmethode vor, die die Diskretheit der Beobachtungen berücksichtigt, während kontinuierliche Verteilungen verwendet werden. Die Methode modelliert die Log-Likelihood-Funktion, indem kontinuierliche Preisänderungen in Intervalle gerundet werden, die den nächsten ganzen Zahlen entsprechen. Die Ergebnisse unterstreichen die Bedeutung der Anpassung an Diskretheit in der Volatilitätsanalyse und bieten einen Rahmen für die Anwendung beliebiger kontinuierlicher Verteilungen auf die Hochfrequenz-Preismodellierung.
Kernproblem: Traditionelle GARCH-Modelle, die kontinuierliche Verteilungen (wie die Student's t-Verteilung) zur Modellierung hochfrequenter Finanzdaten verwenden, weisen grundlegende Mängel auf
Spezifische Manifestation: Wenn Preisänderungen ganzzahlig sind und Nullwerte häufig auftreten, degeneriert die Student's t-Verteilung zu einer ⊥-Form mit Dichte konzentriert auf einen einzelnen Punkt 0 und extrem schweren Schwänzen
Praktische Auswirkungen: Diese Degeneration führt zu explodierenden Likelihood-Funktionen, fehlgeschlagenen Parameterschätzungen und bedeutungslosen oder sogar irreführenden Modellergebnissen
Traditionelle GARCH-Modelle: Gehen von kontinuierlichen Preisänderungen aus und ignorieren die Diskretheit hochfrequenter Daten
Bestehende diskrete Modelle: Basieren hauptsächlich auf der Skellam-Verteilung, was die Flexibilität der Verteilungswahl einschränkt
Softwarepaket-Probleme: Mehrere R-Pakete setzen künstliche Untergrenzen für Freiheitsgrad-Parameter und verschleiern die tatsächlichen Optimierungsprobleme
Warnfunktion: Klärt die Ungeeignetheit von Standard-GARCH-Modellen mit Heavy-Tailed-Verteilungen für hochfrequente Daten
Theoretische Innovation: Schlägt die Intervall-Maximum-Likelihood-Schätzmethode vor, die ganzzahlige Beobachtungen als gerundete kontinuierliche Werte behandelt
Methodischer Rahmen: Etabliert einen auf beliebige kontinuierliche Verteilungen anwendbaren Rahmen für die Hochfrequenz-Preismodellierung
Empirische Validierung: Verifiziert die Methodeneffektivität durch empirische Analysen mehrerer Aktien
Behandelt ganzzahlige Beobachtungen y als Ergebnis der Rundung kontinuierlicher Werte auf die nächste ganze Zahl, d.h. y entspricht dem Intervall (y-0.5, y+0.5].
Theoretische Schlussfolgerung: Student's t-Verteilung eignet sich nicht zur Modellierung ganzzahliger Preisänderungen mit häufig auftretenden Nullwerten
Methodische Schlussfolgerung: Intervall-Maximum-Likelihood-Schätzung kann das Problem der Diskrete-Daten-Modellierung mit kontinuierlichen Verteilungen effektiv lösen
Praktische Schlussfolgerung: Methode zeigt hervorragende Leistung bei relativ niedriger Frequenz (1 Minute), hochfrequente Daten erfordern komplexere Verteilungen
Dieses Papier zitiert wichtige Literatur aus Finanzökonometrie, Hochfrequenzdatenanalyse und Zeitreihenmodellierung, einschließlich:
Engle (1982, 2000, 2002) - GARCH-Modelle und Grundlagen der Hochfrequenzdatenanalyse
Creal et al. (2013) - Theoretische Grundlagen Score-Driven-Modeller
Koopman et al. (2017, 2018) - Dynamische Modellierung diskreter Preisänderungen
Holý (2024) - Verwandte Forschung zu diskreten GARCH-Modellen
Gesamtbewertung: Dieses Papier bietet eine elegante und effektive Lösung für ein wichtiges, aber übersehenes praktisches Problem und hat hohen praktischen Wert. Obwohl die theoretische Analysentiefe begrenzt ist, ist die empirische Forschung umfassend, die Schlussfolgerungen zuverlässig und der Beitrag zur Hochfrequenz-Finanzdatenanalyse bedeutsam.