2025-11-22T22:28:16.439435

The Pitfalls of Continuous Heavy-Tailed Distributions in High-Frequency Data Analysis

Holý
We address the challenges of modeling high-frequency integer price changes in financial markets using continuous distributions, particularly the Student's t-distribution. We demonstrate that traditional GARCH models, which rely on continuous distributions, are ill-suited for high-frequency data due to the discreteness of price changes. We propose a modification to the maximum likelihood estimation procedure that accounts for the discrete nature of observations while still using continuous distributions. Our approach involves modeling the log-likelihood in terms of intervals corresponding to the rounding of continuous price changes to the nearest integer. The findings highlight the importance of adjusting for discreteness in volatility analysis and provide a framework for incroporating any continuous distribution for modeling high-frequency prices.
academic

উচ্চ-ফ্রিকোয়েন্সি ডেটা বিশ্লেষণে ক্রমাগত ভারী-লেজ বিতরণের সমস্যা

মৌলিক তথ্য

  • পেপার আইডি: 2510.09785
  • শিরোনাম: উচ্চ-ফ্রিকোয়েন্সি ডেটা বিশ্লেষণে ক্রমাগত ভারী-লেজ বিতরণের সমস্যা
  • লেখক: ভ্লাদিমির হোলি (প্রাগ অর্থনীতি ও ব্যবসা বিশ্ববিদ্যালয়)
  • শ্রেণীবিভাগ: q-fin.ST (পরিসংখ্যানগত অর্থায়ন)
  • প্রকাশনার সময়: ২০২৫ সালের অক্টোবর ১০ (arXiv প্রি-প্রিন্ট)
  • পেপার লিংক: https://arxiv.org/abs/2510.09785

সারসংক্ষেপ

এই গবেষণাপত্রটি আর্থিক বাজারের উচ্চ-ফ্রিকোয়েন্সি পূর্ণসংখ্যা মূল্য পরিবর্তনের মডেলিংয়ের জন্য ক্রমাগত বিতরণ (বিশেষত স্টুডেন্ট টি-বিতরণ) ব্যবহারের চ্যালেঞ্জগুলি অনুসন্ধান করে। লেখক প্রমাণ করেছেন যে মূল্য পরিবর্তনের বিচ্ছিন্ন প্রকৃতির কারণে ঐতিহ্যবাহী GARCH মডেল উচ্চ-ফ্রিকোয়েন্সি ডেটা বিশ্লেষণের জন্য উপযুক্ত নয়। গবেষণাপত্রটি একটি সংশোধিত সর্বাধিক সম্ভাবনা অনুমান পদ্ধতি প্রস্তাব করে যা ক্রমাগত বিতরণ ব্যবহার করার সময় পর্যবেক্ষণের বিচ্ছিন্ন বৈশিষ্ট্যগুলি বিবেচনা করে। এই পদ্ধতিটি ক্রমাগত মূল্য পরিবর্তনকে নিকটতম পূর্ণসংখ্যার সাথে সামঞ্জস্যপূর্ণ ব্যবধানে রাউন্ড করে লগ-সম্ভাবনা ফাংশন মডেল করে। গবেষণার ফলাফল অস্থিরতা বিশ্লেষণে বিচ্ছিন্নতা সামঞ্জস্যের গুরুত্ব তুলে ধরে এবং উচ্চ-ফ্রিকোয়েন্সি মূল্য মডেলিংয়ে যেকোনো ক্রমাগত বিতরণ প্রয়োগের জন্য একটি কাঠামো প্রদান করে।

গবেষণা পটভূমি এবং প্রেরণা

সমস্যার সংজ্ঞা

  1. মূল সমস্যা: ঐতিহ্যবাহী GARCH মডেল উচ্চ-ফ্রিকোয়েন্সি আর্থিক ডেটা মডেলিংয়ের জন্য ক্রমাগত বিতরণ (যেমন স্টুডেন্ট টি-বিতরণ) ব্যবহার করার সময় মৌলিক ত্রুটি রয়েছে
  2. নির্দিষ্ট প্রকাশ: যখন মূল্য পরিবর্তন পূর্ণসংখ্যা এবং শূন্য মান ঘন ঘন ঘটে, তখন স্টুডেন্ট টি-বিতরণ ⊥ আকারে অবক্ষয় হয়, ঘনত্ব একক বিন্দু ০-এ কেন্দ্রীভূত হয় এবং অত্যন্ত ভারী লেজ থাকে
  3. বাস্তব প্রভাব: এই অবক্ষয় সম্ভাবনা ফাংশন বিস্ফোরণ ঘটায়, পরামিতি অনুমান ব্যর্থ হয়, এবং মডেল ফলাফল অর্থহীন বা বিভ্রান্তিকর হয়

গবেষণার গুরুত্ব

  1. ব্যবহারিক তাৎপর্য: উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং তীব্রতা ক্রমাগত বৃদ্ধি পাচ্ছে, মূল্য বিচ্ছিন্নতার সমস্যা আরও স্পষ্ট হয়ে উঠছে
  2. ঝুঁকি ব্যবস্থাপনা: ভুল অস্থিরতা মডেল ঝুঁকি ব্যবস্থাপনা, পোর্টফোলিও অপ্টিমাইজেশন এবং ডেরিভেটিভ মূল্য নির্ধারণকে প্রভাবিত করে
  3. একাডেমিক মূল্য: বিচ্ছিন্ন ডেটা মডেলিংয়ে ক্রমাগত বিতরণের তাত্ত্বিক ফাঁক পূরণ করে

বিদ্যমান পদ্ধতির সীমাবদ্ধতা

  1. ঐতিহ্যবাহী GARCH মডেল: মূল্য পরিবর্তন ক্রমাগত অনুমান করে, উচ্চ-ফ্রিকোয়েন্সি ডেটার বিচ্ছিন্ন বৈশিষ্ট্য উপেক্ষা করে
  2. বিদ্যমান বিচ্ছিন্ন মডেল: প্রধানত Skellam বিতরণের উপর ভিত্তি করে, কিন্তু বিতরণ পছন্দের নমনীয়তা সীমিত করে
  3. সফটওয়্যার প্যাকেজ সমস্যা: একাধিক R প্যাকেজ স্বাধীনতার ডিগ্রি পরামিতিতে কৃত্রিম নিম্ন সীমা নির্ধারণ করে, প্রকৃত অপ্টিমাইজেশন সমস্যা লুকায়

মূল অবদান

  1. সতর্কতা প্রভাব: উচ্চ-ফ্রিকোয়েন্সি ডেটায় ভারী-লেজ ক্রমাগত বিতরণের সাথে মানক GARCH মডেলের অনুপযুক্ততা স্পষ্টভাবে নির্দেশ করে
  2. তাত্ত্বিক উদ্ভাবন: ব্যবধান সর্বাধিক সম্ভাবনা অনুমান পদ্ধতি প্রস্তাব করে, পূর্ণসংখ্যা পর্যবেক্ষণকে ক্রমাগত মানের রাউন্ডিং ফলাফল হিসাবে বিবেচনা করে
  3. পদ্ধতি কাঠামো: যেকোনো ক্রমাগত বিতরণে প্রয়োগযোগ্য উচ্চ-ফ্রিকোয়েন্সি মূল্য মডেলিংয়ের জন্য একটি কাঠামো প্রতিষ্ঠা করে
  4. অভিজ্ঞতামূলক যাচাইকরণ: একাধিক স্টকের অভিজ্ঞতামূলক বিশ্লেষণের মাধ্যমে পদ্ধতির কার্যকারিতা যাচাই করে

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

  • ইনপুট: উচ্চ-ফ্রিকোয়েন্সি স্টক মূল্য পরিবর্তন ক্রম (পূর্ণসংখ্যা মান, প্রচুর শূন্য মান)
  • আউটপুট: সময়-পরিবর্তনশীল অস্থিরতা পরামিতি এবং বিতরণ পরামিতির অনুমান
  • সীমাবদ্ধতা: ক্রমাগত বিতরণের ব্যবহার বজায় রেখে ডেটার বিচ্ছিন্নতা পরিচালনা করে

ঐতিহ্যবাহী পদ্ধতির সমস্যা

GARCH মডেল

মানক GARCH মডেল:

y_t = μ + e_t, e_t ~ t(0, σ²_t, ν)
σ²_t = ω + αe²_{t-1} + φσ²_{t-1}

স্কোর-চালিত মডেল

y_t ~ t(μ, σ²_t, ν)
ln σ²_t = ω + α∇_{ln σ²}(y_{t-1}; μ, σ²_{t-1}, ν) + φσ²_{t-1}

সমস্যা কোথায়

যখন ν → 0, স্টুডেন্ট টি-বিতরণ অবক্ষয় হয়:

  • σ² → 0 (সংখ্যাগত নিম্ন সীমা 2^{-1074})
  • ঘনত্ব ০ বিন্দুতে বিস্ফোরিত হয়, ⊥ আকার গঠন করে
  • লগ-সম্ভাবনা ফাংশন চরম মান অর্জন করে (যেমন প্রতি পর্যবেক্ষণ ৭২ বনাম সাধারণ -২)

ব্যবধান সর্বাধিক সম্ভাবনা অনুমান পদ্ধতি

মূল ধারণা

পূর্ণসংখ্যা পর্যবেক্ষণ y কে ক্রমাগত মানের রাউন্ডিং ফলাফল হিসাবে বিবেচনা করে যা নিকটতম পূর্ণসংখ্যায় রাউন্ড করা হয়, অর্থাৎ y ব্যবধান (y-0.5, y+0.5] এর সাথে সামঞ্জস্যপূর্ণ।

গাণিতিক প্রকাশ

ব্যবধান লগ-সম্ভাবনা ফাংশন:

ℓ(p|y) = Σ_{t=1}^n ln[F((y_t - μ_t + 0.5)/σ_t | ν) - F((y_t - μ_t - 0.5)/σ_t | ν)]

যেখানে F(·|ν) স্টুডেন্ট টি-বিতরণের ক্রমবর্ধমান বিতরণ ফাংশন।

সংশোধিত স্কোর ফাংশন

∇_{ln σ²}(y; μ, σ², ν) = [(y-μ-0.5)f((y-μ-0.5)/σ|ν) - (y-μ+0.5)f((y-μ+0.5)/σ|ν)] / [2σF((y-μ+0.5)/σ|ν) - 2σF((y-μ-0.5)/σ|ν)]

সম্পূর্ণ মডেল নির্দিষ্টকরণ

অবস্থান পরামিতি গতিশীলতা

μ_t = θ(y_{t-1} - μ_{t-1})

বাজার মাইক্রোস্ট্রাকচার শব্দ ক্যাপচার করে।

স্কেল পরামিতি গতিশীলতা

ln σ²_t = ω + ln ŝ_t + e_t
e_t = α∇_{ln σ²}(y_{t-1}; μ_{t-1}, σ²_{t-1}, ν) + φe_{t-1}

যেখানে ŝ_t মসৃণ স্প্লাইনের মাধ্যমে দিনের মধ্যে অস্থিরতা প্যাটার্ন অনুমান করা হয়।

পরীক্ষামূলক সেটআপ

ডেটাসেট

  1. প্রধান ডেটা: IBM স্টক (NYSE, ২০২৪ সম্পূর্ণ বছর)
  2. সম্পূরক ডেটা: MCD (NYSE), CSCO এবং MSFT (NASDAQ)
  3. ডেটা স্কেল: ১৫ মিলিয়নেরও বেশি টিক-বাই-টিক ট্রেড পর্যবেক্ষণ
  4. ফ্রিকোয়েন্সি সেটিং: ০.১ সেকেন্ড, ১ সেকেন্ড, ১০ সেকেন্ড, ৬০ সেকেন্ড, ৩০০ সেকেন্ড

ডেটা প্রাক-প্রক্রিয়াকরণ

  1. মানক পরিষ্কার: ট্রেডিং সময়ের বাইরে ডেটা অপসারণ, কোন মূল্য রেকর্ড নেই, অসঙ্গতিপূর্ণ মান
  2. অসঙ্গতিপূর্ণ মান সংজ্ঞা: ২০১ পর্যবেক্ষণ রোলিং উইন্ডোর মধ্যে গড় পরম বিচ্যুতির ১০ গুণ অতিক্রম করে
  3. সমন্বয় পদ্ধতি: শেষ ট্রেড মূল্য পদ্ধতি ব্যবহার করে

মূল্যায়ন মেট্রিক্স

  1. লগ-সম্ভাবনা মান (ℓ): মডেল ফিটিং গুণমান
  2. ARCH-LM পরিসংখ্যান: অবশিষ্ট স্বয়ংসম্পর্ক পরীক্ষা
  3. নমুনা বাইরে কর্মক্ষমতা: পরবর্তী দিনের ডেটা পূর্বাভাস ক্ষমতা

তুলনা পদ্ধতি

  1. ক্রমাগত বিতরণ: সাধারণ বিতরণ (ব্যবধান অনুমান), স্টুডেন্ট টি-বিতরণ (ব্যবধান অনুমান)
  2. বিচ্ছিন্ন বিতরণ: Skellam বিতরণ, শূন্য-স্ফীত Skellam বিতরণ
  3. সফটওয়্যার প্যাকেজ: rugarch, fGarch, GAS, gasmodel

পরীক্ষামূলক ফলাফল

প্রধান অনুসন্ধান

ঐতিহ্যবাহী পদ্ধতির ব্যর্থতা

সারণী ১ ফলাফল দেখায়:

  • ১ সেকেন্ড ফ্রিকোয়েন্সিতে, gasmodel প্যাকেজ ν=০.২২০ অনুমান করে (মধ্যমা), অন্যান্য প্যাকেজ কৃত্রিম নিম্ন সীমা দ্বারা সীমাবদ্ধ
  • লগ-সম্ভাবনা পার্থক্য বিশাল: gasmodel ৭২/পর্যবেক্ষণ বনাম অন্যান্য প্রায় -২/পর্যবেক্ষণ
  • ১ মিনিট ফ্রিকোয়েন্সিতে সমস্ত প্যাকেজ ফলাফল অপেক্ষাকৃত সামঞ্জস্যপূর্ণ

ব্যবধান পদ্ধতির কর্মক্ষমতা

সারণী ২ ফলাফল দেখায়:

  • ১ সেকেন্ড ফ্রিকোয়েন্সি: শূন্য-স্ফীত Skellam সর্বোত্তম (ℓ=-১.৭০০), স্টুডেন্ট টি দ্বিতীয় (ℓ=-१.८४१)
  • ১ মিনিট ফ্রিকোয়েন্সি: স্টুডেন্ট টি সর্বোত্তম (ℓ=-३.५५०), অন্যান্য পদ্ধতির চেয়ে সামান্য উন্নত
  • ARCH প্রভাব অবশিষ্ট খুবই কম, মডেল কার্যকরভাবে সময়-পরিবর্তনশীল অস্থিরতা ক্যাপচার করে নির্দেশ করে

নমুনা বাইরে কর্মক্ষমতা

  • স্টুডেন্ট টি, Skellam এবং শূন্য-স্ফীত Skellam মডেল স্থিতিশীল কর্মক্ষমতা প্রদর্শন করে
  • সাধারণ বিতরণ ১ সেকেন্ড ফ্রিকোয়েন্সিতে ৫৬% দিনে সংখ্যাগত শূন্য সম্ভাবনা অভিজ্ঞতা করে, পূর্বাভাসের জন্য অনুপযুক্ত

বিতরণ ফিটিং বিশ্লেষণ

চিত্র ৩ দেখায়:

  • ১ সেকেন্ড ফ্রিকোয়েন্সি: স্টুডেন্ট টি বিতরণ -১ এবং ১ এর সম্ভাবনা অতিমূল্যায়ন করে, অন্যান্য মান সম্ভাবনা কম মূল্যায়ন করে
  • ১ মিনিট ফ্রিকোয়েন্সি: কোন পদ্ধতিগত পক্ষপাত নেই, কিন্তু ০ মান সম্ভাবনা সামান্য কম মূল্যায়ন করে

মাল্টি-স্টক যাচাইকরণ

সংযোজন ফলাফল:

  • MCD স্টক: IBM এর মতো অনুরূপ অবক্ষয় আচরণ
  • CSCO স্টক: শূন্য মান অনুপাত উচ্চতর, সমস্যা আরও গুরুতর
  • MSFT স্টক: বিতরণ আরও বিচ্ছিন্ন, ঐতিহ্যবাহী পদ্ধতি অপেক্ষাকৃত স্থিতিশীল কিন্তু সমস্যা বিদ্যমান

সম্পর্কিত কাজ

উচ্চ-ফ্রিকোয়েন্সি ডেটা মডেলিং উন্নয়ন

  1. প্রাথমিক গবেষণা: Ghysels এবং Jasiak (১৯৯৮), Engle (২০००), Meddahi এবং অন্যান্য (२००६)
  2. বিচ্ছিন্ন মডেল: Koopman এবং অন্যান্য (२०१७-२०१८), Catania এবং অন্যান্য (२०२२), Holý (२०२४)
  3. স্কোর-চালিত মডেল: Creal এবং অন্যান্য (२०१३) তাত্ত্বিক ভিত্তি

এই গবেষণাপত্রের অবস্থান

  1. বিচ্ছিন্ন পদ্ধতি থেকে পার্থক্য: ক্রমাগত বিতরণ ব্যবহারের নমনীয়তা বজায় রাখে
  2. বিদ্যমান তত্ত্ব সম্পূরক: Holý (२०२४) দ্বারা পর্যবেক্ষণ করা কিন্তু বিস্তারিতভাবে গবেষণা করা হয়নি এমন ঘটনা
  3. ব্যবহারিক মূল্য: বিদ্যমান সফটওয়্যার প্যাকেজ ব্যবহারকারীদের জন্য সতর্কতা প্রদান করে

উপসংহার এবং আলোচনা

প্রধান সিদ্ধান্ত

  1. তাত্ত্বিক সিদ্ধান্ত: স্টুডেন্ট টি-বিতরণ ঘন ঘন শূন্য মান সহ পূর্ণসংখ্যা মূল্য পরিবর্তন মডেলিংয়ের জন্য উপযুক্ত নয়
  2. পদ্ধতি সিদ্ধান্ত: ব্যবধান সর্বাধিক সম্ভাবনা অনুমান ক্রমাগত বিতরণের বিচ্ছিন্ন ডেটা মডেলিং সমস্যা কার্যকরভাবে সমাধান করতে পারে
  3. ব্যবহারিক সিদ্ধান্ত: পদ্ধতি অপেক্ষাকৃত কম ফ্রিকোয়েন্সি (১ মিনিট) ডেটায় চমৎকার কর্মক্ষমতা প্রদর্শন করে, অতি-উচ্চ ফ্রিকোয়েন্সি ডেটা আরও জটিল বিতরণ প্রয়োজন

সীমাবদ্ধতা

  1. প্রয়োগযোগ্যতার পরিধি: স্টুডেন্ট টি-বিতরণ অতি-উচ্চ ফ্রিকোয়েন্সি ডেটায় এখনও যথেষ্ট নমনীয় নয়
  2. গণনা জটিলতা: ব্যবধান অনুমান গণনা বোঝা বৃদ্ধি করে
  3. পরামিতি সীমাবদ্ধতা: কিছু ক্ষেত্রে স্কোর সহগে নিম্ন সীমা নির্ধারণের প্রয়োজন হতে পারে

ভবিষ্যত দিকনির্দেশনা

  1. বিতরণ সম্প্রসারণ: পদ্ধতি অন্যান্য ক্রমাগত বিতরণে প্রয়োগ করা
  2. তাত্ত্বিক পরিমার্জন: ব্যবধান অনুমানের অ্যাসিম্পটোটিক বৈশিষ্ট্য গভীরভাবে অধ্যয়ন করা
  3. ব্যবহারিক প্রয়োগ: ঝুঁকি ব্যবস্থাপনা এবং ডেরিভেটিভ মূল্য নির্ধারণে প্রয়োগ

গভীর মূল্যায়ন

শক্তি

  1. সমস্যা সনাক্তকরণ নির্ভুল: একটি উপেক্ষিত কিন্তু গুরুত্বপূর্ণ ব্যবহারিক সমস্যা স্পষ্টভাবে নির্দেশ করে
  2. সমাধান সরল: ব্যবধান অনুমান পদ্ধতি সহজ কার্যকর, বাস্তবায়ন সহজ
  3. অভিজ্ঞতামূলক বিশ্লেষণ পর্যাপ্ত: একাধিক সফটওয়্যার প্যাকেজ, একাধিক স্টক, একাধিক ফ্রিকোয়েন্সির ব্যাপক যাচাইকরণ
  4. ব্যবহারিক মূল্য উচ্চ: অনুশীলনকারীদের স্পষ্ট সতর্কতা এবং সমাধান প্রদান করে

অপূর্ণতা

  1. তাত্ত্বিক বিশ্লেষণ অপর্যাপ্ত: ব্যবধান অনুমান পদ্ধতির তাত্ত্বিক বৈশিষ্ট্য বিশ্লেষণের অভাব
  2. গণনা দক্ষতা: পদ্ধতির গণনা জটিলতা এবং অপ্টিমাইজেশন কৌশল আলোচনা করা হয়নি
  3. মডেল তুলনা সীমিত: প্রধানত মৌলিক বিচ্ছিন্ন বিতরণের সাথে তুলনা, আরও উন্নত বেঞ্চমার্কের অভাব
  4. পরামিতি নির্বাচন: ব্যবধান নির্বাচন (০.৫) তাত্ত্বিক ভিত্তির অভাব

প্রভাব

  1. একাডেমিক অবদান: ক্রমাগত বিতরণ বিচ্ছিন্ন ডেটা মডেলিংয়ের ফাঁক পূরণ করে
  2. ব্যবহারিক মূল্য: উচ্চ-ফ্রিকোয়েন্সি ট্রেডিং এবং ঝুঁকি ব্যবস্থাপনায় সরাসরি প্রয়োগ মূল্য রয়েছে
  3. পদ্ধতি সার্বজনীনতা: কাঠামো অন্যান্য ক্রমাগত বিতরণ এবং প্রয়োগ ক্ষেত্রে সম্প্রসারণযোগ্য

প্রযোজ্য পরিস্থিতি

  1. উচ্চ-ফ্রিকোয়েন্সি আর্থিক ডেটা: বিশেষত মূল্য পরিবর্তন ন্যূনতম ইউনিটে মূল্য নির্ধারিত বাজার
  2. বিচ্ছিন্ন পর্যবেক্ষণের ক্রমাগত প্রক্রিয়া: অন্যান্য রাউন্ডিং ত্রুটি বিদ্যমান সময় সিরিজ
  3. অস্থিরতা মডেলিং: ক্রমাগত বিতরণ নমনীয়তা বজায় রাখার প্রয়োজনীয় ঝুঁকি ব্যবস্থাপনা প্রয়োগ

সংদর্ভ

এই গবেষণাপত্রটি আর্থিক পরিমাপ, উচ্চ-ফ্রিকোয়েন্সি ডেটা বিশ্লেষণ এবং সময় সিরিজ মডেলিংয়ের গুরুত্বপূর্ণ সাহিত্য উদ্ধৃত করে, যার মধ্যে রয়েছে:

  • Engle (१९८२, २०००, २००२) - GARCH মডেল এবং উচ্চ-ফ্রিকোয়েন্সি ডেটা বিশ্লেষণ ভিত্তি
  • Creal এবং অন্যান্য (२०१३) - স্কোর-চালিত মডেল তত্ত্ব
  • Koopman এবং অন্যান্য (२०१७, २०१८) - বিচ্ছিন্ন মূল্য পরিবর্তনের গতিশীল মডেলিং
  • Holý (२०२४) - সম্পর্কিত বিচ্ছিন্ন GARCH মডেল গবেষণা

সামগ্রিক মূল্যায়ন: এই গবেষণাপত্রটি একটি গুরুত্বপূর্ণ কিন্তু উপেক্ষিত ব্যবহারিক সমস্যার জন্য সহজ কার্যকর সমাধান প্রদান করে, অত্যন্ত শক্তিশালী ব্যবহারিক মূল্য রয়েছে। যদিও তাত্ত্বিক বিশ্লেষণ গভীরতায় কিছু অভাব রয়েছে, তার অভিজ্ঞতামূলক গবেষণা পর্যাপ্ত, সিদ্ধান্ত বিশ্বাসযোগ্য, এবং উচ্চ-ফ্রিকোয়েন্সি আর্থিক ডেটা বিশ্লেষণ ক্ষেত্রে গুরুত্বপূর্ণ অবদান রাখে।