2025-11-15T08:13:11.214644

Most claimed statistical findings in cross-sectional return predictability are likely true

Chen
The false discovery rate (FDR) measures the share of false positives in a set of statistical tests. I develop simple and intuitive bounds on the FDR in cross-sectional predictability publications. The simplest bound requires just a few lines of math and finds $\text{FDR} \le 25\%$ based on summary statistics in eight out of nine previous studies. A more refined bound finds $\text{FDR} \le 9\%$. The FDR is small because randomly selecting accounting ratios produces statistically significant predictability far more often than would occur if there were no predictability. The bounds also reconcile the disparate FDR estimates in the literature.
academic

ক্রস-সেকশনাল রিটার্ন প্রেডিক্টেবিলিটিতে বেশিরভাগ দাবিকৃত পরিসংখ্যানগত ফলাফল সম্ভবত সত্য

মৌলিক তথ্য

  • পেপার আইডি: 2206.15365
  • শিরোনাম: Most claimed statistical findings in cross-sectional return predictability are likely true
  • লেখক: Andrew Y. Chen (ফেডারেল রিজার্ভ বোর্ড)
  • শ্রেণীবিভাগ: q-fin.GN (পরিমাণগত অর্থনীতি - সাধারণ অর্থনীতি)
  • প্রকাশনার সময়: ২০২৫ সালের অক্টোবর (SSRN-এ প্রথম প্রকাশ: ২০২১ সালের ২৭ আগস্ট)
  • পেপার লিঙ্ক: https://arxiv.org/abs/2206.15365

সারসংক্ষেপ

মিথ্যা আবিষ্কার হার (FDR) পরিসংখ্যানগত পরীক্ষায় মিথ্যা ইতিবাচক ফলাফলের অনুপাত পরিমাপ করে। এই পেপারটি ক্রস-সেকশনাল প্রেডিক্টেবিলিটি গবেষণার জন্য সহজ এবং স্বজ্ঞাত FDR সীমানা বিকশিত করেছে। সবচেয়ে সহজ সীমানা মাত্র কয়েক লাইন গণিত প্রয়োজন এবং নয়টি পূর্ববর্তী গবেষণার আটটির সংক্ষিপ্ত পরিসংখ্যানের উপর ভিত্তি করে, FDR ≤ ২৫% খুঁজে পায়। আরও পরিশোধিত সীমানা FDR ≤ ৯% খুঁজে পায়। FDR ছোট হওয়ার কারণ হল যে র্যান্ডম অ্যাকাউন্টিং অনুপাত পরিসংখ্যানগতভাবে উল্লেখযোগ্য প্রেডিক্টেবিলিটি তৈরি করার ফ্রিকোয়েন্সি কোন প্রেডিক্টেবিলিটি নেই এমন পরিস্থিতিতে প্রত্যাশিত ফ্রিকোয়েন্সির চেয়ে অনেক বেশি।

গবেষণার পটভূমি এবং প্রেরণা

সমস্যার পটভূমি

গবেষকরা শত শত ক্রস-সেকশনাল স্টক রিটার্ন প্রেডিক্টর আবিষ্কার করেছেন, এই সমৃদ্ধি একাধিক পরীক্ষার সমস্যা সম্পর্কে উদ্বেগ উত্থাপন করেছে। স্বজ্ঞাতভাবে, যদি গবেষকরা অনেক পরীক্ষা পরিচালনা করেন, তবে কোন প্রেডিক্টেবিলিটি নেই এমন শূন্য অনুমানের অধীনেও, কিছু পরীক্ষা খাঁটি সুযোগের কারণে পরিসংখ্যানগতভাবে উল্লেখযোগ্য হতে পারে।

মূল সমস্যা

১. একাধিক পরীক্ষার সমস্যা: বৃহৎ সংখ্যক ফ্যাক্টর আবিষ্কার মিথ্যা ইতিবাচক ফলাফলের দিকে পরিচালিত করতে পারে ২. FDR অনুমান বৈষম্য: বিদ্যমান সাহিত্যে FDR অনুমান প্রায় ০% থেকে ৪৫% এর বেশি পর্যন্ত বিশাল পার্থক্য রয়েছে ३. প্রকাশনা পক্ষপাত: পরিসংখ্যানগতভাবে উল্লেখযোগ্য ফলাফল প্রকাশিত হওয়ার সম্ভাবনা বেশি, যা প্রকৃত FDR অনুমানকে প্রভাবিত করে ४. পদ্ধতিগত বিরোধ: বিভিন্ন গবেষণা দল বিভিন্ন পদ্ধতি ব্যবহার করে সম্পূর্ণ ভিন্ন সিদ্ধান্তে পৌঁছায়

গবেষণার গুরুত্ব

FDR সঠিকভাবে অনুমান করা আর্থিক অসঙ্গতি সাহিত্যের বিশ্বাসযোগ্যতা বোঝার জন্য অত্যন্ত গুরুত্বপূর্ণ, যা বিনিয়োগ কৌশল প্রণয়ন এবং একাডেমিক গবেষণার দিকনির্দেশনাকে সরাসরি প্রভাবিত করে।

মূল অবদান

१. সহজ স্বজ্ঞাত FDR সীমানা: "Easy Bound" পদ্ধতি প্রস্তাব করে, যা মাত্র কয়েক লাইন গণিত দিয়ে FDR উপরের সীমানা অনুমান করতে পারে २. ভিজ্যুয়াল সীমানা পদ্ধতি: "Visual Bound" বিকশিত করে, যা হিস্টোগ্রাম বিয়োজনের মাধ্যমে আরও কঠোর FDR সীমানা প্রদান করে ३. সাহিত্য সমন্বয়: বিদ্যমান সাহিত্যে বিশাল পার্থক্যপূর্ণ FDR অনুমানগুলি একীভূত করে ব্যাখ্যা করে, বৈষম্যগুলি প্রধানত ডেটা পার্থক্যের পরিবর্তে ব্যাখ্যার পার্থক্য থেকে উদ্ভূত হয় ४. অভিজ্ঞতামূলক অনুসন্ধান: প্রমাণ করে যে র্যান্ডম অ্যাকাউন্টিং অনুপাত উল্লেখযোগ্য প্রেডিক্টেবিলিটি তৈরি করার সম্ভাবনা তাত্ত্বিক প্রত্যাশার চেয়ে অনেক বেশি, যা ছোট FDR এর জন্য অভিজ্ঞতামূলক সমর্থন প্রদান করে

পদ্ধতির বিস্তারিত ব্যাখ্যা

কাজের সংজ্ঞা

ক্রস-সেকশনাল সিগন্যাল i এর প্রেডিক্টিভ ক্ষমতা rˉi\bar{r}_i দ্বারা সংজ্ঞায়িত করুন, সাধারণত i এর উপর ভিত্তি করে একটি লং-শর্ট পোর্টফোলিও তৈরি করে এবং নমুনা গড় রিটার্ন গণনা করে পাওয়া যায়। শূন্য অনুমান হল E(rˉi)=0E(\bar{r}_i) = 0

মূল কাঠামো

१. মৌলিক সেটিং

  • tirˉi/SEit_i \equiv \bar{r}_i / SE_i হল t পরিসংখ্যান
  • শূন্য অনুমানের অধীনে: tinulliNormal(0,1)t_i | null_i \sim Normal(0,1)
  • আবিষ্কার সংজ্ঞা: ti>2|t_i| > 2 (৫% উল্লেখযোগ্যতা স্তরের সাথে সামঞ্জস্যপূর্ণ)
  • FDR সংজ্ঞা: FDRt>2Pr(nulliti>2)FDR_{|t|>2} \equiv Pr(null_i | |t_i| > 2)

२. Easy Bound পদ্ধতি

বেয়েস নিয়ম প্রয়োগ করে পান: FDRt>2=Pr(ti>2nulli)Pr(nulli)Pr(ti>2)5%Pr(ti>2)FDR_{|t|>2} = \frac{Pr(|t_i| > 2|null_i) Pr(null_i)}{Pr(|t_i| > 2)} \leq \frac{5\%}{Pr(|t_i| > 2)}

এই সীমানা স্বজ্ঞাত এবং সহজবোধ্য: যদি শূন্য অনুমানের অধীনে লেজের সম্ভাবনা (অংশ) প্রকৃত পর্যবেক্ষিত লেজের সম্ভাবনা (হর) ব্যাখ্যা করতে পারে না, তবে FDR অবশ্যই ছোট হতে হবে।

३. Visual Bound পদ্ধতি

Pr(nulli)Pr(null_i) অনুমান করতে ডেটা ব্যবহার করে সীমানা কঠোর করুন: Pr(ti<0.5)(0.38)Pr(nulli)Pr(|t_i| < 0.5) \geq (0.38)Pr(null_i)

সংমিশ্রণ করে আরও কঠোর সীমানা পান: FDRt>2[5%Pr(ti>2)][Pr(ti<0.5)0.38]FDR_{|t|>2} \leq \left[\frac{5\%}{Pr(|t_i| > 2)}\right]\left[\frac{Pr(|t_i| < 0.5)}{0.38}\right]

প্রযুক্তিগত উদ্ভাবন পয়েন্ট

१. প্রকাশনা পক্ষপাত পরিচালনা

  • ডেটা মাইনিং গবেষণা সর্বোত্তম পরিস্থিতি হিসাবে ব্যবহার করুন
  • রক্ষণশীল এক্সট্রাপোলেশন পদ্ধতি ব্যবহার করে অপ্রকাশিত ফলাফলের বিতরণ অনুমান করুন
  • প্রকাশিত সাহিত্যের পরিসংখ্যানের উপর সরাসরি নির্ভরতা এড়ান

२. হিস্টোগ্রাম বিয়োজন পদ্ধতি

t পরিসংখ্যান হিস্টোগ্রামকে শূন্য উপাদান এবং বিকল্প উপাদানে বিয়োজন করুন: Pr(tib)=Pr(tibnulli)Pr(nulli)+Pr(tibalti)Pr(alti)Pr(|t_i| \in b) = Pr(|t_i| \in b | null_i)Pr(null_i) + Pr(|t_i| \in b | alt_i)Pr(alt_i)

শূন্য উপাদান ডেটা উপাদান অতিক্রম করতে পারে না এমন সীমাবদ্ধতা ব্যবহার করে FDR উপরের সীমানা অনুমান করুন।

३. অ্যালগরিদম १: ভিজ্যুয়াল সীমানা অনুমান

१. ডেটা মাইনিং সিগন্যালের ti|t_i| হিস্টোগ্রাম প্লট করুন २. ডেটার অভ্যন্তরে ফিট করতে পারে এমন সর্বাধিক শূন্য বিতরণ হিস্টোগ্রাম প্লট করুন
३. २.० এ একটি উল্লম্ব লাইন আঁকুন, ডানদিকের শূন্য এলাকা এবং ডেটা এলাকার অনুপাত FDR সীমানা অনুমান করে

পরীক্ষামূলক সেটআপ

ডেটাসেট

१. ডেটা মাইনিং গবেষণা:

  • Yan and Zheng (२०१७): १८,००० অ্যাকাউন্টিং অনুপাত
  • Chordia, Goyal, and Saretto (२०२०): প্রায় २०० অ্যাকাউন্টিং ভেরিয়েবল
  • Chen, Lopez-Lira, and Zimmermann (२०२५): २९,००० সিগন্যাল

२. মেটা-গবেষণা ডেটা:

  • Green, Hand, Zhang (२०१३)
  • Chen, Zimmermann (२०२०): ७७ প্রকাশিত প্রেডিক্টর
  • Harvey, Liu, Zhu (२०१६)
  • McLean, Pontiff (२०१६)
  • Jensen, Kelly, Pedersen (२०२१)
  • Jacobs, Muller (२०२०)

মূল্যায়ন সূচক

  • FDR সীমানা: মিথ্যা আবিষ্কার হারের উপরের সীমানা অনুমান
  • উল্লেখযোগ্যতার অনুপাত: ti>2|t_i| > 2 সিগন্যালের অনুপাত
  • ছোট t পরিসংখ্যান অনুপাত: ti<0.5|t_i| < 0.5 সিগন্যালের অনুপাত

বাস্তবায়ন বিবরণ

  • সমান-ওজন এবং মূল্য-ওজন পোর্টফোলিও ব্যবহার করুন
  • বিভিন্ন ফ্যাক্টর মডেল সমন্বয় বিবেচনা করুন (CAPM, FF३, FF३+মোমেন্টাম)
  • মান ত্রুটি গণনার জন্য Fama-French ক্লাস্টার বুটস্ট্র্যাপ গ্রহণ করুন

পরীক্ষামূলক ফলাফল

প্রধান ফলাফল

१. Easy Bound ফলাফল

নয়টি গবেষণার আটটির উপর ভিত্তি করে, FDR ≤ २५%:

  • ডেটা মাইনিং গবেষণায় কমপক্ষে २०% অ্যাকাউন্টিং অনুপাত ti>2|t_i| > 2 তৈরি করে
  • সূত্র প্রয়োগ করে পান: FDRt>25%/0.20=25%FDR_{|t|>2} \leq 5\%/0.20 = 25\%

२. Visual Bound ফলাফল

CLZ ডেটা ব্যবহার করে আরও নির্ভুল অনুমান:

  • २९,००० সিগন্যালের মধ্যে ९,७०० ti>2|t_i| > 2 পূরণ করে, ६,३०० ti<0.5|t_i| < 0.5 পূরণ করে
  • পান: FDRt>28.5%FDR_{|t|>2} \leq 8.5\%, অর্থাৎ কমপক্ষে ९१.५% আবিষ্কার সত্য

३. বিভিন্ন স্পেসিফিকেশনের ফলাফল

ওজন পদ্ধতিফ্যাক্টর সমন্বয়FDR উপরের সীমানাউল্লেখযোগ্যতার অনুপাত
সমান-ওজনমূল রিটার্ন८.६%३२.७%
সমান-ওজনFF३७.३%३४.९%
মূল্য-ওজনCAPM१९.०%१७.९%
মূল্য-ওজনFF३+মোমেন্টাম४१.७%१०.५%

অ্যাবলেশন পরীক্ষা

१. ওজন পদ্ধতির প্রভাব: মূল্য-ওজন উল্লেখযোগ্যতার অনুপাত উল্লেখযোগ্যভাবে হ্রাস করে, FDR সীমানা বৃদ্ধি করে २. ফ্যাক্টর সমন্বয়ের প্রভাব: FF३+মোমেন্টাম সমন্বয় মূল্য-ওজন পোর্টফোলিওতে সর্বাধিক প্রভাব ফেলে ३. ডেটাসেট শক্তিশালীতা: তিনটি স্বাধীন গবেষণা দলের ডেটা মাইনিং ফলাফল সামঞ্জস্যপূর্ণ

সাহিত্য সমন্বয় বিশ্লেষণ

१. Harvey, Liu, Zhu (२०१६): পুনরায় ব্যাখ্যা করে FDR মাত্র १२% খুঁজে পায়, মূল পাঠ্যে দাবিকৃত "বেশিরভাগ আবিষ্কার মিথ্যা" নয় २. Harvey and Liu (२०२०): ०.१% এর "সত্য" কৌশল আসলে সবচেয়ে চরম মূল্য-ওজন FF३+মোমেন্টাম স্পেসিফিকেশন নির্বাচনের সাথে সামঞ্জস্যপূর্ণ ३. Chordia, Goyal, Saretto (२०२०): ४५% এর FDR অনুমান ক্যালিব্রেশনে ছোট t পরিসংখ্যান তথ্য উপেক্ষা করা থেকে উদ্ভূত

সম্পর্কিত কাজ

FDR পদ্ধতি সাহিত্য

  • Benjamini and Hochberg (१९९५): ক্লাসিক FDR নিয়ন্ত্রণ পদ্ধতি
  • Storey (२००२): সরাসরি FDR অনুমান পদ্ধতি
  • Sorić (१९८९): সবচেয়ে প্রাথমিক FDR ধারণা

আর্থিক অসঙ্গতি সাহিত্য

  • Green, Hand, Zhang (२०१३): ক্রস-সেকশনাল রিটার্ন প্রেডিক্টর সমীক্ষা
  • McLean and Pontiff (२०१६): নমুনা বাইরে হ্রাস গবেষণা
  • Chen and Zimmermann (२०२२): খোলা উৎস ক্রস-সেকশনাল সম্পদ মূল্য নির্ধারণ

আর্থিক ক্ষেত্রে একাধিক পরীক্ষার প্রয়োগ

  • Harvey, Liu, Zhu (२०१६): আর্থিক অর্থনীতিতে একাধিক পরীক্ষার সমস্যা
  • Chen (२०२४): t পরিসংখ্যান থ্রেশহোল্ড বৃদ্ধির প্রয়োজন কিনা তা নিয়ে আলোচনা

উপসংহার এবং আলোচনা

প্রধান উপসংহার

१. ছোট FDR: ক্রস-সেকশনাল প্রেডিক্টেবিলিটি সাহিত্যে কমপক্ষে ७५% দাবিকৃত আবিষ্কার সত্য (FDR ≤ २५%) २. আরও নির্ভুল অনুমান: ছোট t পরিসংখ্যান তথ্য বিবেচনা করার পরে, কমপক্ষে ९१% আবিষ্কার সত্য (FDR ≤ ९%) ३. সাহিত্য সমন্বয়: বিভিন্ন FDR অনুমান প্রধানত ডেটা বা পদ্ধতির পার্থক্যের পরিবর্তে ব্যাখ্যার পার্থক্য থেকে উদ্ভূত ४. অভিজ্ঞতামূলক সমর্থন: র্যান্ডম অ্যাকাউন্টিং অনুপাতের উচ্চ উল্লেখযোগ্যতার হার ছোট FDR এর জন্য সরাসরি প্রমাণ প্রদান করে

সীমাবদ্ধতা

१. পরিসংখ্যানগত বনাম অর্থনৈতিক তাৎপর্য: "সত্য আবিষ্কার" শুধুমাত্র পরিসংখ্যানগতভাবে উল্লেখযোগ্য এবং অ-শূন্য α নির্দেশ করে, লেনদেন খরচ, তথ্য খরচ ইত্যাদি অর্থনৈতিক কারণ বিবেচনা করে না २. নমুনা বাইরে পারফরম্যান্স: পরিসংখ্যানগত সত্যতা অর্থনৈতিক সম্ভাব্যতার সমান নয় ३. কাঠামোগত পরিবর্তন: প্রেডিক্টেবিলিটিতে বাজার কাঠামো পরিবর্তনের প্রভাব সম্পূর্ণভাবে বিবেচনা করা হয়নি ४. ডেটা মাইনিং অনুমান: ধরে নেয় যে গবেষণা প্রক্রিয়া র্যান্ডম ডেটা মাইনিং এর চেয়ে বেশি মিথ্যা আবিষ্কার হার তৈরি করবে না

ভবিষ্যত দিকনির্দেশনা

१. অর্থনৈতিক তাৎপর্য: লেনদেন খরচ এবং বাজার ঘর্ষণ মূল্যায়ন করে অর্থনৈতিক মূল্য মূল্যায়ন করুন २. গতিশীল FDR: সময়-পরিবর্তনশীল প্রেডিক্টেবিলিটি এবং বাজার অবস্থা বিবেচনা করুন ३. কার্যকারণ অনুমান: প্রেডিক্টিভ সম্পর্ক থেকে কার্যকারণ সম্পর্কে সম্প্রসারণ করুন ४. মেশিন লার্নিং পদ্ধতি: উচ্চ-মাত্রিক সেটিংয়ে FDR নিয়ন্ত্রণ

গভীর মূল্যায়ন

শক্তি

१. পদ্ধতির সরলতা: Easy Bound পদ্ধতি অত্যন্ত সহজ, শুধুমাত্র সংক্ষিপ্ত পরিসংখ্যান প্রয়োজন २. শক্তিশালী স্বজ্ঞা: Visual Bound স্বজ্ঞাত হিস্টোগ্রাম বিয়োজন ব্যাখ্যা প্রদান করে ३. অভিজ্ঞতামূলক শক্তিশালীতা: একাধিক স্বাধীন গবেষণা দলের সামঞ্জস্যপূর্ণ ফলাফলের উপর ভিত্তি করে ४. সাহিত্য অবদান: দীর্ঘস্থায়ী FDR অনুমান বৈষম্য সফলভাবে সমন্বয় করে ५. তাত্ত্বিক কঠোরতা: সম্ভাব্যতা তত্ত্বের মৌলিক নীতির উপর ভিত্তি করে, গণিত অনুমান কঠোর

অপূর্ণতা

१. রক্ষণশীলতা: সীমানা পদ্ধতি অত্যধিক রক্ষণশীল হতে পারে, প্রকৃত FDR ছোট হতে পারে २. স্বাধীনতা অনুমান: স্বাধীনতার প্রয়োজন নেই বলে দাবি করলেও, সম্পর্ক অনুমান নির্ভুলতা প্রভাবিত করে ३. ডেটা নির্ভরতা: ফলাফল নির্দিষ্ট ডেটা মাইনিং গবেষণার গুণমান এবং প্রতিনিধিত্বের উপর নির্ভর করে ४. সময়ের স্থিতিশীলতা: সময়ের সাথে FDR পরিবর্তন সম্পর্কে সম্পূর্ণভাবে আলোচনা করা হয়নি ५. অর্থনৈতিক ব্যাখ্যা: পরিসংখ্যানগত তাৎপর্য এবং অর্থনৈতিক অর্থের সম্পর্কের গভীর আলোচনার অভাব

প্রভাব

१. একাডেমিক মূল্য: আর্থিক অসঙ্গতি সাহিত্যের জন্য গুরুত্বপূর্ণ পরিসংখ্যানগত বিশ্বাসযোগ্যতা মূল্যায়ন প্রদান করে २. ব্যবহারিক অর্থ: বিনিয়োগকারী এবং নিয়ন্ত্রকদের জন্য ফ্যাক্টর কার্যকারিতার রেফারেন্স প্রদান করে ३. পদ্ধতি অবদান: সহজ কার্যকর FDR সীমানা পদ্ধতি অন্যান্য ক্ষেত্রে প্রসারিত করা যায় ४. নীতি প্রভাব: আর্থিক বাজার দক্ষতা এবং অসঙ্গতি স্থায়িত্ব সম্পর্কে বোঝার প্রভাব

প্রযোজ্য পরিস্থিতি

१. একাডেমিক গবেষণা: নতুন আবিষ্কৃত ফ্যাক্টরের পরিসংখ্যানগত বিশ্বাসযোগ্যতা মূল্যায়ন করুন २. বিনিয়োগ অনুশীলন: পরিসংখ্যানগত সমর্থন সহ বিনিয়োগ কৌশল ফিল্টার করুন ३. নিয়ন্ত্রক নীতি: বাজার অসঙ্গতির সিস্টেমিক ঝুঁকি মূল্যায়ন করুন ४. ঝুঁকি ব্যবস্থাপনা: ফ্যাক্টর এক্সপোজারের পরিসংখ্যানগত ভিত্তি বুঝুন

তথ্যসূত্র

এই পেপারটি ২২টি গুরুত্বপূর্ণ তথ্যসূত্র উদ্ধৃত করে, যা FDR পদ্ধতি, আর্থিক অসঙ্গতি আবিষ্কার, একাধিক পরীক্ষা নিয়ন্ত্রণ ইত্যাদি মূল ক্ষেত্রের ক্লাসিক এবং অত্যাধুনিক গবেষণা অন্তর্ভুক্ত করে, গবেষণার জন্য দৃঢ় তাত্ত্বিক ভিত্তি এবং অভিজ্ঞতামূলক সমর্থন প্রদান করে।


সামগ্রিক মূল্যায়ন: এটি আর্থিক পরিমাণগত অর্থনীতি ক্ষেত্রে গুরুত্বপূর্ণ অবদান সহ একটি পেপার, যা সহজ এবং মার্জিত পদ্ধতির মাধ্যমে দীর্ঘস্থায়ী বিরোধপূর্ণ সমস্যার সমাধান করে এবং আর্থিক অসঙ্গতি সাহিত্যের পরিসংখ্যানগত বিশ্বাসযোগ্যতা বোঝার জন্য নতুন দৃষ্টিভঙ্গি এবং সরঞ্জাম প্রদান করে।