Taylor's law, also known as fluctuation scaling in physics and the power-law variance function in statistics, is an empirical pattern widely observed across fields including ecology, physics, finance, and epidemiology. It states that the variance of a sample scales as a power function of the mean of the sample. We study generalizations of Taylor's law in the context of heavy-tailed distributions with infinite mean and variance. We establish the probabilistic limit and analyze the associated convergence rates. Our results extend the existing literature by relaxing the i.i.d. assumption to accommodate dependence and heterogeneity among the random variables. This generalization enables application to dependent data such as time series and network-structured data. We support the theoretical developments by extensive simulations, and the practical relevance through applications to real network data.
- 論文ID: 2510.09562
- タイトル: Generalized Taylor's Law for Dependent and Heterogeneous Heavy-Tailed Data
- 著者: Pok Him Cheng(コロンビア大学)、Joel E. Cohen(ロックフェラー大学&コロンビア大学)、Hok Kan Ling(クイーンズ大学)、Sheung Chi Phillip Yam(香港中文大学)
- 分類: math.ST stat.TH
- 発表日: 2025年10月13日
- 論文リンク: https://arxiv.org/abs/2510.09562
テイラーの法則(物理学における変動スケーリング則または統計学における冪乗則分散関数としても知られる)は、生態学、物理学、金融学、疫学など多くの分野で広く観察される経験的パターンである。これは標本分散が標本平均の冪関数に従ってスケーリングされることを示している。本論文は、無限平均および無限分散を持つ重尾分布の背景下でテイラーの法則の一般化を研究する。確率的極限を確立し、関連する収束速度を分析する。独立同分布の仮定を緩和することで、確率変数間の従属性と異質性に対応し、既存文献を拡張する。この一般化により、時系列およびネットワーク構造データなどの従属データへの応用が可能になる。理論的発展は広範なシミュレーションにより支持され、実ネットワークデータへの応用により実用的な関連性が実証される。
- テイラーの法則の古典的形式:古典的テイラーの法則は標本分散と標本平均の間の冪乗則関係を記述する:VarX=aμXb、ここでa>0およびbは定数である。
- 既存研究の限界:
- ほとんどの研究は軽尾データに焦点を当てており、母集団平均と分散が存在する
- 主にデータが独立同分布であると仮定している
- 従属性と異質性を持つデータに対する体系的な理論が欠けている
- 重尾分布の重要性:金融、リスク管理、ネットワーク分析などの分野では、重尾分布(尾指数α ∈ (0,1)、無限平均および無限分散を持つ)が広く存在する
- 実データの複雑性:実際のデータはしばしば従属性(時系列など)と異質性(ネットワークデータなど)を示す
- 理論的空白:従属性および異質性を持つ重尾データに対するテイラーの法則の理論的枠組みが欠けている
- 理論的枠組みの拡張:テイラーの法則を無限平均および無限分散を持つ重尾分布に一般化
- 従属性の処理:独立同分布の仮定を緩和し、弱従属データに適用可能な条件を確立
- 異質性のモデリング:異なる分布の混合ケースを処理
- ネットワークデータへの応用:テイラーの法則をネットワーク構造データに初めて適用
- 収束速度分析:詳細な収束速度の特性化を提供
- 実証的検証:3つの実ネットワークデータセットで理論的結果を検証
重尾分布F(x)=x−αl(x)(ここでα>0、l(⋅)は緩変関数)の下でテイラーの法則を研究し、特にα∈(0,1)の場合に平均と分散が無限である状況を扱う。
非負確率変数X1,…,Xnに対して、共通の生存関数Fˉ(x)=x−αl(x)を持つ場合、以下を定義する:
- 第p次標本モーメント:Mn,p:=n−1∑i=1nXip
- 第k次標本中心モーメント:Mn,kc:=n−1∑i=1n(Xi−Mn,1)k
条件A(p):切断確率変数X˘i:=Xi1(Xi<vn)が以下を満たす:
∑i=jCov(X˘ip,X˘jp)=o(vn2pcn2)
定理2.8(高次モーメントのテイラーの法則):
h1,h2>αに対して、条件A(p)がp=h1およびp=h2に対して成立する場合:
logMn,h2logMn,h1−ι(h1,h2)=Op(lognlogcn)+O(logn∣logl(tn)∣)
ここでι(h1,h2):=h2−αh1−αである。
定理2.11(中心モーメントのテイラーの法則):
α∈(0,1)および整数k>αに対して:
logMn,1log∣Mn,kc∣−ι(k,1)=Op(lognlogcn)+O(logn∣logl(tn)∣)
Karamataの定理を使用して切断重尾確率変数のモーメントを確立し、切断水準tnおよびvnの巧妙な選択を通じて無限モーメントを持つ重尾確率変数を近似する。
強混合、φ-混合などの複数の混合条件がすべて条件A(p)を満たすことを証明し、AR(1)モデルの具体的な応用を提供する。
un個の変数がFU(x)=x−αl(x)に従い、n−un個の変数がより軽い尾を持つ分布FVに従う混合分布の場合、テイラーの法則が依然として成立することを証明する。
- Wikipedia Talkデータセット:147,602人のユーザー、ユーザー間の議論ページ編集回数を記録
- Opinionsデータセット:120,492個の製品ノード、各製品が受け取ったレビュー数を記録
- DBpediaデータセット:2,302個の国ノード、各国に関連するエンティティ数を記録
- Hill推定量:尾指数αの推定に使用
- テイラーの法則の傾き:log分散とlog平均の回帰傾き
- 適合度:調整R2および信頼区間
- 負二項分布フィッティング
- パレート分布フィッティング
- 一般化パレート分布フィッティング
3つのデータセットのHill推定量とテイラーの法則から暗示される尾指数は高度に一貫している:
- Wikipedia Talk:Hill推定0.563、テイラーの法則推定は接近
- Epinions:Hill推定0.539、テイラーの法則推定0.539
- DBpedia:Hill推定0.409、テイラーの法則推定は一貫
すべてのデータセットは明確な線形関係を示す:
| データセット | 傾き | 調整R2 | 95%信頼区間 |
|---|
| Wikipedia Talk | 4.027 | 0.617 | (3.396, 4.658) |
| Epinions | 3.145 | 0.674 | (2.709, 3.580) |
| DBpedia | 2.767 | 0.904 | (2.587, 2.946) |
パレート分布は中程度の値の範囲では負二項分布よりもデータをより良くフィットするが、極端な尾部では偏差が存在する。一般化パレート分布は最適な尾部フィッティングを提供する。
論文は理論的結果を検証するための広範なシミュレーションを実施する:
- 独立同分布の場合:パレート、安定分布などのテイラーの法則を検証
- AR(1)モデル:時系列従属性下の理論的予測を確認
- 異質性データ:混合分布ケースのシミュレーション結果は理論と一貫
- ネットワークデータ:ランダムグラフ上のシミュレーションはネットワーク応用を支持
- Taylor(1961)による初期提案
- Cohen等(2013、2020、2022)による重尾分布への拡張
- Brown等(2017、2021)によるα-安定分布の研究
- de la Peña等(2022)による軽尾従属データの動的テイラーの法則研究
- 本論文は重尾従属データを初めて体系的に処理
本論文はテイラーの法則をネットワークデータに適用した初めての研究である。
- 理論的拡張の成功:テイラーの法則を従属性および異質性を持つ重尾データに成功裏に一般化
- 実用性の検証:実ネットワークデータが理論の実用的価値を検証
- 収束速度の明確化:詳細な収束速度分析を提供
- 条件A(p)の検証:実際の応用では条件A(p)の検証が困難である可能性
- 緩変関数の複雑性:異なる緩変関数の収束速度は大きく異なる可能性
- 有限標本の性能:理論は漸近的であり、有限標本では偏差が生じる可能性
- α ∈ (1,2)の場合:有限平均だが無限分散を持つケースへの拡張
- より複雑なネットワーク構造:より一般的なネットワーク従属構造の研究
- 応用分野の拡張:他の分野への応用の探索
- 理論的厳密性:数学的導出は厳密で証明は完全
- 革新性が顕著:従属性および異質性を持つ重尾データのテイラーの法則を初めて体系的に処理
- 実証が充分:シミュレーションと実データ検証は包括的
- 応用価値が高い:ネットワークデータへの応用は重要な実用的意義を持つ
- 技術的複雑性:切断技術と条件A(p)の実際の応用は困難である可能性
- 仮定の制限:緩変関数の仮定は実際に検証が必要
- 計算複雑度:いくつかの理論的結果の計算実装は複雑である可能性
- 理論的貢献が重大:重尾従属データのテイラーの法則の理論的基礎を確立
- 応用前景が広大:ネットワーク分析、金融リスクなどの分野で重要な応用価値
- 方法論的意義:切断技術と混合条件の処理は関連研究にパラダイムを提供
- ネットワーク分析:ソーシャルネットワーク、引用ネットワークなどの次数分布分析
- 金融リスク:極端事象の尾部リスクモデリング
- 生態学研究:種分布の空間従属性分析
- 疫学:疫病伝播のネットワーク効果研究
論文は99篇の関連文献を引用しており、主に以下を含む:
- テイラーの法則の古典的文献:Taylor(1961)、Cohen等の一連の研究
- 重尾分布理論:Bingham等(1987)、Embrechts等(2013)
- 混合過程理論:Bradley(2005)、Andrews(1983)
- ネットワークデータソース:Stanford SNAPプロジェクトなど
総合評価:これは統計学理論における高品質な論文であり、テイラーの法則の一般化において重要な貢献を行っている。論文は理論的に厳密で、実証的に充分であり、特にネットワークデータへの応用において開拓的な意義を持つ。技術的複雑度は高いが、関連分野の研究に重要な理論的基礎と方法論的ツールを提供している。