Taylor's law, also known as fluctuation scaling in physics and the power-law variance function in statistics, is an empirical pattern widely observed across fields including ecology, physics, finance, and epidemiology. It states that the variance of a sample scales as a power function of the mean of the sample. We study generalizations of Taylor's law in the context of heavy-tailed distributions with infinite mean and variance. We establish the probabilistic limit and analyze the associated convergence rates. Our results extend the existing literature by relaxing the i.i.d. assumption to accommodate dependence and heterogeneity among the random variables. This generalization enables application to dependent data such as time series and network-structured data. We support the theoretical developments by extensive simulations, and the practical relevance through applications to real network data.
- Paper-ID: 2510.09562
- Titel: Generalized Taylor's Law for Dependent and Heterogeneous Heavy-Tailed Data
- Autoren: Pok Him Cheng (Columbia University), Joel E. Cohen (Rockefeller University & Columbia University), Hok Kan Ling (Queen's University), Sheung Chi Phillip Yam (Chinese University of Hong Kong)
- Klassifizierung: math.ST stat.TH
- Veröffentlichungsdatum: 13. Oktober 2025
- Paper-Link: https://arxiv.org/abs/2510.09562
Das Taylorsche Gesetz (auch bekannt als Fluktuationsskalierungsgesetz in der Physik oder Potenzgesetz-Varianzfunktion in der Statistik) ist ein empirisches Muster, das in Ökologie, Physik, Finanzen und Epidemiologie weit verbreitet beobachtet wird. Es besagt, dass die Stichprobenvarianz als Potenzfunktion des Stichprobenmittelwerts skaliert. Dieser Artikel untersucht die Verallgemeinerung des Taylorschen Gesetzes im Kontext von schwanzlastigen Verteilungen mit unendlichem Mittelwert und Varianz. Wir etablieren probabilistische Grenzwerte und analysieren die zugehörigen Konvergenzgeschwindigkeiten. Unsere Ergebnisse erweitern die bestehende Literatur, indem wir die Annahme der unabhängigen und identischen Verteilung lockern, um Abhängigkeiten und Heterogenität zwischen Zufallsvariablen zu berücksichtigen. Diese Verallgemeinerung ermöglicht die Anwendung auf abhängige Daten wie Zeitreihen und Netzwerkstrukturdaten. Wir unterstützen die theoretische Entwicklung durch umfangreiche Simulationen und demonstrieren die praktische Relevanz durch Anwendungen auf echte Netzwerkdaten.
- Klassische Form des Taylorschen Gesetzes: Das klassische Taylorsche Gesetz beschreibt die Potenzgesetz-Beziehung zwischen Stichprobenvarianz und Stichprobenmittelwert: VarX=aμXb, wobei a>0 und b Konstanten sind.
- Einschränkungen bestehender Forschung:
- Die meisten Studien konzentrieren sich auf leichtlastige Daten, bei denen Populationsmittelwert und Varianz existieren
- Die Hauptannahme ist, dass Daten unabhängig und identisch verteilt sind
- Es fehlt eine systematische Theorie für abhängige und heterogene Daten
- Bedeutung schwanzlastiger Verteilungen: In Finanzen, Risikomanagement, Netzwerkanalyse und anderen Bereichen sind schwanzlastige Verteilungen (mit Schwanzindex α ∈ (0,1) und unendlichem Mittelwert und Varianz) weit verbreitet
- Komplexität realer Daten: Reale Daten zeigen häufig Abhängigkeiten (wie in Zeitreihen) und Heterogenität (wie in Netzwerkdaten)
- Theoretische Lücke: Es fehlt ein theoretischer Rahmen für das Taylorsche Gesetz bei abhängigen und heterogenen schwanzlastigen Daten
- Theoretischer Rahmen-Erweiterung: Verallgemeinerung des Taylorschen Gesetzes auf schwanzlastige Verteilungen mit unendlichem Mittelwert und Varianz
- Behandlung von Abhängigkeiten: Lockerung der Annahme unabhängiger und identischer Verteilung mit Bedingungen für schwach abhängige Daten
- Heterogenitätsmodellierung: Behandlung von Mischungen verschiedener Verteilungen
- Anwendung auf Netzwerkdaten: Erstmalige Anwendung des Taylorschen Gesetzes auf Netzwerkstrukturdaten
- Konvergenzgeschwindigkeitsanalyse: Detaillierte Charakterisierung der Konvergenzgeschwindigkeiten
- Empirische Validierung: Validierung der theoretischen Ergebnisse anhand von drei echten Netzwerkdatensätzen
Untersuchung des Taylorschen Gesetzes unter schwanzlastigen Verteilungen F(x)=x−αl(x) (wobei α>0 und l(⋅) eine langsam variierende Funktion ist), besonders wenn α∈(0,1) und Mittelwert und Varianz unendlich sind.
Für nicht-negative Zufallsvariablen X1,…,Xn mit gemeinsamer Überlebensfunktion Fˉ(x)=x−αl(x), definieren wir:
- Das p-te Stichprobenmoment: Mn,p:=n−1∑i=1nXip
- Das k-te zentrierte Stichprobenmoment: Mn,kc:=n−1∑i=1n(Xi−Mn,1)k
Bedingung A(p): Die abgeschnittenen Zufallsvariablen X˘i:=Xi1(Xi<vn) erfüllen:
∑i=jCov(X˘ip,X˘jp)=o(vn2pcn2)
Satz 2.8 (Taylorsches Gesetz für höhere Momente):
Für h1,h2>α, wenn Bedingung A(p) für p=h1 und p=h2 erfüllt ist, dann:
logMn,h2logMn,h1−ι(h1,h2)=Op(lognlogcn)+O(logn∣logl(tn)∣)
wobei ι(h1,h2):=h2−αh1−α.
Satz 2.11 (Taylorsches Gesetz für zentrierte Momente):
Für α∈(0,1) und ganze Zahl k>α:
logMn,1log∣Mn,kc∣−ι(k,1)=Op(lognlogcn)+O(logn∣logl(tn)∣)
Verwendung des Karamata-Theorems zur Etablierung von Momenten abgeschnittener schwanzlastiger Zufallsvariablen durch geschickte Wahl der Abschneidungsniveaus tn und vn zur Approximation unendlicher Momente.
Nachweis, dass verschiedene Mischbedingungen (starke Mischung, φ-Mischung usw.) Bedingung A(p) erfüllen, mit spezifischen Anwendungen auf AR(1)-Modelle.
Für Mischverteilungen, bei denen un Variablen FU(x)=x−αl(x) folgen und n−un Variablen einer leichteren Verteilung FV folgen, wird nachgewiesen, dass das Taylorsche Gesetz weiterhin gilt.
- Wikipedia Talk-Datensatz: 147.602 Benutzer, Aufzeichnung der Bearbeitungen von Diskussionsseiten zwischen Benutzern
- Epinions-Datensatz: 120.492 Produktknoten, Aufzeichnung der Anzahl der Bewertungen pro Produkt
- DBpedia-Datensatz: 2.302 Länderknoten, Aufzeichnung der Anzahl der mit jedem Land verbundenen Entitäten
- Hill-Schätzer: Zur Schätzung des Schwanzindex α
- Taylorsche Gesetz-Steigung: Regressionssteigung von log-Varianz gegen log-Mittelwert
- Anpassungsgüte: Angepasstes R2 und Konfidenzintervalle
- Negative Binomialverteilungsanpassung
- Pareto-Verteilungsanpassung
- Verallgemeinerte Pareto-Verteilungsanpassung
Hill-Schätzer und durch das Taylorsche Gesetz implizierte Schwanzindizes sind bei allen drei Datensätzen hochgradig konsistent:
- Wikipedia Talk: Hill-Schätzung 0,563, Taylorsche Gesetz-Schätzung ähnlich
- Epinions: Hill-Schätzung 0,539, Taylorsche Gesetz-Schätzung 0,539
- DBpedia: Hill-Schätzung 0,409, Taylorsche Gesetz-Schätzung konsistent
Alle Datensätze zeigen eine klare lineare Beziehung:
| Datensatz | Steigung | Angepasstes R2 | 95%-Konfidenzintervall |
|---|
| Wikipedia Talk | 4,027 | 0,617 | (3,396, 4,658) |
| Epinions | 3,145 | 0,674 | (2,709, 3,580) |
| DBpedia | 2,767 | 0,904 | (2,587, 2,946) |
Die Pareto-Verteilung passt Daten im mittleren Wertebereich besser an als die negative Binomialverteilung, zeigt aber Abweichungen in extremen Schwänzen. Die verallgemeinerte Pareto-Verteilung bietet die beste Schwanzanpassung.
Das Papier validiert die theoretischen Ergebnisse durch umfangreiche Simulationen:
- Unabhängig und identisch verteilte Fälle: Validierung des Taylorschen Gesetzes für Pareto-, stabile Verteilungen usw.
- AR(1)-Modell: Bestätigung der theoretischen Vorhersagen unter Zeitreihenabhängigkeit
- Heterogene Daten: Simulationsergebnisse für Mischverteilungen stimmen mit der Theorie überein
- Netzwerkdaten: Simulationen auf Zufallsgraphen unterstützen Netzwerkanwendungen
- Taylor (1961) führte es erstmals ein
- Erweiterungen von Cohen et al. (2013, 2020, 2022) auf schwanzlastige Verteilungen
- Forschung von Brown et al. (2017, 2021) zu α-stabilen Verteilungen
- de la Peña et al. (2022) untersuchten dynamisches Taylorsches Gesetz für leichtlastige abhängige Daten
- Dieses Papier behandelt erstmals systematisch schwanzlastige abhängige Daten
Dieses Papier ist die erste Studie, die das Taylorsche Gesetz auf Netzwerkdaten anwendet.
- Erfolgreiche theoretische Erweiterung: Erfolgreiche Verallgemeinerung des Taylorschen Gesetzes auf abhängige und heterogene schwanzlastige Daten
- Praktische Validierung: Validierung der praktischen Relevanz der Theorie durch echte Netzwerkdaten
- Explizite Konvergenzgeschwindigkeiten: Detaillierte Konvergenzgeschwindigkeitsanalyse bereitgestellt
- Validierung von Bedingung A(p): Die Validierung von Bedingung A(p) in praktischen Anwendungen kann schwierig sein
- Komplexität langsam variierender Funktionen: Konvergenzgeschwindigkeiten unterscheiden sich erheblich für verschiedene langsam variierende Funktionen
- Endliche Stichprobenleistung: Die Theorie ist asymptotisch; endliche Stichproben können Verzerrungen aufweisen
- Fall α ∈ (1,2): Erweiterung auf Fälle mit endlichem Mittelwert aber unendlicher Varianz
- Komplexere Netzwerkstrukturen: Untersuchung allgemeinerer Netzwerkabhängigkeitsstrukturen
- Erweiterung der Anwendungsbereiche: Erkundung von Anwendungen in anderen Bereichen
- Theoretische Strenge: Mathematische Ableitungen sind präzise und Beweise vollständig
- Signifikante Innovativität: Erstmalige systematische Behandlung des Taylorschen Gesetzes für abhängige und heterogene schwanzlastige Daten
- Umfassende empirische Validierung: Simulationen und echte Datenvalidierung sind umfassend
- Hoher Anwendungswert: Netzwerkdatenanwendungen haben wichtige praktische Bedeutung
- Technische Komplexität: Praktische Anwendung von Abschneidungstechniken und Bedingung A(p) kann schwierig sein
- Annahmebeschränkungen: Annahmen über langsam variierende Funktionen müssen in der Praxis validiert werden
- Rechenkomplexität: Implementierung einiger theoretischer Ergebnisse kann komplex sein
- Bedeutender theoretischer Beitrag: Legt theoretische Grundlagen für das Taylorsche Gesetz bei schwanzlastigen abhängigen Daten
- Breite Anwendungsperspektiven: Wichtige Anwendungswerte in Netzwerkanalyse, Finanzrisiko und anderen Bereichen
- Methodologische Bedeutung: Abschneidungstechniken und Mischbedingungsbehandlung bieten Paradigmen für verwandte Forschung
- Netzwerkanalyse: Analyse der Gradverteilung in sozialen Netzwerken, Zitationsnetzwerken usw.
- Finanzrisiko: Modellierung von Extremrisiken bei extremen Ereignissen
- Ökologische Forschung: Analyse räumlicher Abhängigkeiten in Artverteilungen
- Epidemiologie: Untersuchung von Netzwerkeffekten bei der Ausbreitungsdynamik
Das Papier zitiert 99 verwandte Arbeiten, hauptsächlich:
- Klassische Literatur zum Taylorschen Gesetz: Taylor (1961), Arbeiten von Cohen et al.
- Theorie schwanzlastiger Verteilungen: Bingham et al. (1987), Embrechts et al. (2013)
- Theorie von Mischprozessen: Bradley (2005), Andrews (1983)
- Netzwerkdatenquellen: Stanford SNAP-Projekt usw.
Gesamtbewertung: Dies ist ein hochqualitatives theoretisches statistisches Papier, das wichtige Beiträge zur Verallgemeinerung des Taylorschen Gesetzes leistet. Das Papier ist theoretisch streng, empirisch umfassend und besonders bahnbrechend in der Anwendung auf Netzwerkdaten. Obwohl die technische Komplexität hoch ist, bietet es wichtige theoretische Grundlagen und methodische Werkzeuge für verwandte Forschung.