Following the concentration of the measure theory formalism, we consider the transformation $Φ(Z)$ of a random variable $Z$ having a general concentration function $α$. If the transformation $Φ$ is $λ$-Lipschitz with $λ>0$ deterministic, the concentration function of $Φ(Z)$ is immediately deduced to be equal to $α(\cdot/λ)$. If the variations of $Φ$ are bounded by a random variable $Î$ having a concentration function (around $0$) $β: \mathbb R_+\to \mathbb R$, this paper sets that $Φ(Z)$ has a concentration function analogous to the so-called parallel product of $α$ and $β$. With this result at hand (i) we express the concentration of random vectors with independent heavy-tailed entries, (ii) given a transformation $Φ$ with bounded $k^{\text{th}}$ differential, we express the so-called "multi-level" concentration of $Φ(Z)$ as a function of $α$, and the operator norms of the successive differentials up to the $k^{\text{th}}$ (iii) we obtain a heavy-tailed version of the Hanson-Wright inequality.
معرّف الورقة : 2402.08206العنوان : العمل مع عدم المساواة التركيزالمؤلف : Cosme Louart (كلية العلوم البيانات، جامعة شنتشن الصينية بهونج كونج)التصنيف : math.PR (نظرية الاحتمالات)، math.FA (التحليل الدالي)وقت النشر : تم التقديم في فبراير 2024، نسخة معدلة في أكتوبر 2025رابط الورقة : https://arxiv.org/abs/2402.08206v9 تدرس هذه الورقة خصائص التركيز للمتغيرات العشوائية المحولة Φ ( Z ) \Phi(Z) Φ ( Z ) في إطار نظرية تركيز القياس، عندما يكون للمتغير العشوائي Z Z Z دالة تركيز عامة α \alpha α . عندما تكون التحويل Φ \Phi Φ دالة λ \lambda λ -Lipschitz حتمية، فإن دالة التركيز لـ Φ ( Z ) \Phi(Z) Φ ( Z ) هي α ( ⋅ / λ ) \alpha(\cdot/\lambda) α ( ⋅ / λ ) . عندما يتم تحديد تباين Φ \Phi Φ بواسطة متغير عشوائي Λ \Lambda Λ بدالة تركيز β : R + → R \beta: \mathbb{R}_+ \to \mathbb{R} β : R + → R ، تثبت الورقة أن Φ ( Z ) \Phi(Z) Φ ( Z ) يمتلك دالة تركيز مشابهة لـ "الضرب المتوازي" لـ α \alpha α و β \beta β . بناءً على هذه النتيجة، تقدم الورقة: (i) تعبيراً عن التركيز للمتجهات العشوائية ذات المكونات الثقيلة الذيل المستقلة؛ (ii) تعبيراً عن التركيز "متعدد المستويات" لـ Φ ( Z ) \Phi(Z) Φ ( Z ) للتحويلات ذات المشتقات المحدودة من الرتبة k k k ؛ (iii) الحصول على نسخة ثقيلة الذيل من عدم المساواة Hanson-Wright.
تتمثل إحدى النتائج الأساسية لنظرية تركيز القياس في أنه بالنسبة للمتجه العشوائي الغاوسي Z ∼ N ( 0 , I n ) Z \sim N(0, I_n) Z ∼ N ( 0 , I n ) وأي خريطة 1-Lipschitz f : R n → R f: \mathbb{R}^n \to \mathbb{R} f : R n → R بالنسبة لمعيار إقليدي:
∀ t ≥ 0 : P ( ∣ f ( Z ) − E [ f ( Z ) ] ∣ > t ) ≤ 2 e − t 2 / 2 \forall t \geq 0: P(|f(Z) - E[f(Z)]| > t) \leq 2e^{-t^2/2} ∀ t ≥ 0 : P ( ∣ f ( Z ) − E [ f ( Z )] ∣ > t ) ≤ 2 e − t 2 /2
عندما يكون التحويل F F F هو λ \lambda λ -Lipschitz، فإن دالة التركيز لـ F ( Z ) F(Z) F ( Z ) هي α ( ⋅ / λ ) \alpha(\cdot/\lambda) α ( ⋅ / λ ) . لكن عندما لا تكون λ \lambda λ ثابتة بل متغيراً عشوائياً Λ ( Z ) \Lambda(Z) Λ ( Z ) ، كيف يمكن توصيف خصائص التركيز لـ F ( Z ) F(Z) F ( Z ) ؟
الاكتمال النظري : توسيع عدم المساواة التركيز الكلاسيكية إلى حالات أكثر عموميةالانتشار التطبيقي : يغطي التوزيعات الثقيلة الذيل والدوال غير Lipschitz والسيناريوهات العمليةالابتكار التقني : إدخال العمليات المتوازية للتعامل مع ثوابت Lipschitz العشوائيةالنتائج الكلاسيكية تنطبق فقط على ثوابت Lipschitz الحتمية دراسة خصائص التركيز للتوزيعات الثقيلة الذيل ليست منهجية بما يكفي يفتقد إطار عمل موحد للتعامل مع ظواهر التركيز متعددة المستويات إنشاء إطار عمل نظري لعدم المساواة التركيز تحت ثوابت Lipschitz العشوائية ، مع توسيع النتائج الكلاسيكية إلى الحالة التي تكون فيها Λ \Lambda Λ متغيراً عشوائياًإدخال العمليات المتوازية للمؤثرات الرتيبة القصوى ، توفير أدوات رياضية للتعامل مع عمليات دوال التركيزتطوير نظرية التركيز للمتجهات العشوائية الثقيلة الذيل ، دراسة منهجية لخصائص التركيز للمتجهات ذات المكونات الثقيلة الذيل المستقلةإنشاء عدم المساواة التركيز متعددة المستويات ، توصيف التركيز للدوال ذات المشتقات العليا المحدودةالحصول على تعميم ثقيل الذيل لعدم المساواة Hanson-Wright ، توسيع نتائج التركيز للأشكال التربيعيةالنظرية 0.1 : لتكن ( E , d ) (E,d) ( E , d ) ، ( E ′ , d ′ ) (E',d') ( E ′ , d ′ ) فضاءات مترية، و Z ∈ E Z \in E Z ∈ E متغيراً عشوائياً، و Λ : E → R \Lambda: E \to \mathbb{R} Λ : E → R خريطة قابلة للقياس. إذا كانت هناك خرائط تناقصية بشكل صارم α , β : R + → R + \alpha, \beta: \mathbb{R}_+ \to \mathbb{R}_+ α , β : R + → R + بحيث لأي خريطة 1-Lipschitz f : E → R f: E \to \mathbb{R} f : E → R ونسخة مستقلة Z ′ Z' Z ′ من Z Z Z :
P ( ∣ f ( Z ) − f ( Z ′ ) ∣ > t ) ≤ α ( t ) , P ( Λ ( Z ) > t ) ≤ β ( t ) P(|f(Z) - f(Z')| > t) \leq \alpha(t), \quad P(\Lambda(Z) > t) \leq \beta(t) P ( ∣ f ( Z ) − f ( Z ′ ) ∣ > t ) ≤ α ( t ) , P ( Λ ( Z ) > t ) ≤ β ( t )
والتحويل Φ : E → E ′ \Phi: E \to E' Φ : E → E ′ يرضي:
d ′ ( Φ ( z ) , Φ ( z ′ ) ) ≤ max ( Λ ( z ) , Λ ( z ′ ) ) ⋅ d ( z , z ′ ) d'(\Phi(z), \Phi(z')) \leq \max(\Lambda(z), \Lambda(z')) \cdot d(z,z') d ′ ( Φ ( z ) , Φ ( z ′ )) ≤ max ( Λ ( z ) , Λ ( z ′ )) ⋅ d ( z , z ′ )
إذاً لأي خريطة 1-Lipschitz g : E ′ → R g: E' \to \mathbb{R} g : E ′ → R :
P ( ∣ g ( Φ ( Z ) ) − g ( Φ ( Z ′ ) ) ∣ > t ) ≤ 3 ( α − 1 ⋅ β − 1 ) − 1 ( t ) P(|g(\Phi(Z)) - g(\Phi(Z'))| > t) \leq 3(\alpha^{-1} \cdot \beta^{-1})^{-1}(t) P ( ∣ g ( Φ ( Z )) − g ( Φ ( Z ′ )) ∣ > t ) ≤ 3 ( α − 1 ⋅ β − 1 ) − 1 ( t )
تدخل الورقة فئة المؤثرات الرتيبة القصوى M \mathcal{M} M ، بما في ذلك:
M ↑ \mathcal{M}^{\uparrow} M ↑ : فئة المؤثرات غير المتناقصة القصوىM ↓ \mathcal{M}^{\downarrow} M ↓ : فئة المؤثرات غير المتزايدة القصوىبالنسبة للمؤثرات f , g : R → 2 R f, g: \mathbb{R} \to 2^{\mathbb{R}} f , g : R → 2 R :
المجموع المتوازي : f ⊞ g = ( f − 1 + g − 1 ) − 1 f \boxplus g = (f^{-1} + g^{-1})^{-1} f ⊞ g = ( f − 1 + g − 1 ) − 1 الضرب المتوازي : f ⊟ g = ( f − 1 ⋅ g − 1 ) − 1 f \boxminus g = (f^{-1} \cdot g^{-1})^{-1} f ⊟ g = ( f − 1 ⋅ g − 1 ) − 1 تحقق هذه العمليات قوانين التبادل والتجميع والتوزيع.
القضية 2.21 : اعتبر المتجه العشوائي X = ( X 1 , … , X n ) X = (X_1, \ldots, X_n) X = ( X 1 , … , X n ) ، حيث X i = ϕ i ( Z i ) X_i = \phi_i(Z_i) X i = ϕ i ( Z i ) ، و Z i Z_i Z i متغيرات عشوائية لابلاس ثنائية الجانب مستقلة. عرّف:
h ( t ) = sup ∣ u − v ∣ ≤ t , i ∈ [ n ] ∣ ϕ i ( u ) − ϕ i ( v ) ∣ ∣ u − v ∣ h(t) = \sup_{|u-v| \leq t, i \in [n]} \frac{|\phi_i(u) - \phi_i(v)|}{|u-v|} h ( t ) = sup ∣ u − v ∣ ≤ t , i ∈ [ n ] ∣ u − v ∣ ∣ ϕ i ( u ) − ϕ i ( v ) ∣
لأي خريطة 1-Lipschitz f : R n → R f: \mathbb{R}^n \to \mathbb{R} f : R n → R :
P ( ∣ f ( X ) − f ( X ′ ) ∣ > t ) ≤ 3 C E 1 ∘ min ( ( I d ⋅ h ) − 1 ( 2 c t ) , c t 2 h ( log n ) ) P(|f(X) - f(X')| > t) \leq 3CE_1 \circ \min\left((Id \cdot h)^{-1}(2ct), \frac{ct}{2h(\log n)}\right) P ( ∣ f ( X ) − f ( X ′ ) ∣ > t ) ≤ 3 C E 1 ∘ min ( ( I d ⋅ h ) − 1 ( 2 c t ) , 2 h ( l o g n ) c t )
النظرية 0.2 : لتكن Z ∈ R n Z \in \mathbb{R}^n Z ∈ R n ترضي لأي خريطة 1-Lipschitz f f f :
P ( ∣ f ( Z ) − m f ∣ > t ) ≤ α ( t ) P(|f(Z) - m_f| > t) \leq \alpha(t) P ( ∣ f ( Z ) − m f ∣ > t ) ≤ α ( t )
بالنسبة لخريطة قابلة للتفاضل d d d مرات Φ : R n → R p \Phi: \mathbb{R}^n \to \mathbb{R}^p Φ : R n → R p وخريطة 1-Lipschitz g : R p → R g: \mathbb{R}^p \to \mathbb{R} g : R p → R :
P ( ∣ g ( Φ ( Z ) ) − m g ∣ > t ) ≤ 2 d α ( 1 e min k ∈ [ d ] ( t d m k ) 1 / k ) P(|g(\Phi(Z)) - m_g| > t) \leq 2^d \alpha\left(\frac{1}{e}\min_{k \in [d]}\left(\frac{t}{dm_k}\right)^{1/k}\right) P ( ∣ g ( Φ ( Z )) − m g ∣ > t ) ≤ 2 d α ( e 1 min k ∈ [ d ] ( d m k t ) 1/ k )
حيث m k m_k m k هي الوسيط لـ ∥ d k Φ ∣ Z ∥ \|d^k\Phi|_Z\| ∥ d k Φ ∣ Z ∥ .
تتحقق الورقة بشكل أساسي من النتائج من خلال التحليل النظري، بما في ذلك:
التحقق من خصائص المؤثرات : إثبات الخصائص الجبرية المختلفة للعمليات المتوازيةحساب دوال التركيز : حساب دوال التركيز بشكل ملموس للتوزيعات المختلفةتحليل إحكام الحدود : التحقق من إحكام الحدود من خلال بناء أمثلةالتوزيعات الثقيلة الذيل : اعتبر التوزيعات بكثافة t ↦ q 2 ( 1 + ∣ t ∣ ) − 1 − q t \mapsto \frac{q}{2}(1+|t|)^{-1-q} t ↦ 2 q ( 1 + ∣ t ∣ ) − 1 − q تطبيق Hanson-Wright : التركيز للشكل التربيعي X T A X X^TAX X T A X الدوال متعددة الحدود : فئة الدوال ذات المشتقات العليا المحدودةبالنسبة للتوزيعات الثقيلة الذيل ذات اللحظات من الرتبة q q q ، الحصول على معدل التركيز:
P ( ∣ f ( X ) − m f ∣ ≥ t ) ≤ C ( log 2 ( 1 + c t ) c t ) q P(|f(X) - m_f| \geq t) \leq C\left(\frac{\log^2(1+ct)}{ct}\right)^q P ( ∣ f ( X ) − m f ∣ ≥ t ) ≤ C ( c t l o g 2 ( 1 + c t ) ) q
النظرية 2.50 : بالنسبة للمصفوفة العشوائية X ∈ M p , n X \in M_{p,n} X ∈ M p , n والمصفوفات A ∈ M p A \in M_p A ∈ M p , B ∈ M n B \in M_n B ∈ M n :
P ( ∣ Tr ( B ( X T A X − E [ X T A X ] ) ) ∣ > t ) ≤ 2 α ( σ α ) α ∘ min ( α ( σ α ) t 10 ∥ A ∥ F ∥ B ∥ F σ α , t 6 ∥ A ∥ ∥ B ∥ ) P(|\text{Tr}(B(X^TAX - E[X^TAX]))| > t) \leq \frac{2}{\alpha(\sigma_\alpha)}\alpha \circ \min\left(\frac{\alpha(\sigma_\alpha)t}{10\|A\|_F\|B\|_F\sigma_\alpha}, \sqrt{\frac{t}{6\|A\|\|B\|}}\right) P ( ∣ Tr ( B ( X T A X − E [ X T A X ])) ∣ > t ) ≤ α ( σ α ) 2 α ∘ min ( 10∥ A ∥ F ∥ B ∥ F σ α α ( σ α ) t , 6∥ A ∥∥ B ∥ t )
إثبات أن العمليات المتوازية يمكنها التعامل بشكل طبيعي مع التركيز للمتغيرات العشوائية المستقلة والمجاميع والضروب:
تركيز المجموع : S ∑ X k ≤ n α 1 ⊞ ⋯ ⊞ α n S_{\sum X_k} \leq n\alpha_1 \boxplus \cdots \boxplus \alpha_n S ∑ X k ≤ n α 1 ⊞ ⋯ ⊞ α n تركيز الضرب : S ∏ X k ≤ n α 1 ⊟ ⋯ ⊟ α n S_{\prod X_k} \leq n\alpha_1 \boxminus \cdots \boxminus \alpha_n S ∏ X k ≤ n α 1 ⊟ ⋯ ⊟ α n من خلال التطبيق المتكرر للعمليات المتوازية، الحصول بشكل طبيعي على دوال التركيز متعددة المستويات:
⊞ a k ∈ A ( k ) , k ∈ [ n ] α ∘ ( I d σ 1 ( 1 ) ⋯ σ n ( n ) ) 1 1 + a 1 + ⋯ + a n \boxplus_{a_k \in A^{(k)}, k \in [n]} \alpha \circ \left(\frac{Id}{\sigma_1^{(1)} \cdots \sigma_n^{(n)}}\right)^{\frac{1}{1+a_1+\cdots+a_n}} ⊞ a k ∈ A ( k ) , k ∈ [ n ] α ∘ ( σ 1 ( 1 ) ⋯ σ n ( n ) I d ) 1 + a 1 + ⋯ + a n 1
تركيز Talagrand : خصائص التركيز للدوال المحدبةنظرية Ledoux : الإطار العام لتركيز القياسالتركيز الغاوسي : ظواهر التركيز لقياس غاوسعدم المساواة Fuk-Nagaev : الانحرافات الكبيرة لمجاميع المتغيرات العشوائية المستقلةعدم المساواة Poincaré الضعيفة : خصائص التركيز للتوزيعات الثقيلة الذيلمتغيرات α-subexponential : فئة التوزيعات المعممة subexponentialHanson-Wright الكلاسيكية : الأشكال التربيعية للمتغيرات subgaussianطريقة Latała : الطريقة القائمة على كثيرات حدود Hermiteطريقة معايير الموتر : التركيز للأشكال متعددة الخطوطإطار عمل موحد : إنشاء إطار نظري موحد للتعامل مع ثوابت Lipschitz العشوائيةالعمليات المتوازية : إثبات أن العمليات المتوازية هي أداة طبيعية للتعامل مع عمليات دوال التركيزالتعميم الثقيل الذيل : توسيع منهجي للنتائج الكلاسيكية للتركيز إلى الحالة الثقيلة الذيلالنظرية متعددة المستويات : إنشاء نظرية كاملة لتوصيف التركيز للدوال القابلة للتفاضل من الرتبة العلياتحسين الثوابت : قد لا تكون الثوابت في بعض النتائج مثاليةافتراض الاستقلالية : تتطلب بعض النتائج افتراضات الاستقلاليةالتعقيد الحسابي : قد يكون الحساب الملموس للعمليات المتوازية معقداً نسبياًنطاق التطبيق : تتطلب بعض النتائج متطلبات محددة لأنواع التوزيعاتالتنفيذ الخوارزمي : تطوير خوارزميات فعالة لحساب العمليات المتوازيةالحالات المعتمدة : توسيع النتائج إلى حالات المتغيرات العشوائية المعتمدةالتعميم اللانهائي البعد : توسيع النتائج إلى الفضاءات اللانهائية البعدتوسيع التطبيقات : التطبيقات في التعلم الآلي والتعلم الإحصائيالابتكار النظري : إدخال العمليات المتوازية كأداة رياضية جديدة لنظرية التركيزالقوة المنهجية : إنشاء نظام كامل من النظرية الأساسية إلى التطبيقات المحددةالعمق التقني : يتضمن عدة فروع رياضية بما فيها التحليل الدالي ونظرية الاحتمالاتالقيمة العملية : توفير أدوات عملية لمعالجة البيانات الثقيلة الذيل والدوال غير Lipschitzالحد التقني العالي : كمية كبيرة من نظرية المؤثرات قد تحد من القابلية للقراءةالتحقق التطبيقي : نقص التجارب العددية الملموسة للتحقق من النتائج النظريةتحليل الثوابت : تحليل الثوابت في بعض الحدود ليس عميقاً بما يكفيالطرق الحسابية : نقص الطرق الفعالة للحساب الملموس للعمليات المتوازيةالمساهمة النظرية : توفير أدوات نظرية مهمة لنظرية تركيز القياسقيمة المنهجية : قد تكون طريقة العمليات المتوازية قابلة للتطبيق في مشاكل احتمالية أخرىالتطبيق العملي : توفير أساس نظري لطرق إحصائية قوية لمعالجة البيانات الثقيلة الذيلالتقاطع التخصصي : ربط البحث في التحليل الدالي ونظرية الاحتمالاتتحليل البيانات الثقيلة الذيل : تحليل بيانات مالية وحركة الشبكة والظواهر الثقيلة الذيل الأخرىنظرية التعلم الآلي : تحليل نظري للتحسين غير المحدب والتعلم العميقالاستدلال الإحصائي : الأساس النظري لطرق الإحصاء القويتحليل العمليات العشوائية : تحليل العمليات العشوائية ذات الزيادات الثقيلة الذيلتستشهد الورقة بـ 48 مرجعاً مهماً، تغطي:
الأدبيات الكلاسيكية لنظرية تركيز القياس (Ledoux, Talagrand وغيرهم) نظرية المؤثرات الرتيبة في التحليل الدالي (Bauschke & Combettes وغيرهم) عدم المساواة التركيز في نظرية الاحتمالات (Adamczak, Boucheron وغيرهم) البحث ذو الصلة في احتمالات الذيل الثقيل (Cattiaux, Gozlan وغيرهم) التقييم الإجمالي : هذه ورقة احتمالية بعمق نظري عالي جداً، توفر أدوات رياضية جديدة لنظرية تركيز القياس من خلال إدخال العمليات المتوازية. تتميز الورقة بالابتكار النظري والقوة المنهجية، لكن لا تزال هناك مجالات للتحسن من حيث القابلية للقراءة والتحقق التطبيقي. بالنسبة للباحثين في مجالات نظرية الاحتمالات والتحليل الدالي، توفر هذه الورقة مساهمات نظرية قيمة.