This paper deals with a Skorokhod's integral based projection type estimator $\widehat b_m$ of the drift function $b_0$ computed from $N\in\mathbb N^*$ independent copies $X^1,\dots,X^N$ of the solution $X$ of $dX_t = b_0(X_t)dt +ÏdB_t$, where $B$ is a fractional Brownian motion of Hurst index $H\in (1/2,1)$. Skorokhod's integral based estimators cannot be calculated directly from $X^1,\dots,X^N$, but in this paper an $\mathbb L^2$-error bound is established on a calculable approximation of $\widehat b_m$.
论文ID : 2307.04949标题 : On a Calculable Skorokhod's Integral Based Projection Estimator of the Drift Function in Fractional SDE作者 : Nicolas Marie (Laboratoire Modal'X, Université Paris Nanterre)分类 : math.ST (Statistics Theory), math.PR (Probability), stat.TH (Statistics Theory)发表时间 : 2024年1月15日 (arXiv v2)论文链接 : https://arxiv.org/abs/2307.04949 本文研究基于Skorokhod积分的投影型估计器 b ^ m \hat{b}_m b ^ m 来估计分数布朗运动驱动的随机微分方程中的漂移函数 b 0 b_0 b 0 。该估计器基于解 X X X 的 N N N 个独立副本 X 1 , … , X N X^1,\ldots,X^N X 1 , … , X N 计算,其中 d X t = b 0 ( X t ) d t + σ d B t dX_t = b_0(X_t)dt + \sigma dB_t d X t = b 0 ( X t ) d t + σ d B t ,B B B 是Hurst指数 H ∈ ( 1 / 2 , 1 ) H \in (1/2,1) H ∈ ( 1/2 , 1 ) 的分数布朗运动。虽然基于Skorokhod积分的估计器无法直接从观测数据计算,但本文建立了其可计算近似的 L 2 L^2 L 2 误差界。
本文要解决的核心问题是分数随机微分方程中漂移函数的非参数估计问题。考虑如下分数SDE:
X t = X 0 + ∫ 0 t b 0 ( X s ) d s + σ B t , t ∈ [ 0 , T ] X_t = X_0 + \int_0^t b_0(X_s)ds + \sigma B_t, \quad t \in [0,T] X t = X 0 + ∫ 0 t b 0 ( X s ) d s + σ B t , t ∈ [ 0 , T ]
其中 B B B 是双边分数布朗运动,H ∈ ( 1 / 2 , 1 ) H \in (1/2,1) H ∈ ( 1/2 , 1 ) 是Hurst指数,b 0 ∈ C 1 ( R ) b_0 \in C^1(\mathbb{R}) b 0 ∈ C 1 ( R ) 是待估计的漂移函数。
实际应用需求 :在药物动力学等领域,常需要基于多个独立样本(如临床试验中的多个患者)来估计参数,而非依赖单个样本的长时间行为。计算挑战 :传统的基于Skorokhod积分的估计器虽然理论上可行,但无法直接从观测数据计算,这严重限制了其实用性。理论缺口 :现有研究主要关注参数估计或基于长时间行为的估计器,对于基于独立副本的非参数估计研究相对较少。提出可计算的估计器 :通过不动点策略,将不可计算的Skorokhod积分估计器转化为可计算的不动点估计器 b ~ m \tilde{b}_m b ~ m 。建立理论误差界 :为辅助估计器 b ^ m \hat{b}_m b ^ m 和不动点估计器 b ~ m \tilde{b}_m b ~ m 建立了 L 2 L^2 L 2 误差界。收敛率分析 :在平稳情形下,证明了收敛率为 N − ( 2 H − 1 ) / ( 10 H ) N^{-(2H-1)/(10H)} N − ( 2 H − 1 ) / ( 10 H ) ,并给出了样本量 N N N 、时间窗口 T T T 和投影维数 m m m 之间的最优平衡关系。扩展非参数框架 :将Marie 12 的参数估计不动点策略成功扩展到非参数估计框架。给定分数SDE的 N N N 个独立解路径 X 1 , … , X N X^1,\ldots,X^N X 1 , … , X N ,在时间区间 [ 0 , T ] [0,T] [ 0 , T ] 上观测,目标是估计漂移函数 b 0 b_0 b 0 。
设 H = { h : ∥ h ∥ H < ∞ } H = \{h: \|h\|_H < \infty\} H = { h : ∥ h ∥ H < ∞ } 是 B T B_T B T 的再生核Hilbert空间,其内积为:
⟨ h , η ⟩ H = α H ∫ 0 T ∫ 0 T h ( s ) η ( t ) ∣ t − s ∣ 2 H − 2 d s d t \langle h,\eta \rangle_H = \alpha_H \int_0^T \int_0^T h(s)\eta(t)|t-s|^{2H-2}dsdt ⟨ h , η ⟩ H = α H ∫ 0 T ∫ 0 T h ( s ) η ( t ) ∣ t − s ∣ 2 H − 2 d s d t
其中 α H = H ( 2 H − 1 ) \alpha_H = H(2H-1) α H = H ( 2 H − 1 ) 。
Skorokhod积分定义为Malliavin导数的伴随算子。对于过程 Y Y Y ,其Skorokhod积分为:
∫ 0 t Y s δ X s = ∫ 0 t Y s b 0 ( X s ) d s + σ ∫ 0 t Y s δ B s \int_0^t Y_s \delta X_s = \int_0^t Y_s b_0(X_s)ds + \sigma \int_0^t Y_s \delta B_s ∫ 0 t Y s δ X s = ∫ 0 t Y s b 0 ( X s ) d s + σ ∫ 0 t Y s δ B s
考虑区间 I I I 上的正交标准族 ( ϕ 1 , … , ϕ m ) (\phi_1,\ldots,\phi_m) ( ϕ 1 , … , ϕ m ) ,理想的投影估计器为:
b ^ m ( x ) = 1 f ( x ) ∑ j = 1 m ( 1 N T ∑ i = 1 N ∫ 0 T ϕ j ( X s i ) δ X s i ) ϕ j ( x ) \hat{b}_m(x) = \frac{1}{f(x)} \sum_{j=1}^m \left(\frac{1}{NT} \sum_{i=1}^N \int_0^T \phi_j(X^i_s)\delta X^i_s\right) \phi_j(x) b ^ m ( x ) = f ( x ) 1 ∑ j = 1 m ( NT 1 ∑ i = 1 N ∫ 0 T ϕ j ( X s i ) δ X s i ) ϕ j ( x )
其中 f ( x ) = 1 T ∫ 0 T f s ( x ) d s f(x) = \frac{1}{T}\int_0^T f_s(x)ds f ( x ) = T 1 ∫ 0 T f s ( x ) d s 是平均密度函数。
由于Skorokhod积分不可直接计算,利用Nualart 15 的结果:
∫ 0 T ϕ j ( X s i ) δ X s i = I i , j − a ∫ 0 T ∫ 0 t ϕ j ′ ( X t i ) exp ( ∫ s t b 0 ′ ( X u i ) d u ) ∣ t − s ∣ 2 H − 2 d s d t \int_0^T \phi_j(X^i_s)\delta X^i_s = I_{i,j} - a\int_0^T \int_0^t \phi'_j(X^i_t)\exp\left(\int_s^t b'_0(X^i_u)du\right)|t-s|^{2H-2}dsdt ∫ 0 T ϕ j ( X s i ) δ X s i = I i , j − a ∫ 0 T ∫ 0 t ϕ j ′ ( X t i ) exp ( ∫ s t b 0 ′ ( X u i ) d u ) ∣ t − s ∣ 2 H − 2 d s d t
其中 I i , j = ∫ 0 T ϕ j ( X s i ) d X s i I_{i,j} = \int_0^T \phi_j(X^i_s)dX^i_s I i , j = ∫ 0 T ϕ j ( X s i ) d X s i 是可计算的Young积分,a = σ 2 H ( 2 H − 1 ) a = \sigma^2 H(2H-1) a = σ 2 H ( 2 H − 1 ) 。
这导致关系 b ^ m = Φ m ( b 0 ) ≈ Φ m ( b ^ m ) \hat{b}_m = \Phi_m(b_0) \approx \Phi_m(\hat{b}_m) b ^ m = Φ m ( b 0 ) ≈ Φ m ( b ^ m ) ,其中 Φ m \Phi_m Φ m 是映射:
Φ m ( ϕ ) ( x ) = 1 f ( x ) ∑ j = 1 m [ 1 N T ∑ i = 1 N [ I i , j − a ∫ 0 T ∫ 0 t ϕ j ′ ( X t i ) exp ( ∫ s t ϕ ′ ( X u i ) d u ) ∣ t − s ∣ 2 H − 2 d s d t ] ] ϕ j ( x ) \Phi_m(\phi)(x) = \frac{1}{f(x)} \sum_{j=1}^m \left[\frac{1}{NT}\sum_{i=1}^N \left[I_{i,j} - a\int_0^T \int_0^t \phi'_j(X^i_t)\exp\left(\int_s^t \phi'(X^i_u)du\right)|t-s|^{2H-2}dsdt\right]\right]\phi_j(x) Φ m ( ϕ ) ( x ) = f ( x ) 1 ∑ j = 1 m [ NT 1 ∑ i = 1 N [ I i , j − a ∫ 0 T ∫ 0 t ϕ j ′ ( X t i ) exp ( ∫ s t ϕ ′ ( X u i ) d u ) ∣ t − s ∣ 2 H − 2 d s d t ] ] ϕ j ( x )
不动点估计器 b ~ m \tilde{b}_m b ~ m 定义为 Φ m \Phi_m Φ m 在集合 S m , c = { ϕ ∈ S m : ∥ ϕ ′ ∥ ∞ ≤ c } S_{m,c} = \{\phi \in S_m: \|\phi'\|_\infty \leq c\} S m , c = { ϕ ∈ S m : ∥ ϕ ′ ∥ ∞ ≤ c } 中的不动点,其中 c > ∥ b 0 ′ ∥ ∞ c > \|b'_0\|_\infty c > ∥ b 0 ′ ∥ ∞ 。
论文主要进行理论分析,考虑两种主要情形:
确定性初值情形 :X 0 ( ⋅ ) = x 0 ∈ R X_0(\cdot) = x_0 \in \mathbb{R} X 0 ( ⋅ ) = x 0 ∈ R 平稳情形 :b 0 b_0 b 0 满足耗散条件 ∃ m > 0 : ∀ x ∈ R , b 0 ′ ( x ) ≤ − m \exists m > 0: \forall x \in \mathbb{R}, b'_0(x) \leq -m ∃ m > 0 : ∀ x ∈ R , b 0 ′ ( x ) ≤ − m 主要考虑三角基函数情形:在紧区间 I = [ ℓ , r ] I = [\ell,r] I = [ ℓ , r ] 上,
ϕ 1 ( x ) = 1 r − ℓ 1 I ( x ) \phi_1(x) = \sqrt{\frac{1}{r-\ell}}1_I(x) ϕ 1 ( x ) = r − ℓ 1 1 I ( x ) ϕ 2 j + 1 ( x ) = 2 r − ℓ sin ( 2 π j ( x − ℓ ) r − ℓ ) 1 I ( x ) \phi_{2j+1}(x) = \sqrt{\frac{2}{r-\ell}}\sin\left(\frac{2\pi j(x-\ell)}{r-\ell}\right)1_I(x) ϕ 2 j + 1 ( x ) = r − ℓ 2 sin ( r − ℓ 2 πj ( x − ℓ ) ) 1 I ( x ) ϕ 2 j ( x ) = 2 r − ℓ cos ( 2 π j ( x − ℓ ) r − ℓ ) 1 I ( x ) \phi_{2j}(x) = \sqrt{\frac{2}{r-\ell}}\cos\left(\frac{2\pi j(x-\ell)}{r-\ell}\right)1_I(x) ϕ 2 j ( x ) = r − ℓ 2 cos ( r − ℓ 2 πj ( x − ℓ ) ) 1 I ( x )
假设3.1 :X t X_t X t 的分布具有密度 f t f_t f t ,且 t ↦ f t ( x ) ∈ L 1 ( [ 0 , T ] ) t \mapsto f_t(x) \in L^1([0,T]) t ↦ f t ( x ) ∈ L 1 ([ 0 , T ]) 假设4.1 :存在 m f > 0 m_f > 0 m f > 0 使得 f ( x ) ≥ m f , ∀ x ∈ I f(x) \geq m_f, \forall x \in I f ( x ) ≥ m f , ∀ x ∈ I 假设4.4 :存在常数 c ϕ > 0 c_\phi > 0 c ϕ > 0 使得 I ( m ) ∨ L ( m ) ≤ c ϕ R ( m ) I(m) \vee L(m) \leq c_\phi R(m) I ( m ) ∨ L ( m ) ≤ c ϕ R ( m ) 其中 L ( m ) = ∑ j = 1 m ∥ ϕ j ∥ ∞ 2 L(m) = \sum_{j=1}^m \|\phi_j\|_\infty^2 L ( m ) = ∑ j = 1 m ∥ ϕ j ∥ ∞ 2 ,R ( m ) = ∑ j = 1 m ∥ ϕ j ′ ∥ ∞ 2 R(m) = \sum_{j=1}^m \|\phi'_j\|_\infty^2 R ( m ) = ∑ j = 1 m ∥ ϕ j ′ ∥ ∞ 2 。
定理3.3(辅助估计器误差界) :
E ( ∥ b ^ m − b 0 ∥ f 2 2 ) ≤ ∥ b m − b 0 ∥ f 2 2 + 2 N ( ∥ b 0 ∥ f 2 L ( m ) + c 2.5 σ 2 m T T 2 − 2 H ( L ( m ) + R ( m ) ) ) E(\|\hat{b}_m - b_0\|_{f^2}^2) \leq \|b_m - b_0\|_{f^2}^2 + \frac{2}{N}\left(\|b_0\|_f^2 L(m) + c_{2.5}\sigma^2 \frac{m_T}{T^{2-2H}}(L(m) + R(m))\right) E ( ∥ b ^ m − b 0 ∥ f 2 2 ) ≤ ∥ b m − b 0 ∥ f 2 2 + N 2 ( ∥ b 0 ∥ f 2 L ( m ) + c 2.5 σ 2 T 2 − 2 H m T ( L ( m ) + R ( m )) )
定理4.7(不动点估计器误差界) :在平稳情形下,
E ( ∥ b ~ m c , l − b 0 ∥ f 2 2 ) ≤ 2 ∥ b m − b 0 ∥ f 2 2 + c 4.7 R ( m ) V ( N , T ) E(\|\tilde{b}_m^{c,l} - b_0\|_{f^2}^2) \leq 2\|b_m - b_0\|_{f^2}^2 + c_{4.7}R(m)V(N,T) E ( ∥ b ~ m c , l − b 0 ∥ f 2 2 ) ≤ 2∥ b m − b 0 ∥ f 2 2 + c 4.7 R ( m ) V ( N , T )
其中 V ( N , T ) = N − 1 / 2 T − 1 + T 2 H − 1 V(N,T) = N^{-1/2}T^{-1} + T^{2H-1} V ( N , T ) = N − 1/2 T − 1 + T 2 H − 1 。
对于三角基函数,当 ( b 0 f ) ∣ I ∈ W 2 β ( I ) (b_0f)|_I \in W_2^\beta(I) ( b 0 f ) ∣ I ∈ W 2 β ( I ) (β \beta β 阶Sobolev空间)时:
E ( ∥ b ~ m c , l − b 0 ∥ f 2 2 ) ≤ c 4.7 ( m − 2 β + m 3 N − ( 2 H − 1 ) / ( 4 H ) ) E(\|\tilde{b}_m^{c,l} - b_0\|_{f^2}^2) \leq c_{4.7}(m^{-2\beta} + m^3 N^{-(2H-1)/(4H)}) E ( ∥ b ~ m c , l − b 0 ∥ f 2 2 ) ≤ c 4.7 ( m − 2 β + m 3 N − ( 2 H − 1 ) / ( 4 H ) )
最优选择:
时间窗口:T ( N ) = N − 1 / ( 4 H ) T(N) = N^{-1/(4H)} T ( N ) = N − 1/ ( 4 H ) 投影维数:m ≍ N ( 2 H − 1 ) / ( 4 H ( 3 + 2 β ) ) m \asymp N^{(2H-1)/(4H(3+2\beta))} m ≍ N ( 2 H − 1 ) / ( 4 H ( 3 + 2 β )) 收敛率:N − ( 2 H − 1 ) / ( 10 H ) N^{-(2H-1)/(10H)} N − ( 2 H − 1 ) / ( 10 H ) 引理4.6 :在适当条件下,
P ( Δ m c ) ≤ c 4.6 , 2 R ( m ) ( N − 1 / 2 T − 1 + T 2 H − 1 ) P(\Delta_m^c) \leq c_{4.6,2}R(m)(N^{-1/2}T^{-1} + T^{2H-1}) P ( Δ m c ) ≤ c 4.6 , 2 R ( m ) ( N − 1/2 T − 1 + T 2 H − 1 )
其中 Δ m \Delta_m Δ m 是 Φ m \Phi_m Φ m 为压缩映射的事件。
长时间行为估计器 :Kleptsyna & Le Breton 9 , Tudor & Viens 17 , Hu & Nualart 7 等研究了基于单个样本长时间观测的参数估计。非参数估计 :Saussereau 16 , Comte & Marie 2 研究了分数SDE的非参数估计。独立副本方法 :Comte & Genon-Catalot 1 首先在经典扩散过程中研究基于独立副本的估计,Marie 12 将其扩展到分数情形的参数估计。本文首次将基于独立副本的方法扩展到分数SDE的非参数估计,并解决了Skorokhod积分的计算问题。
成功构造了分数SDE漂移函数的可计算非参数估计器 建立了完整的理论分析框架,包括存在性、唯一性和收敛率 揭示了样本量、观测时间和投影维数之间的复杂平衡关系 计算复杂性 :不动点方法需要迭代计算,实际实现较为复杂密度估计依赖 :实际应用中需要同时估计未知密度函数 f f f 假设条件 :需要较强的正则性假设和有界导数条件研究密度函数未知情形下的联合估计问题 开发更高效的数值算法 扩展到多维情形和更一般的分数过程 理论创新性 :首次解决了分数SDE中Skorokhod积分估计器的计算问题方法严谨性 :完整的数学证明和误差分析实用价值 :为分数过程的统计推断提供了新的计算框架技术深度 :巧妙结合Malliavin分析和不动点理论实际验证缺失 :论文纯理论,缺乏数值实验验证计算效率 :不动点迭代的收敛速度和计算复杂度未深入分析假设限制 :某些技术假设在实际应用中可能难以验证学术贡献 :为分数随机过程统计学开辟新方向方法论价值 :不动点策略可能适用于其他类似问题应用前景 :在金融、生物学等领域有潜在应用价值金融市场中的分数布朗运动模型参数估计 生物医学中基于多个个体数据的参数推断 物理系统中长记忆过程的建模 论文引用了17篇相关文献,主要包括:
Malliavin分析基础理论 (Nualart 15 , Decreusefond 4 ) 分数SDE理论 (Hairer & Ohashi 6 ) 统计推断方法 (Comte & Marie 2,3 , Marie 12 ) 逼近理论 (DeVore & Lorentz 5 ) 总体评价 :这是一篇高质量的理论统计学论文,在分数随机微分方程的非参数估计领域做出了重要贡献。虽然缺乏数值实验,但理论分析深入严谨,为该领域的进一步发展奠定了坚实基础。