Consider first a memoryless population model described by the usual branching process with a given mean reproduction matrix on a finite space of types. Motivated by the consequences of atavism in Evolutionary Biology, we are interested in a modification of the dynamics where individuals keep full memory of their forebears and procreation involves the reactivation of a gene picked at random on the ancestral lineage. By comparing the spectral radii of the two mean reproduction matrices (with and without memory), we observe that, on average, the model with memory always grows at least as fast as the model without memory. The proof relies on analyzing a biased Markov chain on the space of memories, and the existence of a unique ergodic law is demonstrated through asymptotic coupling.
论文ID : 2501.00306标题 : On a population model with memory作者 : Jean Bertoin (Institute of Mathematics, University of Zurich, Switzerland)分类 : math.PR (Probability Theory)发表时间 : 2024年12月31日 (arXiv预印本)论文链接 : https://arxiv.org/abs/2501.00306 该论文考虑了一个无记忆的种群模型,该模型由在有限类型空间上具有给定平均繁殖矩阵的标准分支过程描述。受进化生物学中隔代遗传现象的启发,作者研究了一种修改的动力学模型,其中个体保持其祖先的完整记忆,繁殖过程涉及从祖先谱系中随机选择的基因的重新激活。通过比较两个平均繁殖矩阵(有记忆和无记忆)的谱半径,观察到平均而言,有记忆的模型总是比无记忆模型增长得至少一样快。证明依赖于分析记忆空间上的偏置马尔可夫链,并通过渐近耦合证明了唯一遍历律的存在性。
论文研究的核心问题是:在种群模型中引入遗传记忆机制是否有利于种群增长?具体来说,当个体能够"记住"其祖先的遗传信息并在繁殖时随机重新激活这些信息时,种群的平均增长率会如何变化?
研究动机来自进化生物学中的隔代遗传 (atavism)现象:
遗传记忆 :DNA中保存着过去事件的记忆,表型上消失的性状在DNA中并未完全消失基因休眠 :某些基因可能在许多代中保持休眠状态性状重现 :远古祖先的性状可能重新出现,通常由于突变或基因控制缺陷导致休眠基因被激活作者指出,即使在没有自然选择和环境变化的情况下,仅仅是盲目地重新激活祖先遗传材料的可能性,相比无记忆模型总是有益的。这表明隔代遗传对种群的优势不仅来自于提高适应性,还有使用前代记忆进行繁殖所带来的内在益处。
理论结果 :证明了带记忆的分支过程的谱半径总是不小于无记忆模型的谱半径(定理1.1:r ˉ ≥ r \bar{r} \geq r r ˉ ≥ r )数学框架 :建立了分析带记忆种群模型的完整数学框架,包括算子理论和马尔可夫链方法技术创新 :通过偏置马尔可夫链和渐近耦合技术证明了唯一遍历性生物学洞察 :从数学角度证明了遗传记忆机制的内在优势,为进化生物学提供了理论支撑状态空间 :有限类型集合 S S S 繁殖核 :π ( s , ⋅ ) \pi(s, \cdot) π ( s , ⋅ ) ,指定给定父代类型下后代类型的分布平均繁殖矩阵 :m ∈ R + S × S m \in \mathbb{R}_+^{S \times S} m ∈ R + S × S ,其中
m ( s , t ) = ∑ n ∈ N S n t π ( s , n ) m(s,t) = \sum_{n \in \mathbb{N}^S} n_t \pi(s,n) m ( s , t ) = ∑ n ∈ N S n t π ( s , n ) 谱半径 :r r r (Perron-Frobenius特征值)记忆空间 :S N = { s = ( s 0 , s 1 , s 2 , … ) } S^{\mathbb{N}} = \{s = (s_0, s_1, s_2, \ldots)\} S N = { s = ( s 0 , s 1 , s 2 , … )} ,其中s j s_j s j 表示j j j 代前祖先的类型记忆激活 :概率测度τ = ( τ ( j ) : j ≥ 0 ) \tau = (\tau(j) : j \geq 0) τ = ( τ ( j ) : j ≥ 0 ) 描述激活第j j j 代祖先记忆的概率繁殖机制 :个体首先根据τ \tau τ 选择祖先代数T T T ,然后根据π ( s T , ⋅ ) \pi(s_T, \cdot) π ( s T , ⋅ ) 产生后代算子定义 :
m ˉ f ( s ) = ∑ j = 0 ∞ τ ( j ) ∑ t ∈ S m ( s j , t ) f ( t s ) \bar{m}f(s) = \sum_{j=0}^{\infty} \tau(j) \sum_{t \in S} m(s_j, t)f(ts) m ˉ f ( s ) = ∑ j = 0 ∞ τ ( j ) ∑ t ∈ S m ( s j , t ) f ( t s ) 引入符号空间S ˉ = S × S N \bar{S} = S \times S^{\mathbb{N}} S ˉ = S × S N ,其中( s , s ) (s, \mathbf{s}) ( s , s ) 记录个体的激活类型和完整记忆。构造转移核:
Q f ( s , s ) = ∑ j = 0 ∞ τ ( j ) ∑ t ∈ S m ˉ ( s j , t ) f ( s j , t s ) Qf(s, \mathbf{s}) = \sum_{j=0}^{\infty} \tau(j) \sum_{t \in S} \bar{m}(s_j, t)f(s_j, t\mathbf{s}) Q f ( s , s ) = ∑ j = 0 ∞ τ ( j ) ∑ t ∈ S m ˉ ( s j , t ) f ( s j , t s )
其中m ˉ ( s , t ) = m ( s , t ) h ( t ) r h ( s ) \bar{m}(s,t) = \frac{m(s,t)h(t)}{rh(s)} m ˉ ( s , t ) = r h ( s ) m ( s , t ) h ( t ) 是归一化转移矩阵。
建立算子幂次与马尔可夫链的联系:
m ˉ k f ( s ) = r k E s [ f ( X k ) × ∏ j = 1 k h ( Y j ) h ( X j ) ] \bar{m}^k f(s) = r^k \mathbb{E}_s\left[f(X_k) \times \prod_{j=1}^k \frac{h(Y_j)}{h(X_j)}\right] m ˉ k f ( s ) = r k E s [ f ( X k ) × ∏ j = 1 k h ( X j ) h ( Y j ) ]
由于状态空间无限且链保持完整历史记忆,传统的强Feller性质失效。采用渐近耦合:
初始化阶段 :当记忆无公共前缀时,两条链独立演化整合阶段 :当记忆有公共前缀时,使用共同部分激活相同类型陈述 :r ˉ ≥ r \bar{r} \geq r r ˉ ≥ r ,即带记忆模型的谱半径不小于无记忆模型的谱半径。
证明思路 :
通过many-to-one公式将问题转化为分析乘积函数∏ j = 1 k h ( Y j ) h ( X j ) \prod_{j=1}^k \frac{h(Y_j)}{h(X_j)} ∏ j = 1 k h ( X j ) h ( Y j ) 利用Birkhoff遍历定理,需要证明:
lim inf k → ∞ 1 k ∑ j = 1 k ( log h ( Y j ) − log h ( X j ) ) ≥ 0 \liminf_{k \to \infty} \frac{1}{k} \sum_{j=1}^k (\log h(Y_j) - \log h(X_j)) \geq 0 lim inf k → ∞ k 1 ∑ j = 1 k ( log h ( Y j ) − log h ( X j )) ≥ 0 关键在于证明偏置链的唯一遍历性和不变测度的性质 偏置马尔可夫链Q Q Q 是唯一遍历的,即存在唯一的不变概率测度σ \sigma σ 。
不变测度σ \sigma σ 的边际分布满足:
σ ( { ( s , s ) : s = t } ) = σ ( { ( s , s ) : s j = t } ) = ϱ ( t ) h ( t ) \sigma(\{(s, \mathbf{s}) : s = t\}) = \sigma(\{(s, \mathbf{s}) : s_j = t\}) = \varrho(t)h(t) σ ({( s , s ) : s = t }) = σ ({( s , s ) : s j = t }) = ϱ ( t ) h ( t )
无限状态空间 :记忆空间S N S^{\mathbb{N}} S N 是无限的强Feller性质失效 :由于完整记忆保持,传统分析工具不适用不可约性缺失 :经典马尔可夫链理论的标准假设不满足渐近耦合 :构造两条轨道最终无限接近但不完全重合的耦合紧致化技术 :通过伪距离d ( s , s ′ ) = a ∣ s ∧ s ′ ∣ d(s,s') = a_{|s \wedge s'|} d ( s , s ′ ) = a ∣ s ∧ s ′ ∣ 使状态空间紧致多层次分析 :结合算子理论、遍历理论和耦合技术考虑S = { a , b } S = \{a,b\} S = { a , b } ,m = ( 1 1 1 2 ) m = \begin{pmatrix} 1 & 1 \\ 1 & 2 \end{pmatrix} m = ( 1 1 1 2 ) ,τ ( 0 ) = u \tau(0) = u τ ( 0 ) = u ,τ ( 1 ) = 1 − u \tau(1) = 1-u τ ( 1 ) = 1 − u 。
无记忆模型谱半径:r = 3 + 5 2 ≈ 2.618 r = \frac{3+\sqrt{5}}{2} \approx 2.618 r = 2 3 + 5 ≈ 2.618 带记忆模型谱半径:r ˉ ( u ) \bar{r}(u) r ˉ ( u ) 是u u u 的函数,且r ˉ ( u ) ≥ r \bar{r}(u) \geq r r ˉ ( u ) ≥ r 对所有u ∈ ( 0 , 1 ) u \in (0,1) u ∈ ( 0 , 1 ) 成立 论文提供了r ˉ ( u ) \bar{r}(u) r ˉ ( u ) 随u u u 变化的图像,显示不等式通常是严格的。
当平均繁殖矩阵m m m 是平衡的(即∑ t ∈ S m ( s , t ) \sum_{t \in S} m(s,t) ∑ t ∈ S m ( s , t ) 不依赖于s s s )时,有r ˉ = r \bar{r} = r r ˉ = r ,此时记忆不提供额外优势。
论文将该工作与以下领域联系:
强化Galton-Watson过程 :与Bertoin和Mallein的最近工作3,4 有相似性惩罚马尔可夫过程 :与Champagnat等人7 的工作相关多类型分支过程 :基于经典理论1,12 的扩展遗传记忆总是有益的 :即使在没有选择压力的情况下,记忆机制也能提高种群增长率数学机制 :优势来自于多产祖先的遗传材料在当前种群中存在于更大部分,因此更可能被重新激活理论完备性 :提供了分析带记忆分支过程的完整数学框架模型简化 :未考虑环境变化和自然选择记忆激活公平性 :假设激活概率不依赖于记忆内容技术限制 :某些经典结果(如完整的Perron-Frobenius定理)在无界支撑情况下难以建立考虑依赖于记忆内容的激活机制 引入环境变化和选择压力 研究有限记忆长度的优化问题 探索在其他生物学情境中的应用 理论严谨性 :证明技术精巧,特别是渐近耦合的应用生物学相关性 :为隔代遗传现象提供了数学理论支撑技术创新 :克服了传统马尔可夫链理论在无限记忆情况下的困难结果清晰 :主要定理简洁明了,具有直观的生物学解释实际应用限制 :模型过于理想化,与真实生物系统差距较大计算复杂性 :对于实际计算,无限记忆带来的复杂性可能是禁止性的参数敏感性 :缺乏对记忆激活分布τ \tau τ 选择的指导理论贡献 :为概率论中的分支过程理论增加了新的维度跨学科价值 :连接了数学和进化生物学方法论意义 :渐近耦合技术可能适用于其他具有无限记忆的随机过程进化生物学中的理论建模 具有历史依赖性的随机系统分析 遗传算法和进化计算的理论基础研究 论文引用了14篇相关文献,涵盖了分支过程理论、马尔可夫链理论、耦合技术和进化生物学等多个领域,为研究提供了坚实的理论基础。