Cumulants and moments are closely related to the basic mathematics of continuous and discrete selection (respectively). These relationships generalize Fisher's fundamental theorem of natural selection and also make clear some of its limitation. The relationship between cumulants and continuous selection is especially intuitive and also provides an alternative way to understand cumulants. We show that a similarly simple relationship exists between moments and discrete selection. In more complex scenarios, we show that thinking of selection over discrete generations has significant advantages. For a simple mutation model, we find exact solutions for the equilibrium moments of the fitness distribution. These solutions are surprisingly simple and have some interesting implications including: a necessary and sufficient condition for mutation selection balance, a very simple formula for mean fitness and the fact that the shape of the equilibrium fitness distribution is determined solely by mutation (whereas the scale is determined by the starting fitness distribution).
論文ID : 2510.14917タイトル : Cumulants, Moments and Selection: The Connection Between Evolution and Statistics著者 : Hasan Ahmed、Deena Goodgold、Khushali Kothari、Rustom Antia(エモリー大学)分類 : q-bio.PE(集団進化学)対応著者 : Rustom Antia (rantia@emory.edu )論文リンク : https://arxiv.org/abs/2510.14917 本論文は、累積量(cumulants)およびモーメント(moments)と連続/離散選択の数学的基礎との密接な関係を明らかにしている。これらの関係はフィッシャーの自然選択基本定理を一般化し、その限界を明確にしている。累積量と連続選択の関係は特に直感的であり、累積量の理解に新たな視点を提供する。著者らは、モーメントと離散選択の間にも同様の単純な関係が存在することを証明している。複雑な場合には、離散世代選択の思考方法が顕著な利点を示す。単純な突然変異モデルについて、著者らは適応度分布の平衡モーメントの厳密解を見出した。これらの解は重要な意義を持つ:突然変異-選択平衡の必要十分条件を提供し、平均適応度の単純な公式を与え、平衡適応度分布の形状が完全に突然変異によって決定される(スケールは初期適応度分布によって決定される)ことを示している。
本研究は、統計学における累積量/モーメント概念と進化生物学における選択概念の間の数学的関係を確立することを目指している。この関係は、選択メカニズムと統計概念の両方の理解に重要な意義を持つ。
学際的価値 : この関係は進化生物学だけでなく、疫学(感受性の枯渇)、経済学、免疫記憶減衰などの分野にも適用可能である理論の完善化 : フィッシャーの自然選択基本定理を一般化し、その限界を明らかにする実用的価値 : 複雑な進化シナリオに対する厳密な数学的ツールを提供するフィッシャー定理は瞬間的変化にのみ適用でき、本質的に離散世代を含む生物進化の記述には適さない 連続増長率rは極値の場合に数学的困難を生じる(r→-∞ when R→0) 突然変異-選択平衡などの複雑なシナリオを扱う単純な厳密解が欠けている 累積量と連続選択の厳密な関係を確立 : 適応度の第i累積量の変化率が第(i+1)累積量に等しいことを証明モーメントと離散選択の対応関係を発見 : 離散選択下でのモーメント進化の厳密な公式を導出フィッシャー基本定理を一般化 : その適用条件と限界を明確化突然変異-選択モデルの厳密解を提供 : 平衡状態モーメントの単純な閉形式解を取得適応度分布の構造的性質を明らかに : 平衡分布の形状が完全に突然変異によって決定され、スケールが初期分布によって決定されることを証明適応度がマルサス的パラメータr(指数増長率)で測定される場合、累積量と選択の間に直感的な関係が存在する:
d K i ( r ) d t = K i + 1 ( r ) \frac{dK_i(r)}{dt} = K_{i+1}(r) d t d K i ( r ) = K i + 1 ( r )
ここでK i ( r ) K_i(r) K i ( r ) は適応度分布の第i累積量である。これは以下を意味する:
平均適応度の増長率 = 適応度の分散 分散の変化率 = 第3累積量(標準化されていない歪度) 歪度の変化率 = 第4累積量(標準化されていない尖度) 適応度が倍増因子Rで測定される場合(R = e r ⋅ Δ t R = e^{r \cdot \Delta t} R = e r ⋅ Δ t )、モーメントの進化は以下に従う:
M i , t + 1 ( R ) = M i + 1 , t ( R ) M 1 , t ( R ) M_{i,t+1}(R) = \frac{M_{i+1,t}(R)}{M_{1,t}(R)} M i , t + 1 ( R ) = M 1 , t ( R ) M i + 1 , t ( R )
ここでM i , t ( R ) M_{i,t}(R) M i , t ( R ) は時刻tにおける適応度分布の第i原始モーメントである。
子孫の適応度は以下の確率モデルによって決定される:
rモデル: r i = r i ∗ − x ⋅ y r_i = r_i^* - x \cdot y r i = r i ∗ − x ⋅ y Rモデル: R i = R i ∗ ⋅ e − x ⋅ y R_i = R_i^* \cdot e^{-x \cdot y} R i = R i ∗ ⋅ e − x ⋅ y ここでx x x は二項確率変数(有害突然変異の発生の有無)、y y y は突然変異効果の大きさである。
Rモデルについて、平衡状態モーメントは驚くほど単純な形式を持つ:
平均適応度 :
M 1 ( R ) = max ( R ) ⋅ p M_1(R) = \max(R) \cdot p M 1 ( R ) = max ( R ) ⋅ p
高次モーメント :
M i ( R ) = max ( R ) i ⋅ p i ∏ j = 1 i − 1 M j ( e − x ⋅ y ) M_i(R) = \frac{\max(R)^i \cdot p^i}{\prod_{j=1}^{i-1} M_j(e^{-x \cdot y})} M i ( R ) = ∏ j = 1 i − 1 M j ( e − x ⋅ y ) m a x ( R ) i ⋅ p i
ここでp p p は有害突然変異が起こらない確率、max ( R ) \max(R) max ( R ) は初期集団の最大適応度である。
突然変異-選択平衡条件 : p > 0 p > 0 p > 0 は絶対に必要である分布構造 : 平衡分布の形状は完全に突然変異効果分布によって決定され、max ( R ) \max(R) max ( R ) はスケールパラメータとしてのみ機能する変動係数 : C V ( R ) = M 1 ( e − x ⋅ y ) − 1 CV(R) = \sqrt{M_1(e^{-x \cdot y}) - 1} C V ( R ) = M 1 ( e − x ⋅ y ) − 1 著者らはインフルエンザウイルスのパラメータに基づいて詳細なシミュレーションを実施した:
集団サイズ : 100万個体、4000世代突然変異率 : 0.2(インフルエンザ突然変異率に基づく)突然変異効果 : ガンマ分布(α=1、β=2.85)維持メカニズム : 集団が50万以下の場合は倍増研究はさらに3つの物種の突然変異パターンを比較した:
大腸菌 : λ=0.001、M 1 ( e − z ) = 0.969 M_1(e^{-z})=0.969 M 1 ( e − z ) = 0.969 ヒト : λ=2.1、M 1 ( e − z ) = 0.991 M_1(e^{-z})=0.991 M 1 ( e − z ) = 0.991 インフルエンザA : λ=0.223、M 1 ( e − z ) = 0.761 M_1(e^{-z})=0.761 M 1 ( e − z ) = 0.761 Rモデルの理論予測はシミュレーション結果と完全に一致する:
統計量 シミュレーション値 理論値 平均 0.800 0.8 分散 0.0351 0.0351 標準化されていない歪度 -0.00757 -0.00757 標準化されていない尖度 0.000952 0.000951
rモデルの平衡条件d K i ( r ) d t ≈ − K i ( − x ⋅ y ) \frac{dK_i(r)}{dt} \approx -K_i(-x \cdot y) d t d K i ( r ) ≈ − K i ( − x ⋅ y ) は粗く成立するのみであり、理論とシミュレーション間に顕著な偏差が存在する。
異なる物種は全く異なる突然変異パターンを示す:
インフルエンザ : p = 0.8 p=0.8 p = 0.8 、複製精度と速度のトレードオフを体現大腸菌 : p ≈ 1 p≈1 p ≈ 1 、高精度複製ヒト : 多細胞性によりp p p 値が大幅に低下フィッシャー定理は以下の条件下でのみ厳密に成立する:
適応度がrで測定され、瞬間的変化を考慮する場合 Rで測定する場合、親の平均適応度=1または分散=0の場合のみ Hansen (1992) : 累積量と選択の関係に初めて注目Gerrish & Sniegowski (2012) : 関連理論を拡張ハルデーン負荷理論 : 最初の2つのモーメントの導出基礎を提供この理論的枠組みは以下の分野に適用されている:
ワクチン効果の不均一性研究 経済進化理論 免疫記憶ダイナミクス 細胞系統選択測定 統計-進化の関係 : 累積量/モーメントと選択過程の厳密な数学的関係を確立離散の優位性 : Rモデルは複雑なシナリオの処理においてrモデルより適用可能平衡状態構造 : 突然変異-選択平衡下では、分布形状は突然変異によって決定され、スケールは初期条件によって決定される実用的公式 : 平均適応度と変動係数を計算するための単純な公式を提供遺伝的適応度 : 研究は遺伝的適応度に焦点を当てており、実際の子孫数ではない簡略化された仮定 : 有益な突然変異、短期選択などの複雑な要因を考慮していない分布導出 : モーメントのみが得られ、厳密な確率分布は導出されていない極端な場合 : max ( R ) \max(R) max ( R ) が無界でp = 0 p=0 p = 0 の理論的な場合は処理されていない制御実験とシミュレーションを通じて、複雑なシステムが理論公式からどの程度逸脱するかを定量化する モーメントから厳密な確率分布を導出する 組換えが理論的枠組みに与える影響を探索する 有益な突然変異と頻度依存選択の場合を研究する 理論的革新 : 統計学概念と進化理論の橋渡しを初めて体系的に確立数学的厳密性 : 厳密な数学的導出と証明を提供実用的価値 : 公式が単純で実用的であり、適用が容易学際的意義 : 複数の分野に統一的な理論的枠組みを提供実験的検証 : シミュレーション結果が理論予測を完全に検証生物学的現実性 : 一部の仮定(例えば一定の増長率)は生物学的に十分に現実的ではない適用範囲 : 理論は主に単純な突然変異-選択シナリオに適用可能分布の完全性 : モーメントから確率分布を完全に決定できない複雑性の処理 : エピスタシス、頻度依存選択などの複雑な場合の考慮が不足理論的貢献 : 進化理論に新しい数学的ツールを提供方法論的価値 : Rモデルの方法は離散進化過程を研究するための標準的ツールになる可能性がある応用前景 : ウイルス進化、耐性研究などの分野で直接的な応用価値を持つ教育的価値 : 累積量とモーメントの理解に直感的な生物学的説明を提供ウイルス進化 : 特にRNA ウイルスの急速な進化の研究に適している耐性研究 : 耐性突然変異の伝播予測に使用可能合成生物学 : 人工進化システムの設計を指導疫学 : 病原体適応度分布の動的変化を分析主要な参考文献は以下を含む:
Hansen, T.F. (1992). Selection in asexual populations: An extension of the fundamental theorem Gerrish, P.J. & Sniegowski, P.D. (2012). Real time forecasting of near-future evolution Galeota-Sprung, B. et al. (2020). Mutational Load and the Functional Fraction of the Human Genome Elena, S.F. et al. (1998). Distribution of fitness effects caused by random insertion mutations in Escherichia coli 本論文は統計学と進化生物学の間に数学的な橋渡しを確立することにより、理論進化生物学の発展を促進するだけでなく、統計学的概念に新たな理解の視点を提供している。提案されたRモデルの枠組みは離散世代進化問題の処理において顕著な優位性を示し、重要な理論的価値と実際的応用前景を持つ。