Cumulants, Moments and Selection: The Connection Between Evolution and Statistics
Ahmed, Goodgold, Kothari et al.
Cumulants and moments are closely related to the basic mathematics of continuous and discrete selection (respectively). These relationships generalize Fisher's fundamental theorem of natural selection and also make clear some of its limitation. The relationship between cumulants and continuous selection is especially intuitive and also provides an alternative way to understand cumulants. We show that a similarly simple relationship exists between moments and discrete selection. In more complex scenarios, we show that thinking of selection over discrete generations has significant advantages. For a simple mutation model, we find exact solutions for the equilibrium moments of the fitness distribution. These solutions are surprisingly simple and have some interesting implications including: a necessary and sufficient condition for mutation selection balance, a very simple formula for mean fitness and the fact that the shape of the equilibrium fitness distribution is determined solely by mutation (whereas the scale is determined by the starting fitness distribution).
academic
Cumulants, Moments et Sélection : La Connexion Entre Évolution et Statistiques
Cet article révèle les relations étroites entre les cumulants et les moments avec les fondements mathématiques de la sélection continue/discrète. Ces relations généralisent le théorème fondamental de la sélection naturelle de Fisher et élucident ses limitations. La relation entre les cumulants et la sélection continue est particulièrement intuitive, offrant une nouvelle perspective pour comprendre les cumulants. Les auteurs démontrent l'existence de relations simples analogues entre les moments et la sélection discrète. Dans les cas complexes, la pensée de sélection par générations discrètes présente des avantages significatifs. Pour des modèles de mutation simples, les auteurs trouvent des solutions exactes pour les moments d'équilibre de la distribution de fitness, qui ont une importance majeure : elles fournissent des conditions nécessaires et suffisantes pour l'équilibre mutation-sélection, des formules simples pour la fitness moyenne, et la conclusion que la forme de la distribution de fitness à l'équilibre est entièrement déterminée par la mutation (tandis que l'échelle est déterminée par la distribution initiale de fitness).
Cette recherche vise à établir les liens mathématiques entre les concepts de cumulants/moments en statistiques et le concept de sélection en biologie évolutive, une connexion d'importance majeure pour comprendre les mécanismes de sélection et les concepts statistiques.
Valeur interdisciplinaire: Cette relation s'applique non seulement à la biologie évolutive, mais aussi à l'épidémiologie (épuisement des susceptibles), l'économie et la décroissance de la mémoire immunitaire
Perfectionnement théorique: Généralise le théorème fondamental de la sélection naturelle de Fisher et révèle ses limitations
Valeur pratique: Fournit des outils mathématiques précis pour les scénarios évolutifs complexes
Le théorème de Fisher s'applique uniquement aux changements instantanés, inadapté pour décrire l'évolution biologique qui implique essentiellement des générations discrètes
Le taux de croissance continu r produit des difficultés mathématiques dans les cas extrêmes (r→-∞ quand R→0)
Absence de solutions exactes simples pour traiter les scénarios complexes comme l'équilibre mutation-sélection
Établissement de la relation exacte entre cumulants et sélection continue: Preuve que le taux de variation du i-ème cumulant de fitness égale le (i+1)-ème cumulant
Découverte de la correspondance entre moments et sélection discrète: Dérivation de formules exactes pour l'évolution des moments sous sélection discrète
Généralisation du théorème fondamental de Fisher: Clarification des conditions d'applicabilité et des limitations
Provision de solutions exactes pour les modèles mutation-sélection: Obtention de solutions fermées simples pour les moments d'équilibre
Révélation des propriétés structurelles de la distribution de fitness: Preuve que la forme de la distribution d'équilibre est déterminée uniquement par la mutation, l'échelle par la distribution initiale
Quand la fitness est mesurée par le paramètre Malthusien r (taux de croissance exponentielle), les cumulants et la sélection entretiennent une relation intuitive :
dtdKi(r)=Ki+1(r)
où Ki(r) est le i-ème cumulant de la distribution de fitness. Cela signifie :
Taux de croissance de la fitness moyenne = variance de fitness
Taux de variation de la variance = 3e cumulant (asymétrie non standardisée)
Taux de variation de l'asymétrie = 4e cumulant (kurtosis non standardisé)
Condition d'équilibre mutation-sélection: p>0 est absolument nécessaire
Structure de distribution: La forme de la distribution d'équilibre est entièrement déterminée par la distribution des effets de mutation, max(R) servant uniquement de paramètre d'échelle
Connexion statistique-évolution: Établissement de relations mathématiques exactes entre cumulants/moments et processus de sélection
Avantage du discret: Le modèle R est plus applicable que le modèle r pour traiter les scénarios complexes
Structure d'équilibre: Sous équilibre mutation-sélection, la forme de la distribution est déterminée par la mutation, l'échelle par les conditions initiales
Formules pratiques: Fourniture de formules simples pour calculer la fitness moyenne et le coefficient de variation
Hansen, T.F. (1992). Selection in asexual populations: An extension of the fundamental theorem
Gerrish, P.J. & Sniegowski, P.D. (2012). Real time forecasting of near-future evolution
Galeota-Sprung, B. et al. (2020). Mutational Load and the Functional Fraction of the Human Genome
Elena, S.F. et al. (1998). Distribution of fitness effects caused by random insertion mutations in Escherichia coli
En établissant un pont mathématique entre les statistiques et la biologie évolutive, cet article fait progresser non seulement le développement de la biologie évolutive théorique, mais offre également une nouvelle perspective pour comprendre les concepts statistiques. Le cadre du modèle R proposé démontre des avantages significatifs dans le traitement des problèmes d'évolution par générations discrètes, possédant une valeur théorique importante et des perspectives d'application pratique considérables.