2025-11-14T08:01:10.960100

Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism

Green
The human MHC transplantation loci (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) are the most polymorphic in the human genome. It is generally accepted this polymorphism reflects a role in presenting pathogen-derived peptide to the adaptive immune system. Proposed mechanisms for the polymorphism such as negative frequency-dependent selection (NFDS) and heterozygote advantage (HA) focus on HLA alleles, not haplotypes. Here, we propose a model for the polymorphism in which infectious diseases impose independent density-dependent regulation on HLA haplotypes. More specifically, a complex pathogen environment drives extensive host polymorphism through a guild of HLA haplotypes that are specialised and show incomplete peptide recognition. Separation of haplotype guilds is maintained by limiting similarity. The outcome is a wide and stable range of haplotype densities at steady-state in which effective Fisher fitnesses are zero. Densities, and therefore frequencies, emerge theoretically as alternative measures of fitness. A catalogue of ranked frequencies is therefore one of ranked fitnesses. The model is supported by data from a range of sources including a Caucasian HLA dataset compiled by the US National Marrow Donor Program (NMDP). These provide evidence of positive selection on the top 350-2000 5-locus HLA haplotypes taken from an overall NMDP sample set of 10E5. High-fitness haplotypes drive the selection of 137 high-frequency alleles spread across the 5 HLA loci under consideration. These alleles demonstrate positive epistasis and pleiotropy in the formation of haplotypes. Allelic pleiotropy creates a network of highly inter-related HLA haplotypes that account for 97% of the census sample. We suggest this network has properties of a quasi-species and is itself under selection. We also suggest this is the origin of balancing selection in the HLA system.
academic

Les maladies infectieuses, imposant une mortalité dépendante de la densité sur la variation du CMH/HLA, peuvent rendre compte de la sélection équilibrée et du polymorphisme du CMH/HLA

Informations de base

  • ID de l'article: 2501.00767
  • Titre: Les maladies infectieuses, imposant une mortalité dépendante de la densité sur la variation du CMH/HLA, peuvent rendre compte de la sélection équilibrée et du polymorphisme du CMH/HLA
  • Auteur: D. P. L. Green
  • Classification: q-bio.PE (Population et Évolution), q-bio.MN (Réseaux Moléculaires)
  • Date de publication: 31 décembre 2024
  • Lien de l'article: https://arxiv.org/abs/2501.00767

Résumé

Les loci de transplantation du complexe majeur d'histocompatibilité humain (CMH) (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) constituent les régions les plus polymorphes du génome humain. Le consensus général attribue ce polymorphisme à leur rôle dans la présentation des peptides dérivés des pathogènes au système immunitaire adaptatif. Les mécanismes de polymorphisme actuellement proposés, tels que la sélection négative dépendante de la fréquence (SNDF) et l'avantage de l'hétérozygote (AH), se concentrent principalement sur les allèles HLA plutôt que sur les haplotypes. Cette étude propose un nouveau modèle selon lequel les maladies infectieuses imposent une régulation dépendante de la densité indépendante sur les haplotypes HLA. Plus précisément, un environnement pathogène complexe stimule un large polymorphisme de l'hôte par le biais de populations d'haplotypes HLA spécialisées présentant une reconnaissance peptidique incomplète. La séparation entre les populations d'haplotypes est maintenue par la restriction de la similarité. Le résultat est la production, à l'équilibre, d'une large gamme stable de densités d'haplotypes dans laquelle l'aptitude Fisher effective est nulle. La densité et la fréquence deviennent théoriquement des mesures substitutives de l'aptitude. L'analyse basée sur l'ensemble de données HLA caucasienne du Programme national de don de moelle osseuse (PNDMO) soutient le modèle, fournissant des preuves de sélection positive sur 350-2000 haplotypes HLA à cinq loci supérieurs. Les haplotypes à aptitude élevée stimulent la sélection de 137 allèles à haute fréquence. Ces allèles présentent une épistasie positive et une pléiotropie dans la formation d'haplotypes, créant un réseau d'haplotypes HLA hautement interconnecté, représentant 97% du total de l'échantillon.

Contexte et motivation de la recherche

Définition du problème

Le polymorphisme extrême du système HLA est un problème classique en biologie évolutive. Les théories existantes comprennent principalement :

  1. Sélection négative dépendante de la fréquence (SNDF): Les allèles rares présentent un avantage sélectif
  2. Avantage de l'hétérozygote (AH): Les individus hétérozygotes présentent une aptitude supérieure
  3. Variation environnementale: Les changements environnementaux spatio-temporels maintiennent le polymorphisme

Limitations des approches existantes

  1. Concentration sur les allèles plutôt que sur les haplotypes: Néglige les pressions de sélection au niveau des haplotypes
  2. Absence de fondements biologiques populationnels: Ne considère pas les effets dépendants de la densité
  3. Inadéquation théorie-données: Difficultés à expliquer les modèles de distribution de fréquence observés
  4. Négligence des caractéristiques épidémiologiques de la transmission pathogène: Ne considère pas la dépendance à la densité de la propagation des maladies

Motivation de la recherche

L'auteur propose le besoin d'un nouveau cadre théorique pour expliquer :

  • Les distributions de fréquence à queue lourde des allèles et haplotypes HLA
  • Le déséquilibre de liaison positif dans les haplotypes à haute fréquence
  • L'excès d'homozygotie des haplotypes communs à cinq loci
  • Le maintien à long terme du polymorphisme entre espèces

Contributions principales

  1. Proposition d'un modèle de régulation dépendante de la densité: Considère les maladies infectieuses comme source de mortalité dépendante de la densité des haplotypes HLA
  2. Établissement d'une théorie de la sélection des haplotypes: Démontre que la sélection agit principalement au niveau des haplotypes plutôt qu'au niveau des allèles
  3. Découverte de la structure du réseau HLA: Identifie un réseau hautement interconnecté constitué de 137 allèles nucléaires
  4. Soutien empirique: Valide les prédictions théoriques basées sur un grand ensemble de données du PNDMO
  5. Redéfinition de la sélection équilibrée: Interprète la sélection équilibrée comme résultant d'une régulation dépendante de la densité

Détails méthodologiques

Cadre théorique

Modèle de régulation dépendante de la densité

Basé sur l'équation logistique de Verhulst et les équations de propagation des maladies d'Anderson-May :

dN/dt = rN - αN²

Où :

  • N: densité d'haplotype
  • r: taux de croissance intrinsèque (aptitude Fisher)
  • α: coefficient de mortalité dépendant de la densité

Conditions d'équilibre

À l'équilibre (dN/dt = 0) :

r = αN*

Pour la coexistence de multiples haplotypes :

α₁N₁* = α₂N₂* = ... = αᵢNᵢ* = r̃

Extension du modèle de Neher-Shraiman

Décomposition de l'aptitude des haplotypes en :

F = E + A

Où E est la composante épistasique et A la composante additive.

Méthodes d'analyse des données

Analyse log-log rang-fréquence

Utilisation de la méthode d'analyse linguistique de Belevitch :

log(pᵢ/p₀) = -A log(i/i₀)

Analyse de réseau

  • Identification des modèles de pléiotropie des allèles à haute fréquence
  • Analyse de la connectivité entre haplotypes
  • Quantification des effets épistasiques

Configuration expérimentale

Ensemble de données

  • Ensemble de données HLA caucasienne du PNDMO: Contient des données d'haplotypes HLA à cinq loci pour ~10⁵ individus
  • Loci couverts: HLA-A, -B, -C, -DRB1, -DQB1
  • Taille de l'échantillon: 85 000 haplotypes, fréquences s'étendant sur 6 ordres de grandeur

Indicateurs d'analyse

  • Modèles de distribution rang-fréquence
  • Déséquilibre de liaison (D')
  • Entropie de Shannon
  • Ampleur des effets épistasiques

Analyse comparative

  • Fréquences réelles vs fréquences attendues (basées sur le produit des fréquences alléliques)
  • Modèles de déséquilibre de liaison des haplotypes à haute fréquence vs basse fréquence
  • Distribution des allèles nucléaires vs allèles rares

Résultats expérimentaux

Principales découvertes

1. Distribution bimodale des haplotypes

  • Population sélectionnée: 350-2000 haplotypes à haute fréquence (80% de l'échantillon)
  • Population neutre/sélection négative: Haplotypes à basse fréquence (20% de l'échantillon)
  • Point de transition: Environ 1730

2. Réseau d'allèles nucléaires

Identification de 137 allèles nucléaires :

  • HLA-A: 30 allèles (fréquence cumulée 99,7%)
  • HLA-B: 40 allèles (fréquence cumulée 98,6%)
  • HLA-C: 20 allèles (fréquence cumulée 99,6%)
  • HLA-DQB1: 15 allèles (fréquence cumulée 99,9%)
  • HLA-DRB1: 31 allèles (fréquence cumulée 99,3%)

3. Caractéristiques de distribution en loi de puissance

Les haplotypes à haute fréquence suivent une distribution en loi de puissance :

y = 0,0506x^(-0,822)

4. Preuves d'épistasie positive

  • Les fréquences d'haplotypes réelles s'étendent sur 5 ordres de grandeur
  • Les fréquences attendues (basées sur le produit des fréquences alléliques) s'étendent sur 1 ordre de grandeur
  • La composante épistasique représente 9-12% de la fréquence des allèles à haute fréquence

Analyse des supertypes

Cartographie des allèles nucléaires aux supertypes HLA :

  • Les allèles nucléaires anciens (possiblement d'origine néandertalienne/dénisovienne) dominent parmi les allèles à haute fréquence
  • Modèles d'exclusion compétitive au sein des supertypes
  • Modèles de restriction de similarité entre supertypes

Analyse de liaison à longue portée

L'analyse des paires HLA-B~DRB1 révèle :

  • Environ 250 des 1240 paires possibles (20%) sont sous pression de sélection
  • Deux paires principales: B08:01g/DRB103:01g (8%) et B07:02/DRB115:01 (6,9%)

Signification théorique et discussion

Réexamen de la théorie de la sélection équilibrée

Limitations des théories traditionnelles

  1. Avantage de l'hétérozygote: Exige que tous les allèles présentent une aptitude approximativement égale, ce qui ne correspond pas aux observations
  2. Sélection négative dépendante de la fréquence: Prédit des taux de remplacement d'allèles trop rapides, incapable d'expliquer le polymorphisme entre espèces
  3. Négligence de l'épidémiologie: Ne considère pas les caractéristiques dépendantes de la densité de la propagation des maladies

Avantages du nouveau modèle

  1. Régulation dépendante de la densité: Produit automatiquement une aptitude Fisher effective nulle, réalisant une coexistence stable
  2. Sélection des haplotypes: Explique mieux les modèles de déséquilibre de liaison observés
  3. Effets de réseau: Explique la pléiotropie des allèles et l'interconnexion des haplotypes

Analogie avec les stratégies évolutives

Analogie avec la machine Enigma

Le système HLA est analogue à la machine Enigma de la Seconde Guerre mondiale :

  • Conception multi-rotors: Les haplotypes multi-loci augmentent la difficulté de "décryptage"
  • Paramètres dispersés: Le polymorphisme limite l'impact de la percée pathogène
  • Affinité large mais faible: Contraste avec la stratégie d'affinité élevée des anticorps

Dynamique de la Reine Rouge

  • Pathogènes: Reproduction rapide, taux de mutation élevé
  • Défense de l'hôte: Système de présentation relativement stable + réaction d'expansion rapide des cellules T
  • Point d'équilibre: Réalisé par la diversification de la défense via le réseau d'haplotypes

Caractéristiques de quasi-espèce

Le réseau HLA présente des caractéristiques de quasi-espèce :

  • Interconnexion élevée: Connecté par la pléiotropie des allèles
  • Sélection de réseau: Le réseau entier plutôt que les haplotypes individuels est sous pression de sélection
  • Stabilité: Maintenue par la régulation dépendante de la densité

Limitations et directions futures

Limitations actuelles

  1. Mécanisme d'épistasie non élucidé: Les mécanismes moléculaires spécifiques de l'épistasie positive nécessitent une clarification supplémentaire
  2. Problème d'échelle temporelle: L'échelle temporelle de la stabilité du réseau nécessite une validation avec plus de données historiques
  3. Spécificité populationnelle: Principalement basée sur des données caucasiennes, nécessite une extension à d'autres populations
  4. Manque de données pathogènes: Absence de matrice d'interaction pathogène-HLA systématique

Directions de recherche futures

  1. Validation fonctionnelle: Utilisation d'outils de prédiction de structure comme AlphaFold pour étudier les mécanismes d'épistasie
  2. Comparaison entre populations: Analyse du chevauchement fonctionnel des réseaux HLA dans différentes populations
  3. Stabilité historique: Utilisation de données d'ADN ancien pour valider la stabilité des fréquences du réseau
  4. Matrice d'infection: Construction d'une matrice de reconnaissance peptide pathogène-haplotype HLA

Évaluation approfondie

Points forts

  1. Innovation théorique: Introduction novatrice de la régulation dépendante de la densité dans l'explication du polymorphisme HLA
  2. Soutien empirique suffisant: Analyse systématique basée sur un grand ensemble de données du PNDMO
  3. Intégration interdisciplinaire: Intégration réussie de la biologie des populations, de l'épidémiologie et de la génétique immunitaire
  4. Pouvoir explicatif fort: Explication unifiée de multiples phénomènes observés de longue date

Insuffisances

  1. Détails mécanistes: Les bases moléculaires de l'épistasie nécessitent toujours une vérification expérimentale
  2. Simplification du modèle: La complexité de l'environnement pathogène peut être excessivement simplifiée
  3. Capacité prédictive: La capacité du modèle à prédire les dynamiques évolutives futures reste à vérifier

Évaluation de l'impact

Cette recherche pourrait avoir un impact important sur les domaines suivants :

  1. Immunologie évolutive: Redéfinition du cadre théorique de l'évolution du CMH
  2. Médecine personnalisée: Nouvelle perspective pour la prédiction de la susceptibilité aux maladies basée sur le HLA
  3. Conception de vaccins: Orientation du développement de vaccins tenant compte de la diversité HLA des populations

Scénarios d'application

  • Analyse évolutive du polymorphisme du CMH/HLA
  • Recherche en génétique immunitaire des populations
  • Modélisation épidémiologique des maladies infectieuses
  • Conception de thérapies immunitaires personnalisées

Conclusion

Cette étude propose un cadre théorique innovant interprétant le polymorphisme HLA comme résultant d'une sélection dépendante de la densité imposée par les pathogènes. Par l'analyse de données à grande échelle, l'auteur découvre que le système HLA forme un réseau hautement interconnecté constitué de 137 allèles nucléaires, maintenant un polymorphisme stable par l'épistasie positive et la pléiotropie. Cette découverte non seulement fournit une nouvelle perspective pour comprendre l'évolution du CMH, mais établit également une base théorique pour les applications médicales connexes.