2025-11-14T08:01:10.960100

Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism

Green
The human MHC transplantation loci (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) are the most polymorphic in the human genome. It is generally accepted this polymorphism reflects a role in presenting pathogen-derived peptide to the adaptive immune system. Proposed mechanisms for the polymorphism such as negative frequency-dependent selection (NFDS) and heterozygote advantage (HA) focus on HLA alleles, not haplotypes. Here, we propose a model for the polymorphism in which infectious diseases impose independent density-dependent regulation on HLA haplotypes. More specifically, a complex pathogen environment drives extensive host polymorphism through a guild of HLA haplotypes that are specialised and show incomplete peptide recognition. Separation of haplotype guilds is maintained by limiting similarity. The outcome is a wide and stable range of haplotype densities at steady-state in which effective Fisher fitnesses are zero. Densities, and therefore frequencies, emerge theoretically as alternative measures of fitness. A catalogue of ranked frequencies is therefore one of ranked fitnesses. The model is supported by data from a range of sources including a Caucasian HLA dataset compiled by the US National Marrow Donor Program (NMDP). These provide evidence of positive selection on the top 350-2000 5-locus HLA haplotypes taken from an overall NMDP sample set of 10E5. High-fitness haplotypes drive the selection of 137 high-frequency alleles spread across the 5 HLA loci under consideration. These alleles demonstrate positive epistasis and pleiotropy in the formation of haplotypes. Allelic pleiotropy creates a network of highly inter-related HLA haplotypes that account for 97% of the census sample. We suggest this network has properties of a quasi-species and is itself under selection. We also suggest this is the origin of balancing selection in the HLA system.
academic

Enfermedades infecciosas, imponiendo mortalidad dependiente de la densidad en la variación MHC/HLA, pueden explicar la selección balanceadora y el polimorfismo MHC/HLA

Información Básica

  • ID del artículo: 2501.00767
  • Título: Enfermedades infecciosas, imponiendo mortalidad dependiente de la densidad en la variación MHC/HLA, pueden explicar la selección balanceadora y el polimorfismo MHC/HLA
  • Autor: D. P. L. Green
  • Clasificación: q-bio.PE (Población y Evolución), q-bio.MN (Redes Moleculares)
  • Fecha de publicación: 31 de diciembre de 2024
  • Enlace del artículo: https://arxiv.org/abs/2501.00767

Resumen

Los loci de trasplante del complejo principal de histocompatibilidad humano (MHC) (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) representan las regiones de mayor polimorfismo en el genoma humano. Se cree ampliamente que este polimorfismo refleja su papel en la presentación de péptidos derivados de patógenos al sistema inmunológico adaptativo. Los mecanismos de polimorfismo propuestos actualmente, como la selección de frecuencia negativa dependiente (NFDS) y la ventaja del heterocigoto (HA), se centran principalmente en alelos HLA en lugar de haplotipos. Este estudio propone un nuevo modelo que sugiere que las enfermedades infecciosas imponen regulación dependiente de la densidad independiente en haplotipos HLA. Específicamente, el entorno complejo de patógenos impulsa el polimorfismo extenso del hospedador a través de poblaciones de haplotipos HLA especializadas que exhiben reconocimiento de péptidos incompleto. La segregación entre poblaciones de haplotipos se mantiene mediante la restricción de similitud. El resultado es la producción en estado estacionario de rangos extensos y estables de densidad de haplotipos, en los cuales la aptitud de Fisher efectiva es cero. La densidad y frecuencia se convierten teóricamente en medidas sustitutivas de la aptitud. El análisis basado en el conjunto de datos HLA de caucásicos del Programa Nacional de Donantes de Médula Ósea (NMDP) respalda el modelo, proporcionando evidencia de selección positiva en 350-2000 haplotipos HLA de 5 loci principales. Los haplotipos de alta aptitud impulsan la selección de 137 alelos de alta frecuencia. Estos alelos exhiben epistasis positiva y pleiotropía en la formación de haplotipos, creando una red de haplotipos HLA altamente interconectada que representa el 97% del total de la muestra.

Antecedentes de la Investigación y Motivación

Definición del Problema

El polimorfismo extremo del sistema HLA es un problema clásico en biología evolutiva. Las teorías existentes incluyen principalmente:

  1. Selección de frecuencia negativa dependiente (NFDS): Los alelos raros poseen ventaja selectiva
  2. Ventaja del heterocigoto (HA): Los individuos heterocigotos poseen mayor aptitud
  3. Cambio ambiental: Las variaciones ambientales espacio-temporales mantienen el polimorfismo

Limitaciones de los Métodos Existentes

  1. Enfoque en alelos en lugar de haplotipos: Ignora las presiones selectivas a nivel de haplotipo
  2. Falta de base biológica poblacional: No considera efectos dependientes de la densidad
  3. Desajuste entre teoría y datos: Dificultad para explicar patrones de distribución de frecuencias observados
  4. Ignorancia de características epidemiológicas de la transmisión de patógenos: No considera la naturaleza dependiente de la densidad de la propagación de enfermedades

Motivación de la Investigación

El autor propone la necesidad de un nuevo marco teórico para explicar:

  • Distribuciones de frecuencia de cola pesada en alelos y haplotipos HLA
  • Desequilibrio de ligamiento positivo en haplotipos de alta frecuencia
  • Exceso de homocigosidad en haplotipos comunes de 5 loci
  • Mantenimiento a largo plazo del polimorfismo entre especies

Contribuciones Principales

  1. Propone modelo de regulación dependiente de la densidad: Identifica enfermedades infecciosas como fuente de mortalidad dependiente de la densidad en haplotipos HLA
  2. Establece teoría de selección de haplotipos: Demuestra que la selección actúa principalmente a nivel de haplotipo en lugar de alelo
  3. Descubre estructura de red HLA: Identifica una red altamente interconectada constituida por 137 alelos nucleares
  4. Proporciona apoyo empírico: Valida predicciones teóricas basadas en el conjunto de datos NMDP a gran escala
  5. Redefine selección balanceadora: Interpreta la selección balanceadora como resultado de regulación dependiente de la densidad

Explicación Detallada de Métodos

Marco Teórico

Modelo de Regulación Dependiente de la Densidad

Basado en la ecuación logística de Verhulst y las ecuaciones de propagación de enfermedades de Anderson-May:

dN/dt = rN - αN²

Donde:

  • N: densidad de haplotipo
  • r: tasa de crecimiento intrínseco (aptitud de Fisher)
  • α: coeficiente de tasa de mortalidad dependiente de la densidad

Condiciones de Estado Estacionario

En estado estacionario (dN/dt = 0):

r = αN*

Para coexistencia de múltiples haplotipos:

α₁N₁* = α₂N₂* = ... = αᵢNᵢ* = r̃

Extensión del Modelo de Neher-Shraiman

Descomposición de la aptitud del haplotipo en:

F = E + A

Donde E es el componente epistático y A es el componente aditivo.

Métodos de Análisis de Datos

Análisis de Rango-Frecuencia Logarítmico-Logarítmico

Utilizando el método de análisis lingüístico de Belevitch:

log(pᵢ/p₀) = -A log(i/i₀)

Análisis de Red

  • Identificación de patrones de pleiotropía en alelos de alta frecuencia
  • Análisis de conectividad entre haplotipos
  • Cuantificación de efectos epistáticos

Configuración Experimental

Conjunto de Datos

  • Conjunto de datos NMDP de caucásicos: Contiene datos de haplotipos HLA de 5 loci de aproximadamente 10⁵ individuos
  • Loci cubiertos: HLA-A, -B, -C, -DRB1, -DQB1
  • Tamaño de muestra: 85,000 haplotipos, frecuencias que abarcan 6 órdenes de magnitud

Indicadores de Análisis

  • Patrones de distribución rango-frecuencia
  • Desequilibrio de ligamiento (D')
  • Entropía de Shannon
  • Magnitud de efectos epistáticos

Análisis Comparativo

  • Frecuencias reales vs. frecuencias esperadas (basadas en producto de frecuencias de alelos)
  • Patrones de desequilibrio de ligamiento en haplotipos de alta vs. baja frecuencia
  • Distribución de alelos nucleares vs. alelos raros

Resultados Experimentales

Hallazgos Principales

1. Distribución Bimodal de Haplotipos

  • Población selectiva: 350-2000 haplotipos de alta frecuencia (80% de la muestra)
  • Población neutral/selección negativa: Haplotipos de baja frecuencia (20% de la muestra)
  • Punto de transición: Aproximadamente posición 1730

2. Red de Alelos Nucleares

Identificación de 137 alelos nucleares:

  • HLA-A: 30 alelos (frecuencia acumulada 99.7%)
  • HLA-B: 40 alelos (frecuencia acumulada 98.6%)
  • HLA-C: 20 alelos (frecuencia acumulada 99.6%)
  • HLA-DQB1: 15 alelos (frecuencia acumulada 99.9%)
  • HLA-DRB1: 31 alelos (frecuencia acumulada 99.3%)

3. Características de Distribución de Ley de Potencias

Los haplotipos de alta frecuencia obedecen a una distribución de ley de potencias:

y = 0.0506x^(-0.822)

4. Evidencia de Epistasis Positiva

  • Las frecuencias reales de haplotipos abarcan 5 órdenes de magnitud
  • Las frecuencias esperadas (basadas en producto de frecuencias de alelos) abarcan solo 1 orden de magnitud
  • El componente epistático representa el 9-12% de la frecuencia de alelos de alta frecuencia

Análisis de Supertipos

Mapeo de alelos nucleares a supertipos HLA:

  • Los alelos nucleares antiguos (posiblemente originarios de neandertales/denisovanos) predominan en alelos de alta frecuencia
  • Exhiben patrones de exclusión competitiva dentro de supertipos
  • Exhiben restricción de similitud entre supertipos

Análisis de Ligamiento de Largo Alcance

El análisis de emparejamiento HLA-B~DRB1 muestra:

  • Aproximadamente 250 de 1240 emparejamientos posibles (20%) están bajo presión selectiva
  • Dos emparejamientos principales: B08:01g/DRB103:01g (8%) y B07:02/DRB115:01 (6.9%)

Significado Teórico y Discusión

Revisión de la Teoría de Selección Balanceadora

Limitaciones de la Teoría Tradicional

  1. Ventaja del heterocigoto: Requiere que todos los alelos tengan aptitudes aproximadamente iguales, lo que no concuerda con las observaciones
  2. Selección de frecuencia negativa dependiente: Predice velocidades de reemplazo de alelos demasiado rápidas, incapaz de explicar polimorfismo entre especies
  3. Ignorancia de epidemiología: No considera características dependientes de la densidad de la propagación de enfermedades

Ventajas del Nuevo Modelo

  1. Regulación dependiente de la densidad: Produce automáticamente aptitud efectiva cero, realizando coexistencia estable
  2. Selección de haplotipos: Explica mejor los patrones de desequilibrio de ligamiento observados
  3. Efectos de red: Explica pleiotropía de alelos e interconexión de haplotipos

Analogía de Estrategia Evolutiva

Analogía de la "Máquina Enigma"

El sistema HLA es análogo a la máquina Enigma de la Segunda Guerra Mundial:

  • Diseño de múltiples rotores: Los haplotipos de múltiples loci aumentan la dificultad de "descifrar"
  • Configuración dispersa: El polimorfismo limita el alcance del impacto de la ruptura de patógenos
  • Afinidad baja de amplio espectro: Contrasta con la estrategia de alta afinidad de anticuerpos

Dinámica de la Reina Roja

  • Patógenos: Reproducción rápida, tasa de mutación alta
  • Defensa del hospedador: Sistema de presentación relativamente estable + respuesta rápida de expansión de células T
  • Punto de equilibrio: Logrado a través de la red de haplotipos para diversificar la defensa

Características de Cuasiespecie

La red HLA exhibe características de cuasiespecie:

  • Altamente interconectada: Conectada a través de pleiotropía de alelos
  • Selección de red: Toda la red en lugar de haplotipos individuales está bajo presión selectiva
  • Estabilidad: Mantenida a través de regulación dependiente de la densidad

Limitaciones y Direcciones Futuras

Limitaciones Actuales

  1. Mecanismo epistático sin aclarar: El mecanismo molecular específico de la epistasis positiva requiere mayor aclaración
  2. Problema de escala temporal: La escala temporal de la estabilidad de la red requiere validación con más datos históricos
  3. Especificidad poblacional: Basado principalmente en datos de población caucásica, requiere extensión a otras poblaciones
  4. Falta de datos de patógenos: Carencia de matriz sistemática de interacciones patógeno-HLA

Direcciones de Investigación Futura

  1. Validación funcional: Uso de herramientas como AlphaFold para estudiar mecanismos epistáticos
  2. Comparación entre poblaciones: Análisis de superposición funcional de redes HLA en diferentes poblaciones
  3. Estabilidad histórica: Validación de estabilidad de frecuencia de red utilizando datos de ADN antiguo
  4. Matriz de infección: Construcción de matriz de reconocimiento de péptidos de patógenos-haplotipos HLA

Evaluación Profunda

Fortalezas

  1. Innovación teórica: Primera introducción de regulación dependiente de la densidad en la explicación del polimorfismo HLA
  2. Apoyo de datos suficiente: Análisis sistemático basado en el conjunto de datos NMDP a gran escala
  3. Integración interdisciplinaria: Integración exitosa de biología poblacional, epidemiología e inmunogenética
  4. Poder explicativo fuerte: Explicación unificada de múltiples fenómenos observados de larga duración

Insuficiencias

  1. Detalles de mecanismo: La base molecular de la epistasis aún requiere validación experimental
  2. Simplificación del modelo: La complejidad del entorno de patógenos puede estar excesivamente simplificada
  3. Capacidad predictiva: La capacidad del modelo para predecir dinámicas evolutivas futuras requiere verificación

Evaluación de Impacto

Esta investigación puede tener un impacto importante en los siguientes campos:

  1. Inmunología evolutiva: Redefinición del marco teórico de la evolución de MHC
  2. Medicina personalizada: Proporciona nueva perspectiva para predicción de susceptibilidad a enfermedades basada en HLA
  3. Diseño de vacunas: Orienta estrategias de desarrollo de vacunas considerando la diversidad HLA poblacional

Escenarios de Aplicación

  • Análisis evolutivo del polimorfismo MHC/HLA
  • Investigación de inmunogenética poblacional
  • Modelado epidemiológico de enfermedades infecciosas
  • Diseño de inmunoterapia personalizada

Conclusión

Este estudio propone un marco teórico innovador que interpreta el polimorfismo HLA como resultado de la selección dependiente de la densidad impuesta por patógenos. A través del análisis de datos a gran escala, el autor descubre que el sistema HLA forma una red altamente interconectada constituida por 137 alelos nucleares, que mantiene polimorfismo estable a través de epistasis positiva y pleiotropía. Este hallazgo no solo proporciona una nueva perspectiva para comprender la evolución de MHC, sino que también establece una base teórica para aplicaciones médicas relacionadas.