2025-11-14T08:01:10.960100

Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism

Green
The human MHC transplantation loci (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) are the most polymorphic in the human genome. It is generally accepted this polymorphism reflects a role in presenting pathogen-derived peptide to the adaptive immune system. Proposed mechanisms for the polymorphism such as negative frequency-dependent selection (NFDS) and heterozygote advantage (HA) focus on HLA alleles, not haplotypes. Here, we propose a model for the polymorphism in which infectious diseases impose independent density-dependent regulation on HLA haplotypes. More specifically, a complex pathogen environment drives extensive host polymorphism through a guild of HLA haplotypes that are specialised and show incomplete peptide recognition. Separation of haplotype guilds is maintained by limiting similarity. The outcome is a wide and stable range of haplotype densities at steady-state in which effective Fisher fitnesses are zero. Densities, and therefore frequencies, emerge theoretically as alternative measures of fitness. A catalogue of ranked frequencies is therefore one of ranked fitnesses. The model is supported by data from a range of sources including a Caucasian HLA dataset compiled by the US National Marrow Donor Program (NMDP). These provide evidence of positive selection on the top 350-2000 5-locus HLA haplotypes taken from an overall NMDP sample set of 10E5. High-fitness haplotypes drive the selection of 137 high-frequency alleles spread across the 5 HLA loci under consideration. These alleles demonstrate positive epistasis and pleiotropy in the formation of haplotypes. Allelic pleiotropy creates a network of highly inter-related HLA haplotypes that account for 97% of the census sample. We suggest this network has properties of a quasi-species and is itself under selection. We also suggest this is the origin of balancing selection in the HLA system.
academic

Инфекционные заболевания, налагающие зависящую от плотности смертность на вариацию MHC/HLA, могут объяснить балансирующий отбор и полиморфизм MHC/HLA

Основная информация

  • ID статьи: 2501.00767
  • Название: Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism
  • Автор: D. P. L. Green
  • Классификация: q-bio.PE (Популяционная и эволюционная биология), q-bio.MN (Молекулярные сети)
  • Дата публикации: 31 декабря 2024
  • Ссылка на статью: https://arxiv.org/abs/2501.00767

Аннотация

Локусы трансплантационных генов главного комплекса гистосовместимости человека (MHC) (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) представляют собой наиболее полиморфные области человеческого генома. Широко признано, что этот полиморфизм отражает их роль в презентации пептидов, полученных из патогенов, адаптивной иммунной системе. Предложенные в настоящее время механизмы полиморфизма, такие как отрицательная частотно-зависимая селекция (NFDS) и гетерозиготное преимущество (HA), в основном сосредоточены на аллелях HLA, а не на гаплотипах. В данном исследовании предложена новая модель, согласно которой инфекционные заболевания налагают независимую зависящую от плотности регуляцию на гаплотипы HLA. В частности, сложная среда патогенов способствует широкому полиморфизму хозяина через популяции специализированных гаплотипов HLA, демонстрирующих неполное распознавание пептидов. Разделение между популяциями гаплотипов поддерживается путём ограничения сходства. Результатом является создание при стационарном состоянии широкого и стабильного диапазона плотностей гаплотипов, при котором эффективная приспособленность по Фишеру равна нулю. Плотность и частота теоретически становятся альтернативными мерами приспособленности. Анализ, основанный на наборе данных HLA кавказского населения Национальной программы донорства костного мозга (NMDP), подтверждает модель и предоставляет доказательства положительного отбора 350-2000 ведущих пятилокусных гаплотипов HLA. Гаплотипы с высокой приспособленностью управляют отбором 137 высокочастотных аллелей. Эти аллели демонстрируют положительную эпистаз и плейотропию при формировании гаплотипов, создавая высоко взаимосвязанную сеть гаплотипов HLA, составляющую 97% от общего числа образцов.

Исследовательский контекст и мотивация

Определение проблемы

Экстремальный полиморфизм системы HLA является классической проблемой эволюционной биологии. Существующие теории включают:

  1. Отрицательная частотно-зависимая селекция (NFDS): редкие аллели имеют селективное преимущество
  2. Гетерозиготное преимущество (HA): гетерозиготные особи имеют более высокую приспособленность
  3. Изменение окружающей среды: пространственно-временные изменения окружающей среды поддерживают полиморфизм

Ограничения существующих подходов

  1. Фокус на аллелях, а не на гаплотипах: игнорирует селективное давление на уровне гаплотипов
  2. Отсутствие популяционно-биологического обоснования: не учитывает эффекты, зависящие от плотности
  3. Несоответствие теории и данных: затруднено объяснение наблюдаемых моделей распределения частот
  4. Игнорирование эпидемиологических характеристик передачи патогенов: не учитывается зависящая от плотности передача болезней

Мотивация исследования

Автор предлагает необходимость новой теоретической базы для объяснения:

  • Распределения частот с тяжёлыми хвостами аллелей и гаплотипов HLA
  • Положительного неравновесия по сцеплению в высокочастотных гаплотипах
  • Избыточной гомозиготности обычных пятилокусных гаплотипов
  • Долгосрочного сохранения полиморфизма между видами

Основные вклады

  1. Предложение модели регуляции, зависящей от плотности: представление инфекционных заболеваний как источника зависящей от плотности смертности гаплотипов HLA
  2. Установление теории селекции гаплотипов: доказательство того, что селекция действует в основном на уровне гаплотипов, а не аллелей
  3. Обнаружение структуры сети HLA: идентификация высоко взаимосвязанной сети, состоящей из 137 основных аллелей
  4. Предоставление эмпирической поддержки: проверка теоретических предсказаний на основе крупномасштабного набора данных NMDP
  5. Переопределение балансирующей селекции: интерпретация балансирующей селекции как результата регуляции, зависящей от плотности

Подробное описание методов

Теоретическая база

Модель регуляции, зависящей от плотности

На основе логистического уравнения Ферхюльста и уравнения передачи болезни Андерсона-Мея:

dN/dt = rN - αN²

где:

  • N: плотность гаплотипа
  • r: внутренняя скорость роста (приспособленность по Фишеру)
  • α: коэффициент смертности, зависящий от плотности

Условия стационарного состояния

При стационарном состоянии (dN/dt = 0):

r = αN*

Для сосуществования нескольких гаплотипов:

α₁N₁* = α₂N₂* = ... = αᵢNᵢ* = r̃

Расширение модели Нехера-Шраймана

Разложение приспособленности гаплотипа:

F = E + A

где E — компонента эпистаза, A — аддитивная компонента.

Методы анализа данных

Анализ логарифмического ранга-частоты

Использование метода лингвистического анализа Белевича:

log(pᵢ/p₀) = -A log(i/i₀)

Сетевой анализ

  • Идентификация моделей плейотропии высокочастотных аллелей
  • Анализ связности между гаплотипами
  • Количественная оценка эффектов эпистаза

Экспериментальная установка

Наборы данных

  • Набор данных NMDP кавказского населения: содержит данные пятилокусных гаплотипов HLA для ~10⁵ особей
  • Охватываемые локусы: HLA-A, -B, -C, -DRB1, -DQB1
  • Размер выборки: 85 000 гаплотипов с частотами, охватывающими 6 порядков величины

Показатели анализа

  • Модели распределения ранга-частоты
  • Неравновесие по сцеплению (D')
  • Энтропия Шеннона
  • Величина эффектов эпистаза

Сравнительный анализ

  • Наблюдаемые частоты vs ожидаемые частоты (на основе произведения частот аллелей)
  • Модели неравновесия по сцеплению высокочастотных vs низкочастотных гаплотипов
  • Распределение основных аллелей vs редких аллелей

Результаты экспериментов

Основные находки

1. Бимодальное распределение гаплотипов

  • Популяция под отбором: 350-2000 высокочастотных гаплотипов (составляют 80% выборки)
  • Популяция нейтральной/отрицательной селекции: низкочастотные гаплотипы (составляют 20% выборки)
  • Точка перехода: приблизительно 1730-я позиция

2. Сеть основных аллелей

Идентифицировано 137 основных аллелей:

  • HLA-A: 30 аллелей (кумулятивная частота 99,7%)
  • HLA-B: 40 аллелей (кумулятивная частота 98,6%)
  • HLA-C: 20 аллелей (кумулятивная частота 99,6%)
  • HLA-DQB1: 15 аллелей (кумулятивная частота 99,9%)
  • HLA-DRB1: 31 аллель (кумулятивная частота 99,3%)

3. Характеристики степенного закона

Высокочастотные гаплотипы подчиняются степенному закону:

y = 0.0506x^(-0.822)

4. Доказательства положительного эпистаза

  • Наблюдаемые частоты гаплотипов охватывают 5 порядков величины
  • Ожидаемые частоты (на основе произведения частот аллелей) охватывают только 1 порядок величины
  • Компонента эпистаза составляет 9-12% от частоты высокочастотных аллелей

Анализ суперантигенов

Картирование основных аллелей на суперантигены HLA:

  • Древние основные аллели (возможно происходящие из неандертальцев/денисовцев) доминируют среди высокочастотных аллелей
  • Внутри суперантигенов проявляется конкурентное исключение
  • Между суперантигенами проявляется ограничение сходства

Анализ дальнего сцепления

Анализ пар HLA-B~DRB1 показывает:

  • Из 1240 возможных пар приблизительно 250 (20%) находятся под селективным давлением
  • Две основные пары: B08:01g/DRB103:01g (8%) и B07:02/DRB115:01 (6,9%)

Теоретическое значение и обсуждение

Переоценка теории балансирующей селекции

Ограничения традиционной теории

  1. Гетерозиготное преимущество: требует приблизительно равной приспособленности всех аллелей, что не соответствует наблюдениям
  2. Отрицательная частотно-зависимая селекция: предсказывает слишком быструю скорость замены аллелей, не объясняя межвидовой полиморфизм
  3. Игнорирование эпидемиологии: не учитывает зависящую от плотности передачу болезней

Преимущества новой модели

  1. Регуляция, зависящая от плотности: автоматически производит нулевую эффективную приспособленность, обеспечивая стабильное сосуществование
  2. Селекция гаплотипов: лучше объясняет наблюдаемые модели неравновесия по сцеплению
  3. Сетевые эффекты: объясняет плейотропию аллелей и взаимосвязанность гаплотипов

Аналогия с эволюционной стратегией

Аналогия с машиной "Энигма"

Система HLA аналогична машине "Энигма" времён Второй мировой войны:

  • Многоротовая конструкция: многолокусные гаплотипы усложняют "взлом"
  • Распределённые установки: полиморфизм ограничивает влияние прорыва патогена
  • Широкоспектральная низкоаффинность: контрастирует с высокоаффинной стратегией антител

Динамика Красной Королевы

  • Патогены: быстрое размножение, высокая скорость мутаций
  • Защита хозяина: относительно стабильная система презентации + быстрый ответ расширения T-клеток
  • Точка равновесия: достигается через сеть гаплотипов, обеспечивающую разнообразие защиты

Характеристики квазивидов

Сеть HLA демонстрирует характеристики квазивидов:

  • Высокая взаимосвязанность: связь через плейотропию аллелей
  • Селекция сети: вся сеть, а не отдельные гаплотипы, находится под селективным давлением
  • Стабильность: поддерживается регуляцией, зависящей от плотности

Ограничения и направления будущих исследований

Текущие ограничения

  1. Неясные механизмы эпистаза: конкретные молекулярные механизмы положительного эпистаза требуют дальнейшего уточнения
  2. Проблема временных масштабов: временные масштабы стабильности сети требуют проверки с использованием большего количества исторических данных
  3. Специфичность популяции: анализ в основном основан на данных кавказского населения, требует расширения на другие популяции
  4. Отсутствие данных о патогенах: отсутствует систематическая матрица взаимодействия патоген-HLA

Направления будущих исследований

  1. Функциональная верификация: использование инструментов структурного предсказания, таких как AlphaFold, для изучения механизмов эпистаза
  2. Сравнение между популяциями: анализ функционального перекрытия сетей HLA в различных популяциях
  3. Историческая стабильность: использование данных древней ДНК для проверки стабильности частот сети
  4. Матрица инфекций: построение матрицы распознавания пептидов патогенов и гаплотипов HLA

Глубокая оценка

Сильные стороны

  1. Теоретическая инновация: впервые введена регуляция, зависящая от плотности, в объяснение полиморфизма HLA
  2. Достаточная поддержка данными: систематический анализ на основе крупномасштабного набора данных NMDP
  3. Междисциплинарная интеграция: успешная интеграция популяционной биологии, эпидемиологии и иммуногенетики
  4. Сильная объяснительная способность: единое объяснение нескольких долгосрочных наблюдаемых явлений

Недостатки

  1. Детали механизма: молекулярная основа эпистаза всё ещё требует экспериментальной верификации
  2. Упрощение модели: сложность среды патогенов может быть чрезмерно упрощена
  3. Предсказательная способность: способность модели предсказывать будущую эволюционную динамику требует проверки

Оценка влияния

Это исследование может оказать значительное влияние на следующие области:

  1. Эволюционная иммунология: переопределение теоретической базы эволюции MHC
  2. Персонализированная медицина: новая перспектива для предсказания восприимчивости к заболеваниям на основе HLA
  3. Разработка вакцин: руководство по разработке вакцин с учётом разнообразия HLA в популяциях

Сценарии применения

  • Эволюционный анализ полиморфизма MHC/HLA
  • Исследования популяционной иммуногенетики
  • Моделирование эпидемиологии инфекционных заболеваний
  • Разработка персонализированной иммунотерапии

Заключение

В данном исследовании предложена инновационная теоретическая база, интерпретирующая полиморфизм HLA как результат зависящей от плотности селекции, налагаемой патогенами. Посредством крупномасштабного анализа данных авторы обнаружили, что система HLA формирует высоко взаимосвязанную сеть, состоящую из 137 основных аллелей, которая поддерживает стабильный полиморфизм через положительный эпистаз и плейотропию. Это открытие не только предоставляет новую перспективу для понимания эволюции MHC, но также закладывает теоретическую основу для соответствующих медицинских приложений.