2025-11-14T08:01:10.960100

Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism

Green
The human MHC transplantation loci (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) are the most polymorphic in the human genome. It is generally accepted this polymorphism reflects a role in presenting pathogen-derived peptide to the adaptive immune system. Proposed mechanisms for the polymorphism such as negative frequency-dependent selection (NFDS) and heterozygote advantage (HA) focus on HLA alleles, not haplotypes. Here, we propose a model for the polymorphism in which infectious diseases impose independent density-dependent regulation on HLA haplotypes. More specifically, a complex pathogen environment drives extensive host polymorphism through a guild of HLA haplotypes that are specialised and show incomplete peptide recognition. Separation of haplotype guilds is maintained by limiting similarity. The outcome is a wide and stable range of haplotype densities at steady-state in which effective Fisher fitnesses are zero. Densities, and therefore frequencies, emerge theoretically as alternative measures of fitness. A catalogue of ranked frequencies is therefore one of ranked fitnesses. The model is supported by data from a range of sources including a Caucasian HLA dataset compiled by the US National Marrow Donor Program (NMDP). These provide evidence of positive selection on the top 350-2000 5-locus HLA haplotypes taken from an overall NMDP sample set of 10E5. High-fitness haplotypes drive the selection of 137 high-frequency alleles spread across the 5 HLA loci under consideration. These alleles demonstrate positive epistasis and pleiotropy in the formation of haplotypes. Allelic pleiotropy creates a network of highly inter-related HLA haplotypes that account for 97% of the census sample. We suggest this network has properties of a quasi-species and is itself under selection. We also suggest this is the origin of balancing selection in the HLA system.
academic

감염성 질환이 MHC/HLA 변이에 밀도 의존적 사망률을 부과함으로써 균형 선택과 MHC/HLA 다형성을 설명할 수 있음

기본 정보

  • 논문 ID: 2501.00767
  • 제목: Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism
  • 저자: D. P. L. Green
  • 분류: q-bio.PE (집단 및 진화), q-bio.MN (분자 네트워크)
  • 발표 시간: 2024년 12월 31일
  • 논문 링크: https://arxiv.org/abs/2501.00767

초록

인간 주요 조직 적합성 복합체(MHC) 이식 유전자좌(HLA-A, -B, -C, -DPB1, -DQB1, -DRB1)는 인간 게놈에서 가장 높은 다형성을 보이는 영역이다. 이러한 다형성은 적응 면역계에 병원체 유래 펩타이드를 제시하는 역할에 반영된 것으로 널리 인정되고 있다. 현재 제안된 다형성 메커니즘인 음의 빈도 의존 선택(NFDS)과 이형 접합 우위(HA)는 주로 HLA 대립유전자가 아닌 단배형에 초점을 맞추고 있다. 본 연구는 감염성 질환이 HLA 단배형에 독립적인 밀도 의존적 조절을 부과한다는 새로운 모델을 제안한다. 구체적으로, 복잡한 병원체 환경은 전문화되고 불완전한 펩타이드 인식을 나타내는 HLA 단배형 집단을 통해 숙주의 광범위한 다형성을 주도한다. 단배형 집단 간의 분리는 유사성 제한을 통해 유지된다. 결과는 정상 상태에서 광범위하고 안정적인 단배형 밀도 범위를 생성하며, 여기서 유효 Fisher 적합도는 0이다. 밀도와 빈도는 이론적으로 적합도의 대체 측정값이 된다. 미국 국립 골수 기증 프로그램(NMDP) 백인 HLA 데이터셋 분석에 기반하여 이 모델은 350-2000개의 상위 5 유전자좌 HLA 단배형의 양의 선택에 대한 증거를 제공한다. 높은 적합도 단배형은 137개의 고빈도 대립유전자의 선택을 주도한다. 이러한 대립유전자는 단배형 형성에서 양의 상위성과 다면발현을 나타내며, 표본 총수의 97%를 차지하는 고도로 상호 연관된 HLA 단배형 네트워크를 생성한다.

연구 배경 및 동기

문제 정의

HLA 시스템의 극단적 다형성은 진화 생물학의 고전적 문제이다. 기존 이론은 주로 다음을 포함한다:

  1. 음의 빈도 의존 선택(NFDS): 희귀 대립유전자가 선택 우위를 가짐
  2. 이형 접합 우위(HA): 이형 접합 개체가 더 높은 적합도를 가짐
  3. 환경 변화: 시공간 환경 변화가 다형성을 유지함

기존 방법의 한계

  1. 대립유전자가 아닌 단배형에 초점: 단배형 수준의 선택 압력 무시
  2. 인구 생물학적 기초 부족: 밀도 의존적 효과 미고려
  3. 이론과 데이터 불일치: 관찰된 빈도 분포 패턴 설명 곤란
  4. 병원체 전파의 역학적 특성 무시: 질병 전파의 밀도 의존성 미고려

연구 동기

저자는 다음을 설명할 수 있는 새로운 이론적 틀의 필요성을 제시한다:

  • HLA 대립유전자 및 단배형의 두꺼운 꼬리 빈도 분포
  • 고빈도 단배형의 양의 연쇄 부등평형
  • 일반적인 5 유전자좌 단배형의 과도한 동형 접합성
  • 종간 다형성의 장기 유지

핵심 기여

  1. 밀도 의존적 조절 모델 제안: 감염성 질환을 HLA 단배형 밀도 의존적 사망률의 원천으로 제시
  2. 단배형 선택 이론 수립: 선택이 주로 대립유전자가 아닌 단배형 수준에서 작용함을 증명
  3. HLA 네트워크 구조 발견: 137개 핵심 대립유전자로 구성된 고도로 상호 연관된 네트워크 식별
  4. 실증적 지원 제공: NMDP 대규모 데이터셋을 기반으로 이론적 예측 검증
  5. 균형 선택의 재정의: 균형 선택을 밀도 의존적 조절의 결과로 해석

방법론 상세 설명

이론적 틀

밀도 의존적 조절 모델

Verhulst 로지스틱 방정식 및 Anderson-May 질병 전파 방정식에 기반:

dN/dt = rN - αN²

여기서:

  • N: 단배형 밀도
  • r: 내재 증가율(Fisher 적합도)
  • α: 밀도 의존적 사망률 계수

정상 상태 조건

정상 상태에서(dN/dt = 0):

r = αN*

여러 단배형의 공존:

α₁N₁* = α₂N₂* = ... = αᵢNᵢ* = r̃

Neher-Shraiman 모델 확장

단배형 적합도를 다음과 같이 분해:

F = E + A

여기서 E는 상위성 성분, A는 가산 성분이다.

데이터 분석 방법

로그-로그 순위-빈도 분석

Belevitch 언어학 분석 방법 사용:

log(pᵢ/p₀) = -A log(i/i₀)

네트워크 분석

  • 고빈도 대립유전자의 다면발현 패턴 식별
  • 단배형 간 연결도 분석
  • 상위성 효과 정량화

실험 설정

데이터셋

  • NMDP 백인 데이터셋: ~10⁵개 개체의 5 유전자좌 HLA 단배형 데이터 포함
  • 커버 유전자좌: HLA-A, -B, -C, -DRB1, -DQB1
  • 표본 규모: 85,000개 단배형, 6개 수량급 범위의 빈도

분석 지표

  • 순위-빈도 분포 패턴
  • 연쇄 부등평형(D')
  • Shannon 엔트로피
  • 상위성 효과 크기

비교 분석

  • 실제 빈도 vs 예상 빈도(대립유전자 빈도 곱에 기반)
  • 고빈도 vs 저빈도 단배형의 연쇄 부등평형 패턴
  • 핵심 대립유전자 vs 희귀 대립유전자의 분포

실험 결과

주요 발견

1. 이봉형 단배형 분포

  • 선택 집단: 350-2000개 고빈도 단배형(표본의 80%)
  • 중립/음의 선택 집단: 저빈도 단배형(표본의 20%)
  • 전환점: 약 1730번째

2. 핵심 대립유전자 네트워크

137개 핵심 대립유전자 식별:

  • HLA-A: 30개 대립유전자(누적 빈도 99.7%)
  • HLA-B: 40개 대립유전자(누적 빈도 98.6%)
  • HLA-C: 20개 대립유전자(누적 빈도 99.6%)
  • HLA-DQB1: 15개 대립유전자(누적 빈도 99.9%)
  • HLA-DRB1: 31개 대립유전자(누적 빈도 99.3%)

3. 멱법칙 분포 특성

고빈도 단배형은 멱법칙 분포를 따름:

y = 0.0506x^(-0.822)

4. 양의 상위성 증거

  • 실제 단배형 빈도는 5개 수량급 범위
  • 예상 빈도(대립유전자 빈도 곱에 기반)는 1개 수량급 범위만
  • 상위성 성분은 고빈도 대립유전자 빈도의 9-12% 차지

슈퍼타입 분석

핵심 대립유전자를 HLA 슈퍼타입에 매핑:

  • 고대 핵심 대립유전자(네안데르탈인/데니소바인 유래 가능)가 고빈도 대립유전자에서 우위
  • 슈퍼타입 내부는 경쟁 배제 패턴 나타냄
  • 슈퍼타입 간은 유사성 제한 나타냄

장거리 연쇄 분석

HLA-B~DRB1 쌍 분석 결과:

  • 1240개 가능한 쌍 중 약 250개(20%)가 선택 압력 하에 있음
  • 두 개의 주요 쌍: B08:01g/DRB103:01g(8%)과 B07:02/DRB115:01(6.9%)

이론적 의의 및 논의

균형 선택 이론의 재검토

전통 이론의 한계

  1. 이형 접합 우위: 모든 대립유전자가 근사적으로 동등한 적합도를 요구하며, 관찰과 불일치
  2. 음의 빈도 의존 선택: 예측된 대립유전자 교체 속도가 너무 빠르며, 종간 다형성 설명 불가
  3. 역학 무시: 질병 전파의 밀도 의존적 특성 미고려

새로운 모델의 장점

  1. 밀도 의존적 조절: 자동으로 0의 유효 적합도를 생성하여 안정적 공존 실현
  2. 단배형 선택: 관찰된 연쇄 부등평형 패턴을 더 잘 설명
  3. 네트워크 효과: 대립유전자 다면발현 및 단배형 상호 연관성 설명

진화 전략 유추

"에니그마 암호기" 유추

HLA 시스템은 2차 세계대전 에니그마 암호기와 유사:

  • 다중 로터 설계: 다중 유전자좌 단배형이 해독 난이도 증가
  • 설정 분산: 다형성이 병원체 돌파의 영향 범위 제한
  • 광범위 저친화력: 항체 고친화력 전략과 대조

Red Queen 동역학

  • 병원체: 빠른 번식, 높은 돌연변이율
  • 숙주 방어: 상대적으로 안정적인 제시 시스템 + 빠른 T세포 확대 반응
  • 균형점: 단배형 네트워크를 통해 방어 다양화 실현

준종 특성

HLA 네트워크는 준종 특성을 나타냄:

  • 고도 상호 연관: 대립유전자 다면발현을 통해 연결
  • 네트워크 선택: 단일 단배형이 아닌 전체 네트워크가 선택 압력 하에 있음
  • 안정성: 밀도 의존적 조절을 통해 유지

한계 및 향후 방향

현재 한계

  1. 상위성 메커니즘 미명확: 양의 상위성의 구체적 분자 메커니즘 추가 규명 필요
  2. 시간 척도 문제: 네트워크 안정성의 시간 척도 추가 역사 데이터 검증 필요
  3. 집단 특이성: 주로 백인 집단 데이터에 기반하며, 다른 집단으로 확장 필요
  4. 병원체 데이터 부족: 체계적인 병원체-HLA 상호작용 행렬 부재

향후 연구 방향

  1. 기능 검증: AlphaFold 등 구조 예측 도구를 사용한 상위성 메커니즘 연구
  2. 종간 비교: 다양한 집단의 HLA 네트워크 기능 중복 분석
  3. 역사적 안정성: 고대 DNA 데이터를 활용한 네트워크 빈도 안정성 검증
  4. 감염 행렬: 병원체 펩타이드-HLA 단배형 인식 행렬 구축

심층 평가

장점

  1. 이론적 혁신: 밀도 의존적 조절을 HLA 다형성 설명에 처음 도입
  2. 충분한 데이터 지원: NMDP 대규모 데이터셋 기반 체계적 분석
  3. 학제간 통합: 인구 생물학, 역학 및 면역 유전학 성공적 통합
  4. 강한 설명력: 여러 장기 존재 관찰 현상의 통일적 설명

부족한 점

  1. 메커니즘 세부사항: 상위성의 분자 기초 여전히 실험 검증 필요
  2. 모델 단순화: 병원체 환경의 복잡성이 과도하게 단순화될 수 있음
  3. 예측 능력: 향후 진화 동역학에 대한 모델의 예측 능력 검증 필요

영향력 평가

본 연구는 다음 분야에 중요한 영향을 미칠 수 있다:

  1. 진화 면역학: MHC 진화의 이론적 틀 재정의
  2. 개인맞춤 의학: HLA 기반 질병 감수성 예측에 새로운 관점 제공
  3. 백신 설계: 인구 HLA 다양성을 고려한 백신 개발 전략 지도

적용 시나리오

  • MHC/HLA 다형성의 진화 분석
  • 인구 면역 유전학 연구
  • 감염병 역학 모델링
  • 개인맞춤 면역 치료 설계

결론

본 연구는 HLA 다형성을 병원체가 부과하는 밀도 의존적 선택의 결과로 설명하는 혁신적 이론적 틀을 제시한다. 대규모 데이터 분석을 통해 저자는 HLA 시스템이 137개 핵심 대립유전자로 구성된 고도로 상호 연관된 네트워크를 형성하며, 이 네트워크는 양의 상위성과 다면발현을 통해 안정적인 다형성을 유지함을 발견했다. 이 발견은 MHC 진화 이해에 새로운 관점을 제공할 뿐만 아니라 관련 의학 응용을 위한 이론적 기초를 마련한다.