2025-11-14T08:01:10.960100

Infectious diseases, imposing density-dependent mortality on MHC/HLA variation, can account for balancing selection and MHC/HLA polymorphism

Green
The human MHC transplantation loci (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) are the most polymorphic in the human genome. It is generally accepted this polymorphism reflects a role in presenting pathogen-derived peptide to the adaptive immune system. Proposed mechanisms for the polymorphism such as negative frequency-dependent selection (NFDS) and heterozygote advantage (HA) focus on HLA alleles, not haplotypes. Here, we propose a model for the polymorphism in which infectious diseases impose independent density-dependent regulation on HLA haplotypes. More specifically, a complex pathogen environment drives extensive host polymorphism through a guild of HLA haplotypes that are specialised and show incomplete peptide recognition. Separation of haplotype guilds is maintained by limiting similarity. The outcome is a wide and stable range of haplotype densities at steady-state in which effective Fisher fitnesses are zero. Densities, and therefore frequencies, emerge theoretically as alternative measures of fitness. A catalogue of ranked frequencies is therefore one of ranked fitnesses. The model is supported by data from a range of sources including a Caucasian HLA dataset compiled by the US National Marrow Donor Program (NMDP). These provide evidence of positive selection on the top 350-2000 5-locus HLA haplotypes taken from an overall NMDP sample set of 10E5. High-fitness haplotypes drive the selection of 137 high-frequency alleles spread across the 5 HLA loci under consideration. These alleles demonstrate positive epistasis and pleiotropy in the formation of haplotypes. Allelic pleiotropy creates a network of highly inter-related HLA haplotypes that account for 97% of the census sample. We suggest this network has properties of a quasi-species and is itself under selection. We also suggest this is the origin of balancing selection in the HLA system.
academic

الأمراض المعدية، التي تفرض وفيات تعتمد على الكثافة على تباين MHC/HLA، يمكن أن تفسر الاختيار المتوازن وتعدد الأشكال MHC/HLA

المعلومات الأساسية

  • معرّف الورقة: 2501.00767
  • العنوان: الأمراض المعدية، التي تفرض وفيات تعتمد على الكثافة على تباين MHC/HLA، يمكن أن تفسر الاختيار المتوازن وتعدد الأشكال MHC/HLA
  • المؤلف: D. P. L. Green
  • التصنيف: q-bio.PE (علم السكان والتطور)، q-bio.MN (الشبكات الجزيئية)
  • تاريخ النشر: 31 ديسمبر 2024
  • رابط الورقة: https://arxiv.org/abs/2501.00767

الملخص

تُعتبر مواضع الزرع بالمجمع الرئيسي لتوافق الأنسجة البشرية (HLA-A, -B, -C, -DPB1, -DQB1, -DRB1) من أكثر المناطق تعدداً في الشكل في الجينوم البشري. يُعتقد على نطاق واسع أن هذا التعدد يعكس دورها في عرض الببتيدات المشتقة من مسببات الأمراض على نظام المناعة التكيفي. تركز الآليات المقترحة حالياً لتعدد الأشكال، مثل الاختيار المعتمد على التردد السالب (NFDS) والميزة الهجينة (HA)، بشكل أساسي على أليلات HLA وليس على النمط الفردي. تقترح هذه الدراسة نموذجاً جديداً يفترض أن الأمراض المعدية تفرض تنظيماً مستقلاً يعتمد على الكثافة على النمط الفردي HLA. على وجه التحديد، يدفع البيئة المعقدة من مسببات الأمراض تنوعاً واسعاً في المضيف من خلال مجموعات سكانية من النمط الفردي متخصصة وتظهر اعترافاً ببتيدات غير كامل. يتم الحفاظ على الفصل بين مجموعات النمط الفردي من خلال تقييد التشابه. والنتيجة هي إنتاج نطاق واسع وثابت من كثافات النمط الفردي في الحالة المستقرة، حيث يكون لياقة فيشر الفعالة صفراً. تصبح الكثافة والتردد، من الناحية النظرية، مقاييس بديلة للياقة. يدعم التحليل القائم على مجموعة بيانات HLA القوقازية من خطة التبرع بنخاع العظم الوطنية الأمريكية (NMDP) هذا النموذج، مما يوفر أدلة على الاختيار الإيجابي لـ 350-2000 من أفضل النمط الفردي HLA بخمسة مواضع. تدفع النمط الفردي عالي اللياقة الاختيار لـ 137 أليل عالي التردد. تُظهر هذه الأليلات الفوقية الإيجابية والتعددية الوظيفية في تكوين النمط الفردي، مما يخلق شبكة نمط فردي HLA مترابطة بدرجة عالية تمثل 97٪ من إجمالي العينة.

خلفية البحث والدافع

تحديد المشكلة

يُعتبر التعدد الشديد في نظام HLA مشكلة كلاسيكية في علم الأحياء التطوري. تشمل النظريات الموجودة:

  1. الاختيار المعتمد على التردد السالب (NFDS): الأليلات النادرة لها ميزة اختيارية
  2. الميزة الهجينة (HA): الأفراد الهجينون لديهم لياقة أعلى
  3. التغيير البيئي: التغيرات البيئية الزمكانية تحافظ على التعدد

قيود الطرق الموجودة

  1. التركيز على الأليلات وليس النمط الفردي: يتجاهل ضغوط الاختيار على مستوى النمط الفردي
  2. الافتقار إلى الأساس البيولوجي السكاني: لم يتم النظر في التأثيرات المعتمدة على الكثافة
  3. عدم توافق النظرية والبيانات: يصعب شرح أنماط التوزيع المرصودة
  4. تجاهل الخصائص الوبائية لانتقال مسببات الأمراض: لم يتم النظر في الاعتماد على الكثافة لانتقال المرض

دافع البحث

يقترح المؤلف الحاجة إلى إطار نظري جديد لشرح:

  • التوزيع الترددي ذو الذيل الثقيل للأليلات والنمط الفردي HLA
  • عدم التوازن الإيجابي للربط في النمط الفردي عالي التردد
  • الفرط في الزيجوت المتماثل للنمط الفردي الشائع بخمسة مواضع
  • الحفاظ على المدى الطويل على التعدد عبر الأنواع

المساهمات الأساسية

  1. اقتراح نموذج التنظيم المعتمد على الكثافة: اعتبار الأمراض المعدية كمصدر لمعدل الوفيات المعتمد على كثافة النمط الفردي HLA
  2. إنشاء نظرية اختيار النمط الفردي: إثبات أن الاختيار يعمل بشكل أساسي على مستوى النمط الفردي وليس الأليل
  3. اكتشاف بنية شبكة HLA: تحديد شبكة مترابطة بدرجة عالية تتكون من 137 أليل أساسي
  4. توفير الدعم التجريبي: التحقق من التنبؤات النظرية بناءً على مجموعة بيانات NMDP الكبيرة
  5. إعادة تعريف الاختيار المتوازن: تفسير الاختيار المتوازن كنتيجة للتنظيم المعتمد على الكثافة

شرح الطريقة

الإطار النظري

نموذج التنظيم المعتمد على الكثافة

بناءً على معادلة Verhulst اللوجستية ومعادلات انتشار المرض Anderson-May:

dN/dt = rN - αN²

حيث:

  • N: كثافة النمط الفردي
  • r: معدل النمو الجوهري (لياقة فيشر)
  • α: معامل معدل الوفيات المعتمد على الكثافة

شروط الحالة المستقرة

في الحالة المستقرة (dN/dt = 0):

r = αN*

للتعايش بين عدة نمط فردي:

α₁N₁* = α₂N₂* = ... = αᵢNᵢ* = r̃

توسيع نموذج Neher-Shraiman

تحليل لياقة النمط الفردي إلى:

F = E + A

حيث E هو مكون الفوقية، و A هو المكون الإضافي.

طرق تحليل البيانات

تحليل الرتبة-التردد لوغاريتمي-لوغاريتمي

استخدام طريقة تحليل اللغة Belevitch:

log(pᵢ/p₀) = -A log(i/i₀)

تحليل الشبكة

  • تحديد أنماط التعددية الوظيفية للأليلات عالية التردد
  • تحليل درجة الاتصال بين النمط الفردي
  • تحديد حجم تأثير الفوقية

إعداد التجربة

مجموعة البيانات

  • مجموعة بيانات NMDP القوقازية: تحتوي على بيانات النمط الفردي HLA بخمسة مواضع لحوالي 10⁵ فرد
  • المواضع المغطاة: HLA-A, -B, -C, -DRB1, -DQB1
  • حجم العينة: 85,000 نمط فردي، يمتد التردد على ستة رتب من حيث الحجم

مؤشرات التحليل

  • نمط توزيع الرتبة-التردد
  • عدم التوازن الربطي (D') -熵 Shannon
  • حجم تأثير الفوقية

التحليل المقارن

  • التردد الفعلي مقابل التردد المتوقع (بناءً على منتج تردد الأليل)
  • أنماط عدم التوازن الربطي للنمط الفردي عالي التردد مقابل منخفض التردد
  • توزيع الأليلات الأساسية مقابل الأليلات النادرة

نتائج التجربة

النتائج الرئيسية

1. التوزيع ثنائي الذروة للنمط الفردي

  • المجموعة المختارة: 350-2000 نمط فردي عالي التردد (يمثل 80٪ من العينة)
  • المجموعة المحايدة/المختارة سلباً: النمط الفردي منخفض التردد (يمثل 20٪ من العينة)
  • نقطة الانتقال: حوالي 1730 موضع

2. شبكة الأليلات الأساسية

تحديد 137 أليل أساسي:

  • HLA-A: 30 أليل (التردد التراكمي 99.7٪)
  • HLA-B: 40 أليل (التردد التراكمي 98.6%)
  • HLA-C: 20 أليل (التردد التراكمي 99.6%)
  • HLA-DQB1: 15 أليل (التردد التراكمي 99.9٪)
  • HLA-DRB1: 31 أليل (التردد التراكمي 99.3٪)

3. خصائص توزيع القانون الأسي

يتبع النمط الفردي عالي التردد توزيع قانون أسي:

y = 0.0506x^(-0.822)

4. أدلة الفوقية الإيجابية

  • يمتد التردد الفعلي للنمط الفردي على خمسة رتب من حيث الحجم
  • يمتد التردد المتوقع (بناءً على منتج تردد الأليل) على رتبة واحدة فقط من حيث الحجم
  • يمثل مكون الفوقية 9-12٪ من تردد الأليلات عالية التردد

تحليل فرط النوع

تعيين الأليلات الأساسية إلى فرط نوع HLA:

  • الأليلات الأساسية القديمة (ربما من أصل نياندرتالي/دينيسوفان) تهيمن على الأليلات عالية التردد
  • تُظهر أنماط استبعاد تنافسي داخل فرط النوع
  • تُظهر تقييد التشابه بين فرط الأنواع

تحليل الربط على المدى الطويل

يُظهر تحليل الاقتران HLA-B~DRB1:

  • حوالي 250 من 1240 اقتران محتمل (20٪) تحت ضغط اختيار
  • اقترانان رئيسيان: B08:01g/DRB103:01g (8٪) و B07:02/DRB115:01 (6.9٪)

الأهمية النظرية والمناقشة

إعادة النظر في نظرية الاختيار المتوازن

قيود النظرية التقليدية

  1. الميزة الهجينة: تتطلب أن تتمتع جميع الأليلات بلياقة متقاربة تقريباً، وهو ما لا يتوافق مع الملاحظات
  2. الاختيار المعتمد على التردد السالب: يتنبأ بسرعة استبدال أليل سريعة جداً، وغير قادر على شرح التعدد عبر الأنواع
  3. تجاهل علم الأوبئة: لم يتم النظر في الخصائص المعتمدة على الكثافة لانتقال المرض

مزايا النموذج الجديد

  1. التنظيم المعتمد على الكثافة: ينتج تلقائياً لياقة فعالة صفرية، مما يحقق التعايش المستقر
  2. اختيار النمط الفردي: يشرح بشكل أفضل أنماط عدم التوازن الربطي المرصودة
  3. التأثيرات الشبكية: يشرح التعددية الوظيفية للأليلات والترابط المتبادل للنمط الفردي

القياس بالاستراتيجيات التطورية

القياس بآلة Enigma

يشبه نظام HLA آلة Enigma من الحرب العالمية الثانية:

  • تصميم الدوار المتعدد: يزيد النمط الفردي متعدد المواضع من صعوبة كسر الشفرة
  • التوزيع المشتت: يحد التعدد من نطاق تأثير اختراق مسببات الأمراض
  • الانجذاب المنخفض على نطاق واسع: يتناقض مع استراتيجية الأجسام المضادة عالية الانجذاب

ديناميكيات الملكة الحمراء

  • مسببات الأمراض: تتكاثر بسرعة، معدل طفرة عالي
  • الدفاع المضيف: نظام عرض نسبياً مستقر + استجابة توسع T سريعة
  • نقطة التوازن: يتم تحقيقها من خلال شبكة النمط الفردي

خصائص شبه النوع

تُظهر شبكة HLA خصائص شبه النوع:

  • الترابط العالي: متصل من خلال التعددية الوظيفية للأليلات
  • اختيار الشبكة: الشبكة بأكملها وليس النمط الفردي الفردي تحت ضغط اختيار
  • الاستقرار: يتم الحفاظ عليه من خلال التنظيم المعتمد على الكثافة

القيود والاتجاهات المستقبلية

القيود الحالية

  1. آليات الفوقية غير واضحة: تحتاج الآليات الجزيئية المحددة للفوقية الإيجابية إلى مزيد من التوضيح
  2. مشكلة المقياس الزمني: يحتاج المقياس الزمني لاستقرار الشبكة إلى التحقق من خلال بيانات تاريخية أكثر
  3. الخصوصية السكانية: يعتمد بشكل أساسي على بيانات السكان القوقازيين، ويحتاج إلى التوسع إلى مجموعات سكانية أخرى
  4. نقص بيانات مسببات الأمراض: يفتقر إلى مصفوفة منهجية لتفاعل مسببات الأمراض-HLA

اتجاهات البحث المستقبلية

  1. التحقق الوظيفي: استخدام أدوات التنبؤ الهيكلي مثل AlphaFold لدراسة آليات الفوقية
  2. المقارنة عبر السكان: تحليل التداخل الوظيفي لشبكات HLA في مجموعات سكانية مختلفة
  3. الاستقرار التاريخي: استخدام بيانات الحمض النووي القديم للتحقق من استقرار تردد الشبكة
  4. مصفوفة العدوى: بناء مصفوفة اعتراف ببتيدات مسببات الأمراض-النمط الفردي HLA

التقييم المتعمق

المزايا

  1. الابتكار النظري: أول من يقدم التنظيم المعتمد على الكثافة لشرح تعدد الأشكال HLA
  2. الدعم البيانات كافٍ: تحليل منهجي بناءً على مجموعة بيانات NMDP الكبيرة
  3. التكامل متعدد التخصصات: التكامل الناجح لعلم السكان والأوبئة وعلم الوراثة المناعية
  4. قوة التفسير: شرح موحد للعديد من الظواهر المرصودة طويلة الأجل

أوجه القصور

  1. تفاصيل الآلية: لا تزال الأساس الجزيئي للفوقية بحاجة إلى التحقق التجريبي
  2. تبسيط النموذج: قد يتم تبسيط تعقيد بيئة مسببات الأمراض بشكل مفرط
  3. القدرة التنبؤية: تحتاج قدرة النموذج على التنبؤ بالديناميكيات التطورية المستقبلية إلى التحقق

تقييم التأثير

قد يكون لهذا البحث تأثير مهم على المجالات التالية:

  1. علم المناعة التطوري: إعادة تعريف الإطار النظري لتطور MHC
  2. الطب الشخصي: توفير منظور جديد للتنبؤ بقابلية الإصابة بالأمراض بناءً على HLA
  3. تصميم اللقاح: توجيه استراتيجيات تطوير اللقاح التي تأخذ في الاعتبار تنوع HLA السكاني

السيناريوهات القابلة للتطبيق

  • تحليل التطور لتعدد الأشكال MHC/HLA
  • دراسات علم الوراثة المناعية السكانية
  • نمذجة علم الأوبئة للأمراض المعدية
  • تصميم العلاج المناعي الشخصي

الخلاصة

تقترح هذه الدراسة إطاراً نظرياً مبتكراً يفسر تعدد الأشكال HLA كنتيجة للاختيار المعتمد على الكثافة الذي تفرضه مسببات الأمراض. من خلال تحليل البيانات على نطاق واسع، اكتشف المؤلفون أن نظام HLA يشكل شبكة مترابطة بدرجة عالية تتكون من 137 أليل أساسي، يتم الحفاظ على التعدد المستقر فيها من خلال الفوقية الإيجابية والتعددية الوظيفية. لا يوفر هذا الاكتشاف فقط منظوراً جديداً لفهم تطور MHC، بل يضع أيضاً أساساً نظرياً للتطبيقات الطبية ذات الصلة.