2025-11-21T03:07:15.749956

Sequencing on Silicon: AI SoC Design for Mobile Genomics at the Edge

Magierowski, Wu, Beyene et al.
Miniature DNA sequencing hardware has begun to succeed in mobile contexts, driving demand for efficient machine learning at the edge. This domain leverages deep learning techniques familiar from speech and time-series analysis for both low-level signal processing and high-level genomic interpretation. Unlike audio, however, nanopore sequencing presents raw data rates over 100X higher, requiring more aggressive compute and memory handling. In this paper, we present a CMOS system-on-chip (SoC) designed for mobile genetic analysis. Our approach combines a multi-core RISC-V processor with tightly coupled accelerators for deep learning and bioinformatics. A hardware/software co-design strategy enables energy-efficient operation across a heterogeneous compute fabric, targeting real-time, on-device genome analysis. This work exemplifies the integration of deep learning, edge computing, and domain-specific hardware to advance next-generation mobile genomics.
academic

تسلسل على السيليكون: تصميم SoC ذكي لعلم الجينوم المحمول على الحافة

المعلومات الأساسية

  • معرّف الورقة: 2510.09339
  • العنوان: Sequencing on Silicon: AI SoC Design for Mobile Genomics at the Edge
  • المؤلفون: Sebastian Magierowski, Zhongpan Wu, Abel Beyene, Karim Hammad
  • التصنيف: cs.AR (معمارية الحاسوب)، cs.ET (التكنولوجيات الناشئة)
  • تاريخ النشر: 10 أكتوبر 2025 (نسخة أولية على arXiv)
  • رابط الورقة: https://arxiv.org/abs/2510.09339

الملخص

بدأت أجهزة تسلسل الحمض النووي المصغرة تحقق نجاحاً في البيئات المحمولة، مما أدى إلى زيادة الطلب على التعلم الآلي الفعال على الحافة. يستفيد هذا المجال من تقنيات التعلم العميق المألوفة في تحليل الكلام والسلاسل الزمنية، وتطبيقها على معالجة الإشارات منخفضة المستوى والتفسير الجينومي عالي المستوى. ومع ذلك، بخلاف الصوت، يقدم تسلسل النانوبور معدلات بيانات خام تتجاوز 100 مرة، مما يتطلب معالجة حسابية وذاكرة أكثر عدوانية. تقترح هذه الورقة نظام على رقاقة (SoC) بتقنية CMOS مصمم خصيصاً لتحليل الجينوم المحمول. يجمع هذا النهج بين معالج RISC-V متعدد النوى ومسرعات مرتبطة بإحكام للتعلم العميق والمعلوماتية الحيوية. تحقق استراتيجية التصميم المشترك للأجهزة والبرامج تشغيلاً فعالاً من حيث الطاقة على بنية حوسبة غير متجانسة، بهدف تحليل جينومي في الوقت الفعلي على الجهاز.

السياق البحثي والدافع

تعريف المشكلة

  1. تحديات حجم البيانات: تنمو بيانات الجينوميات بشكل أسي، حيث أن وقت المضاعفة (DT) لقاعدة بيانات GenBank هو 17 شهراً فقط خلال السنوات الخمس الماضية، مع نمو متوسط حجم التسلسل بمقدار 20 مرة
  2. متطلبات المعالجة في الوقت الفعلي: تنتج أجهزة تسلسل الحمض النووي المصغرة نتائج قياس في الوقت الفعلي، مع تدفق بيانات يصل إلى 30 ميجابت/ثانية، وهو أعلى بـ 100 مرة من بيانات الكلام (256 كيلوبت/ثانية)
  3. قيود الحوسبة المحمولة: يتطلب التحليل الجينومي التقليدي خوادم كبيرة وعناقيد GPU، وهو غير مناسب للأجهزة المحمولة والحافة

أهمية البحث

  • ظهور الجينوميات المحمولة: تمكن أجهزة تسلسل الحمض النووي المصغرة (كما هو موضح في الشكل 2) من تحليل الجينوم في الموقع
  • احتياجات الذكاء الاصطناعي على الحافة: الحاجة إلى تحليل جينومي في الوقت الفعلي على الأجهزة المحمولة ذات الموارد المحدودة
  • آفاق التطبيق: كشف مسببات الأمراض، الطب الشخصي، التشخيص في الموقع وغيرها

قيود الطرق الموجودة

  1. متطلبات الموارد الحسابية: يتطلب basecalling التقليدي حوالي 50 GFLOP/ثانية/مستشعر DNA
  2. ندرة أبحاث ASIC: يوجد عدد قليل جداً من تصاميم CMOS ASIC المخصصة للتسلسل المحمول في الأدبيات
  3. مشاكل الكفاءة: الحلول الموجودة تستهلك طاقة عالية جداً، غير مناسبة للتطبيقات المحمولة

المساهمات الأساسية

  1. اقتراح إطار عمل منهجي لعلم الجينوم على الحافة: بناءً على مجموعة معايير MLCommons، تقسيم الأجهزة الحافة إلى ثلاث طبقات: Tiny و Mobile و Edge
  2. تصميم وتنفيذ SoC متخصص: نظام على رقاقة غير متجانس بتقنية 22 نانومتر CMOS، يدمج معالج RISC-V ومسرعات متخصصة
  3. تحقيق التصميم المشترك للأجهزة والبرامج: استراتيجيات تحسين موجهة لأحمال عمل تحليل الجينوم
  4. التحقق من جدوى تحليل الجينوم المحمول: تحقيق قدرة كشف مسببات الأمراض في الوقت الفعلي بقوة 50 ميجاوات

شرح الطريقة

تعريف المهام

تتناول هذه الورقة خط أنابيب تحليل الجينوم المحمول الكامل، والذي يتضمن بشكل أساسي:

  • Basecalling: تحويل الإشارات الكهروكيميائية إلى تسلسل نيوكليوتيد
  • Alignment: مطابقة القراءات مع الجينوم المرجعي
  • Variant Calling: تحديد الاختلافات الجينومية

تصميم معمارية SoC

المعمارية الكلية

كما هو موضح في الشكل 4، يحتوي SoC على المكونات الأساسية التالية:

  1. معالج RISC-V ثنائي النوى (CORE1, CORE2): 64 بت متوافق مع Linux، مع وحدة نقطة عائمة
  2. مسرع الحسابات المصفوفية (MAT): مصفوفة نبضية 4×4، للاستدلال بالتعلم العميق
  3. محرك المسافة المحررة (ED): متخصص في البرمجة الديناميكية لمقارنة التسلسل
  4. التخزين على الرقاقة: 700 كيلوبايت SRAM، موزعة بين الذاكرة المؤقتة والمسرعات

المواصفات التقنية

  • التقنية: GlobalFoundries 22 نانومتر CMOS FDSOI
  • المساحة: 5 ملم² (بما في ذلك وسادات الإدخال/الإخراج)
  • الطاقة: حوالي 50 ميجاوات ذروة عند 250 ميجاهرتز
  • نظام التشغيل: دعم نظام Linux

تنفيذ الخوارزميات الرئيسية

Basecaller المستند إلى CNN

  • بنية الشبكة: شبكة عصبية تلافيفية بـ 6 طبقات، دالة تفعيل ReLU
  • عدد المعاملات: حوالي 450 ألف معامل، 80% من الأوزان مركزة في طبقتين
  • الوظيفة: فك التفاف مساهمات الإشارة الخام ضمن نافذة 8 قواعد
  • دقة التصنيف: 85% (مناسبة لكشف مسببات الأمراض، لكن غير كافية للتطبيقات السريرية)

تسريع البرمجة الديناميكية

  • طريقة توسيع البذور: بناءً على تحويل Burrows-Wheeler وفهرس FM
  • تنفيذ DP: محاذاة برمجة ديناميكية تقريبية مسرعة بالأجهزة
  • الأداء: تظهر نتائج FPGA تسريعاً بـ 40 مرة مقارنة بتنفيذ CPU النقي

نقاط الابتكار التقني

  1. معمارية الحوسبة غير المتجانسة: أول تكامل وثيق بين معالج للأغراض العامة ومسرعات متخصصة في المعلوماتية الحيوية
  2. تحسين الكفاءة: تحسن بـ 200 مرة في الكفاءة مقارنة بتنفيذ ARM Cortex-A53
  3. قدرة المعالجة في الوقت الفعلي: تحسين موجه لتحليل الجينوم في الوقت الفعلي على الأجهزة المحمولة
  4. النظام البيئي مفتوح المصدر: معمارية مفتوحة المصدر قائمة على RISC-V، تسهل اعتماد المطورين

إعداد التجارب

منصة الأجهزة

  • تقنية التصنيع: GlobalFoundries 22 نانومتر CMOS FDSOI
  • تردد التشغيل: 250 ميجاهرتز
  • ميزانية الطاقة: 50 ميجاوات ذروة

الاختبارات المعيارية

  • معايير MLCommons: تقييم الأداء وفقاً لثلاث طبقات: Tiny و Mobile و Edge
  • المعايير المقارنة: نظام ARM Cortex-A53 SoC (تقنية 16 نانومتر)

سيناريوهات الاختبار

  • كشف مسببات الأمراض: موجهة نحو الجينوم الفيروسي (مثل 30 ألف قاعدة لـ SARS-CoV-2)
  • Basecalling في الوقت الفعلي: سرعة معالجة تطابق تدفق بيانات مستشعر DNA

نتائج التجارب

مؤشرات الأداء الرئيسية

أداء Basecalling

  • نسبة التسريع: أسرع بـ 15 مرة مقارنة بتنفيذ CPU النقي
  • تحسن الكفاءة: تحسن بـ 13 مرة في الكفاءة
  • معدل المعالجة: حوالي 30 ألف قاعدة/ثانية (عند 20 ميجاوات، 200 ميجاهرتز)
  • دقة التصنيف: 85%

أداء مقارنة التسلسل

  • نسبة التسريع: اختبارات FPGA تظهر أسرع بـ 40 مرة من CPU
  • معدل المعالجة: حوالي 900 ألف قاعدة/ثانية عند 250 ميجاهرتز
  • الكفاءة: تحسن بـ 70 مرة في الكفاءة مقارنة بتنفيذ FPGA

الأداء على مستوى النظام

  • إجمالي الطاقة: 50 ميجاوات ذروة تحت نظام Linux
  • الوقت الفعلي: دعم التحليل في الوقت الفعلي للجينوم الفيروسي
  • القابلية للتوسع: يمكن تحسين الأداء بشكل أكبر من خلال زيادة تردد الساعة وتوسيع مسرع MAT

النتائج المحدودة

  1. مشاكل الاتصال: أخطاء الاتصال التي يقدمها نظام Linux تسبب جمود في الاتصال بين CORE2 و ED
  2. فجوة المعالجة في الوقت الفعلي: معدل basecalling الحالي لا يزال أقل من قدرة القياس في الوقت الفعلي لجهاز تسلسل DNA
  3. قيود الدقة: دقة 85% غير كافية لدعم التطبيقات السريرية العميقة

الأعمال ذات الصلة

تسريع الأجهزة الجينومية

  1. Basecalling ASIC: تم العثور على ASIC واحد فقط مصنوع لـ basecalling 16
  2. مسرعات المحاذاة: تصميم CMOS بـ 55 نانومتر يحقق قدرة توسع 0.25 جيجابيس/ثانية 19
  3. كشف المتغيرات: رقاقة CMOS بـ 28 نانومتر تحقق سرعة معالجة 95 ميجابيس/ثانية 24

معمارية الذكاء الاصطناعي على الحافة

  • معايير MLCommons: توفر إطار تقييم موحد لثلاث طبقات: Edge و Mobile و Tiny
  • رقائق الذكاء الاصطناعي المحمولة: حلول NPU/GPU لأجهزة الهواتف الذكية
  • TinyML: تنفيذ الذكاء الاصطناعي فائق منخفض الطاقة على مستوى المتحكم الدقيق

خوارزميات المعلوماتية الحيوية

  • تطبيقات التعلم العميق: أدوات كشف المتغيرات المستندة إلى التعلم العميق مثل DeepVariant و Clair3
  • الخوارزميات التقليدية: توسيع البذور والبرمجة الديناميكية وغيرها من الطرق الكلاسيكية في المعلوماتية الحيوية
  • مقارنة التسلسل: دراسة استقصائية لـ 107 طريقة محاذاة تسلسل 17

الاستنتاجات والمناقشة

الاستنتاجات الرئيسية

  1. التحقق من الجدوى: إثبات الجدوى التقنية لتحليل الجينوم في الوقت الفعلي على الأجهزة المحمولة
  2. مزايا الكفاءة: تتمتع الأجهزة المتخصصة بمزايا كفاءة واضحة مقارنة بالمعالجات للأغراض العامة
  3. الإمكانات التطبيقية: مناسبة بشكل خاص لسيناريوهات تطبيقية محددة مثل كشف مسببات الأمراض

القيود

  1. قيود الدقة: تحد دقة basecalling الحالية بنسبة 85% من نطاق التطبيق
  2. فجوة الوقت الفعلي: لا تزال سرعة المعالجة غير قادرة على مطابقة معدل إنتاج البيانات لجهاز تسلسل DNA بالكامل
  3. استقرار النظام: يتطلب حل مشاكل الاتصال والجدولة على مستوى نظام التشغيل

الاتجاهات المستقبلية

  1. تحسين الأداء: زيادة تردد الساعة وتوسيع حجم المسرع
  2. تحسين الخوارزمية: تطوير نماذج basecalling خفيفة الوزن بدقة أعلى
  3. تكامل النظام: حل مشاكل الاتصال والجدولة على مستوى نظام التشغيل
  4. توسيع التطبيقات: استكشاف المزيد من سيناريوهات تطبيقات الجينوميات المحمولة

التقييم المتعمق

المزايا

  1. ابتكار قوي: أول حل منهجي لمعالجة متطلبات الأجهزة لتحليل الجينوم المحمول
  2. قيمة عملية عالية: مصمم وفقاً لاحتياجات التطبيق الحقيقية، مع آفاق تطبيق واضحة
  3. تقنية شاملة: تغطي مكدس التقنية الكامل من الخوارزمية إلى تنفيذ الأجهزة
  4. كفاءة ملحوظة: تحقيق تحسن بمقدار عشرات المرات في الكفاءة مقارنة بالحلول التقليدية

أوجه القصور

  1. دقة قابلة للتحسين: دقة 85% تحد من إمكانات التطبيق السريري
  2. التجارب غير مكتملة: لم يتمكن وحدة ED من إكمال الاختبار على الرقاقة بسبب أخطاء النظام
  3. المقارنة محدودة: تفتقد المقارنة المباشرة مع معالجات جينومية متخصصة أخرى
  4. نطاق التطبيق ضيق: موجهة بشكل أساسي نحو كشف مسببات الأمراض، مع عمومية محدودة

التأثير

  1. المساهمة الأكاديمية: توفير مرجع مهم لتصميم أجهزة الجينوميات المحمولة
  2. القيمة الصناعية: توجيه اتجاه تطوير أجهزة تسلسل الجينوم المحمولة
  3. العرض التقني: إظهار إمكانات تطبيق الذكاء الاصطناعي على الحافة في المجال الطبي الحيوي

السيناريوهات المطبقة

  1. كشف مسببات الأمراض في الموقع: مناسب بشكل خاص لمراقبة الأوبئة والتشخيص السريع
  2. البيئات ذات الموارد المحدودة: مناسب للمناطق النائية أو سيناريوهات الطب المحمول
  3. تحليل الجينوم في الوقت الفعلي: تطبيقات تتطلب نتائج تحليل جينومي سريعة
  4. مراقبة الصحة الشخصية: قد يُستخدم في المستقبل في أجهزة إدارة الصحة الشخصية

المراجع

تستشهد الورقة بـ 24 مرجعاً مهماً، تغطي أبحاثاً متقدمة في مجالات متعددة بما في ذلك المعلوماتية الحيوية والحوسبة على الحافة وتسريع الأجهزة، مما يوفر أساساً نظرياً وتقنياً قوياً لهذا العمل.


التقييم الشامل: هذه ورقة ذات أهمية رائدة في مجال تصميم أجهزة الجينوميات المحمولة. على الرغم من أن هناك حاجة لتحسينات في الدقة واستقرار النظام، فإن تصميمها المعماري المبتكر وتحسن الكفاءة الملحوظ يوفران مساراً تقنياً مهماً لتطوير هذا المجال. يجمع هذا العمل بنجاح بين التعلم العميق والحوسبة على الحافة وتصميم الأجهزة المتخصصة، ويمثل ممارسة ناجحة للبحث متعدد التخصصات.