Miniature DNA sequencing hardware has begun to succeed in mobile contexts, driving demand for efficient machine learning at the edge. This domain leverages deep learning techniques familiar from speech and time-series analysis for both low-level signal processing and high-level genomic interpretation. Unlike audio, however, nanopore sequencing presents raw data rates over 100X higher, requiring more aggressive compute and memory handling. In this paper, we present a CMOS system-on-chip (SoC) designed for mobile genetic analysis. Our approach combines a multi-core RISC-V processor with tightly coupled accelerators for deep learning and bioinformatics. A hardware/software co-design strategy enables energy-efficient operation across a heterogeneous compute fabric, targeting real-time, on-device genome analysis. This work exemplifies the integration of deep learning, edge computing, and domain-specific hardware to advance next-generation mobile genomics.
- ID de l'article: 2510.09339
- Titre: Sequencing on Silicon: AI SoC Design for Mobile Genomics at the Edge
- Auteurs: Sebastian Magierowski, Zhongpan Wu, Abel Beyene, Karim Hammad
- Classification: cs.AR (Architecture informatique), cs.ET (Technologies émergentes)
- Date de publication: 10 octobre 2025 (prépublication arXiv)
- Lien de l'article: https://arxiv.org/abs/2510.09339
Le matériel de séquençage d'ADN miniaturisé commence à connaître un succès dans les environnements mobiles, stimulant la demande d'apprentissage automatique efficace en périphérie. Ce domaine exploite les techniques d'apprentissage profond familières dans l'analyse vocale et des séries temporelles pour le traitement des signaux de bas niveau et l'interprétation génomique de haut niveau. Cependant, contrairement à l'audio, le séquençage nanopore présente des débits de données brutes dépassant 100 fois, nécessitant un traitement informatique et mémoriel plus agressif. Cet article propose un système sur puce CMOS (SoC) conçu spécifiquement pour l'analyse génomique mobile. Cette approche combine un processeur RISC-V multicœur et des accélérateurs d'apprentissage profond et de bioinformatique étroitement couplés. Une stratégie de conception matérielle/logicielle collaborative réalise une exécution économe en énergie sur une structure informatique hétérogène, visant une analyse génomique en temps réel au niveau du dispositif.
- Défi de l'échelle des données: Les données génomiques croissent exponentiellement, le temps de doublement (DT) de la base de données GenBank étant de seulement 17 mois au cours des 5 dernières années, avec une augmentation moyenne de la taille des séquences de 20 fois
- Exigences de traitement en temps réel: Les séquenceurs d'ADN miniaturisés produisent des résultats de mesure en temps réel, avec des flux de données atteignant 30 Mbps, soit 100 fois plus élevés que les données vocales (256 kbps)
- Limitations informatiques mobiles: L'analyse génomique traditionnelle nécessite de grands serveurs et des grappes GPU, inadaptés aux appareils mobiles et périphériques
- Émergence de la génomique mobile: Les séquenceurs d'ADN miniaturisés (comme illustré à la figure 2) rendent possible l'analyse génomique sur le terrain
- Besoin d'IA en périphérie: Nécessité d'une analyse génomique en temps réel sur des appareils mobiles aux ressources limitées
- Perspectives d'application: Détection d'agents pathogènes, médecine personnalisée, diagnostic sur le terrain et autres scénarios d'application
- Exigences en ressources informatiques: Le basecalling traditionnel nécessite environ 50 GFLOP/sec/capteur d'ADN
- Rareté de la recherche ASIC: Très peu de conceptions CMOS ASIC dédiées au séquençage mobile dans la littérature
- Problèmes d'efficacité énergétique: Les solutions existantes consomment trop d'énergie, inadaptées aux applications mobiles
- Proposition d'un cadre systématique pour la génomique en périphérie: Basé sur la suite de référence MLCommons, classant les appareils périphériques en trois niveaux : Tiny, Mobile et Edge
- Conception et implémentation d'un SoC spécialisé: SoC hétérogène en technologie CMOS 22nm, intégrant un processeur RISC-V et des accélérateurs dédiés
- Réalisation d'une conception matérielle/logicielle collaborative: Stratégies d'optimisation pour les charges de travail d'analyse génomique
- Validation de la faisabilité de l'analyse génomique mobile: Réalisation de capacités de détection d'agents pathogènes en temps réel à 50mW de consommation d'énergie
Cet article aborde le pipeline complet d'analyse génomique mobile, comprenant principalement :
- Basecalling: Conversion des signaux électrochimiques en séquences de nucléotides
- Alignment: Appariement des lectures avec le génome de référence
- Variant Calling: Identification des variations génomiques
Comme illustré à la figure 4, le SoC contient les composants principaux suivants :
- Processeur RISC-V double cœur (CORE1, CORE2): 64 bits compatible Linux, avec unité virgule flottante
- Accélérateur de calcul matriciel (MAT): Réseau systolique 4×4 pour l'inférence d'apprentissage profond
- Moteur de distance d'édition (ED): Spécialisé dans la programmation dynamique pour la comparaison de séquences
- Mémoire sur puce: 700KB SRAM, distribuée entre le cache et les accélérateurs
- Technologie: GlobalFoundries 22nm CMOS FDSOI
- Surface: 5mm² (y compris les coussinets d'E/S)
- Consommation d'énergie: Environ 50mW de consommation d'énergie de pointe à 250MHz
- Système d'exploitation: Support système Linux
- Structure du réseau: CNN à 6 couches, fonction d'activation ReLU
- Nombre de paramètres: Environ 450K paramètres, 80% des poids concentrés dans deux couches
- Fonction: Déconvolution des contributions de signal brut dans une fenêtre de 8 bases
- Précision: 85% (applicable à la détection d'agents pathogènes, mais insuffisant pour les applications cliniques)
- Méthode d'extension de graine: Basée sur la transformation de Burrows-Wheeler et l'index FM
- Implémentation DP: Alignement de programmation dynamique approximatif accéléré par matériel
- Performance: Les résultats FPGA montrent une accélération 40 fois plus rapide que l'implémentation CPU pure
- Architecture informatique hétérogène: Première intégration étroite d'un processeur polyvalent avec des accélérateurs bioinformatiques spécialisés
- Optimisation de l'efficacité énergétique: Amélioration de l'efficacité énergétique 200 fois supérieure à l'implémentation ARM Cortex-A53
- Capacité de traitement en temps réel: Optimisation pour l'analyse génomique en temps réel sur appareils mobiles
- Écosystème open-source: Architecture open-source basée sur RISC-V, facilitant l'adoption par les développeurs
- Technologie de fabrication: GlobalFoundries 22nm CMOS FDSOI
- Fréquence de fonctionnement: 250MHz
- Budget d'énergie: 50mW de pointe
- Référence MLCommons: Évaluation des performances selon les trois niveaux Tiny, Mobile et Edge
- Référence de comparaison: SoC ARM Cortex-A53 (technologie 16nm)
- Détection d'agents pathogènes: Ciblant les génomes viraux (par exemple, les 30K bases du SARS-CoV-2)
- Basecalling en temps réel: Vitesse de traitement correspondant au flux de données du capteur d'ADN
- Ratio d'accélération: 15 fois plus rapide que l'implémentation CPU pure
- Amélioration de l'efficacité énergétique: Amélioration d'efficacité énergétique 13 fois
- Débit de traitement: Environ 30 Kbase/seconde (à 20mW, 200MHz)
- Précision: 85%
- Ratio d'accélération: Les tests FPGA montrent une accélération 40 fois plus rapide que CPU
- Débit de traitement: Environ 900K bases/seconde à 250MHz
- Efficacité énergétique: Amélioration d'efficacité énergétique 70 fois supérieure à l'implémentation FPGA
- Consommation d'énergie totale: 50mW de pointe sous système Linux
- Temps réel: Support de l'analyse en temps réel des génomes viraux
- Scalabilité: Amélioration supplémentaire des performances possible en augmentant la fréquence d'horloge et en étendant l'accélérateur MAT
- Problèmes de communication: Un bug de communication introduit par le système Linux provoque un interblocage de communication CORE2-ED
- Écart de traitement en temps réel: La vitesse actuelle de basecalling reste inférieure à la capacité de mesure en temps réel du séquenceur d'ADN
- Limitation de précision: La précision de 85% est insuffisante pour les applications cliniques approfondies
- ASIC Basecalling: Un seul ASIC basecalling fabriqué trouvé dans la littérature 16
- Accélérateurs d'alignement: Conception CMOS 55nm réalisant une capacité d'extension de 0,25 Gbases/seconde 19
- Détection de variantes: Puce CMOS 28nm réalisant une vitesse de traitement de 95 Mbases/seconde 24
- Référence MLCommons: Fournissant un cadre d'évaluation standardisé à trois niveaux Edge, Mobile et Tiny
- Puces IA mobiles: Solutions NPU/GPU pour appareils au niveau des smartphones
- TinyML: Implémentation IA ultra-basse consommation au niveau des microcontrôleurs
- Applications d'apprentissage profond: Outils de détection de variantes basés sur l'apprentissage profond tels que DeepVariant et Clair3
- Algorithmes traditionnels: Méthodes classiques de bioinformatique telles que l'extension de graine et la programmation dynamique
- Comparaison de séquences: Étude d'examen de 107 méthodes d'alignement de séquences 17
- Validation de faisabilité: Démonstration de la faisabilité technique de l'analyse génomique en temps réel sur appareils mobiles
- Avantages d'efficacité énergétique: Le matériel spécialisé présente des avantages significatifs en efficacité énergétique par rapport aux processeurs polyvalents
- Potentiel d'application: Particulièrement adapté aux scénarios d'application spécifiques tels que la détection d'agents pathogènes
- Limitation de précision: La précision actuelle de basecalling de 85% limite la portée des applications
- Écart de temps réel: La vitesse de traitement ne peut pas encore correspondre complètement au débit de production de données du capteur d'ADN
- Stabilité du système: L'intégration du système Linux présente des problèmes de communication nécessitant une résolution
- Optimisation des performances: Augmentation de la fréquence d'horloge et extension de l'échelle des accélérateurs
- Amélioration algorithmique: Développement de modèles de basecalling légers de plus haute précision
- Intégration système: Résolution des problèmes de communication et d'ordonnancement au niveau du système d'exploitation
- Extension d'application: Exploration de davantage de scénarios d'application de génomique mobile
- Innovation forte: Première résolution systématique des exigences matérielles pour l'analyse génomique mobile
- Valeur pratique élevée: Conception répondant aux besoins d'application réels, avec des perspectives d'application claires
- Couverture technique complète: Englobant la pile technologique complète de l'algorithme à l'implémentation matérielle
- Efficacité énergétique remarquable: Amélioration de l'efficacité énergétique d'ordre de grandeur par rapport aux solutions traditionnelles
- Précision à améliorer: La précision de 85% limite le potentiel d'application clinique
- Expériences incomplètes: Le module ED n'a pas pu être testé complètement sur la puce en raison de bugs système
- Comparaisons limitées: Manque de comparaison directe avec d'autres processeurs génomiques spécialisés
- Portée d'application étroite: Principalement ciblée sur la détection d'agents pathogènes, avec une généralité limitée
- Contribution académique: Fournissant une référence importante pour la conception matérielle de génomique mobile
- Valeur industrielle: Indiquant la direction du développement des appareils de séquençage génétique portables
- Démonstration technologique: Montrant le potentiel d'application de l'IA en périphérie dans le domaine biomédical
- Détection d'agents pathogènes sur le terrain: Particulièrement adapté à la surveillance épidémiologique et au diagnostic rapide
- Environnements aux ressources limitées: Adapté aux scénarios de zones reculées ou de médecine mobile
- Analyse génomique en temps réel: Applications nécessitant des résultats d'analyse génomique rapides
- Surveillance de la santé personnelle: Potentiellement utilisable dans les appareils de gestion de la santé personnalisée future
L'article cite 24 références importantes couvrant plusieurs domaines de recherche de pointe en bioinformatique, informatique en périphérie et accélération matérielle, fournissant une base théorique et un soutien technique solides pour ce travail.
Évaluation générale: Cet article est un travail de nature pionnière dans le domaine de la conception matérielle de génomique mobile. Bien qu'il y ait encore place à l'amélioration en termes de précision et de stabilité du système, sa conception d'architecture innovante et son amélioration significative de l'efficacité énergétique fournissent un chemin technologique important pour le développement du domaine. Ce travail combine efficacement l'apprentissage profond, l'informatique en périphérie et la conception matérielle spécialisée, représentant une pratique réussie de la recherche interdisciplinaire.