2025-11-13T07:49:11.035604

Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits

Shen, Hua, Zou et al.
Graph representation learning on Analog-Mixed Signal (AMS) circuits is crucial for various downstream tasks, e.g., parasitic estimation. However, the scarcity of design data, the unbalanced distribution of labels, and the inherent diversity of circuit implementations pose significant challenges to learning robust and transferable circuit representations. To address these limitations, we propose CircuitGCL, a novel graph contrastive learning framework that integrates representation scattering and label rebalancing to enhance transferability across heterogeneous circuit graphs. CircuitGCL employs a self-supervised strategy to learn topology-invariant node embeddings through hyperspherical representation scattering, eliminating dependency on large-scale data. Simultaneously, balanced mean squared error (BMSE) and balanced softmax cross-entropy (BSCE) losses are introduced to mitigate label distribution disparities between circuits, enabling robust and transferable parasitic estimation. Evaluated on parasitic capacitance estimation (edge-level task) and ground capacitance classification (node-level task) across TSMC 28nm AMS designs, CircuitGCL outperforms all state-of-the-art (SOTA) methods, with the $R^2$ improvement of $33.64\% \sim 44.20\%$ for edge regression and F1-score gain of $0.9\times \sim 2.1\times$ for node classification. Our code is available at https://github.com/ShenShan123/CircuitGCL.
academic

Estimation Parasitaire Transférable via Apprentissage Contrastif Graphique et Rééquilibrage des Étiquettes dans les Circuits AMS

Informations Fondamentales

  • ID de l'article: 2507.06535
  • Titre: Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits
  • Auteurs: Shan Shen, Shenglu Hua, Jiajun Zou, Jiawei Liu, Jianwang Zhai, Chuan Shi, Wenjian Yu
  • Classification: cs.LG cs.SY eess.SY
  • Date de publication: 10 octobre 2025 (soumission arXiv)
  • Lien de l'article: https://arxiv.org/abs/2507.06535

Résumé

Cet article propose le cadre CircuitGCL pour résoudre le problème d'estimation des paramètres parasitaires dans les circuits analogiques-numériques (AMS). Le cadre utilise l'apprentissage contrastif graphique et des techniques de rééquilibrage des étiquettes pour surmonter les défis liés à la rareté des données de conception de circuits, au déséquilibre de la distribution des étiquettes et à la diversité des implémentations de circuits. CircuitGCL adopte une stratégie d'apprentissage auto-supervisé, générant des plongements de nœuds invariants topologiquement par apprentissage par diffusion de représentation sur la sphère unitaire, tout en introduisant les fonctions de perte d'erreur quadratique moyenne équilibrée (BMSE) et d'entropie croisée softmax équilibrée (BSCE) pour atténuer les différences de distribution d'étiquettes entre circuits. Les expériences sur les conceptions AMS TSMC 28nm montrent que la méthode améliore R² de 33,64 % à 44,20 % sur les tâches de régression d'arêtes et le score F1 de 0,9× à 2,1× sur les tâches de classification de nœuds.

Contexte et Motivation de la Recherche

Définition du Problème

Les circuits AMS modernes intègrent des modules analogiques (tels que les amplificateurs, oscillateurs) et des sous-systèmes numériques (tels que les contrôleurs, matrices SRAM), nécessitant de nombreuses itérations manuelles au cours du processus de conception. À mesure que les nœuds technologiques diminuent, les effets parasitaires deviennent de plus en plus importants, en particulier les capacités parasitaires qui affectent considérablement les performances des circuits, entraînant une augmentation du délai de propagation, une augmentation de la consommation d'énergie et une dégradation de l'intégrité du signal.

Importance de la Recherche

Le flux de conception traditionnel repose sur la simulation post-placement pour vérifier les effets parasitaires, une approche chronophage et coûteuse. La prédiction des paramètres parasitaires au stade pré-placement peut réduire considérablement le nombre d'itérations de conception et améliorer l'efficacité de la conception. Les réseaux de neurones graphiques (GNN) offrent une solution efficace, permettant de modéliser les circuits comme des structures graphiques pour la prédiction des paramètres parasitaires.

Limitations des Méthodes Existantes

  1. Rareté des données: Les données de circuits AMS de haute qualité (incluant les netlistes SPICE, les paramètres parasitaires de placement, etc.) sont généralement propriétaires et coûteuses à générer
  2. Diversité des circuits: Les circuits AMS couvrent les domaines analogique, numérique et mixte, avec des principes de conception et des exigences de performance différents
  3. Déséquilibre des étiquettes: La distribution des capacités parasitaires présente des caractéristiques de queue longue, avec une grave insuffisance d'échantillons de valeurs de capacité élevées
  4. Faible transférabilité: Les méthodes existantes entraînées sur des types de circuits spécifiques ont du mal à généraliser à d'autres topologies de circuits

Contributions Principales

  1. Proposition du cadre CircuitGCL: Adaptation du mécanisme de diffusion de représentation (RSM) à l'apprentissage contrastif graphique, générant des représentations transférables directement applicables aux conceptions AMS non vues, sans nécessiter d'ajustement fin spécifique à la tâche
  2. Techniques de rééquilibrage des étiquettes: Résolution du problème de déséquilibre dans les ensembles de données de circuits par les fonctions de perte BMSE et BSCE équilibrées, renforçant la capacité de transfert inter-domaines du modèle
  3. Cadre théorique unifié: Fourniture d'une base théorique unifiée pour la régression et la classification déséquilibrées basée sur le principe d'alignement de distribution
  4. Applicabilité générale: La méthode peut être directement étendue à la prédiction de résistances/inductances, l'analyse de diaphonie, l'estimation de la chute IR et le transfert inter-processus

Explication Détaillée de la Méthode

Définition de la Tâche

Entrée: Netliste de schéma d'un circuit AMS, modélisée comme un graphe hétérogène G = (V, E), où les nœuds V représentent les réseaux, les dispositifs transistors et les broches, les arêtes E codent les relations de connectivité Sortie:

  • Tâche de régression d'arêtes: Prédiction des valeurs de capacité de couplage
  • Tâche de classification de nœuds: Classification des capacités de masse en plages discrètes (petite/moyenne/grande)

Architecture du Modèle

1. Module de Transformation Graphique

Conversion du graphe AMS hétérogène en graphe homogène, distinguant les nœuds de réseau, dispositif et broche par l'attribut de type de nœud X ∈ {0,1,2}^{N×1}. La matrice de caractéristiques améliorée X_C ∈ R^{N×d_C} capture les paramètres de conception détaillés et les informations statistiques de connectivité.

2. Mécanisme de Diffusion de Représentation (RSM)

Définition: Dans un espace de plongement D-dimensionnel R^D, RSM impose deux contraintes:

  • Contrainte d'éloignement du centre: Séparation maximale des plongements de nœuds du centre de diffusion c
  • Contrainte d'uniformité: Distribution uniforme des plongements de nœuds sur le sous-espace S_k

Implémentation:

h̃_i = h_i / max(||h_i||_2, ε)  # Normalisation L2
L_scattering = -1/N ∑||h̃_i - c||²_2  # Perte de diffusion
c = 1/N ∑h̃_i  # Centre de diffusion

3. Encodeur en Ligne

L'encodeur cible génère la représentation de diffusion H_target = f_φ(A,X), l'encodeur en ligne produit la représentation intermédiaire H_online, obtenant la représentation prédite z_online par le prédicteur q_θ(·). La perte d'alignement est:

L_alignment = -1/N ∑(z_i^T h_i)/(||z_i||_2 ||h_i||_2)

Les paramètres de l'encodeur cible sont mis à jour par moyenne mobile exponentielle: φ ← τφ + (1-τ)θ

Points d'Innovation Technique

1. Avantages par Rapport à DSPD

CircuitGPS utilise la distance du chemin le plus court à double ancre (DSPD) comme codage de position, mais le coût de calcul et de stockage augmente quadratiquement avec la taille du graphe. La préformation GCL de CircuitGCL possède une haute parallélisabilité et une bonne scalabilité du modèle, surpassant considérablement DSPD sur les circuits à grande échelle.

2. Base Théorique du Rééquilibrage des Étiquettes

Basée sur le théorème de Bayes, la relation entre la distribution d'entraînement p_train(y|x) et la distribution équilibrée p_bal(y|x) est:

p_train(y|x)/p_bal(y|x) ∝ p_train(y)/p_bal(y)

Configuration Expérimentale

Ensemble de Données

Utilisation de 6 conceptions de circuits AMS implémentées en technologie CMOS TSMC 28nm:

  • Ensemble d'entraînement: SSRAM (87K nœuds, 134K arêtes)
  • Ensemble de test: DIGITAL CLK GEN, TIMING CTRL, ARRAY 128 32, ULTRA8T, SANDWICH-RAM
  • La conception maximale contient 4,3M nœuds et 13,3M arêtes

Métriques d'Évaluation

  • Tâches de régression: MAE, MSE, R²
  • Tâches de classification: Accuracy, Precision, Recall, F1-score

Méthodes de Comparaison

  1. ParaGraph: Modèle d'ensemble basé sur MPNN
  2. DLPL-Cap: Régresseur GNN multi-experts
  3. CircuitGPS: Méthode d'apprentissage peu supervisé utilisant le codage de position

Détails d'Implémentation

  • Encodeur: 4 couches ClusterGCN, 256 dimensions cachées, activation Tanh, dropout 0,3
  • GNN en aval: 5 couches GraphSAGE, 144 dimensions cachées, activation PReLU
  • σ_noise = 0,001, τ = 0,99

Résultats Expérimentaux

Résultats Principaux

Tâche de Régression d'Arêtes (Estimation de Capacité de Couplage)

Ensemble de TestMeilleure MéthodeAmélioration R²
TIMING CTRLCircuitGCL(GAI)41,08%
ARRAY 128 32CircuitGCL(GAI)44,20%
ULTRA8TCircuitGCL(GAI)37,44%
SANDWICH-RAMCircuitGCL(GAI)33,64%

Tâche de Classification de Nœuds (Classification de Capacité de Masse)

Ensemble de TestMeilleure MéthodeAmélioration F1
DIGITAL CLK GENCircuitGCL(BSCE)0,9×
ARRAY 128 32CircuitGCL(BSCE)2,1×
ULTRA8TCircuitGCL(BSCE)1,2×
SANDWICH-RAMCircuitGCL(BSCE)1,5×

Étude d'Ablation

Analyse de l'Effet RSM

RSM apporte des améliorations de performance sur tous les ensembles de données:

  • Amélioration maximale de R² de 26,9% (ARRAY 128 32)
  • Amélioration maximale de F1 de 20,0% (ULTRA8T)
  • L'amélioration minimale atteint 4,1% (F1) et 6,56% (R²)

Effet du Rééquilibrage des Étiquettes

L'application de BSCE à toutes les méthodes de base apporte des améliorations significatives de précision, particulièrement sur les conceptions à grande échelle. MSE équilibré améliore considérablement les performances du modèle dans les régions de données rares.

Travaux Connexes

Prédiction des Paramètres Parasitaires

  • ParaGraph: Conversion des schémas de circuits en graphes, utilisant MPNN pour prédire les capacités de réseau et les paramètres de placement
  • DLPL-Cap: Combinaison d'un routeur GNN et de cinq régresseurs experts pour traiter la distribution déséquilibrée des données dans les circuits SRAM
  • CircuitGPS: Utilisation de l'apprentissage peu supervisé et du codage de position à faible coût pour la prédiction des paramètres parasitaires

Apprentissage Contrastif Graphique

Les cadres GCL courants exécutent implicitement la diffusion de représentation, qui joue un rôle clé dans leur succès. Cet article adopte SGRL comme base GCL, plongeant les représentations de nœuds dans la sphère unitaire.

Apprentissage Déséquilibré

  • Classification: Rééchantillonnage de données, repondération des pertes, ajustement des logits, etc.
  • Régression: Moins explorée, les méthodes existantes sont principalement l'adaptation SMOTE et la repondération des pertes

Conclusion et Discussion

Conclusions Principales

  1. CircuitGCL résout avec succès les problèmes de rareté des données et de déséquilibre des étiquettes dans la conception de circuits AMS par l'apprentissage de représentation auto-supervisée et les fonctions de perte sensibles à la distribution
  2. Les plongements invariants topologiquement générés par RSM possèdent d'excellentes capacités de transfert inter-domaines
  3. Les fonctions de perte équilibrées unifient théoriquement les problèmes de régression et classification déséquilibrées
  4. Atteint les performances SOTA sur plusieurs conceptions TSMC 28nm

Limitations

  1. Validation uniquement sur la technologie TSMC 28nm, la capacité de transfert inter-nœuds technologiques reste à vérifier
  2. Actuellement axé sur la prédiction de capacité, l'applicabilité à la prédiction de résistance/inductance nécessite une vérification supplémentaire
  3. L'efficacité de calcul des circuits à grande échelle a encore de la place pour l'optimisation

Directions Futures

  1. Extension à des types de circuits AMS plus larges
  2. Adaptation à l'estimation de résistance parasitaire
  3. Intégration dans les outils de placement-routage conscients de RC
  4. Recherche sur l'apprentissage par transfert inter-nœuds technologiques

Évaluation Approfondie

Points Forts

  1. Importance du problème: Aborde les points critiques réels du domaine EDA, avec une valeur d'ingénierie importante
  2. Innovation méthodologique: Première application de l'apprentissage contrastif graphique à la prédiction des paramètres parasitaires de circuits, adaptation RSM ingénieuse
  3. Contribution théorique: Fournit un cadre théorique unifié pour la régression et classification déséquilibrées
  4. Expérimentation complète: Validation sur plusieurs conceptions de circuits réels, résultats convaincants
  5. Reproductibilité: Code open-source fourni, facilitant la reproduction et l'application

Insuffisances

  1. Limitation de l'ensemble de données: Utilisation uniquement de données d'un seul nœud technologique, la capacité de généralisation reste à vérifier
  2. Surcharge de calcul: Bien que plus efficace que DSPD, la préformation GCL nécessite toujours des ressources de calcul supplémentaires
  3. Ingénierie des caractéristiques: L'extraction et la représentation des caractéristiques de circuits dépendent toujours de la conception manuelle
  4. Analyse théorique: Manque d'analyse théorique approfondie sur pourquoi RSM est particulièrement adapté aux graphes de circuits

Impact

  1. Valeur académique: Ouvre l'application de l'apprentissage contrastif graphique dans le domaine EDA, susceptible d'inspirer davantage de recherches connexes
  2. Valeur d'ingénierie: Directement applicable aux outils EDA commerciaux, améliorant l'efficacité de conception
  3. Généralité de la méthode: Le cadre peut être étendu à d'autres types de prédiction de paramètres parasitaires et d'analyse de circuits

Scénarios d'Application

  1. Phase pré-placement: Évaluation rapide des effets parasitaires, réduction des itérations de conception
  2. Exploration de l'espace de conception: Filtrage rapide des candidats dans un grand espace de conception
  3. Transfert inter-conceptions: Application d'un modèle entraîné sur un circuit à de nouvelles conceptions de circuits
  4. Intégration d'outils EDA: Module d'algorithme central pour les outils EDA commerciaux

Évaluation Globale: Cet article est une recherche interdisciplinaire de haute qualité qui applique avec succès les technologies d'apprentissage automatique de pointe aux problèmes pratiques du domaine EDA. La méthode est novatrice, l'expérimentation complète, les résultats significatifs, avec une valeur théorique et pratique importante.