2025-11-13T07:49:11.035604

Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits

Shen, Hua, Zou et al.
Graph representation learning on Analog-Mixed Signal (AMS) circuits is crucial for various downstream tasks, e.g., parasitic estimation. However, the scarcity of design data, the unbalanced distribution of labels, and the inherent diversity of circuit implementations pose significant challenges to learning robust and transferable circuit representations. To address these limitations, we propose CircuitGCL, a novel graph contrastive learning framework that integrates representation scattering and label rebalancing to enhance transferability across heterogeneous circuit graphs. CircuitGCL employs a self-supervised strategy to learn topology-invariant node embeddings through hyperspherical representation scattering, eliminating dependency on large-scale data. Simultaneously, balanced mean squared error (BMSE) and balanced softmax cross-entropy (BSCE) losses are introduced to mitigate label distribution disparities between circuits, enabling robust and transferable parasitic estimation. Evaluated on parasitic capacitance estimation (edge-level task) and ground capacitance classification (node-level task) across TSMC 28nm AMS designs, CircuitGCL outperforms all state-of-the-art (SOTA) methods, with the $R^2$ improvement of $33.64\% \sim 44.20\%$ for edge regression and F1-score gain of $0.9\times \sim 2.1\times$ for node classification. Our code is available at https://github.com/ShenShan123/CircuitGCL.
academic

Estimación de Parásitos Transferibles mediante Aprendizaje Contrastivo de Grafos y Reequilibrio de Etiquetas en Circuitos AMS

Información Básica

  • ID del Artículo: 2507.06535
  • Título: Estimación de Parásitos Transferibles mediante Aprendizaje Contrastivo de Grafos y Reequilibrio de Etiquetas en Circuitos AMS
  • Autores: Shan Shen, Shenglu Hua, Jiajun Zou, Jiawei Liu, Jianwang Zhai, Chuan Shi, Wenjian Yu
  • Clasificación: cs.LG cs.SY eess.SY
  • Fecha de Publicación: 10 de octubre de 2025 (Envío a arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2507.06535

Resumen

Este artículo propone el marco CircuitGCL para abordar el problema de estimación de parámetros parásitos en circuitos analógicos-mixtos (AMS). El marco resuelve los desafíos derivados de la escasez de datos de diseño de circuitos, el desequilibrio en la distribución de etiquetas y la diversidad de implementaciones de circuitos mediante aprendizaje contrastivo de grafos y técnicas de reequilibrio de etiquetas. CircuitGCL adopta una estrategia autosupervisada que aprende incrustaciones de nodos invariantes a la topología mediante dispersión de representación en espacios hipersféricos, mientras introduce funciones de pérdida de error cuadrático medio equilibrado (BMSE) y entropía cruzada softmax equilibrada (BSCE) para mitigar las diferencias en la distribución de etiquetas entre circuitos. Los experimentos en diseños AMS TSMC 28nm demuestran que el método mejora R² en un 33.64%~44.20% en tareas de regresión de aristas y la puntuación F1 en un factor de 0.9×~2.1× en tareas de clasificación de nodos.

Antecedentes y Motivación de la Investigación

Definición del Problema

Los circuitos AMS modernos integran módulos analógicos (como amplificadores y osciladores) y subsistemas digitales (como controladores y matrices SRAM), requiriendo numerosas iteraciones manuales durante el proceso de diseño. Conforme los nodos tecnológicos se reducen, los efectos parásitos se vuelven cada vez más importantes, particularmente las capacitancias parásitas que afectan significativamente el rendimiento del circuito, causando aumento en la latencia de propagación, incremento del consumo de potencia y degradación de la integridad de la señal.

Importancia de la Investigación

El flujo de diseño tradicional depende de simulaciones post-diseño para verificar efectos parásitos, un método que consume tiempo y es costoso. La predicción de parámetros parásitos en la etapa pre-diseño puede reducir significativamente el número de iteraciones de diseño y mejorar la eficiencia del diseño. Las redes neuronales de grafos (GNN) proporcionan una solución efectiva, permitiendo modelar circuitos como estructuras de grafos para predicción de parámetros parásitos.

Limitaciones de Métodos Existentes

  1. Escasez de Datos: Los datos de circuitos AMS de alta calidad (incluyendo netlist SPICE y parámetros parásitos de diseño) suelen ser propietarios y costosos de generar
  2. Diversidad de Circuitos: Los circuitos AMS abarcan dominios analógicos, digitales e híbridos con diferentes principios de diseño y requisitos de rendimiento
  3. Desequilibrio de Etiquetas: La distribución de capacitancias parásitas presenta características de cola larga, con muestras de capacitancias grandes severamente insuficientes
  4. Pobre Transferibilidad: Los métodos existentes entrenados en tipos de circuitos específicos tienen dificultad para generalizar a otras topologías de circuitos

Contribuciones Principales

  1. Propuesta del Marco CircuitGCL: Adapta el mecanismo de dispersión de representación (RSM) al aprendizaje contrastivo de grafos, generando representaciones transferibles directamente aplicables a diseños AMS no vistos, sin necesidad de ajuste fino específico de tareas
  2. Técnicas de Reequilibrio de Etiquetas: Resuelve problemas de desequilibrio en conjuntos de datos de circuitos mediante funciones de pérdida MSE equilibrado y BSCE equilibrado, mejorando la capacidad de transferencia entre dominios del modelo
  3. Marco Teórico Unificado: Proporciona una base teórica unificada para regresión y clasificación desequilibradas basada en principios de alineación de distribuciones
  4. Aplicabilidad Amplia: El método se puede extender directamente a predicción de resistencias/inductancias, análisis de diafonía, estimación de caída IR y transferencia entre procesos

Explicación Detallada del Método

Definición de Tareas

Entrada: Netlist esquemático de circuitos AMS, modelado como grafo heterogéneo G = (V, E), donde los nodos V representan redes, dispositivos transistores y pines, y las aristas E codifican relaciones de conectividad Salida:

  • Tarea de regresión de aristas: Predicción de valores de capacitancia de acoplamiento
  • Tarea de clasificación de nodos: Clasificación de capacitancias a tierra en rangos discretos (pequeño/medio/grande)

Arquitectura del Modelo

1. Módulo de Transformación de Grafos

Convierte grafos AMS heterogéneos en grafos homogéneos, distinguiendo nodos de redes, dispositivos y pines mediante atributos de tipo de nodo X ∈ {0,1,2}^{N×1}. La matriz de características mejorada X_C ∈ R^{N×d_C} captura parámetros de diseño detallados e información estadística de conectividad.

2. Mecanismo de Dispersión de Representación (RSM)

Definición: En un espacio de incrustación D-dimensional R^D, RSM impone dos restricciones:

  • Restricción de distancia del centro: Máxima separación de incrustaciones de nodos respecto al centro de dispersión c
  • Restricción de uniformidad: Incrustaciones de nodos distribuidas uniformemente en el subespacio S_k

Implementación:

h̃_i = h_i / max(||h_i||_2, ε)  # Normalización L2
L_scattering = -1/N ∑||h̃_i - c||²_2  # Pérdida de dispersión
c = 1/N ∑h̃_i  # Centro de dispersión

3. Codificador en Línea

El codificador objetivo genera representaciones dispersas H_target = f_φ(A,X), el codificador en línea produce representaciones intermedias H_online, obteniendo representaciones predichas z_online mediante el predictor q_θ(·). La pérdida de alineación es:

L_alignment = -1/N ∑(z_i^T h_i)/(||z_i||_2 ||h_i||_2)

Los parámetros del codificador objetivo se actualizan mediante media móvil exponencial: φ ← τφ + (1-τ)θ

Puntos de Innovación Técnica

1. Ventajas Comparadas con DSPD

CircuitGPS utiliza distancia de ruta más corta de doble ancla (DSPD) como codificación de posición, pero los costos computacionales y de almacenamiento crecen cuadráticamente con el tamaño del grafo. El preentrenamiento GCL de CircuitGCL tiene alto paralelismo y buena escalabilidad del modelo, superando significativamente a DSPD en circuitos a gran escala.

2. Base Teórica del Reequilibrio de Etiquetas

Basado en el teorema de Bayes, la relación entre la distribución de entrenamiento p_train(y|x) y la distribución equilibrada p_bal(y|x) es:

p_train(y|x)/p_bal(y|x) ∝ p_train(y)/p_bal(y)

Configuración Experimental

Conjunto de Datos

Se utilizan 6 diseños de circuitos AMS implementados en tecnología CMOS TSMC 28nm:

  • Conjunto de Entrenamiento: SSRAM (87K nodos, 134K aristas)
  • Conjunto de Prueba: DIGITAL CLK GEN, TIMING CTRL, ARRAY 128 32, ULTRA8T, SANDWICH-RAM
  • El diseño máximo contiene 4.3M nodos y 13.3M aristas

Métricas de Evaluación

  • Tareas de Regresión: MAE, MSE, R²
  • Tareas de Clasificación: Accuracy, Precision, Recall, F1-score

Métodos de Comparación

  1. ParaGraph: Modelo integrado basado en MPNN
  2. DLPL-Cap: Regresor GNN multiexperto
  3. CircuitGPS: Método de aprendizaje con pocas muestras usando codificación de posición

Detalles de Implementación

  • Codificador: 4 capas ClusterGCN, 256 dimensiones ocultas, activación Tanh, dropout 0.3
  • GNN descendente: 5 capas GraphSAGE, 144 dimensiones ocultas, activación PReLU
  • σ_noise = 0.001, τ = 0.99

Resultados Experimentales

Resultados Principales

Tarea de Regresión de Aristas (Estimación de Capacitancia de Acoplamiento)

Conjunto de PruebaMejor MétodoMejora R²
TIMING CTRLCircuitGCL(GAI)41.08%
ARRAY 128 32CircuitGCL(GAI)44.20%
ULTRA8TCircuitGCL(GAI)37.44%
SANDWICH-RAMCircuitGCL(GAI)33.64%

Tarea de Clasificación de Nodos (Clasificación de Capacitancia a Tierra)

Conjunto de PruebaMejor MétodoMejora F1
DIGITAL CLK GENCircuitGCL(BSCE)0.9×
ARRAY 128 32CircuitGCL(BSCE)2.1×
ULTRA8TCircuitGCL(BSCE)1.2×
SANDWICH-RAMCircuitGCL(BSCE)1.5×

Experimentos de Ablación

Análisis del Efecto RSM

RSM aporta mejoras de rendimiento en todos los conjuntos de datos:

  • Mejora máxima de R² del 26.9% (ARRAY 128 32)
  • Mejora máxima de F1 del 20.0% (ULTRA8T)
  • La mejora mínima alcanza 4.1% (F1) y 6.56% (R²)

Efecto del Reequilibrio de Etiquetas

La aplicación de BSCE a todos los métodos de referencia produce mejoras significativas en precisión, siendo el efecto más notable en diseños a gran escala. MSE equilibrado mejora significativamente el rendimiento del modelo en regiones de datos escasos.

Trabajo Relacionado

Predicción de Parámetros Parásitos

  • ParaGraph: Convierte esquemáticos de circuitos en grafos, utilizando MPNN para predecir capacitancias de red y parámetros de diseño
  • DLPL-Cap: Combina enrutador GNN y cinco regresores expertos para manejar distribuciones de datos desequilibradas en circuitos SRAM
  • CircuitGPS: Utiliza aprendizaje con pocas muestras y codificación de posición de bajo costo para predicción de parámetros parásitos

Aprendizaje Contrastivo de Grafos

Los marcos GCL convencionales ejecutan implícitamente dispersión de representación, que juega un papel crucial en su éxito. Este artículo adopta SGRL como base GCL, incrustando representaciones de nodos dentro de espacios hipersféricos.

Aprendizaje Desequilibrado

  • Clasificación: Remuestreo de datos, reponderación de pérdidas, ajuste de logits y otros métodos
  • Regresión: Relativamente menos explorada, con métodos existentes principalmente enfocados en adaptación SMOTE y reponderación de pérdidas

Conclusiones y Discusión

Conclusiones Principales

  1. CircuitGCL resuelve exitosamente los problemas de escasez de datos y desequilibrio de etiquetas en diseño de circuitos AMS mediante aprendizaje de representación autosupervisada y funciones de pérdida conscientes de la distribución
  2. Las incrustaciones invariantes a topología generadas por RSM poseen excelente capacidad de transferencia entre dominios
  3. Las funciones de pérdida equilibradas unifican teóricamente problemas de regresión y clasificación desequilibradas
  4. Logra rendimiento SOTA en múltiples diseños TSMC 28nm

Limitaciones

  1. Validado solo en tecnología TSMC 28nm; la capacidad de transferencia entre nodos tecnológicos requiere verificación adicional
  2. Actualmente enfocado en predicción de capacitancias; la aplicabilidad a predicción de resistencias/inductancias requiere verificación adicional
  3. La eficiencia computacional en circuitos a gran escala aún tiene espacio para optimización

Direcciones Futuras

  1. Extensión a tipos más amplios de circuitos AMS
  2. Adaptación a estimación de resistencias parásitas
  3. Integración en herramientas de diseño y enrutamiento conscientes de RC
  4. Investigación de aprendizaje de transferencia entre nodos tecnológicos

Evaluación Profunda

Fortalezas

  1. Importancia del Problema: Aborda puntos críticos reales en el campo EDA, con valor ingenieril significativo
  2. Innovación Metodológica: Primera aplicación de aprendizaje contrastivo de grafos a predicción de parámetros parásitos de circuitos; la adaptación de RSM es ingeniosa
  3. Contribución Teórica: Proporciona marco teórico unificado para regresión y clasificación desequilibradas
  4. Experimentación Completa: Validación en múltiples diseños de circuitos reales con resultados convincentes
  5. Reproducibilidad: Proporciona código de código abierto para facilitar reproducción y aplicación

Deficiencias

  1. Limitaciones del Conjunto de Datos: Utiliza solo datos de un nodo tecnológico único; la capacidad de generalización requiere verificación
  2. Sobrecarga Computacional: Aunque más eficiente que DSPD, el preentrenamiento GCL aún requiere recursos computacionales adicionales
  3. Ingeniería de Características: La extracción y representación de características de circuitos aún depende de diseño manual
  4. Análisis Teórico: Carece de análisis teórico profundo sobre por qué RSM es particularmente adecuado para grafos de circuitos

Impacto

  1. Valor Académico: Abre la aplicación de aprendizaje contrastivo de grafos en el campo EDA, potencialmente inspirando investigaciones relacionadas
  2. Valor Ingenieril: Directamente aplicable a herramientas EDA comerciales, mejorando eficiencia de diseño
  3. Generalidad del Método: El marco es extensible a otros tipos de predicción de parámetros parásitos y análisis de circuitos

Escenarios de Aplicación

  1. Etapa Pre-Diseño: Evaluación rápida de efectos parásitos, reduciendo iteraciones de diseño
  2. Exploración del Espacio de Diseño: Filtrado rápido de candidatos en espacios de diseño a gran escala
  3. Transferencia Entre Diseños: Aplicación de modelos entrenados en un circuito a nuevos diseños de circuitos
  4. Integración en Herramientas EDA: Como módulo de algoritmo central en herramientas EDA comerciales

Evaluación General: Este es un artículo de investigación interdisciplinaria de alta calidad que aplica exitosamente técnicas de aprendizaje automático de vanguardia a problemas prácticos en el campo EDA. El método es novedoso, la experimentación es completa, los resultados son significativos, y posee importante valor teórico y práctico.