A protocol to reduce worst-case latency in deflection-based on-chip networks
Indrusiak
We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.
academic
Un protocolo para reducir la latencia en el peor caso en redes en chip basadas en deflexión
Este artículo propone un protocolo novedoso para reducir la latencia de paquetes en el peor caso en redes de interconexión en chip basadas en enrutamiento por deflexión. El protocolo obliga a deflectar solo la cabecera de los paquetes en lugar de su carga útil, reduciendo así el tráfico general de la red y, más importante aún, disminuyendo la latencia de paquetes en el peor caso al reducir la latencia previa a la inyección.
Problema Central: En redes en chip (NoC) basadas en enrutamiento por deflexión, el mecanismo tradicional de deflexión de paquetes completos causa problemas graves de latencia, particularmente en sistemas embebidos en tiempo real donde se requieren garantías de rendimiento.
Importancia del Problema:
Las redes de enrutamiento por deflexión, aunque ofrecen ventajas de eficiencia de recursos (reducción del 85% del área del chip, disminución de 10 veces en consumo de energía), producen un impacto grave en la latencia de la red
Las plataformas multiprocesador embebidas requieren garantías de rendimiento; el aumento de latencia afecta directamente el rendimiento de extremo a extremo
Los modelos de análisis existentes muestran que la deflexión aumenta significativamente la latencia en el peor caso
Limitaciones de Métodos Existentes:
El enrutamiento por deflexión tradicional envía el paquete completo (incluyendo cabecera y carga útil) a través de una ruta alternativa cuando hay congestión
Este enfoque aumenta el tráfico innecesario de la red, especialmente cuando el paquete necesita regresar al punto de inyección para reintentar
Los métodos de optimización existentes se enfocan principalmente en cambiar el enrutamiento o reducir el número de deflexiones, sin considerar la optimización del tráfico durante el proceso de deflexión
Motivación de la Investigación:
Observación de que los paquetes deflectados siempre pasan a través de su conmutador de inyección antes de poder llegar nuevamente al destino
Propuesta de deflectar solo la cabecera mientras se descarta la carga útil, reinyectando la carga útil en el punto de inyección
Objetivo de reducir la interferencia de la red, mejorando así la latencia general en el peor caso
Propuesta de Nuevo Protocolo de Deflexión: Separación innovadora del manejo de cabecera y carga útil de paquetes, deflectando solo la cabecera mientras se descarta la carga útil
Establecimiento de Modelo de Análisis Teórico: Modificación del marco de análisis de latencia en el peor caso existente, cuantificando las mejoras de rendimiento del nuevo protocolo
Provisión de Garantías de Rendimiento: Demostración teórica de que el nuevo protocolo supera a los métodos tradicionales en latencia en el peor caso
Verificación Experimental Extensiva: Validación del protocolo a través de evaluaciones específicas de aplicaciones y sintéticas a gran escala, demostrando su efectividad en diferentes escenarios
Entrada: Red en chip sin enrutador basada en topología de anillo, empleando mecanismo de enrutamiento por deflexión de paquete completo
Salida: Protocolo de deflexión mejorado que reduce la latencia de paquetes en el peor caso
Restricciones: Mantener la funcionalidad original de la red, sin aumentar gastos generales de búfer adicionales, satisfaciendo requisitos de rendimiento de sistemas en tiempo real
En el protocolo tradicional, cuando un paquete no puede ser extraído en el conmutador de destino (por ejemplo, el enlace de extracción está ocupado), el paquete completo se deflecta y se transmite a través del anillo hasta que llega nuevamente al destino.
La carga útil del paquete no puede eliminarse inmediatamente del búfer de inyección después de la inyección
Se emplean técnicas de búfer SAFC o SAMQ para gestionar requisitos de reinyección
Bajo restricciones de plazo (Di ≤ Ti), no se requiere memoria de búfer adicional
Mecanismo de Identificación de Cabecera:
El conmutador de inyección debe poder identificar cabeceras deflectadas
La cabecera contiene el conmutador de destino e identificadores únicos del flujo de paquetes
La modificación de campos implementa el mecanismo de activación de reinyección
Optimización de Tráfico:
Método tradicional: Deflexión de paquete completo = Cabecera(H) + Carga útil(L-H)
Nuevo protocolo: Solo deflexión de cabecera = Cabecera(H)
Reducción de tráfico = (L-H) × número de deflexiones × longitud de ruta de retorno
Fórmula de análisis de tiempo de inactividad previa a la inyección modificada:
La fórmula original involucra la longitud de paquete completo Lj de todos los flujos
La fórmula del nuevo protocolo reemplaza la longitud de carga útil de flujos deflectados con la longitud de cabecera H
Dado que Lj > H, el nuevo protocolo es teóricamente superior al método original
Rango de Aplicación Limitado: Principalmente dirigido a redes de anillo, aplicabilidad a otras topologías poco clara
Detalles de Implementación Insuficientes: Falta de detalles específicos sobre métodos de codificación de modificación de cabecera e implementación de hardware
Comparación de Línea Base Limitada: Principalmente comparación con un método de línea base, falta de comparación con otras técnicas de optimización
Métricas de Evaluación Únicas: Enfoque en latencia en el peor caso, análisis insuficiente de impacto en rendimiento promedio y consumo de energía
Este artículo cita 15 trabajos relacionados, incluyendo principalmente:
1 Arquitectura de red sin enrutador de Alazemi et al.
6 Análisis de latencia en el peor caso de Indrusiak y Burns
8 Diseño de red de anillo IMR de Liu et al.
Otros trabajos relacionados con enrutamiento por deflexión, análisis en tiempo real y optimización de NoC
Evaluación General: Este es un artículo de arquitectura de sistemas de alta calidad que propone un protocolo de optimización de enrutamiento por deflexión innovador, con base teórica sólida y verificación experimental completa. Aunque presenta ciertas limitaciones en rango de aplicación y detalles de implementación, su idea central posee importante valor académico y práctico, proporcionando nuevas direcciones para investigación en optimización de redes en chip.