2025-11-22T19:13:16.751799

A protocol to reduce worst-case latency in deflection-based on-chip networks

Indrusiak

We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.

academic

Un protocolo para reducir la latencia en el peor caso en redes en chip basadas en deflexión

Información Básica

ID del Artículo: 2510.11361
Título: Un protocolo para reducir la latencia en el peor caso en redes en chip basadas en deflexión
Autor: Leandro Soares Indrusiak (Universidad de Leeds)
Clasificación: cs.NI (Arquitectura de Redes e Internet), cs.PF (Rendimiento)
Fecha de Publicación: 13 de octubre de 2025 (preimpresión en arXiv)
Enlace del Artículo: https://arxiv.org/abs/2510.11361

Resumen

Este artículo propone un protocolo novedoso para reducir la latencia de paquetes en el peor caso en redes de interconexión en chip basadas en enrutamiento por deflexión. El protocolo obliga a deflectar solo la cabecera de los paquetes en lugar de su carga útil, reduciendo así el tráfico general de la red y, más importante aún, disminuyendo la latencia de paquetes en el peor caso al reducir la latencia previa a la inyección.

Antecedentes de Investigación y Motivación

Definición del Problema

Problema Central: En redes en chip (NoC) basadas en enrutamiento por deflexión, el mecanismo tradicional de deflexión de paquetes completos causa problemas graves de latencia, particularmente en sistemas embebidos en tiempo real donde se requieren garantías de rendimiento.
Importancia del Problema:
- Las redes de enrutamiento por deflexión, aunque ofrecen ventajas de eficiencia de recursos (reducción del 85% del área del chip, disminución de 10 veces en consumo de energía), producen un impacto grave en la latencia de la red
- Las plataformas multiprocesador embebidas requieren garantías de rendimiento; el aumento de latencia afecta directamente el rendimiento de extremo a extremo
- Los modelos de análisis existentes muestran que la deflexión aumenta significativamente la latencia en el peor caso
Limitaciones de Métodos Existentes:
- El enrutamiento por deflexión tradicional envía el paquete completo (incluyendo cabecera y carga útil) a través de una ruta alternativa cuando hay congestión
- Este enfoque aumenta el tráfico innecesario de la red, especialmente cuando el paquete necesita regresar al punto de inyección para reintentar
- Los métodos de optimización existentes se enfocan principalmente en cambiar el enrutamiento o reducir el número de deflexiones, sin considerar la optimización del tráfico durante el proceso de deflexión
Motivación de la Investigación:
- Observación de que los paquetes deflectados siempre pasan a través de su conmutador de inyección antes de poder llegar nuevamente al destino
- Propuesta de deflectar solo la cabecera mientras se descarta la carga útil, reinyectando la carga útil en el punto de inyección
- Objetivo de reducir la interferencia de la red, mejorando así la latencia general en el peor caso

Contribuciones Principales

Propuesta de Nuevo Protocolo de Deflexión: Separación innovadora del manejo de cabecera y carga útil de paquetes, deflectando solo la cabecera mientras se descarta la carga útil
Establecimiento de Modelo de Análisis Teórico: Modificación del marco de análisis de latencia en el peor caso existente, cuantificando las mejoras de rendimiento del nuevo protocolo
Provisión de Garantías de Rendimiento: Demostración teórica de que el nuevo protocolo supera a los métodos tradicionales en latencia en el peor caso
Verificación Experimental Extensiva: Validación del protocolo a través de evaluaciones específicas de aplicaciones y sintéticas a gran escala, demostrando su efectividad en diferentes escenarios

Explicación Detallada del Método

Definición de Tareas

Entrada: Red en chip sin enrutador basada en topología de anillo, empleando mecanismo de enrutamiento por deflexión de paquete completo Salida: Protocolo de deflexión mejorado que reduce la latencia de paquetes en el peor caso Restricciones: Mantener la funcionalidad original de la red, sin aumentar gastos generales de búfer adicionales, satisfaciendo requisitos de rendimiento de sistemas en tiempo real

Arquitectura del Protocolo

Mecanismo de Deflexión Tradicional

En el protocolo tradicional, cuando un paquete no puede ser extraído en el conmutador de destino (por ejemplo, el enlace de extracción está ocupado), el paquete completo se deflecta y se transmite a través del anillo hasta que llega nuevamente al destino.

Diseño del Nuevo Protocolo

Deflexión de Cabecera: Cuando ocurre una deflexión, solo la cabecera del paquete continúa transmitiéndose en el anillo
Descarte de Carga Útil: La carga útil del paquete se descarta completamente en el punto de deflexión
Reinyección de Carga Útil: Cuando la cabecera modificada regresa al conmutador de inyección, se activa la reinyección de la carga útil
Modificación de Cabecera: El conmutador de destino modifica los campos de la cabecera durante la deflexión, identificando la necesidad de reinyección

Detalles Técnicos Clave

Gestión de Búfer:

La carga útil del paquete no puede eliminarse inmediatamente del búfer de inyección después de la inyección
Se emplean técnicas de búfer SAFC o SAMQ para gestionar requisitos de reinyección
Bajo restricciones de plazo (Di ≤ Ti), no se requiere memoria de búfer adicional

Mecanismo de Identificación de Cabecera:

El conmutador de inyección debe poder identificar cabeceras deflectadas
La cabecera contiene el conmutador de destino e identificadores únicos del flujo de paquetes
La modificación de campos implementa el mecanismo de activación de reinyección

Optimización de Tráfico:

Método tradicional: Deflexión de paquete completo = Cabecera(H) + Carga útil(L-H)
Nuevo protocolo: Solo deflexión de cabecera = Cabecera(H)
Reducción de tráfico = (L-H) × número de deflexiones × longitud de ruta de retorno

Puntos de Innovación Técnica

Estrategia de Deflexión Separada:
- Ruptura del pensamiento tradicional de deflexión de paquete completo
- Aprovechamiento de características de topología de anillo (los paquetes deflectados deben pasar por el punto de inyección)
- Reutilización in situ de carga útil
Mecanismo de Reducción de Interferencia:
- No reduce directamente el número de deflexiones de paquetes individuales
- Reduce la interferencia en otros paquetes disminuyendo el tráfico de la red
- Enfoque en optimizar la latencia previa a la inyección (Ipre)
Diseño de Compatibilidad Hacia Atrás:
- Puede combinarse con técnicas existentes de reducción de deflexión
- Mantiene consistencia en el comportamiento original de la red
- Soporta extensión de mecanismos de confirmación de extremo a extremo

Configuración Experimental

Conjuntos de Datos

Evaluación Específica de Aplicación:
- Uso de prueba de referencia de vehículos autónomos (AV) con 39 flujos
- Configuración: cámara de resolución VGA, color de 8 bits, 25 fps
- Generación de 100 asignaciones aleatorias para evitar sesgos
Evaluación Sintética a Gran Escala:
- Cada referencia contiene 100 conjuntos de flujos generados aleatoriamente
- Número de flujos que aumenta de 20 a 280
- Rango de parámetros: período de 1-100 microsegundos, jitter de 0-50% del período, tamaño de paquete de 16-48 o 32-96 flits

Configuración de Red

Topología de Red: Redes de núcleo 4×4, 5×5, 6×6, 7×7, 8×8, 9×9
Parámetros Técnicos: Flit de 32 bits, cabecera de 1 flit, frecuencia de reloj de 1 GHz
Configuración de Deflexión: Máximo de 0-3 deflexiones, usando mecanismo de prevención de bloqueo vivo más antiguo primero

Métricas de Evaluación

Porcentaje de Reducción de Latencia en el Peor Caso: Mejora de latencia del nuevo protocolo relativa a la línea base
Relación de Planificabilidad: Porcentaje de casos completamente planificables en el conjunto de pruebas
Mejora Promedio Agrupada: Mejora promedio en todos los flujos y asignaciones

Métodos de Comparación

Método de Línea Base: Protocolo de red sin enrutador tradicional propuesto por Alazemi et al.
Método de Análisis: Uso del modelo de análisis de latencia en el peor caso de Indrusiak y Burns

Resultados Experimentales

Resultados Principales

Resultados de Evaluación Específica de Aplicación

Tamaño de Red	4×4	5×5	6×6	7×7	8×8	9×9
Mejora Máxima(%)	93.07	89.45	89.26	89.33	83.36	80.66
Promedio Agrupado(%)	6.60	3.33	3.20	2.64	2.16	0.92

Hallazgos Clave:

Todas las topologías de red se benefician del nuevo protocolo
La mejora máxima puede alcanzar el 93%, ocurriendo principalmente en flujos con interferencia severa previa a la inyección
La mejora promedio disminuye gradualmente a medida que aumenta el tamaño de la red (distribución de tráfico más uniforme)

Resultados de Evaluación Sintética a Gran Escala

El nuevo protocolo supera significativamente a la línea base en términos de relación de planificabilidad:

Escenario de Deflexión Única: Mejora de planificabilidad superior al 20%
Escenario de Deflexiones Múltiples: Mejor rendimiento bajo carga media
Impacto del Tamaño de Red: Mejoras más evidentes en redes más pequeñas (4×4)
Impacto del Tamaño de Paquete: Paquetes más grandes (32-96 flits) impulsan la red hacia saturación

Experimentos de Ablación

Análisis comparativo a través de diferentes números de deflexiones (0-3):

0 Deflexiones: El nuevo protocolo es idéntico a la línea base (verificación de corrección)
1 Deflexión: La ventaja del nuevo protocolo es más evidente
Deflexiones Múltiples: El grado de mejora disminuye con el aumento del número de deflexiones

Verificación de Análisis Teórico

Fórmula de análisis de tiempo de inactividad previa a la inyección modificada:

La fórmula original involucra la longitud de paquete completo Lj de todos los flujos
La fórmula del nuevo protocolo reemplaza la longitud de carga útil de flujos deflectados con la longitud de cabecera H
Dado que Lj > H, el nuevo protocolo es teóricamente superior al método original

Hallazgos Experimentales

Condiciones de Mejora Óptima: Escenarios con interferencia severa previa a la inyección y red no completamente saturada
Efecto de Escala: El algoritmo RLrec genera más anillos pequeños en redes grandes, limitando el espacio de mejora
Sensibilidad de Carga: El efecto de mejora se correlaciona positivamente con el tamaño de paquete y la frecuencia de deflexión

Trabajo Relacionado

Direcciones de Investigación en Enrutamiento por Deflexión

Deflexión a Nivel de Flit: Cada flit toma decisiones de deflexión independientes, requiere mecanismo de reordenamiento
Deflexión a Nivel de Paquete: El paquete completo se deflecta de manera unificada, preservando el orden de flits
Métodos Híbridos: Estrategias que combinan búfer y deflexión

Posicionamiento de Este Artículo

Línea Técnica: Selección de deflexión a nivel de paquete para obtener ventajas de eficiencia de recursos
Ángulo de Innovación: Primera propuesta de mecanismo de deflexión con separación cabecera-carga útil
Contribución de Análisis: Extensión del marco de análisis de latencia en el peor caso existente

Trabajo de Optimización Relacionado

Optimización de Enrutamiento: Métodos como DARES que cambian rutas de enrutamiento
Optimización de Hardware: Mejoras en diseño de búfer y estrategias de arbitraje
Optimización de Topología: Optimización de configuración de anillo y diseño de conmutador

Conclusiones y Discusión

Conclusiones Principales

Ventaja Teórica: El nuevo protocolo es teóricamente superior a todos los métodos existentes en latencia en el peor caso
Efecto Práctico: Logra reducciones significativas de latencia y mejoras de planificabilidad en múltiples escenarios
Viabilidad de Implementación: No requiere gastos generales de hardware adicionales, puede implementarse usando técnicas de búfer existentes
Valor de Aplicación: Particularmente adecuado para requisitos de garantía de rendimiento en sistemas de tiempo real duro

Limitaciones

Restricción de Topología: Principalmente aplicable a topologías de red de anillo
Atenuación de Mejora: Efecto de mejora limitado en redes grandes o bajo alta carga
Complejidad de Implementación: Requiere modificación de gestión de búfer de inyección y mecanismo de identificación de cabecera
Alcance de Evaluación: No cuantifica mejoras de latencia de caso promedio y consumo de energía

Direcciones Futuras

Extensión de Topología: Exploración de posibilidades de aplicación en otras topologías de red
Cuantificación de Rendimiento: Evaluación de efectos de mejora de latencia de caso promedio y consumo de energía
Implementación de Hardware: Desarrollo de esquemas de implementación de hardware específicos y verificación de prototipos
Optimización de Protocolo: Optimización combinada con otras técnicas de reducción de deflexión

Evaluación Profunda

Fortalezas

Innovación Fuerte: La idea de deflexión con separación cabecera-carga útil posee originalidad e inspiración
Rigor Teórico: Proporciona marco de análisis matemático completo y demostración teórica
Evaluación Experimental Completa: Abarca métodos de evaluación específica de aplicación y sintética a gran escala
Alto Valor Práctico: Resuelve problemas críticos de rendimiento en sistemas en tiempo real
Escritura Clara: Descripción técnica precisa, estructura lógica razonable

Deficiencias

Rango de Aplicación Limitado: Principalmente dirigido a redes de anillo, aplicabilidad a otras topologías poco clara
Detalles de Implementación Insuficientes: Falta de detalles específicos sobre métodos de codificación de modificación de cabecera e implementación de hardware
Comparación de Línea Base Limitada: Principalmente comparación con un método de línea base, falta de comparación con otras técnicas de optimización
Métricas de Evaluación Únicas: Enfoque en latencia en el peor caso, análisis insuficiente de impacto en rendimiento promedio y consumo de energía

Impacto

Contribución Académica: Proporciona nueva dirección de investigación para optimización de redes de enrutamiento por deflexión
Valor Práctico: Puede aplicarse directamente al diseño de NoC en sistemas embebidos en tiempo real
Reproducibilidad: Proporciona modelo de análisis detallado y configuración experimental, facilitando reproducción y extensión
Significado Inspirador: El enfoque de procesamiento separado puede inspirar investigación de optimización de red adicional

Escenarios Aplicables

Sistemas de Tiempo Real Duro: Aplicaciones embebidas que requieren garantías estrictas de latencia
Entornos con Recursos Limitados: Diseño de NoC sensible a área y consumo de energía
Arquitectura de Red de Anillo: Sistemas NoC que adoptan topología de anillo
Redes de Escala Media: Redes de tamaño 4×4 a 6×6 logran el mejor efecto de mejora

Referencias

Este artículo cita 15 trabajos relacionados, incluyendo principalmente:

1 Arquitectura de red sin enrutador de Alazemi et al.
6 Análisis de latencia en el peor caso de Indrusiak y Burns
8 Diseño de red de anillo IMR de Liu et al.
Otros trabajos relacionados con enrutamiento por deflexión, análisis en tiempo real y optimización de NoC

Evaluación General: Este es un artículo de arquitectura de sistemas de alta calidad que propone un protocolo de optimización de enrutamiento por deflexión innovador, con base teórica sólida y verificación experimental completa. Aunque presenta ciertas limitaciones en rango de aplicación y detalles de implementación, su idea central posee importante valor académico y práctico, proporcionando nuevas direcciones para investigación en optimización de redes en chip.