2025-11-22T19:13:16.751799

A protocol to reduce worst-case latency in deflection-based on-chip networks

Indrusiak
We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.
academic

Un protocolo para reducir la latencia en el peor caso en redes en chip basadas en deflexión

Información Básica

  • ID del Artículo: 2510.11361
  • Título: Un protocolo para reducir la latencia en el peor caso en redes en chip basadas en deflexión
  • Autor: Leandro Soares Indrusiak (Universidad de Leeds)
  • Clasificación: cs.NI (Arquitectura de Redes e Internet), cs.PF (Rendimiento)
  • Fecha de Publicación: 13 de octubre de 2025 (preimpresión en arXiv)
  • Enlace del Artículo: https://arxiv.org/abs/2510.11361

Resumen

Este artículo propone un protocolo novedoso para reducir la latencia de paquetes en el peor caso en redes de interconexión en chip basadas en enrutamiento por deflexión. El protocolo obliga a deflectar solo la cabecera de los paquetes en lugar de su carga útil, reduciendo así el tráfico general de la red y, más importante aún, disminuyendo la latencia de paquetes en el peor caso al reducir la latencia previa a la inyección.

Antecedentes de Investigación y Motivación

Definición del Problema

  1. Problema Central: En redes en chip (NoC) basadas en enrutamiento por deflexión, el mecanismo tradicional de deflexión de paquetes completos causa problemas graves de latencia, particularmente en sistemas embebidos en tiempo real donde se requieren garantías de rendimiento.
  2. Importancia del Problema:
    • Las redes de enrutamiento por deflexión, aunque ofrecen ventajas de eficiencia de recursos (reducción del 85% del área del chip, disminución de 10 veces en consumo de energía), producen un impacto grave en la latencia de la red
    • Las plataformas multiprocesador embebidas requieren garantías de rendimiento; el aumento de latencia afecta directamente el rendimiento de extremo a extremo
    • Los modelos de análisis existentes muestran que la deflexión aumenta significativamente la latencia en el peor caso
  3. Limitaciones de Métodos Existentes:
    • El enrutamiento por deflexión tradicional envía el paquete completo (incluyendo cabecera y carga útil) a través de una ruta alternativa cuando hay congestión
    • Este enfoque aumenta el tráfico innecesario de la red, especialmente cuando el paquete necesita regresar al punto de inyección para reintentar
    • Los métodos de optimización existentes se enfocan principalmente en cambiar el enrutamiento o reducir el número de deflexiones, sin considerar la optimización del tráfico durante el proceso de deflexión
  4. Motivación de la Investigación:
    • Observación de que los paquetes deflectados siempre pasan a través de su conmutador de inyección antes de poder llegar nuevamente al destino
    • Propuesta de deflectar solo la cabecera mientras se descarta la carga útil, reinyectando la carga útil en el punto de inyección
    • Objetivo de reducir la interferencia de la red, mejorando así la latencia general en el peor caso

Contribuciones Principales

  1. Propuesta de Nuevo Protocolo de Deflexión: Separación innovadora del manejo de cabecera y carga útil de paquetes, deflectando solo la cabecera mientras se descarta la carga útil
  2. Establecimiento de Modelo de Análisis Teórico: Modificación del marco de análisis de latencia en el peor caso existente, cuantificando las mejoras de rendimiento del nuevo protocolo
  3. Provisión de Garantías de Rendimiento: Demostración teórica de que el nuevo protocolo supera a los métodos tradicionales en latencia en el peor caso
  4. Verificación Experimental Extensiva: Validación del protocolo a través de evaluaciones específicas de aplicaciones y sintéticas a gran escala, demostrando su efectividad en diferentes escenarios

Explicación Detallada del Método

Definición de Tareas

Entrada: Red en chip sin enrutador basada en topología de anillo, empleando mecanismo de enrutamiento por deflexión de paquete completo Salida: Protocolo de deflexión mejorado que reduce la latencia de paquetes en el peor caso Restricciones: Mantener la funcionalidad original de la red, sin aumentar gastos generales de búfer adicionales, satisfaciendo requisitos de rendimiento de sistemas en tiempo real

Arquitectura del Protocolo

Mecanismo de Deflexión Tradicional

En el protocolo tradicional, cuando un paquete no puede ser extraído en el conmutador de destino (por ejemplo, el enlace de extracción está ocupado), el paquete completo se deflecta y se transmite a través del anillo hasta que llega nuevamente al destino.

Diseño del Nuevo Protocolo

  1. Deflexión de Cabecera: Cuando ocurre una deflexión, solo la cabecera del paquete continúa transmitiéndose en el anillo
  2. Descarte de Carga Útil: La carga útil del paquete se descarta completamente en el punto de deflexión
  3. Reinyección de Carga Útil: Cuando la cabecera modificada regresa al conmutador de inyección, se activa la reinyección de la carga útil
  4. Modificación de Cabecera: El conmutador de destino modifica los campos de la cabecera durante la deflexión, identificando la necesidad de reinyección

Detalles Técnicos Clave

Gestión de Búfer:

  • La carga útil del paquete no puede eliminarse inmediatamente del búfer de inyección después de la inyección
  • Se emplean técnicas de búfer SAFC o SAMQ para gestionar requisitos de reinyección
  • Bajo restricciones de plazo (Di ≤ Ti), no se requiere memoria de búfer adicional

Mecanismo de Identificación de Cabecera:

  • El conmutador de inyección debe poder identificar cabeceras deflectadas
  • La cabecera contiene el conmutador de destino e identificadores únicos del flujo de paquetes
  • La modificación de campos implementa el mecanismo de activación de reinyección

Optimización de Tráfico:

Método tradicional: Deflexión de paquete completo = Cabecera(H) + Carga útil(L-H)
Nuevo protocolo: Solo deflexión de cabecera = Cabecera(H)
Reducción de tráfico = (L-H) × número de deflexiones × longitud de ruta de retorno

Puntos de Innovación Técnica

  1. Estrategia de Deflexión Separada:
    • Ruptura del pensamiento tradicional de deflexión de paquete completo
    • Aprovechamiento de características de topología de anillo (los paquetes deflectados deben pasar por el punto de inyección)
    • Reutilización in situ de carga útil
  2. Mecanismo de Reducción de Interferencia:
    • No reduce directamente el número de deflexiones de paquetes individuales
    • Reduce la interferencia en otros paquetes disminuyendo el tráfico de la red
    • Enfoque en optimizar la latencia previa a la inyección (Ipre)
  3. Diseño de Compatibilidad Hacia Atrás:
    • Puede combinarse con técnicas existentes de reducción de deflexión
    • Mantiene consistencia en el comportamiento original de la red
    • Soporta extensión de mecanismos de confirmación de extremo a extremo

Configuración Experimental

Conjuntos de Datos

  1. Evaluación Específica de Aplicación:
    • Uso de prueba de referencia de vehículos autónomos (AV) con 39 flujos
    • Configuración: cámara de resolución VGA, color de 8 bits, 25 fps
    • Generación de 100 asignaciones aleatorias para evitar sesgos
  2. Evaluación Sintética a Gran Escala:
    • Cada referencia contiene 100 conjuntos de flujos generados aleatoriamente
    • Número de flujos que aumenta de 20 a 280
    • Rango de parámetros: período de 1-100 microsegundos, jitter de 0-50% del período, tamaño de paquete de 16-48 o 32-96 flits

Configuración de Red

  • Topología de Red: Redes de núcleo 4×4, 5×5, 6×6, 7×7, 8×8, 9×9
  • Parámetros Técnicos: Flit de 32 bits, cabecera de 1 flit, frecuencia de reloj de 1 GHz
  • Configuración de Deflexión: Máximo de 0-3 deflexiones, usando mecanismo de prevención de bloqueo vivo más antiguo primero

Métricas de Evaluación

  1. Porcentaje de Reducción de Latencia en el Peor Caso: Mejora de latencia del nuevo protocolo relativa a la línea base
  2. Relación de Planificabilidad: Porcentaje de casos completamente planificables en el conjunto de pruebas
  3. Mejora Promedio Agrupada: Mejora promedio en todos los flujos y asignaciones

Métodos de Comparación

  • Método de Línea Base: Protocolo de red sin enrutador tradicional propuesto por Alazemi et al.
  • Método de Análisis: Uso del modelo de análisis de latencia en el peor caso de Indrusiak y Burns

Resultados Experimentales

Resultados Principales

Resultados de Evaluación Específica de Aplicación

Tamaño de Red4×45×56×67×78×89×9
Mejora Máxima(%)93.0789.4589.2689.3383.3680.66
Promedio Agrupado(%)6.603.333.202.642.160.92

Hallazgos Clave:

  • Todas las topologías de red se benefician del nuevo protocolo
  • La mejora máxima puede alcanzar el 93%, ocurriendo principalmente en flujos con interferencia severa previa a la inyección
  • La mejora promedio disminuye gradualmente a medida que aumenta el tamaño de la red (distribución de tráfico más uniforme)

Resultados de Evaluación Sintética a Gran Escala

El nuevo protocolo supera significativamente a la línea base en términos de relación de planificabilidad:

  • Escenario de Deflexión Única: Mejora de planificabilidad superior al 20%
  • Escenario de Deflexiones Múltiples: Mejor rendimiento bajo carga media
  • Impacto del Tamaño de Red: Mejoras más evidentes en redes más pequeñas (4×4)
  • Impacto del Tamaño de Paquete: Paquetes más grandes (32-96 flits) impulsan la red hacia saturación

Experimentos de Ablación

Análisis comparativo a través de diferentes números de deflexiones (0-3):

  • 0 Deflexiones: El nuevo protocolo es idéntico a la línea base (verificación de corrección)
  • 1 Deflexión: La ventaja del nuevo protocolo es más evidente
  • Deflexiones Múltiples: El grado de mejora disminuye con el aumento del número de deflexiones

Verificación de Análisis Teórico

Fórmula de análisis de tiempo de inactividad previa a la inyección modificada:

La fórmula original involucra la longitud de paquete completo Lj de todos los flujos
La fórmula del nuevo protocolo reemplaza la longitud de carga útil de flujos deflectados con la longitud de cabecera H
Dado que Lj > H, el nuevo protocolo es teóricamente superior al método original

Hallazgos Experimentales

  1. Condiciones de Mejora Óptima: Escenarios con interferencia severa previa a la inyección y red no completamente saturada
  2. Efecto de Escala: El algoritmo RLrec genera más anillos pequeños en redes grandes, limitando el espacio de mejora
  3. Sensibilidad de Carga: El efecto de mejora se correlaciona positivamente con el tamaño de paquete y la frecuencia de deflexión

Trabajo Relacionado

Direcciones de Investigación en Enrutamiento por Deflexión

  1. Deflexión a Nivel de Flit: Cada flit toma decisiones de deflexión independientes, requiere mecanismo de reordenamiento
  2. Deflexión a Nivel de Paquete: El paquete completo se deflecta de manera unificada, preservando el orden de flits
  3. Métodos Híbridos: Estrategias que combinan búfer y deflexión

Posicionamiento de Este Artículo

  • Línea Técnica: Selección de deflexión a nivel de paquete para obtener ventajas de eficiencia de recursos
  • Ángulo de Innovación: Primera propuesta de mecanismo de deflexión con separación cabecera-carga útil
  • Contribución de Análisis: Extensión del marco de análisis de latencia en el peor caso existente

Trabajo de Optimización Relacionado

  • Optimización de Enrutamiento: Métodos como DARES que cambian rutas de enrutamiento
  • Optimización de Hardware: Mejoras en diseño de búfer y estrategias de arbitraje
  • Optimización de Topología: Optimización de configuración de anillo y diseño de conmutador

Conclusiones y Discusión

Conclusiones Principales

  1. Ventaja Teórica: El nuevo protocolo es teóricamente superior a todos los métodos existentes en latencia en el peor caso
  2. Efecto Práctico: Logra reducciones significativas de latencia y mejoras de planificabilidad en múltiples escenarios
  3. Viabilidad de Implementación: No requiere gastos generales de hardware adicionales, puede implementarse usando técnicas de búfer existentes
  4. Valor de Aplicación: Particularmente adecuado para requisitos de garantía de rendimiento en sistemas de tiempo real duro

Limitaciones

  1. Restricción de Topología: Principalmente aplicable a topologías de red de anillo
  2. Atenuación de Mejora: Efecto de mejora limitado en redes grandes o bajo alta carga
  3. Complejidad de Implementación: Requiere modificación de gestión de búfer de inyección y mecanismo de identificación de cabecera
  4. Alcance de Evaluación: No cuantifica mejoras de latencia de caso promedio y consumo de energía

Direcciones Futuras

  1. Extensión de Topología: Exploración de posibilidades de aplicación en otras topologías de red
  2. Cuantificación de Rendimiento: Evaluación de efectos de mejora de latencia de caso promedio y consumo de energía
  3. Implementación de Hardware: Desarrollo de esquemas de implementación de hardware específicos y verificación de prototipos
  4. Optimización de Protocolo: Optimización combinada con otras técnicas de reducción de deflexión

Evaluación Profunda

Fortalezas

  1. Innovación Fuerte: La idea de deflexión con separación cabecera-carga útil posee originalidad e inspiración
  2. Rigor Teórico: Proporciona marco de análisis matemático completo y demostración teórica
  3. Evaluación Experimental Completa: Abarca métodos de evaluación específica de aplicación y sintética a gran escala
  4. Alto Valor Práctico: Resuelve problemas críticos de rendimiento en sistemas en tiempo real
  5. Escritura Clara: Descripción técnica precisa, estructura lógica razonable

Deficiencias

  1. Rango de Aplicación Limitado: Principalmente dirigido a redes de anillo, aplicabilidad a otras topologías poco clara
  2. Detalles de Implementación Insuficientes: Falta de detalles específicos sobre métodos de codificación de modificación de cabecera e implementación de hardware
  3. Comparación de Línea Base Limitada: Principalmente comparación con un método de línea base, falta de comparación con otras técnicas de optimización
  4. Métricas de Evaluación Únicas: Enfoque en latencia en el peor caso, análisis insuficiente de impacto en rendimiento promedio y consumo de energía

Impacto

  1. Contribución Académica: Proporciona nueva dirección de investigación para optimización de redes de enrutamiento por deflexión
  2. Valor Práctico: Puede aplicarse directamente al diseño de NoC en sistemas embebidos en tiempo real
  3. Reproducibilidad: Proporciona modelo de análisis detallado y configuración experimental, facilitando reproducción y extensión
  4. Significado Inspirador: El enfoque de procesamiento separado puede inspirar investigación de optimización de red adicional

Escenarios Aplicables

  1. Sistemas de Tiempo Real Duro: Aplicaciones embebidas que requieren garantías estrictas de latencia
  2. Entornos con Recursos Limitados: Diseño de NoC sensible a área y consumo de energía
  3. Arquitectura de Red de Anillo: Sistemas NoC que adoptan topología de anillo
  4. Redes de Escala Media: Redes de tamaño 4×4 a 6×6 logran el mejor efecto de mejora

Referencias

Este artículo cita 15 trabajos relacionados, incluyendo principalmente:

  • 1 Arquitectura de red sin enrutador de Alazemi et al.
  • 6 Análisis de latencia en el peor caso de Indrusiak y Burns
  • 8 Diseño de red de anillo IMR de Liu et al.
  • Otros trabajos relacionados con enrutamiento por deflexión, análisis en tiempo real y optimización de NoC

Evaluación General: Este es un artículo de arquitectura de sistemas de alta calidad que propone un protocolo de optimización de enrutamiento por deflexión innovador, con base teórica sólida y verificación experimental completa. Aunque presenta ciertas limitaciones en rango de aplicación y detalles de implementación, su idea central posee importante valor académico y práctico, proporcionando nuevas direcciones para investigación en optimización de redes en chip.