2025-11-22T19:13:16.751799

A protocol to reduce worst-case latency in deflection-based on-chip networks

Indrusiak
We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.
academic

Протокол снижения наихудшей задержки в сетях на кристалле на основе отклонения

Основная информация

  • ID статьи: 2510.11361
  • Название: A protocol to reduce worst-case latency in deflection-based on-chip networks
  • Автор: Leandro Soares Indrusiak (University of Leeds)
  • Классификация: cs.NI (Сетевая архитектура и интернет), cs.PF (Производительность)
  • Дата публикации: 13 октября 2025 г. (препринт arXiv)
  • Ссылка на статью: https://arxiv.org/abs/2510.11361

Аннотация

В данной работе предложен новый протокол для снижения наихудшей задержки пакетов в сетях на кристалле (NoC) на основе маршрутизации с отклонением. Протокол предусматривает отклонение только заголовков пакетов, а не их полезной нагрузки, что снижает общий сетевой трафик и, что более важно, уменьшает наихудшую задержку пакетов путём снижения задержки перед инъекцией.

Исследовательский контекст и мотивация

Определение проблемы

  1. Основная проблема: В сетях на кристалле на основе маршрутизации с отклонением традиционный механизм отклонения полных пакетов приводит к серьёзным проблемам с задержкой, особенно в встроенных системах реального времени, где требуется гарантия производительности.
  2. Значимость проблемы:
    • Сети маршрутизации с отклонением, хотя и обладают преимуществами в эффективности ресурсов (снижение площади кристалла на 85%, снижение энергопотребления в 10 раз), оказывают серьёзное влияние на задержку в сети
    • Встроенные многопроцессорные платформы требуют гарантий производительности; увеличение задержки напрямую влияет на сквозную производительность
    • Существующие модели анализа показывают, что отклонение значительно увеличивает наихудшую задержку
  3. Ограничения существующих методов:
    • Традиционная маршрутизация с отклонением отправляет весь пакет (включая заголовок и полезную нагрузку) по альтернативному пути при перегрузке
    • Такой подход увеличивает ненужный сетевой трафик, особенно когда пакет должен вернуться в точку инъекции для повторной попытки
    • Существующие методы оптимизации в основном сосредоточены на изменении маршрутизации или снижении количества отклонений, не учитывая оптимизацию трафика во время отклонения
  4. Исследовательская мотивация:
    • Наблюдение того, что отклоняемые пакеты всегда проходят через коммутатор инъекции, чтобы снова достичь пункта назначения
    • Предложение идеи отклонения только заголовка с отбросом полезной нагрузки и повторной инъекцией полезной нагрузки в точке инъекции
    • Цель — снизить сетевые помехи и тем самым улучшить общую наихудшую задержку

Основные вклады

  1. Предложение нового протокола отклонения: Инновационное разделение обработки заголовков и полезной нагрузки пакетов с отклонением только заголовков
  2. Установление модели теоретического анализа: Модификация существующей структуры анализа наихудшей задержки для количественной оценки улучшений производительности нового протокола
  3. Обеспечение гарантий производительности: Теоретическое доказательство того, что новый протокол превосходит традиционные методы по наихудшей задержке
  4. Широкая экспериментальная проверка: Доказательство эффективности протокола в различных сценариях посредством оценки, специфичной для приложений, и крупномасштабной синтетической оценки

Подробное описание методов

Определение задачи

Входные данные: Сеть на кристалле без маршрутизатора на основе кольцевой топологии с механизмом маршрутизации с полным отклонением пакетов Выходные данные: Улучшенный протокол отклонения, снижающий наихудшую задержку пакетов Ограничения: Сохранение исходной функциональности сети, отсутствие дополнительных затрат на буферизацию, соответствие требованиям производительности систем реального времени

Архитектура протокола

Традиционный механизм отклонения

В традиционном протоколе, когда пакет не может быть извлечен на коммутаторе назначения (например, канал извлечения занят), весь пакет отклоняется и передаётся по кольцу до повторного достижения пункта назначения.

Проектирование нового протокола

  1. Отклонение заголовка: При возникновении отклонения только заголовок пакета продолжает передаваться по кольцу
  2. Отброс полезной нагрузки: Полезная нагрузка пакета полностью отбрасывается в точке отклонения
  3. Повторная инъекция полезной нагрузки: При возврате изменённого заголовка на коммутатор инъекции запускается повторная инъекция полезной нагрузки
  4. Модификация заголовка: Коммутатор назначения изменяет поля заголовка при отклонении, идентифицируя необходимость повторной инъекции

Ключевые технические детали

Управление буферизацией:

  • Полезная нагрузка пакета не может быть немедленно удалена из буфера инъекции после инъекции
  • Использование технологий буферизации SAFC или SAMQ для управления требованиями повторной инъекции
  • При ограничениях по крайним срокам (Di ≤ Ti) дополнительная память буфера не требуется

Механизм идентификации заголовка:

  • Коммутатор инъекции должен иметь возможность идентифицировать отклоняемый заголовок
  • Заголовок содержит коммутатор назначения и уникальный идентификатор потока пакетов
  • Модификация полей реализует механизм запуска повторной инъекции

Оптимизация трафика:

Традиционный способ: отклонение полного пакета = заголовок(H) + полезная нагрузка(L-H)
Новый протокол: отклонение только заголовка = заголовок(H)
Снижение трафика = (L-H) × количество отклонений × длина пути возврата

Технические инновации

  1. Стратегия разделённого отклонения:
    • Преодоление традиционного мышления полного отклонения пакетов
    • Использование характеристик кольцевой топологии сети (отклоняемые пакеты обязательно проходят через точку инъекции)
    • Реализация локального переиспользования полезной нагрузки
  2. Механизм снижения помех:
    • Не прямое снижение количества отклонений отдельного пакета
    • Снижение помех для других пакетов путём уменьшения сетевого трафика
    • Основной акцент на оптимизацию задержки перед инъекцией (Ipre)
  3. Обратно совместимое проектирование:
    • Возможность комбинирования с существующими технологиями снижения отклонений
    • Сохранение согласованности исходного сетевого поведения
    • Поддержка расширения механизмов сквозного подтверждения

Экспериментальная установка

Наборы данных

  1. Оценка, специфичная для приложений:
    • Использование эталонного теста автономного транспортного средства (AV) с 39 потоками
    • Конфигурация: камера разрешением VGA, 8-битный цвет, 25 кадров/сек
    • Генерация 100 случайных отображений для избежания смещения
  2. Крупномасштабная синтетическая оценка:
    • Каждый эталон содержит 100 случайно сгенерированных наборов потоков
    • Количество потоков увеличивается от 20 до 280
    • Диапазон параметров: период 1-100 микросекунд, дрожание 0-50% периода, размер пакета 16-48 или 32-96 flit

Конфигурация сети

  • Топология сети: сети ядер 4×4, 5×5, 6×6, 7×7, 8×8, 9×9
  • Технические параметры: 32-битный flit, 1-flit заголовок, тактовая частота 1 ГГц
  • Параметры отклонения: максимум 0-3 отклонения, использование механизма предотвращения живой блокировки по принципу "самый старый первым"

Метрики оценки

  1. Процент снижения наихудшей задержки: улучшение задержки нового протокола относительно базовой линии
  2. Коэффициент планируемости: процент полностью планируемых случаев в наборе эталонов
  3. Объединённое среднее улучшение: среднее улучшение по всем потокам и отображениям

Методы сравнения

  • Базовый метод: традиционный протокол сети без маршрутизатора, предложенный Alazemi и др.
  • Метод анализа: модель анализа наихудшей задержки Indrusiak и Burns

Результаты экспериментов

Основные результаты

Результаты оценки, специфичной для приложений

Размер сети4×45×56×67×78×89×9
Максимальное улучшение (%)93,0789,4589,2689,3383,3680,66
Объединённое среднее (%)6,603,333,202,642,160,92

Ключевые выводы:

  • Все топологии сети получают выгоду от нового протокола
  • Максимальное улучшение может достигать 93%, в основном проявляясь в потоках с серьёзными помехами перед инъекцией
  • По мере увеличения размера сети среднее улучшение постепенно снижается (более равномерное распределение трафика)

Результаты крупномасштабной синтетической оценки

Новый протокол значительно превосходит базовую линию по коэффициенту планируемости:

  • Сценарий одного отклонения: улучшение планируемости более 20%
  • Сценарий множественных отклонений: лучшая производительность при средней нагрузке
  • Влияние размера сети: более значительное улучшение в меньших сетях (4×4)
  • Влияние размера пакета: пакеты большего размера (32-96 flit) приводят сеть к насыщению

Абляционные исследования

Сравнительный анализ при различном количестве отклонений (0-3):

  • 0 отклонений: новый протокол полностью идентичен базовой линии (проверка корректности)
  • 1 отклонение: преимущество нового протокола наиболее очевидно
  • Множественные отклонения: степень улучшения снижается с увеличением количества отклонений

Проверка теоретического анализа

Модифицированная формула анализа времени простоя перед инъекцией:

Исходная формула включает полную длину пакета Lj всех потоков
Формула нового протокола заменяет длину полезной нагрузки отклоняемых потоков на длину заголовка H
Поскольку Lj > H, новый протокол теоретически обязательно превосходит исходный метод

Экспериментальные выводы

  1. Условия оптимального улучшения: сценарии с серьёзными помехами перед инъекцией и неполной насыщением сети
  2. Эффект масштаба: алгоритм RLrec генерирует больше малых циклов в больших сетях, ограничивая пространство для улучшения
  3. Чувствительность к нагрузке: эффект улучшения положительно коррелирует с размером пакета и частотой отклонений

Связанные работы

Направления исследований маршрутизации с отклонением

  1. Отклонение на уровне flit: каждый flit принимает независимое решение об отклонении, требует механизма переупорядочения
  2. Отклонение на уровне пакета: весь пакет отклоняется единообразно, сохраняя порядок flit
  3. Гибридные методы: стратегии, сочетающие буферизацию и отклонение

Позиционирование данной работы

  • Технологический маршрут: выбор отклонения на уровне пакета для получения преимуществ эффективности ресурсов
  • Угол инновации: первое предложение механизма отклонения с разделением заголовка и полезной нагрузки
  • Вклад анализа: расширение существующей структуры анализа наихудшей задержки

Связанные работы по оптимизации

  • Оптимизация маршрутизации: методы, такие как DARES, изменяющие пути маршрутизации
  • Оптимизация оборудования: улучшения конструкции буферов и стратегий арбитража
  • Оптимизация топологии: оптимизация конфигурации колец и проектирования коммутаторов

Выводы и обсуждение

Основные выводы

  1. Теоретическое преимущество: новый протокол теоретически превосходит все существующие методы по наихудшей задержке
  2. Практический эффект: реализация значительного снижения задержки и улучшения планируемости в различных сценариях
  3. Осуществимость реализации: отсутствие необходимости в дополнительных аппаратных затратах, возможность реализации с использованием существующих технологий буферизации
  4. Практическая ценность: особенно подходит для требований гарантии производительности в системах жёсткого реального времени

Ограничения

  1. Ограничения топологии: в основном применимо к кольцевым топологиям сети
  2. Затухание улучшения: эффект улучшения ограничен в больших сетях или при высокой нагрузке
  3. Сложность реализации: требует модификации управления буферизацией инъекции и механизма идентификации заголовка
  4. Диапазон оценки: отсутствие количественной оценки улучшений средней задержки и энергопотребления

Направления будущих исследований

  1. Расширение топологии: исследование возможности применения в других топологиях сети
  2. Количественная оценка производительности: оценка эффектов улучшения средней задержки и энергопотребления
  3. Аппаратная реализация: разработка конкретных схем аппаратной реализации и проверка прототипов
  4. Оптимизация протокола: комбинированная оптимизация с другими технологиями снижения отклонений

Глубокая оценка

Преимущества

  1. Высокая инновационность: идея отклонения с разделением заголовка и полезной нагрузки обладает оригинальностью и вдохновляющей ценностью
  2. Теоретическая строгость: предоставление полной математической структуры анализа и теоретических доказательств
  3. Полнота экспериментов: охват оценки, специфичной для приложений, и крупномасштабной синтетической оценки
  4. Высокая практическая ценность: решение критических проблем производительности в системах реального времени
  5. Ясность изложения: точное техническое описание, логичная структура

Недостатки

  1. Ограниченный диапазон применения: в основном ориентировано на кольцевые сети; применимость к другим топологиям неясна
  2. Недостаточность деталей реализации: отсутствие конкретных методов кодирования модификации заголовка и деталей аппаратной реализации
  3. Ограниченность базовых методов сравнения: в основном сравнение с одним базовым методом; отсутствие сравнения с другими методами оптимизации
  4. Единственность метрик оценки: основной акцент на наихудшую задержку; недостаточный анализ влияния на среднюю производительность и энергопотребление

Влияние

  1. Академический вклад: предоставление нового направления исследований для оптимизации сетей маршрутизации с отклонением
  2. Практическая ценность: прямое применение в проектировании NoC встроенных систем реального времени
  3. Воспроизводимость: предоставление подробной модели анализа и параметров экспериментов, облегчающих воспроизведение и расширение
  4. Вдохновляющее значение: идея разделённой обработки может вдохновить другие исследования оптимизации сетей

Применимые сценарии

  1. Системы жёсткого реального времени: встроенные приложения, требующие строгих гарантий задержки
  2. Среды с ограниченными ресурсами: проектирование сетей на кристалле, чувствительное к площади и энергопотреблению
  3. Архитектуры кольцевых сетей: системы NoC, использующие кольцевую топологию
  4. Сети среднего масштаба: сети размером 4×4 до 6×6 получают наилучший эффект улучшения

Библиография

В статье цитируется 15 связанных исследований, в основном включая:

  • 1 Архитектура сети без маршрутизатора Alazemi и др.
  • 6 Анализ наихудшей задержки Indrusiak и Burns
  • 8 Проектирование кольцевой сети IMR Liu и др.
  • Другие работы, связанные с маршрутизацией с отклонением, анализом реального времени и оптимизацией NoC

Общая оценка: Это высококачественная статья по архитектуре систем, предлагающая инновационный протокол оптимизации маршрутизации с отклонением с прочной теоретической базой и полной экспериментальной проверкой. Хотя существуют определённые ограничения в диапазоне применения и деталях реализации, основная идея обладает важной академической ценностью и практическим значением, предоставляя новое направление для исследований оптимизации сетей на кристалле.