We present a novel protocol that reduces worst-case packet latency in deflection-based on-chip interconnect networks. It enforces the deflection of the header of a packet but not its payload, resulting in a reduction in overall network traffic and, more importantly, worst-case packet latency due to decreased pre-injection latency.
논문 ID : 2510.11361제목 : A protocol to reduce worst-case latency in deflection-based on-chip networks저자 : Leandro Soares Indrusiak (University of Leeds)분류 : cs.NI (네트워킹 및 인터넷 아키텍처), cs.PF (성능)발표 시간 : 2025년 10월 13일 (arXiv 사전인쇄본)논문 링크 : https://arxiv.org/abs/2510.11361 본 논문은 편향 라우팅 기반 온칩 상호연결 네트워크에서 최악의 경우 패킷 지연을 줄이기 위한 새로운 프로토콜을 제안한다. 이 프로토콜은 편향된 패킷의 헤더만 편향시키고 페이로드는 편향시키지 않음으로써 전체 네트워크 트래픽을 감소시키고, 더욱 중요하게는 주입 전 지연을 줄여 최악의 경우 패킷 지연을 감소시킨다.
핵심 문제 : 편향 라우팅 기반 온칩 네트워크(NoC)에서 전통적인 전체 패킷 편향 메커니즘은 심각한 지연 문제를 야기하며, 특히 임베디드 실시간 시스템에서 성능 보장 요구사항을 충족하기 어렵다.문제의 중요성 :편향 라우팅 네트워크는 자원 효율성 장점(칩 면적 85% 감소, 에너지 소비 10배 감소)을 가지지만 네트워크 지연에 심각한 영향을 미친다 임베디드 멀티프로세서 플랫폼은 성능 보장이 필요하며, 지연 증가는 종단 간 성능에 직접적인 영향을 미친다 기존 분석 모델은 편향이 최악의 경우 지연을 크게 증가시킴을 보여준다 기존 방법의 한계 :전통적인 편향 라우팅은 혼잡 시 전체 패킷(헤더 및 페이로드 포함)을 대체 경로로 전송한다 이러한 방식은 불필요한 네트워크 트래픽을 증가시키며, 특히 패킷이 주입점으로 돌아와 재시도해야 할 때 그렇다 기존 최적화 방법은 주로 라우팅 변경 또는 편향 횟수 감소에 초점을 맞추며, 편향 과정 중 트래픽 최적화를 고려하지 않는다 연구 동기 :편향된 패킷은 항상 주입 스위치를 거쳐 목적지에 도달한다는 관찰 헤더만 편향시키고 페이로드는 버린 후 주입점에서 재주입하는 아이디어 제시 목표는 네트워크 간섭을 줄여 전체 최악의 경우 지연을 개선하는 것 새로운 편향 프로토콜 제안 : 패킷 헤더와 페이로드를 분리하여 처리하고 헤더만 편향시키는 혁신적 방법이론적 분석 모델 수립 : 기존 최악의 경우 지연 분석 프레임워크를 수정하여 새 프로토콜의 성능 개선을 정량화성능 보장 제공 : 새 프로토콜이 최악의 경우 지연 측면에서 기존 방법보다 우수함을 이론적으로 증명광범위한 실험 검증 : 애플리케이션 특정 및 대규모 합성 평가를 통해 다양한 시나리오에서 프로토콜의 효과성 증명입력 : 환형 토폴로지 기반 라우터 없는 온칩 네트워크, 전체 패킷 편향 라우팅 메커니즘 적용
출력 : 최악의 경우 패킷 지연을 줄이는 개선된 편향 프로토콜
제약 조건 : 기존 네트워크 기능 유지, 추가 버퍼 오버헤드 없음, 실시간 시스템 성능 요구사항 충족
전통 프로토콜에서 패킷이 목적 스위치에서 팝할 수 없을 때(예: 팝 링크가 점유됨), 전체 패킷이 편향되어 환형 경로를 따라 전송되며 다시 목적지에 도달할 때까지 전송된다.
헤더 편향 : 편향 발생 시 패킷 헤더만 환형 경로에서 계속 전송페이로드 폐기 : 패킷 페이로드는 편향 지점에서 완전히 폐기페이로드 재주입 : 수정된 헤더가 주입 스위치로 돌아올 때 페이로드의 재주입 트리거헤더 수정 : 목적 스위치는 편향 시 헤더 필드를 수정하여 재주입 필요 표시버퍼 관리 :
패킷 페이로드는 주입 후 주입 버퍼에서 즉시 삭제될 수 없음 SAFC 또는 SAMQ 버퍼 기술을 사용하여 재주입 요구사항 관리 마감시간 제약(Di ≤ Ti) 하에서 추가 버퍼 메모리 불필요 헤더 식별 메커니즘 :
주입 스위치는 편향된 헤더를 식별할 수 있어야 함 헤더는 목적 스위치 및 패킷 흐름의 고유 식별자 포함 필드 수정을 통해 재주입 트리거 메커니즘 구현 트래픽 최적화 :
전통 방식: 완전한 패킷 편향 = 헤더(H) + 페이로드(L-H)
새 프로토콜: 헤더만 편향 = 헤더(H)
트래픽 감소 = (L-H) × 편향 횟수 × 반환 경로 길이
분리식 편향 전략 :전통적인 전체 패킷 편향 사고방식 탈피 환형 네트워크 토폴로지 특성 활용(편향 패킷은 반드시 주입점을 거침) 페이로드의 제자리 재사용 구현 간섭 감소 메커니즘 :개별 패킷의 편향 횟수를 직접 줄이지 않음 네트워크 트래픽 감소를 통해 다른 패킷에 대한 간섭 감소 주입 전 지연(Ipre) 최적화에 중점 하위 호환성 설계 :기존 편향 감소 기술과 결합 가능 원래 네트워크 동작의 일관성 유지 종단 간 확인 메커니즘 확장 지원 애플리케이션 특정 평가 :39개 흐름 자율주행차량(AV) 벤치마크 사용 구성: VGA 해상도 카메라, 8비트 색상, 25fps 편향을 피하기 위해 100개의 무작위 매핑 생성 대규모 합성 평가 :각 벤치마크는 100개의 무작위 생성 흐름 집합 포함 흐름 수 20에서 280으로 증가 매개변수 범위: 주기 1-100마이크로초, 지터 0-50% 주기, 패킷 크기 16-48 또는 32-96 flit 네트워크 토폴로지 : 4×4, 5×5, 6×6, 7×7, 8×8, 9×9 코어 네트워크기술 매개변수 : 32비트 flit, 1-flit 헤더, 1GHz 클록 주파수편향 설정 : 최대 0-3회 편향, 최오래된 우선 활록 방지 메커니즘 사용최악의 경우 지연 감소 백분율 : 기준선 대비 새 프로토콜의 지연 개선스케줄 가능성 비율 : 벤치마크 세트에서 완전히 스케줄 가능한 경우의 백분율풀링된 평균 개선 : 모든 흐름 및 매핑의 평균 개선기준선 방법 : Alazemi 등이 제안한 전통적인 라우터 없는 네트워크 프로토콜분석 방법 : Indrusiak과 Burns의 최악의 경우 지연 분석 모델 사용네트워크 규모 4×4 5×5 6×6 7×7 8×8 9×9 최대 개선(%) 93.07 89.45 89.26 89.33 83.36 80.66 풀링된 평균(%) 6.60 3.33 3.20 2.64 2.16 0.92
주요 발견 :
모든 네트워크 토폴로지가 새 프로토콜로부터 이점을 얻음 최대 개선은 93%에 달하며, 주로 주입 전 간섭이 심한 흐름에서 나타남 네트워크 규모가 증가함에 따라 평균 개선이 점진적으로 감소(트래픽 분포가 더 균등함) 새 프로토콜은 스케줄 가능성 비율 측면에서 기준선을 크게 능가함:
단일 편향 시나리오 : 스케줄 가능성 개선 20% 초과다중 편향 시나리오 : 중간 부하에서 최고 성능네트워크 규모 영향 : 더 작은 네트워크(4×4)에서 더 명확한 개선패킷 크기 영향 : 더 큰 패킷(32-96 flit)이 네트워크를 포화 상태로 유도다양한 편향 횟수(0-3회)의 비교 분석:
0회 편향 : 새 프로토콜과 기준선이 완전히 동일(정확성 검증)1회 편향 : 새 프로토콜의 장점이 가장 명확함다중 편향 : 편향 횟수 증가에 따라 개선 정도 감소수정된 주입 전 유휴 시간 분석 공식:
원래 공식은 모든 흐름의 완전한 패킷 길이 Lj 포함
새 프로토콜 공식은 편향 흐름의 페이로드 길이를 헤더 길이 H로 대체
Lj > H이므로 새 프로토콜은 이론적으로 반드시 원래 방법보다 우수함
최적 개선 조건 : 주입 전 간섭이 심하고 네트워크가 완전히 포화되지 않은 시나리오규모 효과 : RLrec 알고리즘이 대형 네트워크에서 더 많은 작은 환을 생성하여 개선 공간 제한부하 민감성 : 개선 효과는 패킷 크기 및 편향 빈도와 정상 관계Flit 수준 편향 : 각 flit이 독립적으로 편향 결정, 재정렬 메커니즘 필요패킷 수준 편향 : 전체 패킷이 통일되게 편향, flit 순서 유지혼합 방법 : 버퍼링과 편향을 결합한 전략기술 경로 : 자원 효율성 장점을 얻기 위해 패킷 수준 편향 선택혁신 각도 : 헤더-페이로드 분리 편향 메커니즘을 처음 제안분석 기여 : 기존 최악의 경우 지연 분석 프레임워크 확장라우팅 최적화 : DARES 등 라우팅 경로 변경 방법하드웨어 최적화 : 버퍼 설계 및 중재 전략 개선토폴로지 최적화 : 환 구성 및 스위치 설계 최적화이론적 장점 : 새 프로토콜은 최악의 경우 지연 측면에서 이론적으로 모든 기존 방법보다 우수실제 효과 : 다양한 시나리오에서 상당한 지연 감소 및 스케줄 가능성 개선 달성구현 가능성 : 추가 하드웨어 오버헤드 없이 기존 버퍼 기술로 구현 가능응용 가치 : 특히 하드 실시간 시스템의 성능 보장 요구사항에 적합토폴로지 제한 : 주로 환형 네트워크 토폴로지에 적용개선 감소 : 대형 네트워크 또는 고부하에서 개선 효과 제한구현 복잡성 : 주입 버퍼 관리 및 헤더 식별 메커니즘 수정 필요평가 범위 : 평균 경우 지연 및 에너지 소비 개선 미정량화토폴로지 확장 : 다른 네트워크 토폴로지에서의 응용 가능성 탐색성능 정량화 : 평균 지연 및 에너지 소비 개선 효과 평가하드웨어 구현 : 구체적인 하드웨어 구현 방안 및 프로토타입 검증 개발프로토콜 최적화 : 다른 편향 감소 기술과의 결합 최적화높은 혁신성 : 헤더-페이로드 분리 편향 아이디어는 독창성과 영감을 제공이론적 엄밀성 : 완전한 수학적 분석 프레임워크 및 이론적 증명 제공포괄적인 실험 : 애플리케이션 특정 및 대규모 합성 평가 방법 포함높은 실용 가치 : 실시간 시스템의 핵심 성능 문제 해결명확한 작성 : 기술 설명이 정확하고 논리 구조가 합리적제한된 응용 범위 : 주로 환형 네트워크에 초점, 다른 토폴로지의 적용성 불명확불충분한 구현 세부사항 : 헤더 수정의 구체적인 인코딩 방법 및 하드웨어 구현 세부사항 부족제한된 비교 기준선 : 주로 한 가지 기준선 방법과 비교, 다른 최적화 기술과의 비교 부족단일 평가 지표 : 최악의 경우 지연에 중점, 평균 성능 및 에너지 소비 영향 분석 부족학술 기여 : 편향 라우팅 네트워크 최적화에 새로운 연구 방향 제공실용 가치 : 임베디드 실시간 시스템의 NoC 설계에 직접 적용 가능재현성 : 상세한 분석 모델 및 실험 설정 제공으로 재현 및 확장 용이영감 제공 : 분리 처리 아이디어가 다른 네트워크 최적화 연구에 영감 제공 가능하드 실시간 시스템 : 엄격한 지연 보장이 필요한 임베디드 애플리케이션자원 제약 환경 : 면적 및 전력 소비에 민감한 온칩 네트워크 설계환형 네트워크 아키텍처 : 환형 토폴로지를 채택한 NoC 시스템중간 규모 네트워크 : 4×4에서 6×6 규모의 네트워크가 최고의 개선 효과 획득본 논문은 15개의 관련 연구를 인용하며, 주요 내용은 다음을 포함:
1 Alazemi 등의 라우터 없는 네트워크 아키텍처6 Indrusiak과 Burns의 최악의 경우 지연 분석8 Liu 등의 IMR 환형 네트워크 설계기타 편향 라우팅, 실시간 분석 및 NoC 최적화 관련 연구 종합 평가 : 이는 혁신적인 편향 라우팅 최적화 프로토콜을 제안하는 고품질의 시스템 아키텍처 논문으로, 견고한 이론적 기초와 포괄적인 실험 검증을 갖추고 있다. 응용 범위 및 구현 세부사항 측면에서 일정한 한계가 있지만, 핵심 아이디어는 중요한 학술 가치와 실용적 의미를 가지며, 온칩 네트워크 최적화 연구에 새로운 방향을 제공한다.