Remote inference allows lightweight devices to leverage powerful cloud models. However, communication network latency makes predictions stale and unsuitable for real-time tasks. To address this, we introduce Dedelayed, a delay-corrective method that mitigates arbitrary remote inference delays, allowing the local device to produce low-latency outputs in real time. Our method employs a lightweight local model that processes the current frame and fuses in features that a heavyweight remote model computes from past frames. On video from the BDD100K driving dataset, Dedelayed improves semantic segmentation accuracy over the stronger of the local-only and remote-only baselines across all realistic communication network delays beyond 33 ms. Without incurring additional delay, it improves accuracy by 6.4 mIoU compared to fully local inference and 9.8 mIoU compared to remote inference, for a round-trip delay of 100 ms. The advantage grows under longer delays and higher-motion scenes, as delay-mitigated split inference sustains accuracy more effectively, providing clear advantages for real-time tasks that must remain aligned with the current world state.
원격 추론을 통해 경량 기기는 강력한 클라우드 모델을 활용할 수 있습니다. 그러나 통신 네트워크 지연으로 인해 예측 결과가 시대에 뒤떨어져 실시간 작업에 부적합합니다. 이 문제를 해결하기 위해 본 논문에서는 Dedelayed를 제시하며, 이는 임의의 원격 추론 지연을 완화할 수 있는 지연 보정 방법으로, 로컬 기기가 실시간으로 저지연 출력을 생성할 수 있게 합니다. 이 방법은 경량 로컬 모델을 사용하여 현재 프레임을 처리하고 과거 프레임에서 계산한 무거운 원격 모델의 특징을 융합합니다. BDD100K 운전 데이터셋의 비디오에서 Dedelayed는 33ms를 초과하는 모든 현실적인 통신 네트워크 지연에서 순수 로컬 및 순수 원격 기준선 중 더 강한 것과 비교하여 의미론적 분할 정확도를 개선했습니다. 추가 지연을 발생시키지 않으면서 100ms 왕복 지연의 경우 순수 로컬 추론 대비 6.4 mIoU, 원격 추론 대비 9.8 mIoU 개선을 달성했습니다.
종합 평가: 이는 실제 문제를 해결하는 고품질 논문으로, 제시된 Dedelayed 프레임워크는 이론과 실제 모두에서 중요한 가치를 가집니다. 방법은 단순하고 효과적이며, 실험 검증이 충분하고, 엣지-클라우드 협력 추론 분야에 가치 있는 기여를 제공합니다. 평가 범위 및 지연 처리 능력에서 개선 여지가 있지만, 전반적으로 의미 있는 연구 작업입니다.