Optimising Virtual Resource Mapping in Multi-Level NUMA Disaggregated Systems
Lakew, Svärd, Elmroth et al.
Disaggregated systems have a novel architecture motivated by the requirements of resource intensive applications such as social networking, search, and in-memory databases. The total amount of resources such as memory and CPU cores is very large in such systems. However, the distributed topology of disaggregated server systems result in non-uniform access latency and performance, with both NUMA aspects inside each box, as well as additional access latency for remote resources. In this work, we study the effects complex NUMA topologies on application performance and propose a method for improved, NUMA-aware, mapping for virtualized environments running on disaggregated systems. Our mapping algorithm is based on pinning of virtual cores and/or migration of memory across a disaggregated system and takes into account application performance, resource contention, and utilization. The proposed method is evaluated on a 288 cores and around 1TB memory system, composed of six disaggregated commodity servers, through a combination of benchmarks and real applications such as memory intensive graph databases. Our evaluation demonstrates significant improvement over the vanilla resource mapping methods. Overall, the mapping algorithm is able to improve performance by significant magnitude compared the default Linux scheduler used in system.
본 논문은 분해 시스템(disaggregated systems)에서 복잡한 NUMA 토폴로지가 애플리케이션 성능에 미치는 영향을 연구하고, 개선된 NUMA 인식 매핑 방법을 제안합니다. 이 방법은 가상 코어 바인딩과 메모리 마이그레이션을 기반으로 하며, 애플리케이션 성능, 리소스 경합 및 활용률을 종합적으로 고려합니다. 6대의 상용 서버로 구성된 288개 코어, 약 1TB 메모리의 분해 시스템에서 평가한 결과, 기본 Linux 스케줄러 대비 현저한 성능 향상을 보여줍니다.
if VMi is a new arrival then
if Free slot is suitable for VMi given ci, ai then
Map VMi directly
else
Reshuffle existing VMs to create suitable slot
Map VMi to new slot
단계 2: 간섭 최소화(런타임 최적화)
for each VMi do
if (expected_perf - measured_perf)/expected_perf ≥ Threshold then
Add VMi to affected list
for each affected VM do
Build potential neighbor list based on class compatibility
Compute new configuration with minimal reshuffle
Remap if beneficial
본 논문은 분해 시스템, NUMA 최적화, 가상화 기술 등 여러 분야의 중요한 연구 성과를 포함한 26편의 관련 문헌을 인용하여 연구 작업에 견고한 이론적 기초를 제공합니다.
종합 평가: 본 논문은 분해 시스템 리소스 관리 분야에서 중요한 기여를 하는 논문으로, 엄밀한 실험 설계와 충분한 성능 평가를 통해 NUMA 인식 매핑 알고리즘의 효과성을 입증합니다. 일부 한계가 있지만 실용 가치와 학술적 기여 모두 매우 유의미하며, 해당 분야의 추가 발전을 위한 기초를 마련합니다.