Optimising Virtual Resource Mapping in Multi-Level NUMA Disaggregated Systems
Lakew, Svärd, Elmroth et al.
Disaggregated systems have a novel architecture motivated by the requirements of resource intensive applications such as social networking, search, and in-memory databases. The total amount of resources such as memory and CPU cores is very large in such systems. However, the distributed topology of disaggregated server systems result in non-uniform access latency and performance, with both NUMA aspects inside each box, as well as additional access latency for remote resources. In this work, we study the effects complex NUMA topologies on application performance and propose a method for improved, NUMA-aware, mapping for virtualized environments running on disaggregated systems. Our mapping algorithm is based on pinning of virtual cores and/or migration of memory across a disaggregated system and takes into account application performance, resource contention, and utilization. The proposed method is evaluated on a 288 cores and around 1TB memory system, composed of six disaggregated commodity servers, through a combination of benchmarks and real applications such as memory intensive graph databases. Our evaluation demonstrates significant improvement over the vanilla resource mapping methods. Overall, the mapping algorithm is able to improve performance by significant magnitude compared the default Linux scheduler used in system.
academic
बहु-स्तरीय NUMA विघटित प्रणालियों में आभासी संसाधन मानचित्रण का अनुकूलन
यह पेपर विघटित प्रणालियों में जटिल NUMA टोपोलॉजी के अनुप्रयोग प्रदर्शन पर प्रभाव का अध्ययन करता है और एक सुधारित NUMA-जागरूक मानचित्रण विधि प्रस्तावित करता है। यह विधि आभासी कोर बाइंडिंग और मेमोरी माइग्रेशन पर आधारित है, जो अनुप्रयोग प्रदर्शन, संसाधन प्रतिद्वंद्विता और उपयोग को एकीकृत रूप से विचार करती है। 6 वाणिज्यिक सर्वरों से बनी 288-कोर, लगभग 1TB मेमोरी वाली विघटित प्रणाली पर मूल्यांकन से डिफ़ॉल्ट Linux शेड्यूलर की तुलना में महत्वपूर्ण प्रदर्शन सुधार दिखाई देता है।
विघटित प्रणाली आर्किटेक्चर चुनौतियाँ: विघटित प्रणालियाँ कई भौतिक सर्वरों के संसाधनों को एकत्रित करके संसाधन-गहन अनुप्रयोगों (जैसे सामाजिक नेटवर्क, खोज, मेमोरी डेटाबेस) का समर्थन करती हैं, लेकिन वितरित टोपोलॉजी असमान पहुंच विलंबता और प्रदर्शन समस्याओं का कारण बनती है
बहु-स्तरीय NUMA जटिलता: प्रणाली में एकल मशीन के भीतर NUMA विशेषताएं और क्रॉस-मशीन दूरस्थ संसाधन पहुंच विलंबता दोनों मौजूद हैं, जो जटिल बहु-स्तरीय NUMA टोपोलॉजी बनाती हैं
आभासीकरण वातावरण अनुकूलन: मौजूदा Linux शेड्यूलर इस जटिल संसाधन मानचित्रण परिदृश्य को प्रभावी ढंग से संभाल नहीं सकते
विघटित प्रणालियों का पहला गहन वास्तविक माप अनुसंधान: वास्तविक विघटित हार्डवेयर पर गहन माप, संसाधन प्रतिद्वंद्विता, स्थानीयता और हस्तक्षेप की डिग्री पर विचार
अनुप्रयोग वर्गीकरण और प्रदर्शन मेट्रिक्स प्रणाली: अनुप्रयोगों को वर्गीकृत करने के लिए Animal Classes वर्गीकरण विधि का उपयोग, IPC और MPI को प्रदर्शन संकेतक के रूप में उपयोग
NUMA-जागरूक मानचित्रण एल्गोरिदम: अनुप्रयोग वर्गीकरण, संसाधन निकटता और रन-टाइम हार्डवेयर प्रदर्शन काउंटर पर विचार करने वाला ऑनलाइन मानचित्रण एल्गोरिदम प्रस्तावित करता है
महत्वपूर्ण प्रदर्शन सुधार: वास्तविक प्रणाली पर औसत 50 गुना प्रदर्शन सुधार प्राप्त करता है
इनपुट: आभासी मशीन अनुरोध (CPU कोर संख्या, मेमोरी आवश्यकता सहित), अनुप्रयोग वर्गीकरण, प्रणाली संसाधन स्थिति
आउटपुट: आभासी CPU से भौतिक CPU का इष्टतम मानचित्रण योजना
बाधाएं: संसाधन ओवरसबस्क्रिप्शन से बचें, NUMA दूरी को कम करें, अनुप्रयोगों के बीच हस्तक्षेप को कम करें
if VMi is a new arrival then
if Free slot is suitable for VMi given ci, ai then
Map VMi directly
else
Reshuffle existing VMs to create suitable slot
Map VMi to new slot
चरण 2: हस्तक्षेप न्यूनीकरण (रन-टाइम अनुकूलन)
for each VMi do
if (expected_perf - measured_perf)/expected_perf ≥ Threshold then
Add VMi to affected list
for each affected VM do
Build potential neighbor list based on class compatibility
Compute new configuration with minimal reshuffle
Remap if beneficial
यह पेपर 26 संबंधित संदर्भों का हवाला देता है, जो विघटित प्रणालियों, NUMA अनुकूलन, आभासीकरण तकनीक और अन्य कई क्षेत्रों के महत्वपूर्ण अनुसंधान परिणामों को कवर करते हैं, जो अनुसंधान कार्य के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं।
समग्र मूल्यांकन: यह विघटित प्रणाली संसाधन प्रबंधन क्षेत्र में महत्वपूर्ण योगदान वाला एक पेपर है, जो कठोर प्रायोगिक डिजाइन और पर्याप्त प्रदर्शन मूल्यांकन के माध्यम से NUMA-जागरूक मानचित्रण एल्गोरिदम की प्रभावशीलता को सिद्ध करता है। हालांकि कुछ सीमाएं हैं, लेकिन इसका व्यावहारिक मूल्य और शैक्षणिक योगदान दोनों बहुत महत्वपूर्ण हैं, जो इस क्षेत्र के आगे विकास के लिए आधार तैयार करते हैं।