Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases
Abdullah, Zaman
Modern cloud databases present scaling as a binary decision: scale-out by adding nodes or scale-up by increasing per-node resources. This one-dimensional view is limiting because database performance, cost, and coordination overhead emerge from the joint interaction of horizontal elasticity and per-node CPU, memory, network bandwidth, and storage IOPS. As a result, systems often overreact to load spikes, underreact to memory pressure, or oscillate between suboptimal states. We introduce the Scaling Plane, a two-dimensional model in which each distributed database configuration is represented as a point (H, V), with H denoting node count and V a vector of resources. Over this plane, we define smooth approximations of latency, throughput, coordination overhead, and monetary cost, providing a unified view of performance trade-offs. We show analytically and empirically that optimal scaling trajectories frequently lie along diagonal paths: sequences of joint horizontal and vertical adjustments that simultaneously exploit cluster parallelism and per-node improvements. To compute such actions, we propose DIAGONALSCALE, a discrete local-search algorithm that evaluates horizontal, vertical, and diagonal moves in the Scaling Plane and selects the configuration minimizing a multi-objective function subject to SLA constraints. Using synthetic surfaces, microbenchmarks, and experiments on distributed SQL and KV systems, we demonstrate that diagonal scaling reduces p95 latency by up to 40 percent, lowers cost-per-query by up to 37 percent, and reduces rebalancing by 2 to 5 times compared to horizontal-only and vertical-only autoscaling. Our results highlight the need for multi-dimensional scaling models and provide a foundation for next-generation autoscaling in cloud database systems.
academic
विकर्ण स्केलिंग: वितरित डेटाबेस के लिए बहु-आयामी संसाधन मॉडल और अनुकूलन ढांचा
आधुनिक क्लाउड डेटाबेस स्केलिंग को एक द्विआधारी निर्णय के रूप में देखते हैं: नोड्स जोड़कर क्षैतिज स्केलिंग (scale-out) या एकल नोड संसाधन बढ़ाकर ऊर्ध्वाधर स्केलिंग (scale-up)। यह एकल-आयामी दृष्टिकोण सीमित है क्योंकि डेटाबेस प्रदर्शन, लागत और समन्वय ओवरहेड क्षैतिज लोच और एकल नोड CPU, मेमोरी, नेटवर्क बैंडविड्थ और स्टोरेज IOPS के संयुक्त इंटरैक्शन से उत्पन्न होते हैं। परिणामस्वरूप, सिस्टम अक्सर लोड शिखरों पर अत्यधिक प्रतिक्रिया करते हैं, मेमोरी दबाव पर अपर्याप्त प्रतिक्रिया करते हैं, या उप-इष्टतम स्थितियों के बीच दोलन करते हैं।
यह पेपर स्केलिंग प्लेन प्रस्तुत करता है, जो एक द्वि-आयामी मॉडल है जहां प्रत्येक वितरित डेटाबेस कॉन्फ़िगरेशन बिंदु (H, V) के रूप में प्रदर्शित होता है, जहां H नोड्स की संख्या है और V संसाधन वेक्टर है। इस प्लेन पर, लेखक विलंबता, थ्रूपुट, समन्वय ओवरहेड और मौद्रिक लागत के लिए सुचारू सन्निकटन परिभाषित करते हैं, जो प्रदर्शन ट्रेड-ऑफ का एकीकृत दृश्य प्रदान करते हैं। अनुसंधान से पता चलता है कि इष्टतम स्केलिंग प्रक्षेपवक्र आमतौर पर विकर्ण पथ के साथ चलते हैं: क्लस्टर समानता और एकल-नोड सुधार के संयुक्त क्षैतिज-ऊर्ध्वाधर समायोजन अनुक्रम। इसके लिए, लेखक DIAGONALSCALE एल्गोरिदम प्रस्तावित करते हैं, जो एक असतत स्थानीय खोज एल्गोरिदम है जो स्केलिंग प्लेन में क्षैतिज, ऊर्ध्वाधर और विकर्ण गतिविधियों का मूल्यांकन करता है, और SLA बाधाओं के तहत बहु-उद्देश्य फ़ंक्शन को कम करने वाले कॉन्फ़िगरेशन का चयन करता है।
प्रयोग दिखाते हैं कि विकर्ण स्केलिंग शुद्ध क्षैतिज या शुद्ध ऊर्ध्वाधर स्वत: स्केलिंग की तुलना में p95 विलंबता को 40% तक कम कर सकता है, प्रति क्वेरी लागत को 37% तक कम कर सकता है, और पुनः संतुलन को 2-5 गुना कम कर सकता है।
आर्थिक प्रभाव: क्लाउड डेटाबेस महत्वपूर्ण बुनियादी ढांचा हैं (वित्त, ई-कॉमर्स, लॉजिस्टिक्स, सामाजिक नेटवर्क), अनुचित स्केलिंग निर्णय विशाल लागत बर्बादी का कारण बनते हैं
प्रदर्शन महत्वपूर्ण: स्केलिंग निर्णय सीधे विलंबता, थ्रूपुट और उपलब्धता को प्रभावित करते हैं
परिचालन जटिलता: गलत स्केलिंग रणनीति बार-बार डेटा पुनः संतुलन, नेतृत्व परिवर्तन और सिस्टम अस्थिरता का कारण बनती है
लेखकों ने देखा कि: कई कार्यभार समन्वित लेकिन स्वतंत्र क्षैतिज और ऊर्ध्वाधर संसाधन समायोजन से लाभान्वित होते हैं। यह उन्हें एक एकीकृत बहु-आयामी स्केलिंग मॉडल बनाने और इस स्थान में अनुकूलन करने में सक्षम एल्गोरिदम विकसित करने के लिए प्रेरित करता है।
स्केलिंग प्लेन मॉडल: लचीले डेटाबेस कॉन्फ़िगरेशन का एक नया द्वि-आयामी अमूर्तता प्रस्तावित करता है, कॉन्फ़िगरेशन को (H, V) बिंदु के रूप में प्रदर्शित करता है, जहां H नोड्स की संख्या है और V संसाधन वेक्टर है
विश्लेषणात्मक प्रदर्शन सतहें: विलंबता, थ्रूपुट, लागत और समन्वय ओवरहेड के लिए बंद-रूप मॉडल प्राप्त करता है, जो H-V प्लेन पर इन मेट्रिक्स की ज्यामितीय संरचना को प्रकट करता है
DIAGONALSCALE एल्गोरिदम: H-V प्लेन में स्थानीय पड़ोस का मूल्यांकन करने वाला असतत अनुकूलन एल्गोरिदम डिज़ाइन करता है, क्षैतिज, ऊर्ध्वाधर और विकर्ण गतिविधियों का समर्थन करता है
सैद्धांतिक गारंटियां: एकल-दिशा सुधार, स्थानीय इष्टतम में अभिसरण और स्थिरता के प्रमाण स्केच प्रदान करता है
व्यापक मूल्यांकन: सिंथेटिक सतहों, माइक्रो-बेंचमार्क और वितरित SQL/KV सिस्टम प्रयोगों के माध्यम से, विकर्ण स्केलिंग के लाभ प्रदर्शित करता है:
मुख्य खोज: F का न्यूनतम शायद ही कभी अक्ष-संरेखित किनारों (शुद्ध scale-up या शुद्ध scale-out) पर होता है। इसके बजाय, न्यूनतम प्लेन के अंदर स्थित है, विकर्ण प्रक्षेपवक्र के साथ।
यह इसलिए है क्योंकि:
L V के साथ घटता है लेकिन H के साथ बढ़ता है
T H और V के साथ बढ़ता है लेकिन संतृप्त होता है
C H के साथ रैखिक रूप से बढ़ता है, V के साथ सुपर-रैखिक रूप से बढ़ता है
जहां H और V दोनों t के साथ बढ़ते हैं। ढलान को m = dH/d||V|| के रूप में सेट करें।
ग्रेडिएंट संरेखण शर्त:
उद्देश्य फ़ंक्शन का ग्रेडिएंट:
∇F = (∂F/∂H, ∂F/∂||V||)
प्रक्षेपवक्र दिशा (1, m) के साथ स्थानीय इष्टतम को संतुष्ट करता है:
∇F(H*, V*) · (1, m*) = 0
इसलिए इष्टतम विकर्ण दिशा (1, m*) -∇F के साथ संरेखित है।
लेम्मा 1 (अक्ष-संरेखित स्केलिंग शायद ही कभी इष्टतम है):
यदि ∂F/∂H ≠ 0 और ∂F/∂||V|| ≠ 0, तो इष्टतम दिशा न तो क्षैतिज है और न ही ऊर्ध्वाधर।
प्रमाण स्केच: यदि इष्टतम स्केलिंग क्षैतिज है, तो दिशा वेक्टर (1, 0) है। लेकिन:
∇F · (1, 0) = ∂F/∂H ≠ 0
विरोधाभास। ऊर्ध्वाधर स्केलिंग भी इसी तरह। इसलिए विकर्ण स्केलिंग आवश्यक है। □
प्रस्ताव (आंतरिक न्यूनतम का अस्तित्व):
यदि L V में घटता है, H में बढ़ता है, C दोनों में बढ़ता है, K H में बढ़ता है लेकिन V में घटता है, तो F के पास कम से कम एक आंतरिक स्थिर बिंदु (H*, V*) है।
स्थानीय खोज: (H, V) के चारों ओर पड़ोसियों की खोज करता है
SLA-जागरूक: केवल व्यावहारिक कॉन्फ़िगरेशन पर विचार करता है
दिशा विविधता: क्षैतिज, ऊर्ध्वाधर और विकर्ण गतिविधियों की जांच करता है
स्थिरता: अपेक्षित पुनः संतुलन दंड के आधार पर विनाशकारी गतिविधियों को दंडित करता है
एकरसता: केवल तभी स्वीकार करता है जब F सुधार सीमांत ε से अधिक हो
पड़ोस परिभाषा:
N(H,V) = {(H±ΔH, V), (H, V±1), (H±ΔH, V±1)}
ΔH आमतौर पर 1-2 नोड्स है, ऊर्ध्वाधर गतिविधि आसन्न उदाहरण प्रकारों के अनुरूप है।
एल्गोरिदम प्रवाह (Algorithm 1):
इनपुट: वर्तमान कॉन्फ़िगरेशन (H,V), SLA(Lmax, Tmin)
आउटपुट: अगला कॉन्फ़िगरेशन (Hnext, Vnext)
1. पड़ोस N(H,V) की गणना करें
2. N में प्रत्येक (H', V') के लिए:
a. L(H', V'), T(H', V'), K(H', V'), C(H', V') का अनुमान लगाएं
b. यदि SLA का उल्लंघन करता है, तो अव्यावहारिक के रूप में चिह्नित करें और जारी रखें
c. उद्देश्य F(H', V') की गणना करें
d. पुनः संतुलन दंड Prebalance(H,V; H', V') की गणना करें
e. F'(H', V') = F(H', V') + δPrebalance सेट करें
3. F' को कम करने वाले व्यावहारिक पड़ोसी (H*, V*) का चयन करें
4. यदि F'(H*, V*) < F(H,V) - ε:
(H*, V*) लौटाएं
अन्यथा:
(H,V) लौटाएं
हालांकि पेपर स्पष्ट रूप से पारंपरिक विलोपन प्रयोग सूचीबद्ध नहीं करता है, लेकिन तीन रणनीतियों (H-only, V-only, Diagonal) की तुलना के माध्यम से वास्तव में निहित विलोपन करता है:
विकर्ण गतिविधि के बिना (H-only + V-only): प्रदर्शन में उल्लेखनीय गिरावट
स्थिरता दंड के बिना: अधिक बार-बार दोलन (δ पैरामीटर द्वारा नियंत्रित)
विभिन्न पड़ोस आकार: 8-पड़ोसी कॉन्फ़िगरेशन अन्वेषण और कम्प्यूटेशनल लागत को संतुलित करता है