Modern cloud databases present scaling as a binary decision: scale-out by adding nodes or scale-up by increasing per-node resources. This one-dimensional view is limiting because database performance, cost, and coordination overhead emerge from the joint interaction of horizontal elasticity and per-node CPU, memory, network bandwidth, and storage IOPS. As a result, systems often overreact to load spikes, underreact to memory pressure, or oscillate between suboptimal states. We introduce the Scaling Plane, a two-dimensional model in which each distributed database configuration is represented as a point (H, V), with H denoting node count and V a vector of resources. Over this plane, we define smooth approximations of latency, throughput, coordination overhead, and monetary cost, providing a unified view of performance trade-offs. We show analytically and empirically that optimal scaling trajectories frequently lie along diagonal paths: sequences of joint horizontal and vertical adjustments that simultaneously exploit cluster parallelism and per-node improvements. To compute such actions, we propose DIAGONALSCALE, a discrete local-search algorithm that evaluates horizontal, vertical, and diagonal moves in the Scaling Plane and selects the configuration minimizing a multi-objective function subject to SLA constraints. Using synthetic surfaces, microbenchmarks, and experiments on distributed SQL and KV systems, we demonstrate that diagonal scaling reduces p95 latency by up to 40 percent, lowers cost-per-query by up to 37 percent, and reduces rebalancing by 2 to 5 times compared to horizontal-only and vertical-only autoscaling. Our results highlight the need for multi-dimensional scaling models and provide a foundation for next-generation autoscaling in cloud database systems.
論文ID : 2511.21612タイトル : Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases著者 : Shahir Abdullah, Syed Rohit Zaman分類 : cs.DC(分散コンピューティング)発表日時 : 2025年11月26日(arXiv v1)論文リンク : https://arxiv.org/abs/2511.21612 現代のクラウドデータベースは、スケーリングを二項決定として捉えています:ノード追加によるスケールアウト(横方向スケーリング)またはノード単位のリソース増加によるスケールアップ(縦方向スケーリング)です。この一次元的な視点には限界があります。なぜなら、データベースのパフォーマンス、コスト、および調整オーバーヘッドは、水平弾性と単一ノードのCPU、メモリ、ネットワーク帯域幅、ストレージIOPS間の相互作用から生じるからです。その結果、システムは負荷ピークに過剰反応したり、メモリ圧力に過小反応したり、最適でない状態間で振動することが多くあります。
本論文ではスケーリング平面(Scaling Plane)を導入します。これは二次元モデルであり、各分散データベース構成は点(H, V)として表現されます。ここでHはノード数、Vはリソースベクトルです。この平面上で、著者らはレイテンシ、スループット、調整オーバーヘッド、および金銭的コストの滑らかな近似を定義し、パフォーマンストレードオフの統一的な見方を提供します。研究により、最適なスケーリング軌跡は通常、対角経路に沿うことが示されています:クラスタ並列性と単一ノード改善の両方を活用する結合された水平-垂直調整シーケンスです。このため、著者らは DIAGONALSCALEアルゴリズム を提案します。これはスケーリング平面内で水平、垂直、および対角移動を評価し、SLA制約下で多目的関数を最小化する構成を選択する離散局所探索アルゴリズムです。
実験により、対角スケーリングは純粋な水平または純粋な垂直自動スケーリングと比較して、p95レイテンシを最大40%削減し、クエリあたりのコストを最大37%削減し、リバランスを2~5倍削減することが示されています。
現代の分散データベースが直面するスケーリング決定のジレンマ :
二項選択の限界 :従来の方法は、スケールアウト(ノード追加)とスケールアップ(リソース追加)を独立した決定として扱うシステム動作の問題 :負荷変化への不適切な対応により、過度なプロビジョニング、SLA違反、または頻繁な破壊的リバランスが発生統一的見方の欠如 :パフォーマンス、コスト、調整オーバーヘッド間の多次元相互作用を理解する包括的なモデルがない経済的影響 :クラウドデータベースは重要なインフラストラクチャ(金融、電子商取引、物流、ソーシャルネットワーク)であり、不適切なスケーリング決定は莫大なコスト浪費につながるパフォーマンス重要性 :スケーリング決定はレイテンシ、スループット、可用性に直接影響運用複雑性 :誤ったスケーリング戦略は頻繁なデータリバランス、リーダーシップ変更、システム不安定性を招くスケールアウト(横方向スケーリング)の問題 :
合意形成オーバーヘッド増加(Paxos/Raftメッセージ数) レプリカグループサイズの拡大 レプリケーションファンアウトの増加 より多くのリーダーシップ変更を引き起こす 高コストなデータリバランスをトリガー スケールアップ(縦方向スケーリング)の問題 :
メモリアップグレードはパーティション間のデータスキューを解決できない CPUアップグレードはメタデータボトルネックを解決できない 最終的にハードウェア上限に達する 収益逓減を示す 既存の自動スケーリングの不足 :
Kubernetes HPA/VPAなどのツールは2つの次元を個別に処理 CPU > 70%などの単純なしきい値に基づく反応的戦略 2つの次元の非線形相互作用を考慮しない 対角軌跡を計算できない 著者らの観察:多くのワークロードは独立ではなく、調整された水平および垂直リソース調整から利益を得ます 。これにより、統一された多次元スケーリングモデルを構築し、このスペース内で最適化できるアルゴリズムを開発するよう促されました。
スケーリング平面モデル(Scaling Plane Model) :弾性データベース構成の新しい二次元抽象化を提案。構成を(H, V)点として表現。ここでHはノード数、Vはリソースベクトル分析的パフォーマンス曲面(Analytical Performance Surfaces) :レイテンシ、スループット、コスト、調整オーバーヘッドの閉形式モデルを導出。これらのメトリクスのH-V平面上の幾何学的構造を明らかにDIAGONALSCALEアルゴリズム :H-V平面内で局所近傍を評価する離散最適化アルゴリズムを設計。水平、垂直、対角移動をサポート理論的保証 :単調改善、局所最適への収束、安定性の証明スケッチを提供包括的評価 :合成曲面、マイクロベンチマーク、分散SQL/KVシステム実験を通じて、対角スケーリングの利点を実証:p95レイテンシ最大40%削減 クエリあたりのコスト最大37%削減 リバランス2~5倍削減 入力 :
現在の構成:(H, V)。ここでHはノード数、V = (c, r, b, s)は単一ノードのCPU、RAM、帯域幅、ストレージIOPS ワークロード特性:リクエストレートλ、読み書き比率、アクセス分布 SLA制約:最大レイテンシLmax、最小スループットTmin 出力 :
目的 :
多目的関数を最小化:F(H,V) = αL(H,V) + βC(H,V) + γK(H,V) SLA制約を満たす:L(H,V) ≤ Lmax かつ T(H,V) ≥ Tmin 構成空間は以下のように定義されます:
S = {(H,V) : H ≥ 1, c, r, b, s > 0}
ここでHは離散整数(ノード数)、Vは有限のインスタンスタイプセットから選択されます。
(a) ノード固有レイテンシ(Node-Intrinsic Latency)
加重調和形式を採用:
Lnode(V) = α/c + β/r + γ/b + δ/s
これは以下をキャプチャします:
計算集約的操作に対するCPUの強い影響 ワーキングセットとキャッシュ動作に対するRAMの影響 レプリケーションとRPCに対するネットワーク帯域幅の作用 LSMツリー圧縮とログフラッシュに対するストレージIOPSの効果 (b) 調整レイテンシ(Coordination Latency)
合意形成プロトコル、グローバルタイムスタンプ、メタデータ同期により、調整コストはクラスタサイズとともに増加:
Lcoord(H) = η log H + μH^θ
ここで0 < θ < 1は超対数的だが亜線形の増長曲線を作成します。
(c) 総レイテンシ
L(H,V) = Lnode(V) + Lcoord(H)
主要な性質:
∂L/∂H > 0(レイテンシはノード増加とともに増加) ∂L/∂||V|| < 0(レイテンシはリソース増加とともに減少) (d) スループット曲面(Throughput Surface)
単一ノードスループット:
Tnode(V) = κ · min(c, r, b, s)
クラスタスループットは収益逓減を考慮:
T(H,V) = H · Tnode(V) · φ(H)
ここで:
調整オーバーヘッドとレプリケーションコストの増加を反映します。
(e) 調整オーバーヘッド曲面(Coordination Overhead Surface)
書き込み集約的なワークロードの場合、書き込み到着レートはλw:
K(H,V) = ρ · Lcoord(H) · λw / T(H,V)
直感:
調整オーバーヘッドは書き込みロードとともに増加 スループット増加時に減少 クラスタサイズが大きいほど上昇 (f) 金銭的コスト曲面(Monetary Cost Surface)
ここでCnode(V)はリソースVを持つインスタンスのクラウドコストです。
目的関数を定義:
F(H,V) = αL(H,V) + βC(H,V) + γK(H,V)
制約条件:
L(H,V) ≤ Lmax
T(H,V) ≥ Tmin
これは二次元非凸最適化問題 を作成します。
主要な発見 :Fの最小値は軸配置エッジ(純粋なスケールアップまたは純粋なスケールアウト)上にはめったにありません。代わりに、最小値は平面内部に位置し、対角軌跡 に沿っています。
これは以下の理由によります:
LはVで減少しますがHで増加 TはHとVで増加しますが飽和 CはHで線形に増加し、Vで超線形に増加 KはHで増加しますがVで減少 軌跡定義 :
ここでHとVの両方がtとともに増加します。勾配をm = dH/d||V||とします。
勾配整列条件 :
目的関数の勾配:
軌跡方向(1, m)に沿った局所最適は以下を満たします:
したがって最適対角方向(1, m*)は-∇Fと整列します。
補題1(軸配置スケーリングはめったに最適ではない) :
∂F/∂H ≠ 0かつ∂F/∂||V|| ≠ 0の場合、最適方向は水平でも垂直でもありません。
証明スケッチ :最適スケーリングが水平の場合、方向ベクトルは(1, 0)です。しかし:
矛盾です。垂直スケーリングも同様です。したがって対角スケーリングが必要です。□
命題(内部最小値の存在性) :
LがVで減少しHで増加し、Cがその両方で増加し、KがHで増加しますがVで減少する場合、Fは少なくとも1つの内部臨界点(H*, V*)を持ちます。
設計原則 :
局所探索 :(H, V)周辺の近傍を探索SLA認識 :実行可能な構成のみを考慮方向多様性 :水平、垂直、対角移動をチェック安定性 :予想されるリバランスペナルティに基づいて破壊的な移動にペナルティ単調性 :Fの改善が限界εを超える場合のみ移動を受け入れ近傍定義 :
N(H,V) = {(H±ΔH, V), (H, V±1), (H±ΔH, V±1)}
ΔHは通常1~2ノード、垂直移動は隣接するインスタンスタイプに対応します。
アルゴリズムフロー (Algorithm 1):
入力:現在の構成(H,V)、SLA(Lmax, Tmin)
出力:次の構成(Hnext, Vnext)
1. 近傍N(H,V)を計算
2. N内の各(H', V')について:
a. L(H', V'), T(H', V'), K(H', V'), C(H', V')を推定
b. SLAを違反する場合、実行不可能とマーク、続行
c. 目的F(H', V')を計算
d. リバランスペナルティPrebalance(H,V; H', V')を計算
e. F'(H', V') = F(H', V') + δPrebalanceを設定
3. F'を最小化する実行可能な近傍(H*, V*)を選択
4. F'(H*, V*) < F(H,V) - εの場合:
(H*, V*)を返す
そうでない場合:
(H,V)を返す
リバランスペナルティ :
Prebalance = λ1|H' - H| + λ2||V' - V||1 + λ3·ShardMovement(H,V → H', V')
シャード移動推定はパーティションメタデータを使用して取得できます。
複雑度分析 :
近傍サイズ|N| = 8。各評価は閉形式表現を計算し、時間複雑度O(1)。
したがって各スケーリング決定の時間複雑度:O(|N|) = O(1)
収束性定理 :
目的評価が正確でスペースが有限(有限Hおよび有限インスタンスタイプ)の場合、DIAGONALSCALEは局所最小値に収束します。
証明スケッチ :単調下降 + 離散有限状態空間 → 終了保証。
安定性命題 :
δが十分に大きい場合、DIAGONALSCALEは変動するワークロード内の構成間の振動を回避します。
テストシステム :
CockroachDB (分散SQL):Raft合意形成、範囲ベースのパーティション、動的リバランスを使用Redis Cluster (分散KV):ハッシュスロットシャーディングと非同期レプリケーション合成モデル :パラメータ化された分析スケーリング平面曲面水平スケール :
垂直インスタンスタイプ :
V ∈ {Small, Medium, Large, XLarge}
各タイプはクラウドインスタンスファミリーの(c, r, b, s)にマップされます。
合計20以上の構成がスケーリング平面の離散サブセットを形成します。
読み込み集約的 :90% GET、10% PUT(YCSB Workload B)書き込み集約的 :30% GET、70% PUT(YCSB Workload A)混合型 :バランスの取れたGET/PUT比率(Workload D)スキュー型 :Zipfian分布、スキューパラメータθ = 0.8動的型 :時間変動リクエストレート、正弦波、ステップ、バースト流量パターンレイテンシ :p50、p95、p99レイテンシスループット :ops/sコスト :単位時間あたりのコストと操作あたりのコスト安定性 :自動スケーリング操作数、リバランスおよびリーダーシップ変更数SLA違反率 Horizontal-only (H-only) :CPU/メモリに基づいてのみノード追加/削除Vertical-only (V-only) :リソース飽和度に基づいてのみインスタンスタイプを変更DiagonalScale(本論文) :安定性ペナルティを伴うH-V空間での局所探索プラットフォーム :HPA+VPAを無効にしたKubernetesクラスタコントローラ :DIAGONALSCALEを実装するカスタム自動スケーリングコントローラ監視 :Prometheus + Grafana負荷生成 :Locust/YCSB繰り返し :すべての実験を5回繰り返し、エラーバーは標準偏差を反映合成レイテンシ曲面L(H,V) (図2)は以下を示します:
固定Vの水平線は増加するLcoordに遭遇 固定Hの垂直線は収益逓減に直面 対角経路はFを最小化する内部谷に到達 クエリあたりのコストヒートマップ (図3)は以下を示します:
内部最小値は対角スケーリングで到達可能 純粋な軸配置戦略は最適領域を見逃す 観察 :
H-only :振動、頻繁なノード循環と高コストなリバランスV-only :負荷ピークへの反応不足、SLA制約違反DiagonalScale :迅速な安定化、より少ない破壊的操作の使用結果 :
H-only :リバランス期間中のレイテンシピークV-only :CPUおよびメモリ飽和DiagonalScale :両方の問題を回避、より低く安定した尾部レイテンシを維持具体的な数値 :
p95レイテンシ最大**40%**削減 レイテンシ変動性が大幅に減少 DiagonalScaleは以下の方法でコストを削減:
不要なノード追加を回避 小さな垂直調整を実施 高コストなリバランスを最小化 クエリあたりのコスト削減 :最大37%
リバランスイベントとスケーリング操作 :
DiagonalScaleは破壊的な変更を2~5倍 削減 より少ないリーダーシップ変更 より滑らかなリソース調整 DiagonalScaleは以下の方法でSLA違反を削減:
滑らかなリソース調整 CPU飽和を防止 ネットワークホットスポットを回避 各自動スケーリング決定は**< 5ms**を消費(閉形式評価による)。
実時間制御ループに適切(反復あたり1~5秒)。
論文は従来のアブレーション実験を明示的にリストしていませんが、3つの戦略(H-only、V-only、Diagonal)の比較を通じて実質的にアブレーション実験を実施しています:
対角移動なし (H-only + V-only):パフォーマンスが大幅に低下安定性ペナルティなし :より頻繁な振動につながる(δパラメータで制御)異なる近傍サイズ :8近傍構成は探索と計算コストのバランスを取るシナリオ:バースト流量パターン
H-only応答 :即座に4ノード追加 → 大規模リバランスをトリガー → レイテンシピーク → 流量低下後の過度なプロビジョニングV-only応答 :XLargeインスタンスにアップグレード → CPU改善だがネットワークはまだ飽和 → 部分的なSLA違反DiagonalScale応答 :1ノード追加 + Largeへアップグレード → バランスの取れた改善 → リバランスピークなし → コスト効率が高い対角経路は普遍的に最適 :ワークロード構成の80%以上で、最適解は平面内部に位置小さな垂直調整は大きな影響 :1つのインスタンスタイプのアップグレードでさえ、必要な水平スケーリングを大幅に削減安定性-パフォーマンストレードオフ :適切なδ値(リバランスペナルティ)は振動を回避するために重要ワークロード特異性 :書き込み集約的なワークロードは対角スケーリングからより多くの利益を得る(調整オーバーヘッドのため)代表的なシステム :
Google Spanner :Paxos + TrueTime調整Bigtable :範囲ベースのパーティションCassandra :最終的一貫性レプリケーションCockroachDB :Raft合意形成DynamoDB :ハッシュパーティション限界 :スケールアウトは調整コストを増加させ、場合によっては超線形に増加し、p99レイテンシの低下につながります。
代表的なシステム :
Aurora Serverless v2 :インスタンス容量の微調整をサポートKubernetes VPA :ポッドサイズの調整限界 :
メモリアップグレードはパーティション間のスキューを解決できない CPUアップグレードはメタデータボトルネックを解決できない 最終的にハードウェア上限に達する 既存の方法 :
Kubernetes HPA :CPUまたはQPSに基づいてレプリカ数を調整Cluster Autoscaler :クラスタノード数を変更ルールベース :CPU > 70%などのしきい値不足 :
HとV間のパフォーマンス応答曲面をモデル化しない 2つの次元の非線形相互作用を考慮しない 対角軌跡を計算できない 初めて :
多次元スケーリング平面を構築 (H,V)上のコスト/レイテンシ曲面を導出 対角スケーリング軌跡を最適化 対角スケーリングが必要 :最適構成は純粋な水平または純粋な垂直軸上にはめったにない統一モデルが有効 :スケーリング平面はパフォーマンストレードオフの幾何学的直感を提供実際のパフォーマンス向上が顕著 :p95レイテンシ↓40%、コスト↓37%、リバランス↓2-5×理論と実践が一致 :分析曲面は実際のシステム動作を予測曲面近似 :実際のシステムにはより多くの二次効果がある(LSMツリー圧縮、ガベージコレクションなど)モデル校正 :パラメータα、β、γ、δなどを適合させるためのサンプリングが必要局所最適 :アルゴリズムは局所ではなく全局最適を見つける離散スペース :インスタンスタイプの離散性は微調整を制限単一クラスタ仮定 :マルチリージョンまたはフェデレーション展開を考慮しない機械学習の強化 :MLを使用して曲面近似をリアルタイムで学習三次元スケーリング :計算、メモリ、ストレージが分離されたアーキテクチャに拡張Serverlessアプリケーション :serverlessデータベースへの対角スケーリング適用多目的最適化 :より複雑なパレート前線探索予測的スケーリング :ワークロード予測と組み合わせた主動的調整パラダイムシフト :一次元から二次元スケーリング決定への転換は根本的な革新理論的基礎が堅実 :勾配整列条件、収束性証明を提供実用性が高い :O(1)複雑度は実時間制御に適切複数システムの検証 :CockroachDB(強い一貫性)+ Redis Cluster(最終的一貫性)多様なワークロード :読み込み/書き込み/混合/スキュー/動的シナリオをカバー合成+実際 :理論検証と実践的証拠の両方再現性 :詳細な実装の詳細とパラメータ設定顕著な改善 :40%のレイテンシ削減と37%のコスト削減は実質的安定性向上 :2~5×のリバランス削減は本番システムに重要統計的厳密性 :5回の繰り返し実験、エラーバーで表示構造が良好 :動機→モデル→アルゴリズム→評価のロジックが明確可視化が有効 :図2-7は核心概念を直感的に示す数学的厳密性 :式表現が正確線形結合の仮定 :F = αL + βC + γKは過度に単純かもしれないパラメータ感度 :α、β、γの重み選択に体系的な方法がない二次効果を無視 :ネットワーク輻輳、ディスク競合など規模が限定的 :最大12ノード、大規模クラスタ(100+ノード)未テストワークロードが単一 :主にYCSB、実際のアプリケーショントレース不足クラウド環境が単一 :異なるクラウドプロバイダーの価格モデル差異未テスト全局最適性 :局所最適のみ保証、全局保証なし収束速度 :収束速度を分析していない最悪ケース分析 :病的なワークロードの議論不足コールドスタート問題 :パラメータα、β、γ、δをどのように初期化するか?オンライン学習 :実行時にモデルをどのように調整するか?故障処理 :ノード障害時の動作について議論なし新しい方向を開拓 :多次元スケーリング最適化は新しい研究領域になる可能性理論的フレームワーク :スケーリング平面モデルは後続研究で拡張可能引用の可能性 :データベースとクラウドコンピューティング会議で広く引用される予想直接的な応用 :AWS、GCP、Azureの管理データベースサービスに統合可能コスト削減 :大規模展開に対する37%のコスト削減は莫大な経済価値安定性改善 :リバランス削減は運用チームに極めて魅力的利点 :アルゴリズム記述が明確、複雑度が低い課題 :CockroachDB/Redisクラスタへのアクセスが必要、パラメータ校正に専門知識が必要クラウドネイティブデータベース :Spanner、CockroachDB、YugabyteDBなど混合ワークロード :読み書き比率が変動するアプリケーションコスト敏感環境 :クラウド支出最適化が必要な企業動的負荷 :日中パターンまたは予測不可能なピークを持つシステム極小規模 :単一ノードまたは2~3ノードクラスタ(対角スケーリングの利点が不明確)静的ワークロード :負荷が完全に予測可能で一定ハードリアルタイムシステム :スケーリング操作の遅延を許容できない高度にカスタマイズされたシステム :スケーリング動作が通用モデルに適合しない6 Spanner (OSDI'12) :GoogleのグローバルPaxos分散データベース7 Dynamo (SOSP'07) :AmazonのKV高可用性ストレージ3 Bigtable (TOCS'08) :Googleの分散ストレージシステム4 CockroachDB :オープンソース分散SQLデータベース5 YCSB (SoCC'10) :クラウドサービスシステムベンチマークフレームワーク8-10 Kubernetes自動スケーリング :HPA、VPA、Cluster Autoscaler次元 評価 説明 革新性 9/10 対角スケーリングは高い独創性を持つ新概念 技術的深さ 8/10 理論導出が堅実、アルゴリズム設計が合理的 実験の質 8/10 複数システムの検証、ただし規模に限界 実用的価値 9/10 産業システムに直接適用可能 文章の質 8/10 明確だが部分的に詳細改善の余地 総合 8.4/10 優秀な論文、重要な影響を与える可能性
推奨読者 :クラウドデータベース研究者、分散システムエンジニア、クラウドプラットフォームアーキテクト、自動スケーリングシステム開発者