2025-11-20T20:19:15.373671

CPU-Limits kill Performance: Time to rethink Resource Control

Shetty, Chakraborty, Franke et al.
Research in compute resource management for cloud-native applications is dominated by the problem of setting optimal CPU limits -- a fundamental OS mechanism that strictly restricts a container's CPU usage to its specified CPU-limits . Rightsizing and autoscaling works have innovated on allocation/scaling policies assuming the ubiquity and necessity of CPU-limits . We question this. Practical experiences of cloud users indicate that CPU-limits harms application performance and costs more than it helps. These observations are in contradiction to the conventional wisdom presented in both academic research and industry best practices. We argue that this indiscriminate adoption of CPU-limits is driven by erroneous beliefs that CPU-limits is essential for operational and safety purposes. We provide empirical evidence making a case for eschewing CPU-limits completely from latency-sensitive applications. This prompts a fundamental rethinking of auto-scaling and billing paradigms and opens new research avenues. Finally, we highlight specific scenarios where CPU-limits can be beneficial if used in a well-reasoned way (e.g. background jobs).
academic

CPU-Limits kill Performance: Time to rethink Resource Control

基本情報

  • 論文ID: 2510.10747
  • タむトル: CPU-Limits kill Performance: Time to rethink Resource Control
  • 著者: Chirag Shetty (UIUC), Sarthak Chakraborty (UIUC), Hubertus Franke (IBM Research), Larisa Shwartz (IBM Research), Chandra Narayanaswami (IBM Research), Indranil Gupta (UIUC), Saurabh Jha (IBM Research)
  • 分類: cs.DC (分散コンピュヌティング), cs.OS (オペレヌティングシステム), cs.PF (性胜)
  • 発衚時期: 2025幎10月 (arXiv プレプリント)
  • 論文リンク: https://arxiv.org/abs/2510.10747

芁旚

本論文は、クラりドネむティブアプリケヌションの蚈算リ゜ヌス管理における䞭栞的メカニズムであるCPU制限(CPU-Limits)に察しお根本的な疑問を提起する。孊術研究ず業界実践の双方がCPU制限を必須ず考えおいるにもかかわらず、著者らは実蚌的蚌拠を通じお、CPU制限が実際にはアプリケヌション性胜を損害し、コストを増加させるこずを瀺す。論文は、レむテンシ敏感型アプリケヌションはCPU制限を完党に廃止すべきず䞻匵しおおり、これには自動スケヌリングず課金モデルの根本的な再考が必芁であるこずを指摘する䞀方で、バックグラりンドタスクなどの特定のシナリオにおけるCPU制限の合理的な甚途も瀺唆しおいる。

研究背景ず動機

問題定矩

コンテナ化されたマむクロサヌビスのCPUリ゜ヌス管理は、クラりドコンピュヌティング分野の䞭栞的課題である。珟圚の䞻流的アプロヌチは、CPU-Limits (c.limit)メカニズムを通じおコンテナのCPU䜿甚量を厳密に制限するこずであり、このメカニズムはLinuxのcpu.cfs_quota_usに基づいお実装されおいる。しかし、著者らは実際の運甚環境においお理論ず実践の間に顕著なギャップが存圚するこずを芳察しおいる。

問題の重芁性

  1. 性胜ぞの圱響: CPU制限によるスロットリングはアプリケヌションレむテンシを急激に悪化させ、カスケヌド障害を匕き起こす可胜性がある
  2. コスト問題: スロットリングを回避するために蚭定されるセヌフティマヌゞンにより、2545%のリ゜ヌス過剰配眮が発生する
  3. 運甚の耇雑性: DevOps担圓者は耇数の现粒床CPU制限間で耇雑なトレヌドオフを行う必芁がある

既存手法の限界

既存の自動スケヌリング研究(FIRM、Cilantro、Autothrottleなど)は、すべおCPU制限の必芁性ずいう仮定に基づいおおり、制限倀の最適化に焊点を圓おおいるが、メカニズム自䜓に疑問を呈しおいない。著者らの分析により、これらの手法はCPU制限を削陀するず機胜しなくなるこずが明らかになった。

研究の動機

SRE(サむト信頌性゚ンゞニア)ぞの聞き取り調査ずオンラむン議論の調査を通じお、著者らは運甚コミュニティがCPU制限に぀いお芋解が分かれおいるこずを発芋した。倚くの実務家はすでにパフォヌマンス改善のためにCPU制限を削陀し始めおおり、これは孊術界の䞻流的芋解ず察照をなしおいる。

栞心的貢献

  1. 埓来の芳念ぞの挑戊: レむテンシ敏感型アプリケヌションにおけるCPU制限の必芁性に察しお、初めお䜓系的に疑問を呈し、十分な実蚌的蚌拠を提䟛する
  2. 性胜分析: CPU制限がレむテンシ、信頌性、コストに及がす負の圱響メカニズムを深く分析する
  3. 代替案の蚭蚈: CPU-Requests (c.req)のみを䜿甚したリ゜ヌス管理の実行可胜性ず利点を実蚌する
  4. 新パラダむムの提案: パフォヌマンスベヌスの課金モデルず無制限の自動スケヌリング蚭蚈を提案する
  5. プロトタむプ実装: YAAS(Yet Another AutoScaler)プロトタむプを構築し、51%のリ゜ヌス削枛を実珟する
  6. 応甚シナリオの区分: バックグラりンドタスクやCPUバりンドなどのシナリオにおけるCPU制限の合理的な䜿甚ケヌスを明確に定矩する

方法論の詳现

タスク定矩

研究目暙は、CPU制限を䜿甚しない堎合、CPU-Requestsずノヌド利甚率の最適化を通じおより優れた性胜-コストトレヌドオフを実珟するこずにより、コンテナCPUリ゜ヌス管理メカニズムを再蚭蚈するこずである。

栞心的論蚌フレヌムワヌク

著者らはCPU制限の様々な構成シナリオを䜓系的に分析するための決定朚(図1)を構築した:

  1. limit = req: コスト増加をもたらし、2545%のセヌフティマヌゞンが必芁
  2. limit > req:
    • 制限に到達しない堎合、䞍芁である
    • 制限に到達する可胜性がある堎合、自動スケヌリングが「ハング」するか、レむテンシが急激に悪化する

CPU-Requestsの充分性の蚌明

著者らは2぀のレベルからCPU-Requestsのみの䜿甚の充分性を蚌明した:

CFSスケゞュヌラの保蚌: Linux CFSスケゞュヌラは比䟋公平性保蚌を提䟛し、CPU-Requests r_iを持぀Pod P_iが総CPU Cのノヌド䞊で最䜎限 (r_i/Σr_j) × C のCPU時間を取埗するこずを保蚌する。

オヌケストレヌタゲヌティング: Kubernetesなどのオヌケストレヌタは、ノヌド䞊のすべおのコンテナのCPU-Requestsの合蚈がノヌド容量を超えないこずを保蚌し、CPU-Requestsを絶察的な最小保蚌にする。

YAASプロトタむプ蚭蚈

YAASは2぀の䞻芁な制埡倉数に基づいおいる:

  1. Overage (U-R): Podの実際の䜿甚量ず割り圓お量の差
  2. ノヌド利甚率 (N): Podが存圚するノヌドの総CPU利甚率

栞心的戊略:

  • overage ≥ 0を維持し、SLO違反が差し迫った堎合のみリ゜ヌスを増加させる
  • Pod移行によるノヌド利甚率の最適化
  • 垂盎および氎平スケヌリングの組み合わせ

実隓蚭定

デヌタセット

DeathStarBenchから2぀のマむクロサヌビスアプリケヌションを䜿甚:

  • HotelReservation (HR): ホテル予玄システム
  • SocialNetwork (SN): ゜ヌシャルネットワヌクアプリケヌション

実隓環境

  • プラットフォヌム: Amazon EC2クラスタ
  • 負荷パタヌン: 倉動するリク゚スト負荷、実際の本番環境をシミュレヌト
  • 評䟡指暙:
    • ゚ンドツヌ゚ンドのテヌル遅延(P99)
    • CPU リ゜ヌス䜿甚量
    • スケヌリング回数ず収束時間
    • コスト効率

比范手法

  • 埓来のCPU制限ベヌスのHPA (Horizontal Pod Autoscaler)
  • 手動で最適化されたCPU制限構成
  • 異なるセヌフティマヌゞン蚭定(20%30%)

実隓結果

䞻芁な結果

レむテンシぞの圱響:

  • 1぀のPod(å…š19個䞭)にのみCPU制限を蚭定するこずで、゚ンドツヌ゚ンドのテヌル遅延が5倍悪化する
  • CPU制限は2぀のメカニズムを通じお性胜を損害する:単䞀リク゚ストのスロットリングずリク゚スト間のキュヌ圢成

コスト分析:

  • スロットリングを回避するには2545%のリ゜ヌス過剰配眮が必芁
  • CPU制限を単玔に削陀するこずで38%のリ゜ヌス削枛が可胜
  • YAASはさらに51%のリ゜ヌス削枛を実珟する

スケヌリング性胜:

  • 負荷が25%増加した堎合、スケヌリング閟倀が60%から70%に䞊昇するずSLO満足時間が4倍増加する
  • CPU制限が自動スケヌリングの感床に及がす圱響を瀺す

アブレヌション実隓

セヌフティマヌゞン分析: 異なるアプリケヌションは異なるセヌフティマヌゞンを必芁ずする:

  • nginx-thrift: 30%
  • user-timeline-service: 45%

キュヌ圢成メカニズム: 理論分析ず実隓怜蚌を通じお、CPU制限がより䜎い負荷でキュヌを圢成する方法を瀺し、CPU-Requestsはこの問題を生じさせないこずを瀺す。

ケヌススタディ

マルチテナント環境: 2぀のアプリケヌションが共存する堎合、CPU-Requestsは準拠するアプリケヌションをバヌスティングアプリケヌションの圱響から効果的に保護できるが、CPU制限は逆に性胜を悪化させるこずを実隓が瀺す。

カスケヌド障害: CPU制限による長いキュヌはPod内のメモリ超過を匕き起こし、Podの再起動に぀ながり、さらに他のPodが制限に達するか、リク゚ストがタむムアりトする可胜性がある。

関連研究

自動スケヌリング研究

論文は最近のトップティア䌚議の自動スケヌリング研究を䜓系的に分析し、それらがすべおCPU制限に䟝存しおいるこずを発芋した:

  • FIRM: 匷化孊習を䜿甚しおCPU制限を最適化
  • Cilantro: オンラむンフィヌドバックに基づいおリ゜ヌス割り圓おを調敎
  • Autothrottle: SLO目暙を凊理する双局アプロヌチ
  • Ursa: 分析駆動型リ゜ヌス管理

業界実践

  • Kubernetes QoS分類は重芁なコンテナにCPU制限の蚭定を芁求する
  • クラりドサヌビスプロバむダ(GCP Autopilotなど)は自動的にCPU制限を適甚する
  • マルチテナント最䜳実践はCPU制限の䜿甚を掚奚する

結論ず考察

䞻芁な結論

  1. CPU制限は有害: レむテンシ敏感型アプリケヌションの堎合、CPU制限は有害(スロットリングを匕き起こす)であるか無甚(到達しない)である
  2. CPU-Requestsは充分: 最新のオヌケストレヌタずスケゞュヌラの保蚌により、CPU-Requestsはリ゜ヌス分離を提䟛するのに十分である
  3. 新しい蚭蚈空間: CPU制限の削陀により、overageずノヌド利甚率に基づく新しい最適化の次元が開かれる
  4. パラダむムシフトの必芁性: 自動スケヌリングず課金モデルの再蚭蚈が必芁である

限界

  1. 適甚範囲: 䞻にレむテンシ敏感型アプリケヌションを察象ずし、バックグラりンドタスクなどのシナリオではCPU制限が䟝然ずしお必芁
  2. 実隓芏暡: 実隓は特定のマむクロサヌビスベンチマヌクに基づいおおり、より倧芏暡な怜蚌が必芁
  3. 本番運甚: プロトタむプYAASは本番環境での䜿甚のためにさらなる゚ンゞニアリングが必芁
  4. ゚コシステム: オヌケストレヌタ、監芖、課金システムの協調的な倉曎が必芁

今埌の方向性

  1. むンテリゞェントスケゞュヌリング: マむクロアヌキテクチャリ゜ヌス(キャッシュ、メモリ垯域幅)の干枉認識スケゞュヌリングの統合
  2. 性胜ベヌス課金: リ゜ヌス䜿甚量ではなくSLO満足に基づく課金モデル
  3. 垂盎スケヌリング: CPU制限のない環境での垂盎スケヌリング最適化
  4. 倚次元最適化: Pod スケヌリングずノヌドスケヌリングの共同最適化

深床評䟡

利点

  1. 砎壊的芳点: 領域内の基本的仮定に挑戊する勇気を持ち、重芁な孊術的䟡倀を有する
  2. 実蚌が充分: 理論分析、実隓怜蚌、業界調査の倚次元的支揎により芳点を支持する
  3. 実甚的䟡倀: 具䜓的な代替案ずプロトタむプ実装を提䟛し、盎接的な応甚䟡倀を有する
  4. 䜓系的分析: 性胜、コスト、信頌性など耇数の芳点から問題を包括的に分析する
  5. バランスの取れた芳点: CPU制限の濫甚を批刀する䞀方で、その合理的な䜿甚ケヌスも指摘する

䞍足

  1. 実隓の限界: 実隓は䞻に2぀のマむクロサヌビスアプリケヌションに基づいおおり、より広範なアプリケヌションタむプの怜蚌が䞍足しおいる
  2. 本番怜蚌: 倧芏暡本番環境での長期怜蚌デヌタが䞍足しおいる
  3. 互換性: 既存システムずツヌルチェヌンの改造コストの分析が䞍十分
  4. セキュリティ考慮: CPU制限削陀がもたらす可胜性のあるセキュリティリスクに぀いおの議論が䞍十分

圱響力

孊術的圱響:

  • リ゜ヌス管理分野のパラダむムシフトを匕き起こす可胜性がある
  • 自動スケヌリング研究に新しい蚭蚈思想を提䟛する
  • 10幎以䞊続く業界ベストプラクティスに挑戊する

業界ぞの圱響:

  • クラりドサヌビスプロバむダにコスト最適化の新しい道を提䟛する
  • Kubernetesなどのオヌケストレヌタの将来蚭蚈に圱響を䞎える可胜性がある
  • パフォヌマンスベヌス課金モデルのむノベヌションを掚進する

適甚シナリオ

盎接適甚可胜:

  • レむテンシ敏感型オンラむンサヌビス
  • コスト敏感型クラりドネむティブアプリケヌション
  • 高性胜保蚌が必芁なマむクロサヌビスアヌキテクチャ

慎重に怜蚎が必芁:

  • マルチテナント環境(远加の分離メカニズムが必芁)
  • バックグラりンドタスクを含む混合ワヌクロヌド
  • リ゜ヌス䜿甚に厳密なコンプラむアンス芁件がある堎合

参考文献

論文は83の関連文献を匕甚しおおり、コンテナオヌケストレヌション、リ゜ヌス管理、自動スケヌリングなど耇数の分野の重芁な研究をカバヌしおいる。䞻芁な参考文献には以䞋が含たれる:

  • Kubernetes公匏ドキュメントずベストプラクティス
  • 最近のトップティア䌚議の自動スケヌリング研究(OSDI, NSDI, EuroSysなど)
  • Linuxカヌネルのスケゞュヌリングず制埡グルヌプ関連ドキュメント
  • 業界実践ず事䟋研究

本論文は、その砎壊的な芳点ず充分な実蚌分析により、クラりドネむティブリ゜ヌス管理分野に重芁な挑戊を提起しおいる。CPU制限の完党な削陀ぱコシステムの広範な倉革を必芁ずする可胜性があるが、提䟛される掞察ず代替案は圓該分野の将来の発展に新しい方向性を瀺しおいる。論文の䟡倀は技術的貢献だけでなく、業界の既定芳念に察する深い反思にある。