In this introductory chapter, we lay the groundwork for the rest of the book by providing a more detailed picture of the expected purpose, shape, and architecture of future grid systems. We structure the chapter in terms of six questions that we believe are central to this discussion: Why do we need computational grids? What types of applications will grids be used for? Who will use grids? How will grids be used? What is involved in building a grid? And, what problems must be solved to make grids commonplace? We provide an overview of each of these issues here, referring to subsequent chapters for more detailed discussion.
論文ID : 2501.01316タイトル : Computational Grids著者 : Ian Foster (アルゴンヌ国立研究所)、Carl Kesselman (南カリフォルニア大学)分類 : cs.DC (分散・並列・クラスタコンピューティング)発表時期/会議 : 1998年、Morgan Kaufmann Publishers『The Grid: Blueprint for a Future Computing Infrastructure』論文リンク : https://arxiv.org/abs/2501.01316 本章は、将来のグリッドシステムの予期される目標、形態、およびアーキテクチャの詳細な図景を提供することで、本書全体の基礎を確立している。本章は6つの中核的な問題を中心に展開している:計算グリッドがなぜ必要なのか、グリッドはどのような種類のアプリケーションに使用されるのか、誰がグリッドを使用するのか、グリッドをどのように使用するのか、グリッドの構築には何が関わるのか、そしてグリッドの普及に必要な課題は何か。
計算資源需要の増加 :計算手法がさまざまな分野で価値を実証しているにもかかわらず、コンピュータの利用はその可能性に遠く及ばない。例えば、大学の研究者は土地利用が生物多様性に与える影響を研究する際にコンピュータを広く使用しているが、都市計画者は新しい道路ルートの選択や新しい区画条例の制定時には使用していない。既存計算環境の不十分性 :今日のPCは10年前のCrayスーパーコンピュータより高速であるが、複雑な行動の結果を予測したり、多くの選択肢から選択したりするような計算集約的なタスクには依然として不十分である。リソース利用率の低さ :ほとんどのローエンドコンピュータ(PCとワークステーション)は頻繁にアイドル状態にあり、学術および商業環境での利用率は約30%であることが研究で示されている。著者は、ユーザーに大幅に増加した計算能力を提供する機会が存在すると考えている:5年以内に3桁の増加、10年以内に5桁の増加。この劇的な成長は以下のイノベーションを通じて実現される:
技術改善 :VLSI技術とマイクロプロセッサアーキテクチャの進化オンデマンドアクセス計算能力 :間欠的なニーズに対するハイエンドリソースへの信頼性の高い、即座で透過的なアクセスアイドル容量利用率の向上 :遊休計算リソースのより良い利用計算結果のより大きな共有 :気象予報などの効果的な共有新しい問題解決技術とツール :ネットワーク強化ソルバー、遠隔没入技術など計算グリッドの概念定義の提案 :計算グリッドを「高度な計算能力への信頼性の高い、一貫性のある、普遍的で廉価なアクセスを提供するハードウェアおよびソフトウェアインフラストラクチャ」と定義グリッドアプリケーション分類体系の確立 :5つの主要なグリッドアプリケーションカテゴリを識別(分散スーパーコンピューティング、高スループットコンピューティング、オンデマンドコンピューティング、データ集約型コンピューティング、協調コンピューティング)グリッドユーザー階層モデルの構築 :5つのユーザーカテゴリを定義(エンドユーザー、アプリケーション開発者、ツール開発者、グリッド開発者、システム管理者)階層的アーキテクチャフレームワークの提案 :エンドシステム、クラスタ、イントラネット、インターネットの4層アーキテクチャモデル主要な研究課題の識別 :グリッド発展が直面する技術的および非技術的課題を体系的に分析本論文の中核的なタスクは、計算グリッドという新興計算パラダイムに対して包括的な概念フレームワークおよび技術的青写真を提供することである。これには以下が含まれる:
入力:分散的で異種の計算およびストレージリソース 出力:統一された高性能計算サービス 制約:信頼性、一貫性、普遍性および経済性の要件 信頼性 :ユーザーはグリッドのさまざまなコンポーネントから予測可能で継続的かつ通常は高水準のパフォーマンス保証を必要とする一貫性 :標準的なサービス、標準的なインターフェース、および標準的なパラメータが必要普遍性 :サービスは予期される環境で常に利用可能経済性 :収入に対して廉価なアクセスを提供する必要があるカテゴリ 例 特性 分散スーパーコンピューティング DIS、恒星動力学、第一原理化学 大量のCPU、メモリなどを必要とする超大規模問題 高スループットコンピューティング チップ設計、パラメータ研究、暗号問題 アイドルリソースを利用して全体的なスループットを向上 オンデマンドコンピューティング 医療機器、ネットワークソルバー、クラウド検出 リモートリソースとローカル計算の統合 データ集約型コンピューティング スカイサーベイ、物理データ、データ同化 複数のまたは大規模なデータソースから新しい情報を合成 協調コンピューティング 協調設計、データ探索、教育 複数の参加者間の通信または協力をサポート
インターネット (集中管理の欠如、地理的分散、国際的問題)
↓
イントラネット (異種性、独立した管理、グローバル知識の欠如)
↓
クラスタ (スケール増加、統合度低下)
↓
エンドシステム (マルチスレッド、自動並列化、ローカルI/O)
電力網への類比 :計算リソース共有を電力網に類比させることを初めて体系的に行い、直感的な概念モデルを提供階層的サービスアーキテクチャ :基本サービスからアプリケーションまでの完全な階層的アーキテクチャを提案クロスドメインリソース管理 :組織境界を越えたリソース共有および管理の問題を解決パフォーマンス保証メカニズム :動的で異種の環境におけるエンドツーエンドのパフォーマンス保証を提供本論文は概念的論文であるが、著者は多くの実際のシステムおよび実験に基づいている:
ギガビットテストベッド経験 :gigabit testbeds、I-WAYネットワークなどの実験システムの経験に基づく既存システムの事例 :Condorシステム:数百台のワークステーションを管理 NEOSおよびNetSolve:ネットワーク強化数値ソルバー 分散インタラクティブシミュレーション(DIS):軍事訓練および計画 パフォーマンスデータ :ワークステーション利用率(約30%)、並列プログラムのパフォーマンス向上などの具体的なデータを引用スケーラビリティ:数千から数万のノードを処理できるか パフォーマンス:高いパフォーマンス保証を提供できるか 信頼性:動的環境での安定性 使いやすさ:異なるタイプのユーザーへの親しみやすさ アプリケーションの多様性 :成熟したグリッドインフラストラクチャが不足している場合でも、豊富な成功したアプリケーション事例が出現しているリソース需要の巨大性 :ほぼすべてのアプリケーションが計算リソース(CPU、メモリ、ディスクなど)に対する巨大な需要を示しているインタラクティビティ要件 :多くのアプリケーションはインタラクティブであるか、計算コンポーネントとの密接な同期に依存しているパフォーマンス感度 :堅牢なパフォーマンス保証を提供できるグリッドインフラストラクチャが必要AMDマイクロプロセッサ設計 :Platform Computing Corporationは、AMDがK6およびK7マイクロプロセッサ設計のピーク段階で設計検証に1000台以上のコンピュータを使用したと報告している気象予報共有 :毎日の気象予報には約10^14の数値演算が関わり、予報が10^7人に有益であると仮定すると、10^21の有効な演算に相当し、世界中のすべてのPCが毎日実行する計算量に等しい医療画像強化 :NCSAが開発した計算機強化MRI機械およびスキャニングトンネル顕微鏡は、スーパーコンピュータを使用してリアルタイム画像処理を実現しているメタコンピューティング概念 :CatlettおよびSmarrの原著論文は高性能分散計算の初期のビジョンを提供ネットワークコンピューティングの進化 :40年間、ネットワークコンピューティングは反復的な変化を経験し、基盤となる技術の各桁の改善は革命的なアプリケーションをもたらしている分散システム技術 :DCE、CORBA、DCOMなどの分散コンピューティング技術がグリッド発展の基礎を提供電力網研究:Corporation for National Research Initiativesの一連の出版物 電気通信ネットワーク:電話および電報インフラストラクチャ発展の経験 銀行システム:大規模インフラストラクチャ管理の経験 グリッドの必要性 :計算グリッドは計算能力の大幅な向上を実現するための主要な技術的経路である多様化したニーズ :異なるコミュニティは異なるタイプのグリッドを必要とし、単一の汎用グリッドは出現しない技術的実現可能性 :既存の技術発展傾向に基づいて、説明されたグリッドビジョンは技術的に実現可能である課題の複雑性 :グリッドの実現には、技術的、経済的、政治的、社会的な多面的な課題の解決が必要技術予測の不確実性 :将来の技術発展の予測には偏差の可能性がある経済モデルの欠如 :計算グリッドの経済的要因の影響はまだ十分に理解されていない政治的および制度的要因 :組織間協力の政治的および制度的課題が過小評価される可能性があるセキュリティとプライバシーの問題 :大規模なリソース共有がもたらすセキュリティ上の課題は、より深い研究が必要アプリケーション探索 :科学、工学、商業、芸術、娯楽などの分野におけるグリッド技術の応用の境界を探索プログラミングモデルの革新 :グリッド環境に適した新しいプログラミングモデルおよびツールの開発システムアーキテクチャの最適化 :複雑なパフォーマンス要件を満たすスケーラブルなシステムアーキテクチャの設計アルゴリズムおよび方法論の革新 :グリッド環境の特性に適応する新しいアルゴリズムおよび問題解決方法の開発先見的視点 :分散コンピューティングの発展傾向を正確に予見し、多くの予測は今日でも検証されている体系的フレームワーク :アプリケーション要件から技術アーキテクチャまで、体系的な分析を提供する完全な概念フレームワーク実用志向 :理論的分析だけでなく、多くの実際のシステム経験に基づいており、強い実用的価値を持つ学際的視点 :コンピュータ科学を電気工学、経済学、政治学などと組み合わせ、ユニークな視点を提供技術詳細の不足 :概念的論文として、具体的な技術実装の詳細が不足しているパフォーマンス分析の欠如 :詳細なパフォーマンスモデリングおよび分析が提供されていないセキュリティ考慮の不十分性 :大規模分散システムのセキュリティ課題に関する議論は相対的に単純標準化問題 :グリッドサービス標準化の実現方法に関する具体的な方案の議論が不十分領域基礎作用 :本論文はグリッドコンピューティング分野の理論的基礎を確立し、その後10年以上の研究方向に影響を与えた産業推進 :Globus、Legionなどの重要なグリッドミドルウェアプロジェクトの発展を推進概念伝播 :「計算グリッド」概念は広く受け入れられ、分散コンピューティングの重要なパラダイムとなった後続発展 :クラウドコンピューティング、エッジコンピューティングなどの後続技術発展に思想的基礎を提供科学計算 :大規模科学シミュレーションおよびデータ分析企業計算 :組織間のリソース共有および協力教育研究 :研究機関への計算リソースアクセス提供商業サービス :計算サービスの商業化運営論文は豊富な関連文献を引用しており、主に以下を含む:
インフラストラクチャ研究 :Amy Friedlanderによる鉄道、電気通信、電力、銀行などのインフラストラクチャ発展に関する一連の研究メタコンピューティング :C. CatlettおよびL. Smarrの開拓的な業績分散システム :DCE、CORBA、分散共有メモリなどの関連技術ネットワークコンピューティング :インターネットプロトコル、高性能ネットワーク、並列コンピューティングなどの分野における重要な業績セキュリティ技術 :Kerberos、デジタル証明書、モバイルコードセキュリティなど要約 :本論文はグリッドコンピューティング分野の基礎的な業績として、分散コンピューティングの発展傾向を正確に予見しただけでなく、より重要なことに、体系的な概念フレームワークおよび技術的青写真を提供している。技術的詳細において不足している点があるが、その先見的視点と学際的方法論により、本分野で最も影響力のある論文の一つとなっている。論文で提案された多くの概念および課題は、今日のクラウドコンピューティング、エッジコンピューティング時代においても依然として重要な指導的意義を持つ。