In this introductory chapter, we lay the groundwork for the rest of the book by providing a more detailed picture of the expected purpose, shape, and architecture of future grid systems. We structure the chapter in terms of six questions that we believe are central to this discussion: Why do we need computational grids? What types of applications will grids be used for? Who will use grids? How will grids be used? What is involved in building a grid? And, what problems must be solved to make grids commonplace? We provide an overview of each of these issues here, referring to subsequent chapters for more detailed discussion.
Ce chapitre pose les fondations de l'ouvrage en fournissant une description détaillée des objectifs, de la morphologie et de l'architecture attendus des futurs systèmes de grille. La section s'articule autour de six questions fondamentales : pourquoi les grilles de calcul sont-elles nécessaires ? Quels types d'applications utiliseront les grilles ? Qui utilisera les grilles ? Comment utiliser les grilles ? Que implique la construction de grilles ? Et quels problèmes doivent être résolus pour généraliser les grilles ?
Croissance des besoins en ressources de calcul : Bien que les méthodes informatiques aient prouvé leur valeur dans divers domaines, l'utilisation des ordinateurs est loin d'atteindre son potentiel. Par exemple, les chercheurs universitaires utilisent massivement les ordinateurs pour étudier l'impact de l'utilisation des terres sur la biodiversité, tandis que les urbanistes ne les utilisent pas pour choisir les tracés de nouvelles routes ou établir de nouveaux règlements de zonage.
Insuffisance de l'environnement informatique actuel : Bien que les PC d'aujourd'hui soient plus rapides que les superordinateurs Cray d'il y a dix ans, ils restent largement insuffisants pour les tâches informatiques intensives telles que la prédiction des résultats d'actions complexes ou le choix parmi de nombreuses options.
Faible taux d'utilisation des ressources : La plupart des ordinateurs bas de gamme (PC et stations de travail) sont souvent inactifs, les études montrant que le taux d'utilisation dans les environnements académiques et commerciaux est d'environ 30 %.
Les auteurs estiment qu'il existe une opportunité de fournir aux utilisateurs une augmentation spectaculaire de la puissance de calcul : une augmentation de trois ordres de grandeur en cinq ans et de cinq ordres de grandeur en dix ans. Cette croissance dramatique sera réalisée par les innovations suivantes :
Améliorations technologiques : Évolution de la technologie VLSI et de l'architecture des microprocesseurs
Accès à la demande à la puissance de calcul : Accès fiable, immédiat et transparent à des ressources haut de gamme pour les besoins intermittents
Amélioration de l'utilisation de la capacité inactive : Meilleure utilisation des ressources informatiques inactives
Partage accru des résultats de calcul : Partage efficace de résultats tels que les prévisions météorologiques
Nouvelles techniques et outils de résolution de problèmes : Solveurs renforcés par réseau, technologies d'immersion à distance, etc.
Proposition d'une définition conceptuelle de la grille de calcul : Définition de la grille de calcul comme « l'infrastructure matérielle et logicielle fournissant un accès fiable, cohérent, universel et économique à la puissance de calcul haut de gamme »
Établissement d'un système de classification des applications de grille : Identification de cinq catégories d'applications de grille (supercalcul distribué, calcul haut débit, calcul à la demande, calcul intensif en données, calcul collaboratif)
Construction d'un modèle hiérarchique d'utilisateurs de grille : Définition de cinq catégories d'utilisateurs (utilisateurs finaux, développeurs d'applications, développeurs d'outils, développeurs de grille, administrateurs système)
Proposition d'un cadre d'architecture hiérarchisée : Modèle d'architecture à quatre niveaux allant des systèmes terminaux, aux grappes, aux intranets et à Internet
Identification des défis de recherche critiques : Analyse systématique des défis techniques et non techniques auxquels fait face le développement des grilles
La tâche fondamentale de cet article est de fournir un cadre conceptuel complet et un plan technique pour le paradigme informatique émergent qu'est la grille de calcul, incluant :
Entrées : ressources de calcul et de stockage distribuées et hétérogènes
Sorties : services informatiques unifiés et haute performance
Contraintes : exigences de fiabilité, cohérence, universalité et économie
Fiabilité : Les utilisateurs ont besoin de garanties de performance prévisibles, continues et généralement élevées de la part de divers composants de la grille
Cohérence : Nécessité de services standards, d'interfaces standards et de paramètres standards
Universalité : Les services sont toujours disponibles dans l'environnement prévu
Économie : Doit fournir un accès économique par rapport aux revenus
Internet (absence de contrôle centralisé, distribution géographique, enjeux internationaux)
↓
Intranet (hétérogénéité, gestion indépendante, absence de connaissance globale)
↓
Grappe (augmentation de l'échelle, réduction du degré d'intégration)
↓
Système Terminal (multithreading, parallélisation automatique, E/S locale)
Analogie avec le réseau électrique : Première approche systématique comparant le partage des ressources informatiques au réseau électrique, fournissant un modèle conceptuel intuitif
Architecture de services hiérarchisée : Proposition d'une architecture complète en couches allant des services de base aux applications
Gestion des ressources inter-domaines : Résolution du partage et de la gestion des ressources au-delà des limites organisationnelles
Mécanismes de garantie de performance : Fourniture de garanties de performance de bout en bout dans un environnement dynamique et hétérogène
Bien que cet article soit conceptuel, les auteurs s'appuient sur une vaste expérience de systèmes et d'expériences réels :
Expérience des plateformes de test gigabit : Basée sur l'expérience de systèmes expérimentaux tels que les testbeds gigabit et le réseau I-WAY
Études de cas de systèmes existants :
Système Condor : gestion de centaines de stations de travail
NEOS et NetSolve : solveurs numériques renforcés par réseau
Simulation interactive distribuée (DIS) : entraînement et planification militaires
Données de performance : Citations de données concrètes sur l'utilisation des stations de travail (environ 30 %), l'amélioration des performances des programmes parallèles, etc.
Conception de microprocesseurs AMD : Platform Computing Corporation a rapporté qu'AMD a utilisé plus de 1 000 ordinateurs au stade de pointe de la conception des microprocesseurs K6 et K7 pour la vérification de conception
Partage des prévisions météorologiques : Les prévisions météorologiques quotidiennes impliquent environ 10^14 opérations numériques, et si l'on suppose que les prévisions bénéficient à 10^7 personnes, cela représente 10^21 opérations efficaces, équivalent au volume de calcul exécuté quotidiennement par tous les PC du monde
Amélioration de l'imagerie médicale : Les machines IRM améliorées par ordinateur et les microscopes à effet tunnel développés par le NCSA utilisent des superordinateurs pour le traitement d'images en temps réel
Concept de Métacalcul : Les articles originaux de Catlett et Smarr fournissent une vision précoce du calcul distribué haute performance
Évolution du calcul en réseau : Le calcul en réseau a connu des transformations répétées au cours de 40 ans, chaque amélioration d'un ordre de grandeur de la technologie sous-jacente apportant des applications révolutionnaires
Technologie des systèmes distribués : Les technologies informatiques distribuées telles que DCE, CORBA et DCOM jettent les bases du développement des grilles
Incertitude des prédictions technologiques : Les prédictions sur le développement technologique futur peuvent contenir des biais
Manque de modèles économiques : Les facteurs économiques affectant les grilles de calcul n'ont pas été suffisamment compris
Facteurs politiques et institutionnels : Les défis politiques et institutionnels de la coopération inter-organisationnelle pourraient être sous-estimés
Problèmes de sécurité et de confidentialité : Les défis de sécurité posés par le partage de ressources à grande échelle nécessitent une recherche plus approfondie
Exploration d'applications : Exploration des limites d'application de la technologie de grille dans les domaines scientifique, ingénierie, commercial, artistique et divertissement
Innovation des modèles de programmation : Développement de nouveaux modèles et outils de programmation adaptés à l'environnement de grille
Optimisation de l'architecture système : Conception d'architectures système scalables satisfaisant aux exigences de performance complexes
Innovation en algorithmes et méthodes : Développement de nouveaux algorithmes et méthodes de résolution de problèmes adaptés aux caractéristiques de l'environnement de grille
Vision prospective : Prédiction précise des tendances de développement du calcul distribué, avec de nombreuses prédictions validées aujourd'hui
Cadre systématique : Fourniture d'un cadre conceptuel complet avec analyse systématique des besoins d'applications à l'architecture technique
Orientation pratique : Non seulement analyse théorique, mais aussi basée sur une vaste expérience de systèmes réels, avec une forte valeur pratique
Perspective interdisciplinaire : Combinaison de l'informatique avec l'ingénierie électrique, l'économie, la science politique, etc., avec une perspective unique
Rôle fondateur du domaine : Cet article pose les fondations théoriques du domaine du calcul en grille, influençant les orientations de recherche de plus d'une décennie
Promotion industrielle : Promotion du développement de projets importants de middleware de grille tels que Globus et Legion
Diffusion conceptuelle : Le concept de « grille de calcul » est largement accepté et devient un paradigme important du calcul distribué
Développement ultérieur : Fournit une base intellectuelle pour le développement ultérieur de technologies telles que le cloud computing et l'edge computing
L'article cite une riche littérature connexe, comprenant principalement :
Recherche d'infrastructure : Série d'études d'Amy Friedlander sur le développement des infrastructures ferroviaires, de télécommunication, électrique, bancaire, etc.
Métacalcul : Travaux fondateurs de C. Catlett et L. Smarr
Systèmes distribués : Technologies connexes telles que DCE, CORBA, mémoire partagée distribuée, etc.
Calcul en réseau : Travaux importants dans les domaines des protocoles Internet, réseaux haute performance, calcul parallèle, etc.
Technologie de sécurité : Kerberos, certificats numériques, sécurité du code mobile, etc.
Résumé : En tant que travail fondateur du domaine du calcul en grille, cet article non seulement prédit avec précision les tendances de développement du calcul distribué, mais fournit également un cadre conceptuel systématique et un plan technique. Bien qu'il présente certaines insuffisances dans les détails techniques, sa vision prospective et sa approche interdisciplinaire en font l'un des articles les plus influents du domaine. De nombreux concepts et défis proposés dans cet article conservent une importance directrice significative à l'ère actuelle du cloud computing et de l'edge computing.