In this introductory chapter, we lay the groundwork for the rest of the book by providing a more detailed picture of the expected purpose, shape, and architecture of future grid systems. We structure the chapter in terms of six questions that we believe are central to this discussion: Why do we need computational grids? What types of applications will grids be used for? Who will use grids? How will grids be used? What is involved in building a grid? And, what problems must be solved to make grids commonplace? We provide an overview of each of these issues here, referring to subsequent chapters for more detailed discussion.
Questo capitolo pone le fondamenta dell'intero volume, fornendo una descrizione dettagliata degli obiettivi, della morfologia e dell'architettura previsti dei futuri sistemi di griglia. La sezione si sviluppa attorno a sei questioni fondamentali: perché sono necessarie le griglie computazionali? Quali tipi di applicazioni utilizzeranno le griglie? Chi utilizzerà le griglie? Come si utilizzeranno le griglie? Cosa comporta la costruzione di una griglia? E quali problemi devono essere risolti per diffondere le griglie?
Crescita della Domanda di Risorse Computazionali: Sebbene i metodi computazionali abbiano provato il loro valore in vari settori, l'utilizzo dei computer è ancora lontano dal raggiungere il suo potenziale. Ad esempio, i ricercatori universitari utilizzano ampiamente i computer nello studio dell'impatto dell'uso del suolo sulla biodiversità, mentre gli urbanisti non li utilizzano nella scelta dei percorsi delle nuove strade o nella formulazione di nuove normative di zonizzazione.
Insufficienza degli Ambienti Computazionali Attuali: Sebbene i PC odierni siano più veloci dei supercomputer Cray di dieci anni fa, rimangono insufficienti per compiti computazionalmente intensivi come la previsione dei risultati di azioni complesse o la scelta tra numerose alternative.
Basso Tasso di Utilizzo delle Risorse: La maggior parte dei computer di fascia bassa (PC e workstation) rimane frequentemente inattiva, con studi che dimostrano un tasso di utilizzo di circa il 30% negli ambienti accademici e commerciali.
Gli autori sostengono che esista un'opportunità di fornire agli utenti un aumento significativo della capacità computazionale: tre ordini di grandezza in cinque anni, cinque ordini di grandezza in dieci anni. Questa crescita drammatica sarà realizzata attraverso le seguenti innovazioni:
Miglioramenti Tecnologici: Evoluzione della tecnologia VLSI e dell'architettura dei microprocessori
Accesso On-Demand alla Capacità Computazionale: Accesso affidabile, immediato e trasparente a risorse di fascia alta per esigenze intermittenti
Miglioramento dell'Utilizzo della Capacità Inattiva: Migliore sfruttamento delle risorse computazionali inattive
Maggiore Condivisione dei Risultati Computazionali: Condivisione efficace di risultati come le previsioni meteorologiche
Nuove Tecniche e Strumenti per la Risoluzione dei Problemi: Risolutori potenziati dalla rete, tecniche di immersione remota, ecc.
Proposta della Definizione Concettuale di Griglia Computazionale: Definisce la griglia computazionale come "l'infrastruttura hardware e software che fornisce accesso affidabile, coerente, universale ed economico a capacità computazionali di fascia alta"
Istituzione di un Sistema di Classificazione delle Applicazioni di Griglia: Identifica cinque categorie di applicazioni di griglia (supercomputing distribuito, calcolo ad alto throughput, calcolo on-demand, calcolo ad alta intensità di dati, calcolo collaborativo)
Costruzione di un Modello Gerarchico di Utenti della Griglia: Definisce cinque categorie di utenti (utenti finali, sviluppatori di applicazioni, sviluppatori di strumenti, sviluppatori di griglia, amministratori di sistema)
Proposta di un Framework Architetturale Gerarchico: Modello architetturale a quattro livelli dai sistemi terminali, ai cluster, alle intranet fino a Internet
Identificazione delle Sfide di Ricerca Critiche: Analisi sistematica delle sfide tecniche e non tecniche affrontate dallo sviluppo della griglia
Il compito fondamentale di questo articolo è fornire un framework concettuale completo e una roadmap tecnica per il nuovo paradigma computazionale della griglia computazionale, includendo:
Input: Risorse computazionali e di archiviazione distribuite e eterogenee
Output: Servizi computazionali unificati e ad alte prestazioni
Vincoli: Requisiti di affidabilità, coerenza, universalità ed economicità
Internet (mancanza di controllo centralizzato, distribuzione geografica, problematiche internazionali)
↓
Intranet (eterogeneità, gestione indipendente, mancanza di conoscenza globale)
↓
Cluster (aumento di scala, riduzione dell'integrazione)
↓
End System (multithreading, parallelizzazione automatica, I/O locale)
Analogia con la Rete Elettrica: Prima applicazione sistematica dell'analogia tra la condivisione di risorse computazionali e la rete elettrica, fornendo un modello concettuale intuitivo
Architettura di Servizi Gerarchica: Propone un'architettura completa e stratificata dai servizi di base alle applicazioni
Gestione delle Risorse Transfrontaliera: Risolve il problema della condivisione e della gestione delle risorse oltre i confini organizzativi
Meccanismi di Garanzia delle Prestazioni: Fornisce garanzie di prestazioni end-to-end in ambienti dinamici e eterogenei
Progettazione di Microprocessori AMD: Platform Computing Corporation ha riferito che AMD ha utilizzato oltre 1000 computer durante la fase di picco della progettazione e verifica dei microprocessori K6 e K7
Condivisione delle Previsioni Meteorologiche: Le previsioni meteorologiche giornaliere comportano circa 10^14 operazioni numeriche; se si assume che la previsione sia utile a 10^7 persone, si ottengono 10^21 operazioni effettive, equivalenti alla quantità di calcolo eseguita da tutti i PC del mondo in un giorno
Miglioramento dell'Imaging Medico: Le macchine MRI potenziate da computer e i microscopi a scansione tunnel sviluppati dall'NCSA utilizzano supercomputer per l'elaborazione delle immagini in tempo reale
Concetto di Metacomputing: L'articolo originale di Catlett e Smarr fornisce una visione iniziale del calcolo distribuito ad alte prestazioni
Evoluzione del Calcolo in Rete: Il calcolo in rete ha subito cambiamenti ripetuti nel corso di 40 anni, con ogni miglioramento di un ordine di grandezza nella tecnologia sottostante che porta a applicazioni rivoluzionarie
Tecnologie di Sistemi Distribuiti: DCE, CORBA, DCOM e altre tecnologie di calcolo distribuito pongono le fondamenta per lo sviluppo della griglia
Necessità della Griglia: La griglia computazionale è il percorso tecnologico chiave per realizzare un aumento significativo della capacità computazionale
Esigenze Diversificate: Comunità diverse necessitano di diversi tipi di griglie; non emergerà una singola griglia universale
Fattibilità Tecnica: Sulla base delle tendenze di sviluppo tecnologico attuali, la visione della griglia descritta è tecnicamente fattibile
Complessità delle Sfide: La realizzazione della griglia richiede la risoluzione di sfide tecniche, economiche, politiche e sociali
Esplorazione delle Applicazioni: Esplorazione dei confini dell'applicazione della tecnologia di griglia in scienza, ingegneria, commercio, arte e intrattenimento
Innovazione nei Modelli di Programmazione: Sviluppo di nuovi modelli di programmazione e strumenti adatti all'ambiente di griglia
Ottimizzazione dell'Architettura di Sistema: Progettazione di architetture di sistema scalabili che soddisfino requisiti di prestazioni complessi
Innovazione in Algoritmi e Metodi: Sviluppo di nuovi algoritmi e metodi di risoluzione dei problemi adattati alle caratteristiche dell'ambiente di griglia
Ruolo Fondativo nel Settore: Questo articolo pone le fondamenta teoriche per il campo del grid computing, influenzando la direzione della ricerca per oltre un decennio
Promozione Industriale: Ha promosso lo sviluppo di importanti progetti middleware di griglia come Globus e Legion
Diffusione del Concetto: Il concetto di "griglia computazionale" è stato ampiamente accettato, diventando un paradigma importante nel calcolo distribuito
Sviluppo Successivo: Fornisce le fondamenta concettuali per lo sviluppo di tecnologie successive come il cloud computing e l'edge computing
L'articolo cita una ricca bibliografia di letteratura correlata, principalmente includente:
Ricerca su Infrastrutture: Serie di ricerche di Amy Friedlander sullo sviluppo di ferrovie, telecomunicazioni, energia elettrica, banche e altre infrastrutture
Metacomputing: Lavori pioneristici di C. Catlett e L. Smarr
Sistemi Distribuiti: DCE, CORBA, memoria condivisa distribuita e tecnologie correlate
Calcolo in Rete: Protocolli Internet, reti ad alte prestazioni, calcolo parallelo e altri lavori importanti
Tecnologie di Sicurezza: Kerberos, certificati digitali, sicurezza del codice mobile, ecc.
Riepilogo: Come lavoro fondativo nel campo del grid computing, questo articolo non solo prevede accuratamente le tendenze di sviluppo del calcolo distribuito, ma più importante ancora, fornisce un framework concettuale sistematico e una roadmap tecnica. Sebbene presenti alcune insufficienze nei dettagli tecnici, la sua visione lungimirante e il suo approccio interdisciplinare lo rendono uno degli articoli più influenti nel settore. Molti dei concetti e delle sfide proposti rimangono di importanza significativa nell'era odierna del cloud computing e dell'edge computing.