In this introductory chapter, we lay the groundwork for the rest of the book by providing a more detailed picture of the expected purpose, shape, and architecture of future grid systems. We structure the chapter in terms of six questions that we believe are central to this discussion: Why do we need computational grids? What types of applications will grids be used for? Who will use grids? How will grids be used? What is involved in building a grid? And, what problems must be solved to make grids commonplace? We provide an overview of each of these issues here, referring to subsequent chapters for more detailed discussion.
Данная глава закладывает основу для всей книги, предоставляя детальное описание ожидаемых целей, характеристик и архитектуры будущих систем сеток. Раздел организован вокруг шести ключевых вопросов: почему необходимы вычислительные сетки? Какие типы приложений будут использовать сетки? Кто будет использовать сетки? Как использовать сетки? Что включает в себя построение сеток? И какие проблемы необходимо решить для массового распространения сеток?
Растущие требования к вычислительным ресурсам: Несмотря на доказанную ценность вычислительных методов во всех областях, использование компьютеров далеко не достигло своего потенциала. Например, университетские исследователи активно используют компьютеры при изучении влияния землепользования на биоразнообразие, однако городские планировщики не используют их при выборе маршрутов новых дорог или разработке новых норм зонирования.
Недостаточность существующей вычислительной среды: Хотя современные персональные компьютеры быстрее суперкомпьютеров Cray десятилетней давности, они всё ещё недостаточны для вычислительно интенсивных задач, таких как прогнозирование результатов сложных действий или выбор из множества вариантов.
Низкий коэффициент использования ресурсов: Большинство маломощных компьютеров (персональные компьютеры и рабочие станции) часто находятся в режиме простоя; исследования показывают, что коэффициент использования в академической и коммерческой среде составляет примерно 30%.
Авторы полагают, что существует возможность предоставить пользователям значительное увеличение вычислительной мощности: увеличение на три порядка в течение пяти лет и на пять порядков в течение десяти лет. Такой драматический рост будет достигнут благодаря следующим инновациям:
Технологические улучшения: Эволюция технологии VLSI и архитектуры микропроцессоров
Доступ к вычислительной мощности по требованию: Надёжный, немедленный и прозрачный доступ к высокопроизводительным ресурсам для периодических потребностей
Повышение использования неиспользуемой ёмкости: Лучшее использование простаивающих вычислительных ресурсов
Большее совместное использование вычислительных результатов: Эффективное совместное использование результатов, таких как прогнозы погоды
Новые методы и инструменты решения проблем: Сетевые улучшенные решатели, технологии удалённой иммерсии и т.д.
Предложено определение концепции вычислительной сетки: Вычислительная сетка определяется как «аппаратное и программное обеспечение, обеспечивающее надёжный, согласованный, универсальный и экономичный доступ к высокопроизводительным вычислительным возможностям»
Установлена система классификации приложений сеток: Выявлены пять основных категорий приложений сеток (распределённые суперкомпьютерные вычисления, высокопроизводительные вычисления, вычисления по требованию, вычисления, интенсивные по данным, совместные вычисления)
Построена иерархическая модель пользователей сеток: Определены пять категорий пользователей (конечные пользователи, разработчики приложений, разработчики инструментов, разработчики сеток, системные администраторы)
Предложена иерархическая архитектурная структура: Четырёхуровневая архитектурная модель от конечных систем, кластеров, интранетов к интернету
Выявлены ключевые исследовательские вызовы: Систематический анализ технических и нетехнических вызовов, стоящих перед развитием сеток
Основная задача данной работы — предоставить комплексную концептуальную структуру и технический план для новой парадигмы вычислений — вычислительных сеток, включая:
Входные данные: распределённые, гетерогенные вычислительные и запоминающие ресурсы
Выходные данные: унифицированные, высокопроизводительные вычислительные услуги
Ограничения: требования надёжности, согласованности, универсальности и экономичности
Интернет (отсутствие централизованного управления, географическое распределение, международные проблемы)
↓
Интранет (гетерогенность, независимое управление, отсутствие глобального знания)
↓
Кластер (увеличение масштаба, снижение степени интеграции)
↓
Конечная система (многопоточность, автоматическая параллелизация, локальный ввод-вывод)
Аналогия с электросетью: Первый систематический анализ совместного использования вычислительных ресурсов по аналогии с электросетью, предоставляющий интуитивную концептуальную модель
Иерархическая архитектура услуг: Предложена полная иерархическая архитектура от базовых услуг к приложениям
Управление ресурсами в кросс-доменной среде: Решение проблемы совместного использования и управления ресурсами через границы организаций
Механизмы гарантии производительности: Обеспечение сквозных гарантий производительности в динамичной, гетерогенной среде
Хотя это концептуальная статья, авторы основываются на обширном опыте реальных систем и экспериментов:
Опыт работы с гигабитными тестовыми платформами: Основано на опыте работы с экспериментальными системами, такими как gigabit testbeds и сеть I-WAY
Примеры существующих систем:
Система Condor: управление сотнями рабочих станций
NEOS и NetSolve: сетевые улучшенные численные решатели
Распределённое интерактивное моделирование (DIS): военное обучение и планирование
Данные производительности: Ссылки на конкретные данные об использовании рабочих станций (примерно 30%), повышении производительности параллельных программ и т.д.
Разнообразие приложений: Даже при отсутствии зрелой инфраструктуры сеток уже появилось множество успешных примеров приложений
Огромные требования к ресурсам: Почти все приложения демонстрируют огромные потребности в вычислительных ресурсах (CPU, памяти, дисковом пространстве и т.д.)
Требования к интерактивности: Многие приложения являются интерактивными или зависят от тесной синхронизации с вычислительными компонентами
Чувствительность к производительности: Требуется инфраструктура сеток, способная обеспечивать надёжные гарантии производительности
Проектирование микропроцессоров AMD: Platform Computing Corporation сообщила, что AMD использовала более 1000 компьютеров для верификации проектирования микропроцессоров K6 и K7 на пиковом этапе разработки
Совместное использование прогнозов погоды: Ежедневный прогноз погоды включает примерно 10^14 численных операций; если предположить, что прогноз полезен для 10^7 человек, то это составляет 10^21 эффективных операций, что эквивалентно объёму вычислений, выполняемых всеми персональными компьютерами в мире за день
Улучшение медицинской визуализации: Компьютерные улучшенные МРТ-машины и сканирующие туннельные микроскопы, разработанные в NCSA, используют суперкомпьютеры для обработки изображений в реальном времени
Концепция Metacomputing: Оригинальные статьи Кэтлетта и Смарра предоставили раннее видение высокопроизводительных распределённых вычислений
Эволюция сетевых вычислений: За 40 лет сетевые вычисления претерпели повторяющиеся преобразования, каждое из которых приносило революционные приложения благодаря порядковому улучшению базовых технологий
Технологии распределённых систем: DCE, CORBA, DCOM и другие технологии распределённых вычислений заложили основу для развития сеток
Неопределённость технологических прогнозов: Прогнозы развития будущих технологий могут содержать отклонения
Отсутствие экономических моделей: Экономические факторы, влияющие на вычислительные сетки, ещё недостаточно изучены
Политические и институциональные факторы: Политические и институциональные вызовы кросс-организационного сотрудничества могут быть недооценены
Проблемы безопасности и конфиденциальности: Проблемы безопасности, возникающие при крупномасштабном совместном использовании ресурсов, требуют более глубокого исследования
Дальновидное видение: Точное предвидение тенденций развития распределённых вычислений; многие прогнозы подтверждены в наши дни
Систематическая структура: Предоставляет комплексную концептуальную структуру с систематическим анализом от требований приложений до технической архитектуры
Практическая ориентация: Не только теоретический анализ, но и основано на обширном опыте реальных систем с высокой практической ценностью
Междисциплинарная перспектива: Объединяет компьютерные науки с электротехникой, экономикой, политологией и другими дисциплинами; уникальная перспектива
Роль основания для области: Эта статья заложила теоретические основы области сетевых вычислений и повлияла на направления исследований более чем десяти лет
Продвижение в промышленности: Способствовала развитию важных проектов сетевого промежуточного программного обеспечения, таких как Globus и Legion
Распространение концепций: Концепция «вычислительной сетки» получила широкое признание и стала важной парадигмой распределённых вычислений
Последующее развитие: Предоставила идеологическую основу для последующего развития технологий облачных вычислений, граничных вычислений и т.д.
Статья цитирует богатую литературу, основные категории которой включают:
Исследования инфраструктуры: Серия исследований Эми Фридлендер о развитии железных дорог, телекоммуникаций, электроэнергии, банковской системы и другой инфраструктуры
Metacomputing: Пионерские работы К. Кэтлетта и Л. Смарра
Распределённые системы: Соответствующие технологии DCE, CORBA, распределённой общей памяти и т.д.
Сетевые вычисления: Важные работы в области интернет-протоколов, высокопроизводительных сетей, параллельных вычислений и т.д.
Технологии безопасности: Kerberos, цифровые сертификаты, безопасность мобильного кода и т.д.
Резюме: Как основополагающая работа в области сетевых вычислений, эта статья не только точно предвидела тенденции развития распределённых вычислений, но, что более важно, предоставила систематическую концептуальную структуру и технический план. Хотя в технических деталях имеются некоторые недостатки, её дальновидное видение и междисциплинарный подход делают её одной из наиболее влиятельных статей в этой области. Многие концепции и вызовы, предложенные в статье, остаются актуальными и имеют важное руководящее значение в эпоху облачных вычислений и граничных вычислений.