Понятие о виртуальной организации
Инфраструктура Грид основана на предоставлении ресурсов в общее пользование, с одной стороны, и на использовании публично доступных ресурсов, с другой. В этом плане ключевое понятие инфраструктуры Грид – виртуальная организация, в которой кооперируются как потребители, так и владельцы ресурсов. Мотивы кооперации могут быть разными. В существующих Грид-системах виртуальная организация представляет собой объединение (коллаборацию) специалистов из некоторой прикладной области, которые объединяются для достижения общей цели.
Любая ВО располагает определенным количеством ресурсов, которые предоставлены зарегистрированными в ней владельцами (некоторые ресурсы могут одновременно принадлежать нескольким ВО).
Каждая ВО самостоятельно устанавливает правила работы для своих участников, исходя из соблюдения баланса между потребностями пользователей и наличным объемом ресурсов, поэтому пользователь должен обосновать свое желание работать с Грид-системой и получить согласие управляющих органов ВО.
Грид-система является средой коллективного компьютинга, в которой каждый ресурс имеет владельца, а доступ к ресурсам открыт в разделяемом по времени и по пространству режиме множеству входящих в ВО пользователей. Виртуальная организация может образовываться динамически и иметь ограниченное время существования.
К настоящему времени существует множество ВО, входящих в различные Грид-системы. Примерами ВО, действующих в рамках проекта LCG-2 (Грид для обработки данных с ускорителя LHC), являются ВО экспериментов, которые планируется проводить на этом ускорителе: ATLAS, CMS, Alice, LHCb.
МЕСТО ПЛАНИРОВАНИЯ В АРХИТЕКТУРЕ ГРИД
Получивший общее признание способ организации программного
обеспечения грид основан на открытой архитектуре служб OGSA [6], в
соответствие с которой грид квалифицируется как программная система,
состоящая из распределенных компонентов – служб, взаимодействующих
между собой посредством стандартных, открытых и универсальных
протоколов и интерфейсов [7].
Имея в виду главным образом грид вычислительного типа, можно рассматривать его функционирование как процесс обслуживания стандартизированных запросов на выполнение вычислений, оформленных в виде заданий для общераспространенных операционных систем, причем выполнение этих заданий производится на ресурсах, которые выбираются из общего пула. Перечислим основные этапы обработки задания (рис.5):
· Планирование ресурсов. Специальная компонента программного обеспечения – планировщик выделяет из общего пула исполнительные ресурсы – те, на которых задание будет выполняться.
· Доставка исполняемых файлов и входных файлов на исполнительные ресурсы.
· Выполнение задания.
· По окончании задания доставка результирующих файлы на серверы
хранения (в частности, на рабочее место пользователя).
· Все перечисленные этапы обработки задания выполняются автоматически, без участия субъекта, выдавшего запрос (в частности, пользователя, хотя это может быть и программа), так что грид действительно представляет собой единую операционную среду.
Рис.5. Схема обработки запросов и виртуализация ресурсов
Назначение планирования – распределение ресурсов грид между заданиями. Планирование имеет два аспекта: во-первых, оно определяет исполнительные ресурсы, на которых будет выполняться каждое задание, и, во-вторых, время, когда исполнительные ресурсы отводятся тому или иному заданию. Цель планирования – обеспечить скоординированное разделение ресурсов, учитывающее как интересы пользователей, так и владельцев ресурсов. Эти интересы выражаются правилами и соглашениями, которые устанавливаются объединениями пользователей и владельцев ресурсов – виртуальными организациями. Задача планирования в грид представляет интерес как самостоятельное исследовательское направление.
Планирование в грид относится к широкому классу задач, общая постановка которых характеризуется наличием множества ресурсов, множеством их потребителей и определенными условиями выделения ресурсов потребителям. Известно, что способы планирования в зависимости от этих условий, целей планирования и других факторов, могут быть совершенно разными. Что касается постановки задачи, то в качестве ресурсов будут рассматриваться вычислительные ресурсы компьютеров
RS={RSi, i=1,…,N} – процессоры, вместе со связанными с ними оперативной и дисковой памятью. Компьютеры глобально распределены, то есть могут находиться в произвольных точках глобальной сети. В систему планирования (планировщик) от работающих независимо друг от друга пользователей поступает неограниченный во времени поток заданий Z(T)={zi (ti), i=1,2,…}, где ti – время поступления задания. Предположим, что все компьютеры однопроцессорные и выделяются заданиям в эксклюзивном режиме: в любой момент времени на компьютере выполняется не более одного задания.
Результатом планирования является последовательность аллокаций ресурсов A={Ai, i=1,2,…}. Нас интересуют такие методы планирования, способные строить точные аллокации A∈A, A=[z, IRS, tb, te], в которых определяется множество исполнительных ресурсов IRS⊆RS для выполнения задания z и временной интервал [tb,te], на который они отводятся заданию z. На этом интервале ресурсы считаются занятыми и недоступными другим заданиям.
Планирование будет детерминированным, если оно строит точные аллокации, и запуск заданий на исполнительных ресурсах осуществляется в соответствии с этими аллокациями. Для этого необходимо, чтобы:
· Характеристики среды исполнительных ресурсов отвечали требованиям задания.
· Задание могло быть доставлено на исполнительные ресурсы к моменту начала аллокации.
· Исполнительные ресурсы были к этому моменту свободны, и политика управления ресурсами не препятствовала их выделению для задания. Особенности грид делают возможность построения точных аллокаций проблематичной, и вместо этого во многих алгоритмах и практических реализациях планировщиков результатом являются аллокации, в которых некоторые элементы (исполнительные ресурсы, время начала аллокации) определены примерно, что делает планирование недетерминированным в той или иной степени. Проявляется это в серьезных дефектах обработки заданий: например, если не известно точно время начала аллокаций, то в некоторых ситуациях запуск задания вообще может не состояться – есть шанс, что задание “зависнет”.
Обстоятельства в которых происходит планирование в грид и которыми в большой степени определяется возможность построения метода планирования, обладающего свойством детерминированности: гетерогенность ресурсов; организация ресурсов; режимы использования ресурсов.