Анализ текущего состояния кластерных технологий

В настоящий момент происходит бурное развитие параллельных вычислительных систем и кластерных систем в частности. Кластерные системы занимают не последнее место по производительности (как максимальной, так и пиковой).

Одновременно с этим кластерные системы позволяют добиться приемлемой производительности при относительно небольших по сравнению с суперкомпьютерами затратах на их приобретение или построение.

В настоящее время во всём мире в связи с перспективностью данного направления предпринимаются целенаправленные усилия по развитию работ в данной области.

Недостатки кластеров

Скорость обмена между узлами зависит от используемого сетевого оборудования. Желательно использовать наиболее современное и дорогостоящее оборудование.

GRID-ЭВМ

Впервые о проекте Grid мир услышал в середине 2000 года.

Развитие архитектур информационно-вычислительных комплексов, технологий и способов обработки данных с развитием Internet эволюционирует от «монолитных», сильносвязанных многопроцессорных систем высокой и сверхвысокой производительности (кластеры) к более эффективным и перспективным распределенным системам, использующим Internet как среду совместной обработки, передачи и хранения информации. Такое направление принято именовать GRID.

Эффективное внедрение GRID-решений в повседневную практику обеспечивается лишь с достижением скоростей передачи данных в глобальных сетях, соизмеримых с современными скоростями внутримашинного обмена. Такое возможно при скоростях маршрутизации пакетов на магистральных каналах ≈106–109 пакетов/сек и передачи данных порядка 109–1012 бит/сек, то есть на скоростях, близких к терабитным.

Достижение подобных скоростей передачи данных на физическом уровне в ближайшие годы возможно. Перспективы разработки механизмов необходимой для этого сверхскоростной маршрутизации пакетов по магистральным сетям Internet следующего поколения в настоящее время определяется так называемыми λ-подходами. Лямбда-коммутация — это уплотнения каналов по длине волны в одной физической волоконно-оптической линии связи под управлением MPλS (MultiProtocol λ-Switching)–протокола маршрутизации пакетов на основе их меточной (по длине волны) коммутации.

Основными объектами исследований, связанных с распределенной обработкой данных на основе GRID-технологий, являются принципы, модели и алгоритмы, программные средства для построения подобных систем и управления ими.

Разработанные принципы, алгоритмы, программные средства позволяют объединять отдельные, соединенные коммуникационными каналами вычислительные системы в единый ресурс, обеспечивая при этом большую производительность, доступность и эффективность его использования при решении прикладных задач. В состав сетевой среды распределенных вычислений могут входить отдельные комплексы, имеющие различную архитектуру, программное обеспечение, коммуникационные средства. Для включения таких комплексов в состав распределенной системы обязательным является функционирование на ней (на управляющей машине соответствующего кластера) компонентов Globus Toolkit, библиотек MPI для Globus и менеджеров системы управления. Отдельный вычислительный комплекс может использовать собственную систему планирования заданий. В этом случае требуется реализация интерфейса процесса Jobmanager пакета Globus к конкретной системе планирования заданий (в пакет Globus уже включена поддержка таких систем планирования, как LSF, PBS, PRUN, NQE, CODINE и др.). В случае нахождения отдельного вычислительного комплекса в защищенном сетевым экраном фрагменте сети может потребоваться установка на нем программных средств туннелирования сетевого трафика (например, программы Vtune) для преодоления ограничений, устанавливаемых администраторами данного сегмента сети.

Новизна GRID заключается в том, что:

q система управления имеет распределенную гетерогенную вычислительную среду в виде иерархии менеджеров, реализующих алгоритмы управления в процессе асинхронного параллельного взаимодействия;

q система имеет оптимальное назначение параллельной задаче вычислительных ресурсов сетевой среды распределенных вычислений.

Наши рекомендации