Производительность. Программное обеспечение суперкомпьютеров
Введение
Диалектическая спираль развития компьютерных технологий совершила свой очередной виток - опять, как и десять лет назад, в соответствии с требованиями жизни, в моду входят суперкомпьютерные архитектуры. Безусловно, это уже не те монстры, которые помнят ветераны - новые технологии и требовательный рынок коммерческих применений существенно изменили облик современного суперкомпьютера, Теперь это не огромные шкафы с уникальной аппаратурой, вокруг которой колдуют шаманы от информатики, а вполне эргономичные системы с унифицированным программным обеспечением, совместимые со своими младшими собратьями. Рассмотрим основные области применения суперЭВМ и проанализируем особенности различных типов архитектур, характерных для современных суперкомпьютеров.
Что такое суперЭВМ? Оксфордский толковый словарь по вычислительной технике, изданный почти 10 лет назад, в 1986 году, сообщает, что суперкомпьютер - это очень мощная ЭВМ с производительностью свыше 10 MFLOPS (миллионов операций с плавающей запятой в секунду). Сегодня этот результат перекрывают уже не только рабочие станции, но даже, по крайней мере, по пиковой производительности, и ПК. В начале 90-х годов границу проводили уже около отметки в 300 MFLOPS. архитектура параметр применение суперкомпьютер
Однако такой подход к определению суперЭВМ не совсем корректен. Очевидно, что, современный двухпроцессорный компьютер Cray C90 любой здравомыслящий человек назовет суперЭВМ. А тем не менее, его пиковая производительность меньше 2 GFLOPS. С этим вопросом тесно связаны и ограничения (ранее - КОКОМ, теперь - Госдепартамента США) на поставку высокопроизводительных средств вычислительной техники другим странам. Компьютеры с производительностью свыше 10 000 млн. теоретических операций в сек. (MTOPS), согласно определению Госдепартамента США, считаются суперкомпьютерами.
Более корректно перечислить основные признаки, характеризующие суперЭВМ, среди которых кроме высокой производительности следует отметить:
- самый современный технологический уровень (например, GaAs-технология);
- специфические архитектурные решения, направленные на повышение быстродействия (например, наличие операций над векторами);
- цена, обычно свыше 1-2 млн. долл.
В телеконференции USENET по суперкомпьютерам в связи с быстрым прогрессом в технологии RISC-микропроцессоров и соответствующим ростом их производительности был как-то задан вопрос: когда рабочая станция превратится в суперЭВМ? На что последовал ответ: "Когда она будет стоить свыше 1 млн. долларов". Для иллюстрации можно отметить, что компьютер Cray-1 в свое время стоил около 8 млн. долларов, а анонсированные в этом году суперкомпьютеры Сгау Т90, имеющие намного более высокую производительность, - от 2.5 до 35 млн. долл. Стоимость создания суперкомпьютерной MPP-системы в проекте лаборатории Sandia Министерства энергетики США составляет около 46 млн. долларов.
С точки зрения архитектуры мини суперкомпьютеры не представляют собой некоторое особенное направление, поэтому в дальнейшем они отдельно не рассматриваются.
Глава 1 Основные понятия
Понятие суперкомпьютера
Cуперкомпьютер — вычислительная установка, ЭВМ мелкосерийного или штучного выпуска, многократно превосходящая по вычислительной мощности массово выпускаемые компьютеры, когда быстродействие измеряется в миллионах/триллионах операций в секунду. Суперкомпьютер - машина, нацеленная прежде всего на масштабные вычисления больших объемов разнородных или однородных данных, а значит на снижение времени выполнения сложных, как правило, инженерных или научных расчетов. Нужна для различных сложных задач — от предсказания прогноза погоды до моделирования ядерных взрывов или нефтескважин.
Мир суперкомпьютеров становится весьма профессиональным и технологичным. За минувшие несколько лет оказалась полностью исчерпана возможность установить рекорды путем незамысловатого объединения стандартным межсоединением немыслимого количества процессоров, в том числе графических, с затратой столь же огромного количества энергии. Об этом свидетельствуют успехи корпорации IBM, ее компьютеры BlueGene/Q заняли в 2012 году четыре почетных места в первой десятке новой версии суперкомпьютерного рейтинга Top500, в том числе и первое (а в общей сложности в Top500 попали 20 систем с этой архитектурой). Тираж — вот в чем качественное отличие Sequoia и его младших братьев от прежнего лидера, Fujitsu K Computer.
Наблюдается явный спад интереса к графическим процессорам. В компьютерной отрасли они способны обеспечить более высокую скорость решения отдельных задач, но не могут лечь в основу магистрального пути развития из-за очевидных проблем с распараллеливанием. На данный момент ускорители стоят всего в 58 машинах из Top500, из них в 53 — Nvidia Fermi, по два — IBM Cell и ATI Radeon и пока всего один — Intel MIC.
Повышенный интерес к межсоединениям на базе высокоскоростных коммутаторов. Теперь эта технология доступна не только таким крупным компаниям, как IBM, SGI и Cray, но и менее известным, среди них европейские Eurotech и Extoll, есть свои разработки в Японии, Индии и России. Подобные решения имеют стратегическое значение, а потому они не попадают в категорию «продуктов с полки», их можно либо приобрести в составе компьютера, либо разрабатывать самостоятельно. В 2010 году первые машины на коммутаторах вошли в Top 500, а сегодня их более 50, причем они занимают верхнюю часть списка.
Производительность
Производительность суперкомпьютеров чаще всего оценивается и выражается в количестве операций с плавающей точкой в секунду (FLOPS). Это связано с тем, что задачи численного моделирования, под которые и создаются суперкомпьютеры, чаще всего требуют вычислений, связанных с вещественными числами с высокой степенью точности, а не целыми числами. Поэтому для суперкомпьютеров неприменима мера быстродействия обычных компьютерных систем - количество миллионов операций в секунду (MIPS). При всей своей неоднозначности и приблизительности, оценка в флопсах позволяет легко сравнивать суперкомпьютерные системы друг с другом, опираясь на объективный критерий.
Первые суперкомпьютеры имели производительность порядка 1 кфлопс, т.е. 1000 операций с плавающей точкой в секунду. Компьютер CDC 6600, имевший производительность в 1 миллион флопсов (1 Мфлопс) был создан в 1964 году. Планка в 1 миллиард флопс (1 Гигафлопс) была преодолена суперкомпьютером NEC SX-2 в 1983 с результатом 1.3 Гфлопс. Граница в 1 триллион флопс (1 Тфлопс) была достигнута в 1996 году суперкомпьютером ASCI Red. Рубеж 1 квадриллион флопс (1 Петафлопс) был взят в 2008 году суперкомпьютером IBM Roadrunner. Сейчас ведутся работы по созданию к 2016 году экзафлопсных компьютеров, способных выполнять 1 квинтиллион операций с плавающей точкой в секунду.
Рис. 1
Финансирование
И SuperMUC и незаменимым расширение зданий LRZ, которые также включают новый центр визуализации были профинансированы одинаково федерального правительства Германии и земли Бавария. Расходы на персонал покрыты исключительно Свободного государства Бавария. Сопутствующие проекты финансируются Европейским Союзом, Федерального министерства образования и научных исследований, а также с помощью дополнительных средств сторонних производителей.
Как и его предшественники на LRZ, SuperMUC отличается от его универсальным юзабилити. Как и на предыдущих систем, многие из проектов решения проблем в области физики и гидродинамики. Совсем недавно ученые из когда-либо более других областях смогли добиться значительного прогресса в ответе на сложные научные вопросы с помощью моделирования работают на суперкомпьютерах в LRZ. Например, геофизики в университете Людвига-Максимилиана в Мюнхене уже адаптировали свои модели динамики земных недр к SuperMUC. Эта модель в настоящее время международным стандартом для моделирования других исследовательских групп по всему миру. Другие ученые исследуют например, поток крови у здоровых и поврежденных кровеносных сосудов или поток воздуха в легких.
Энергоэффективность
Потребление энергии нового компьютера создает большие финансовые и технические проблемы всех заинтересованных сторон. SuperMUC необходимо значительно меньше энергии, чем другие компьютеры сравнимой производительности. Это значительный прогресс в области энергоэффективного суперкомпьютера может быть достигнуто только потому, что процессоры и оперативную память непосредственно охлаждается с теплой водой и никакой дополнительной инфраструктуры охлаждения не требуется. Концепция охлаждения была разработана специально для IBM SuperMUC, и впервые развернут на очень большом масштабе видно на этой системе. Кроме того, процессоры Intel и система программного обеспечения, поставляемого в LRZ предложить дополнительные возможности для экономии энергии. На протяжении всех этих мер, общее потребление энергии может быть значительно уменьшена и таким образом существенный вклад в защиту климата могут быть реализованы.
"Так как он состоит из процессоров со стандартным набором команд, которые хорошо известны из ноутбуков, персональных компьютеров и серверов, SuperMUC особенно удобно для пользователя. Это делает адаптацию пользователя программного обеспечения намного легче, чем многие другие из TOP500 систем, которые только может достичь высокую производительность за счет использования специальных ускорителей, но вряд ли может быть использован для подавляющего большинства прикладных программ. ", Объясняет д-р Арндт Боде, LRZ-х Председатель.
Церемония на 20 июля, 2012
Официальный передача права собственности на SuperMUC от IBM в LRZ а также запуск операции состоится 20 июля 2012 года, совместно с 50-й годовщиной суперкомпьютерам Центра Лейбница Баварской академии наук.
Профессор Ганс Meuer, соучредитель списка TOP500 вручает сертификаты: генеральный директор IBM Германии, Мартина Koederitz и Председателю Совета LRZ, профессор Арндт Боде
(При высоком разрешении, нажмите на изображение.
Вы можете использовать это изображение именования "LRZ" в качестве источника.)
Глобальный взгляд на SuperMUC на LRZ, оказываемых на SuperMUC
(При высоком разрешении, нажмите на изображение.
Вы можете использовать это изображение именования "LRZ" в качестве источника.)
Посмотрите на IBM узел в SuperMUC ((с) IBM)
Рост пиковая производительность в LRZ
(При высоком разрешении, нажмите на изображение.
Вы можете использовать это изображение именования "LRZ" в качестве источника.)
Заключение
Сегодня в суперкомпьютерном мире наблюдается новая волна, вызванная как успехами в области микропроцессорных технологий, так и появлением нового круга задач, выходящих за рамки традиционных научно-исследовательских лабораторий. Налицо быстрый прогресс в производительности микропроцессоров RISC-архитектуры, которая растет заметно быстрее, чем производительность векторных процессоров. Например, микропроцессор HP РА-8000 отстает от Cray T90 всего примерно в два раза. В результате в ближайшее время вероятно дальнейшее вытеснение векторных суперЭВМ компьютерами, использующими RISC-микропроцессоры, такими, как, например, IBM SP2, Convex/HP SPP, DEC AlphaServer 8400, SGI POWER CHALENGE. Подтверждением этого стали результаты рейтинга ТОР500, где лидерами по числу инсталляций стали системы POWER CHALLENGE и SP2, опережающие модели ведущего производителя суперкомпьютеров - компании Cray Research.
Тем не менее, очевидна, будет продолжаться развитие векторных суперЭВМ, по крайней мере от Cray Research. Возможно, оно начинает сдерживаться из-за требований совместимости со старыми моделями. Так, не нашла потребителя система Cray-4 компании Cray Computer, имеющая характеристики конфигурации и производительность, близкие к новейшей системе Cray T90 от Cray Research при в 2 раза более низкой цене, но несовместимая с компьютерами Cray Research. В результате Cray Computer разорилась.
Успешно развиваются системы на базе MPP-архитектур, в том числе с распределенной памятью. Появление новых высокопроизводительных микропроцессоров, использующих дешевую КМОП-технологию, существенно повышает конкурентоспособность данных систем.
Введение
Диалектическая спираль развития компьютерных технологий совершила свой очередной виток - опять, как и десять лет назад, в соответствии с требованиями жизни, в моду входят суперкомпьютерные архитектуры. Безусловно, это уже не те монстры, которые помнят ветераны - новые технологии и требовательный рынок коммерческих применений существенно изменили облик современного суперкомпьютера, Теперь это не огромные шкафы с уникальной аппаратурой, вокруг которой колдуют шаманы от информатики, а вполне эргономичные системы с унифицированным программным обеспечением, совместимые со своими младшими собратьями. Рассмотрим основные области применения суперЭВМ и проанализируем особенности различных типов архитектур, характерных для современных суперкомпьютеров.
Что такое суперЭВМ? Оксфордский толковый словарь по вычислительной технике, изданный почти 10 лет назад, в 1986 году, сообщает, что суперкомпьютер - это очень мощная ЭВМ с производительностью свыше 10 MFLOPS (миллионов операций с плавающей запятой в секунду). Сегодня этот результат перекрывают уже не только рабочие станции, но даже, по крайней мере, по пиковой производительности, и ПК. В начале 90-х годов границу проводили уже около отметки в 300 MFLOPS. архитектура параметр применение суперкомпьютер
Однако такой подход к определению суперЭВМ не совсем корректен. Очевидно, что, современный двухпроцессорный компьютер Cray C90 любой здравомыслящий человек назовет суперЭВМ. А тем не менее, его пиковая производительность меньше 2 GFLOPS. С этим вопросом тесно связаны и ограничения (ранее - КОКОМ, теперь - Госдепартамента США) на поставку высокопроизводительных средств вычислительной техники другим странам. Компьютеры с производительностью свыше 10 000 млн. теоретических операций в сек. (MTOPS), согласно определению Госдепартамента США, считаются суперкомпьютерами.
Более корректно перечислить основные признаки, характеризующие суперЭВМ, среди которых кроме высокой производительности следует отметить:
- самый современный технологический уровень (например, GaAs-технология);
- специфические архитектурные решения, направленные на повышение быстродействия (например, наличие операций над векторами);
- цена, обычно свыше 1-2 млн. долл.
В телеконференции USENET по суперкомпьютерам в связи с быстрым прогрессом в технологии RISC-микропроцессоров и соответствующим ростом их производительности был как-то задан вопрос: когда рабочая станция превратится в суперЭВМ? На что последовал ответ: "Когда она будет стоить свыше 1 млн. долларов". Для иллюстрации можно отметить, что компьютер Cray-1 в свое время стоил около 8 млн. долларов, а анонсированные в этом году суперкомпьютеры Сгау Т90, имеющие намного более высокую производительность, - от 2.5 до 35 млн. долл. Стоимость создания суперкомпьютерной MPP-системы в проекте лаборатории Sandia Министерства энергетики США составляет около 46 млн. долларов.
С точки зрения архитектуры мини суперкомпьютеры не представляют собой некоторое особенное направление, поэтому в дальнейшем они отдельно не рассматриваются.
Глава 1 Основные понятия
Понятие суперкомпьютера
Cуперкомпьютер — вычислительная установка, ЭВМ мелкосерийного или штучного выпуска, многократно превосходящая по вычислительной мощности массово выпускаемые компьютеры, когда быстродействие измеряется в миллионах/триллионах операций в секунду. Суперкомпьютер - машина, нацеленная прежде всего на масштабные вычисления больших объемов разнородных или однородных данных, а значит на снижение времени выполнения сложных, как правило, инженерных или научных расчетов. Нужна для различных сложных задач — от предсказания прогноза погоды до моделирования ядерных взрывов или нефтескважин.
Мир суперкомпьютеров становится весьма профессиональным и технологичным. За минувшие несколько лет оказалась полностью исчерпана возможность установить рекорды путем незамысловатого объединения стандартным межсоединением немыслимого количества процессоров, в том числе графических, с затратой столь же огромного количества энергии. Об этом свидетельствуют успехи корпорации IBM, ее компьютеры BlueGene/Q заняли в 2012 году четыре почетных места в первой десятке новой версии суперкомпьютерного рейтинга Top500, в том числе и первое (а в общей сложности в Top500 попали 20 систем с этой архитектурой). Тираж — вот в чем качественное отличие Sequoia и его младших братьев от прежнего лидера, Fujitsu K Computer.
Наблюдается явный спад интереса к графическим процессорам. В компьютерной отрасли они способны обеспечить более высокую скорость решения отдельных задач, но не могут лечь в основу магистрального пути развития из-за очевидных проблем с распараллеливанием. На данный момент ускорители стоят всего в 58 машинах из Top500, из них в 53 — Nvidia Fermi, по два — IBM Cell и ATI Radeon и пока всего один — Intel MIC.
Повышенный интерес к межсоединениям на базе высокоскоростных коммутаторов. Теперь эта технология доступна не только таким крупным компаниям, как IBM, SGI и Cray, но и менее известным, среди них европейские Eurotech и Extoll, есть свои разработки в Японии, Индии и России. Подобные решения имеют стратегическое значение, а потому они не попадают в категорию «продуктов с полки», их можно либо приобрести в составе компьютера, либо разрабатывать самостоятельно. В 2010 году первые машины на коммутаторах вошли в Top 500, а сегодня их более 50, причем они занимают верхнюю часть списка.
Производительность. Программное обеспечение суперкомпьютеров
Производительность
Производительность суперкомпьютеров чаще всего оценивается и выражается в количестве операций с плавающей точкой в секунду (FLOPS). Это связано с тем, что задачи численного моделирования, под которые и создаются суперкомпьютеры, чаще всего требуют вычислений, связанных с вещественными числами с высокой степенью точности, а не целыми числами. Поэтому для суперкомпьютеров неприменима мера быстродействия обычных компьютерных систем - количество миллионов операций в секунду (MIPS). При всей своей неоднозначности и приблизительности, оценка в флопсах позволяет легко сравнивать суперкомпьютерные системы друг с другом, опираясь на объективный критерий.
Первые суперкомпьютеры имели производительность порядка 1 кфлопс, т.е. 1000 операций с плавающей точкой в секунду. Компьютер CDC 6600, имевший производительность в 1 миллион флопсов (1 Мфлопс) был создан в 1964 году. Планка в 1 миллиард флопс (1 Гигафлопс) была преодолена суперкомпьютером NEC SX-2 в 1983 с результатом 1.3 Гфлопс. Граница в 1 триллион флопс (1 Тфлопс) была достигнута в 1996 году суперкомпьютером ASCI Red. Рубеж 1 квадриллион флопс (1 Петафлопс) был взят в 2008 году суперкомпьютером IBM Roadrunner. Сейчас ведутся работы по созданию к 2016 году экзафлопсных компьютеров, способных выполнять 1 квинтиллион операций с плавающей точкой в секунду.