Разработка статистических методов анализа исторических данных загрузки hpc-систем

Инструкция по оформлению статей на конференцию ИТиС-2017

1. Статья объемом от 3 до 10 страниц формата А4 в редакторе Microsoft Word.

2. Размеры полей: левое – 2 см, правое – 2 см, верхнее – 2 см, нижнее – 2см. Шрифт TimesNewRoman, размер – 14, интервал – одинарный (для всей статьи).

3. Порядок размещения материала:

- сведения об авторах (не более трех), которые состоят из инициалов и фамилий в именительном падеже (через запятую, заглавными буквами, по центру, без точки);

- название статьи (заглавными буквами, без абзаца, по центру, без заключительной точки);

- аннотация на русском языке (не более 500 знаков);

- текст статьи (абзац 1,25, ссылки на литературу в квадратных скобках);

- иллюстрации в статье могут быть двух типов – «плавающие» – прижатые к верхнему или нижнему краю области текста, и «встроенные» – размещенные между абзацами внутри колонок текста;

- при использовании графических средств иллюстрацию выполнять как единый объект «рисунок».

- сложные формулы набирать с помощью редактора MathType. Настройки редактора формул: Full – 12pt; Subscript/Superscript – 7pt; Sub-subscript – 5pt; Symbol – 18pt; Sub-symbol – 12pt;

- литература указывается в конце основного текста с заголовком «Библиографический список», без заключительной точки, нумерация источников цифрами с точкой;

- контактная информация об авторах статьи: название организации/института/ университета (без абзаца, по центру, без точки), должность, ученое звание, электронная почта;

- фамилии и инициалы авторов, название статьи и аннотация на английском языке.

ПРИМЕР ОФОРМЛЕНИЯ СТАТЬИ

С. А. Петунин

РАЗРАБОТКА СТАТИСТИЧЕСКИХ МЕТОДОВ АНАЛИЗА ИСТОРИЧЕСКИХ ДАННЫХ ЗАГРУЗКИ HPC-СИСТЕМ

Предложена методика анализа загрузки промышленных суперкомпьютеров уровня предприятия, базирую­щаяся на оценке статистических шаблонов программных приложений.

Обеспечение эффективной загрузки ресурсов высокопроизводительных вычислительных систем напрямую связано с созданием и использованием адаптивной технологии взаимодействия техниче­ского персонала и пользователей, которая бы учи­тывала не только особенности аппаратуры вычи­слительных кластеров, но и специфику рабочей нагрузки запускаемых приложений. Построение подобной системы обработки информации, ориен­тированной на качественное проведение массовых расчетов, невозможно без хорошего понимания ста­тистических характеристик и шаблонов пользова­тельских заданий.

Большинство известных классификационных мо­делей рабочей нагрузки опирается на следующую интерпретацию [1; 2]:

- определение совокупности вычислительных заданий как объектов потребления суперкомпьютер­ных ресурсов;

- выделение групп субъектов-пользователей, ге­нерирующих эти задания и имеющих различия по активности и параметрам запрашиваемых ресурсов […] .

Для обеспечения подобной классификации необ­ходимо обязать пользователя указывать эти дополни­тельные поля при запуске задания. […]. Таким образом, предлагает­ся расширить традиционную модель кластеризации входного потока заданий на основе поведения поль­зователей следующим образом:

разработка статистических методов анализа исторических данных загрузки hpc-систем - student2.ru

где i =1, 2, …, n (n — количество кластеров);

F = <пользователь | задача | код |…> (тип фактора) методика кластеризации:

k-means и др.;

параметры вектора: <A, {Ri}, {Ki}>

A — активность по фактору (доля заданий, %);

Ri — запрашиваемые ресурсы (например, R1 — количество запрашиваемых узлов, R2 — запраши­ваемое время);

Ki — дополнительная группа параметров.

В таблице приведен пример вычисленных стати­стических характеристик ресурсной модели с па­раметрами R1 (узлы) и R2 (время выполнения) при группировке входного потока по двум категориям («пользователи» и «задачи») в 3 кластера, проведен­ной для 6-месячной выборки. Значения параметров нормализованы для проведения кластеризации. Гра­фический результат кластеризации иллюстрируется на рис. 1.

разработка статистических методов анализа исторических данных загрузки hpc-систем - student2.ru разработка статистических методов анализа исторических данных загрузки hpc-систем - student2.ru

Рис. 1. Кластеризация по ресурсной модели в категориях «пользователь» и «задача»

Полученные статистические шаблоны поведения входного потока возможно использовать:

- при выборе и тюнинге алгоритмов управления заданиями;

- для назначения единых политик распределения ресурсов для кластерных групп.

Значения нормализованных параметров
ресурсной модели кластеризации

Кластер Доля зада­ний, % mean узлы R1 sd узлы mean TRUN R2 sd TRUN
KUSER 1 1.3 0.6 0.8 0.6
KUSER 2 1.2 1.0 3.7 1.0
KUSER 3 1.5 0.8 1.4 0.9
KTASK 1 2.8 3.2 2.1 1.4
KTASK 2 3.5 3.1 4.8 5.5
KTASK 3 5.7 5.9 42.5 42.0

Существует три штатных подхода для анализа эф­фективности выполнения параллельного приложе­ния:

1) проведение профилирования своей программы самим пользователем;

2) сбор и анализ некоторых данных о выполнении программы на уровне системы мониторинга;

3) анализ временны´ х характеристик использова­ния ресурсов, сохраненных планировщиком в исто­рической базе данных […].

Применим следующую методику: в каче­стве индикаторов эффективности алгоритмов реша­телей программ определим и исследуем поведение двух параметров:

1. Доля затрат на системное время — коэффициент эффективности Kef1. Kef1 = Tsys / (Tsys + Tuser). Если его величина, находящаяся в интервале (0,1), превышает значение 0,5, это говорит о том, что более половины времени своего выполнения программа тратила на вызовы ядра операционной системы.

2. Второй индикатор показывает отношение разни­цы между потребленным вычислительным ресурсом кластера (процессорным временем TCPU) и суммой времен системной и пользовательской фазы задания, используемых в предыдущей формуле. Можно попы­таться интерпретировать это отношение как коэффи­циент «непараллельности» задания — Kef2.

Kef2 = (TCPU – (Tsys + Tuser)) / TCPU […].

Поддержка описанных выше методик анализа эф­фективности реализована в составе общих возмож­ностей аналитического программного комплекса ANTIK. Программа обеспечивает следующий основ­ной функционал:

- проведение статистического анализа времен­ных, […];

- формирование отчетов с обобщенной статисти­кой по различным группам;

- визуализацию всех статистических данных как базовых, так и консолидированных в виде различных графических представлений (рис. 3);

разработка статистических методов анализа исторических данных загрузки hpc-систем - student2.ru разработка статистических методов анализа исторических данных загрузки hpc-систем - student2.ru

Рис. 3. Определение точек перегиба масштабирования вычислительных узлов для временных метрик расчетной модели

- обеспечение интерактивности работы аналити­ка с возможностью замены и масштабирования ис­следуемых показателей непосредственно на визуали­зируемых графиках;

- проведение анализа эффективности выполнен­ных заданий с помощью специальных оценочных коэффициентов;

- унификацию и легкость импорта исторических данных планировщика slurm в систему ана­лиза из любой суперкомпьютерной системы без необходимости описания ее вычислительной кон­фигурации.

Программное обеспечение реализовано с помо­щью статистической системы программирования на базе языка R. Для построения интерфейсной части ANTIK используется веб-фреймворк shiny.

Библиографический список

1. Mishra, A. K. Towards Characterizing Cloud Back­end Workloads: Insights from Google Compute Clusters / A. K. Mishra, J. L. Hellerstein, W. Cirne, C. R. Das // ACM SIGMETRICS Performance Evaluation Review. 2010. Vol. 37, № 4. P. 34–41.

2. Moreno, I. S. Analysis, Modeling and Simulation of Workload Patterns in Large-Scale Utility Cloud / I. S. More­no, P. Garraghan, P. Townend, J. Xu // IEEE Transactions on Emerging Topics in Computing. 2014.

3. Petunin, S. A. Management of HPC Clusters: Development and Maintenance / S. A. Petunin, K. V. Ivanov, A. B. Novikov // Proc. of the 15th International Work­shop on Computer Science and Information Technologies CSIT’2013’. Vienna ; Budapest ; Bratislava, 2013. P. 43–46.

4. Петунин, С. А. Методика начального анализа ра­бочей нагрузки вычислительных кластеров / С. А. Пе­тунин // Информационные технологии и системы : тр. Четвертой Междунар. науч. конф., Банное. Россия, 25 февр. — 1 марта 2015 г. Челябинск : Изд-во Челяб. гос. ун-та, 2015. С. 129–130.

Сведения об авторе

Петунин Сергей Александрович— кандидат физико-математических наук, главный специалист Всерос­сийского научно-исследовательского института автоматики им. Н. Л. Духова, Москва. E-mail.

S. A. Petunin

Наши рекомендации