Анализ надежности работы систем с холодным резервированием
Резервирование является мощным средством повышения надежности информационных систем. Существуют различные способы включения резервной аппаратуры [3]:
постоянное резервирование;
резервирование замещением.
При резервирование замещением резервные единицы замещают основные только после их отказа. Различают три режима работы при резервирование замещением:
1) нагруженный или горячий резерв;
2) облегченный или теплый резерв;
3) ненагруженный или холодный резерв.
Холодный резерв имеет следующие преимущества:
-сохранение постоянных электрических режимов схемы;
- обеспечение максимального использования резервных единиц.
Будем считать, что надежности переключающих устройств равны. Резервные элементы находятся в тех же внешних условиях, что и основной элемент, который является рабочим. Всего в состав группы входит S элементов: 1 рабочий и S-1 – резервные. Интенсивность отказов – λ. Тогда граф переходов системы будет иметь следующий вид
Рис.2. Граф переходов для системы с холодным резервированием
Уравнения Колмогорова для подобных систем в общем виде выглядят таким образом:
Здесь учтено, что для состояний, не имеющих непосредственных переходов, можно считать
Для системы, граф которой изображен на рисунке 1, получаем следующую систему дифференциальных уравнений:
(5)
1. Решим данную систему уравнений, используя преобразования Лапласа. При этом будем использовать следующие соотношения:
Получаем систему алгебраических уравнений относительно комплексной переменной
(6)
Последовательно перемножая эти уравнения, находим вероятность отказа системы
Используя соотношение
переходим в область оригиналов
(7)
Вероятность безотказной работы резервированной системы найдется как
(8)
С учетом соотношения
(9)
получаем формулу для оценки вероятности безотказной работы резервированной системы
(10)
Как видно из выражения (10), вероятность исправной работы не подчиняется экспоненциальному закону, поэтому нельзя среднее время исправной работы определять из выражения . В этом случае среднее время безотказной работы можно найти как
(11)
2. Систему дифференциальных уравнений (5) можно решить численными методами. В среде MathCAD [4] имеется возможность решения обыкновенных дифференциальных уравнений (0ДУ) и систем ОДУ. Для этой цели можно использовать метод Рунге – Кутты с постоянным шагом (процедура rkfixed [3]). В данной процедуре задается количество шагов N(число узлов сетки), отрезок, на котором ищется решение [a,b], вектор (или скаляр) начальных условий y и вектор правых частей системы дифференциальных уравнений f(x,y). Вектор f(x,y) задан системой уравнений Колмогорова (5), начальные условия определяются из условий задачи (обычно вероятность нахождения системы в начальном состоянии равна единице, т.к. система в начале работы исправна, а остальные вероятности равны нулю). Отрезок [a,b] соответствует времени, при котором необходимо оценить работоспособность (вероятность исправной работы) системы. Количество шагов N выбирает исследователь, исходя из требований точности решения задачи и наглядности представления результатов.
Таким образом, обращение к заданной процедуре может иметь следующий вид:
Более подробно анализ надежности систем с помощью численного метода рассмотрен в примере, приведенном ниже.
3. Анализ надежности системы с холодным резервированием методами имитационного моделирования [5].
При холодном резервировании система состоит из одного основного элемента и нескольких резервных. Работу такой системы можно представить как последовательное прохождение транзакта через несколько последовательных каналов обслуживания. Транзакт в этом случае представляет собой указатель работающего в данный момент времени элемента. В начале работы транзакт помещается в первый канал и задерживается там на время исправной работы первого элемента. После выхода из строя основного элемента транзакт поступает в первый резервный элемент и т.д. При возникновении неисправности в последнем резервном элементе транзакт покидает модель системы через блок TERMINATE 1 с меткой BAD.
Начинается работа моделирующей программы вводом в систему одного транзакта в момент времени t0 , в который необходимо оценить работоспособность системы. Транзакт, войдя в систему, последовательно захватывает и освобождает все каналы системы, отправляя транзакт из одного из каналов (если он находится хотя бы в одном из них) на блок TERMINATE 1 с меткой GOOD.
Повторяя эту процедуру достаточно большое число раз, можно рассчитать вероятность исправной работы системы в момент t0. Действительно, очередной транзакт, войдя в систему, отправляет предыдущий на метку GOOD, если тот находился в одном из каналов, т.е. система была в рабочем состоянии. Отношение числа транзактов, прошедших через метку GOOD, к общему числу транзактов дает вероятность исправной работы системы через время t0 с момента ее запуска . При проходе первого транзакта возникает погрешность за счет того, что он всегда будет идентифицировать состояние системы как неисправное. Однако при большом числе запусков программы с помощью оператора START (например 10000), эта погрешность исчезающее мала.
Захват системы (например системы с именем sys2) и ее освобождение реализуется парой операторов [3]
preempt sys2,,go,,re
return sys2
( операнд re означает, что данный транзакт больше не будет обрабатываться системой).
Второй способ имитационного моделирования систем с холодным резервированием основывается на использовании трех сегментов GPSS – программы.
Первый сегмент имитирует работу системы. Блок GENERATE вводит в начальный момент общее количество транзактов - элементов резервируемой системы (работающий и резервные). Следующий оператор - SPLIT - создает копию этих транзактов, чтобы через какое- то время, достаточное для того, чтобы все введенные оператором GENERATE транзакты заведомо покинули систему, повторить процесс. Первый транзакт, прошедший оператор SPLIT, занимает канал обслуживания, задерживается в нем на время исправной работы и покидает систему через оператор TERMINATE без операнда, т е. не уменьшая счетчик числа завершений. Т.о. первый сегмент программы может иметь следующий вид:
Описание экспоненциальной функции c именем EXP
GENERATE ,,,3 система содержит 1 рабочий и 2 резервных элемента
L1 SPLIT 1,L2
SEIZE COMP
ADVANCE 20,FN$EXP среднее время работы – 20 единиц времени
RELEASE COMP
TERMINATE
L2 ADVANCE 500 задержка на время, достаточное для ухода трех
TRANSFER ,L1 транзактов из системы
Во втором сегменте производится проверка работоспособности системы через время t0 после запуска системы в работу. Проверка проводится оператором TEST, который может иметь такой вид:
Test E F$comp,1,L4
Транзакт проходит через блок TEST на следующий оператор, только в том случае, если прибор с именем comp занят. В противном случае транзакт отправляется на метку L4.
Для подсчета числа успешных проверок можно пропустить транзакт, прошедший через оператор TEST, через фиктивный прибор, который используется в качестве счетчика.
Второй сегмент программы может выглядеть таким образом
GENERATE ,,,1
L3 ADVANCE 60 проверка производится через 60 единиц
TEST E F$comp,1,L4 системного времени после начала работы
SEIZE NUMBER системы
RELEASE NUMBER
L4 ADVANCE 440 временная задержка для синхронизации
TRANSFER , L3 транзактов первого и второго сегментов
Третий транзакт управляет временем моделирования.
Для подсчета доли успешного числа проверок можно поставить метку у оператора TEST. В этом случае вероятность исправной работы найдется из отношения транзактов, прошедших через прибор NUMBER к общему числу транзактов, прошедших через указанную метку.