Надежность отказоустойчивых электрических систем
Отказоустойчивость - свойство электрической системы сохранять работоспособность и тогда, когда в элементах системы (в общем случае в аппаратурных и программных
средствах) возникают отказы.
По способу реализации различают пассивную и активную отказоустойчивость системы.
Пассивная отказоустойчивость заключается в свойстве системы непрерывно сохранять работоспособное состояние в случае отказа отдельных элементов системы, т. е. в этом случае отказ элементов маскируется системой. Примером таких систем являются системы с постоянным резервированием. Пассивная отказоустойчивость обеспечивается при увеличении количества элементов системы в несколько раз. Ею должны обладать особо ответственные ЭС, когда не допустимы даже кратковременные перерывы в их работе, а также для обеспечения отказоустойчивости важнейших компонентов ЭС.
Активная отказоустойчивость реализуется путем организации процессов обнаружения отказа, поиска отказавшего элемента системы и реконфигурации системы. Обнаружение отказов и поиск отказавших элементов производится средствами технического диагностирования, устраняются отказы системы автоматической реконфигурацией ее. Примером такой системы является система с динамическим резервированием.
Реконфигурация - перестройка структуры ЭС таким образом, чтобы отказавшие ее элементы были исключены из процесса функционирования системы.
Активная отказоустойчивость характеризуется более экономичным расходованием ресурсов элементов структуры ЭС, чем пассивная. Однако применение активной отказоустойчивости связано с некоторыми потерями времени при восстановлении работы ЭС после отказа. В связи с этим активная отказоустойчивость применяется в ответственных достаточно сложных и дорогостоящих системах, где важна экономия применяемых аппаратурных средств, но допускаются кратковременные перерывы в работе.
Повышение отказоустойчивости - один из путей повышения надежности ЭС в тех случаях, когда другие пути оказываются экономически менее выгодными или не могут обеспечить требуемого уровня надежности.
Отказоустойчивость ЭС может быть охарактеризована коэффициентом разряжения первичного потока отказов kp, показывающим, какая доля из всех отказов элементов системы приведет к отказу системы:
kр = λс/ э,
где λс - интенсивность отказов системы; э - суммарная интенсивность отказов элементов системы.
В качестве меры отказоустойчивости может быть использована d-устойчивость - максимальное число d элементов или других структурных единиц ЭС, отказ которых приводит к отказу всей системы.
Отказоустойчивость ЭС обеспечивается различными видами резервирования (п. 3.10). При этом наиболее эффективным является структурное резервирование с помощью дополнительных элементов, узлов или устройств в структуре ЭС, предназначенных для автоматической замены отказавших элементов, узлов или устройств.
Как было показано раньше (п. 3.10), резервирование на более низком иерархическом уровне (раздельное резервирование) обеспечивает при прочих равных условиях и достаточно высокой надежности коммутационных элементов большую вероятность безотказной работы, чем резервирование на более высоком иерархическом уровне (общее резервирование).
Рассмотрим процесс восстановления отказоустойчивой системы в случае возникновения отказа элемента ЭС, вызванного различными причинами (рис. 3.42). Отказ 1 может обнаруживаться 2 или не обнаруживаться 3 средствами технического диагностирования. В последнем случае результатом отказа 1 является отказ системы 4.
Рис. 3.42. Граф процесса функционирования отказоустойчивой системы
при отказе ее элемента
При применении пассивной отказоустойчивости в ЭС отказ может быть замаскирован 5, и система без перерыва продолжит функционирование 6.
В случае обнаружения отказа СТД обычно алгоритм функционирования ЭС реализуется заданное число раз. Если имел место самоустраняющийся отказ 7, последствия которого при повторении исчезли, то процесс функционирования системы 6 продолжается. Если повторение оказалось безуспешным 8, то это свидетельствует об устойчивом отказе элемента системы, и поэтому производится автоматическая реконфигурация 9.
Реконфигурация ЭС может заключаться в замене отказавшего элемента (подсистемы, блока, устройства) за счет резервирования или в простом отключении. В последнем случае происходит постепенная деградация системы. После реконфигурации производится включение системы 10, и процесс функционирования ЭС возобновляется 11.
Описанный процесс восстановления отказоустойчивой ЭС может несколько отличаться в конкретных системах, особенно относительно способов обнаружения отказов аппаратурными или программными средствами и последующих процессов реконфигурации и контроля работоспособности системы.
Показатели надежности пассивно отказоустойчивых ЭС могут быть оценены по формулам, приведенным в п.3.4.
Оценка показателей надежности активно отказоустойчивых систем отличается тем, что при этом необходимо определять время восстановления системы.
Будем считать, что активно отказоустойчивая система может находиться в состояниях
е = 0, 1, 2,..., n,
где состояние е = 0 соответствует отсутствию отказов элементов, а состояние е = 1, 2,..., п - состояниям, соответствующим отказам отдельных элементов.
Для каждого е-го состояния системы может быть определена суммарная интенсивность отказов
λe(t) =
где λei(t) - интенсивность отказов i-го элемента, работоспособного в е-м состоянии системы; r - количество элементов.
Тогда при известных безусловных вероятностях Pe(t) нахождения системы в состоянии е сумма
λ(t) =
представляет собой интенсивность отказов элементов в неремонтируемой отказоустойчивой системе.
Интенсивность отказов системы λс(t) определяется умножением интенсивностей отказов λei на условные вероятности Qei того, что система, находящаяся в е-м состоянии, не может быть восстановлена автоматически в случае отказа i-го элемента, т. е.
λc(t) =
Распределение вероятностей времени восстановления может быть определено на основании графа, показанного на рис.3.42. Для последовательных дуг графа имеет место композиция распределений и может быть применен метод моментов, согласно которому дисперсии и математические ожидания составляющих складываются.
Для параллельных ветвей графа функция распределения имеет вид смеси, математическое ожидание смеси
М =
где πj - вероятности составляющих смеси; Mj - математические ожидания составляющих смеси. Дисперсия смеси
где σ - среднеквадратическое отклонение i-гo составляющего смеси.
Если имеется только две составляющие, то приведенная формула приводится к виду (с учетом соотношения π1 + π2 = 1)
σ2 = π1σ12 + π2σ22 + π1π2(M1 - М2)2.
Функция распределения времени восстановления Рв(τ) определяется постепенным объединением последовательных и параллельных участков графа.
Вероятность того, что последствия отказа элемента не будут автоматически устранены за допустимое с точки зрения пользователя время τдоп,
Qв = 1 - Рв(τдоп) .
Функция распределения Рв(τ) известна только с точностью до первых двух моментов М и σ2, поэтому вероятность Qв можно оценить по неравенству Чебышева
Qвτ ≤ (M - τ доп)2.
Указанным образом определяют показатели надежности аппаратурных средств отказоустойчивых систем. Для оценки надежности программ могут быть использованы методы, приведенные в п. 3.12. Так как отказы программ не зависят от отказов аппаратуры, а отказы аппаратуры не зависят от отказов программ, вероятность безотказной работы системы с учетом надежности программ Pcn(t) может быть определена как произведение вероятностей безотказной работы аппаратуры Pc(t) и программ Pn(t), т. е. Pcn(t) =Pc(t)Pп(t). Интенсивности отказов и параметры потоков отказов в этом случае складываются, а продолжительность восстановления определяется по закону смеси.
Пример.Активно отказоустойчивая ЭС состоит из трех одинаковых подсистем, СТД и коммутационных устройств. Интенсивность отказов подсистемы λ = 10-6(1/r),СТД и коммутационные устройства для упрощения расчетов считаются безотказными. Отказоустойчивая система остается работоспособной, если работоспособна хотя бы одна из подсистем, т. е. система имеет три работоспособных состояния е = 0, 1, 2, соответствующих числу отказавших подсистем.
Определить вероятность безотказной работы системы Pc(t), математическое ожидание времени восстановления Мв, вероятность невосстановления Qвт за допустимое время, полагая справедливым экспоненциальное распределение для каждой подсистемы P(t) = e-λt.
Если реализуется полное восстановление системы в пределах реконфигурационных возможностей системы (система работоспособна, когда работоспособна хотя бы одна подсистема из трех), то вероятность безотказной работы системы может быть определена с помощью метода гипотез о состоянии системы из трех одинаковых подсистем (см. табл. 3.16) в виде
Pc(t) = P3(t) — 3P2(t) + 3P(t) = e-3λt - 3e-2λt + 3e-λt.
При t = 1000 ч получится Рс(1000) = 0,998.
Оценку математического ожидания времени восстановления можно выполнить на основе графа рис. 3.42, рассмотрев подграф, состоящий из ветвей дуг 2, 8, ... 11. Для упрощения анализа дуга 7, соответствующая сбою, не учитывается. Интервалы времени, соответствующие каждому этапу восстановления системы, могут быть определены для каждой конкретной системы, исходя из ее быстродействия.
Пусть оценки математических ожиданий времени прохождения отдельных дуг j графа составляют:
j.................................. 2 8 9 10 11
Mj, c............................ 0,1 0,2 0,5 0,5 1,0
Предполагается, что все временные интервалы распределены по показательному закону, следовательно среднеквадратичные отклонения времени σj = Mj.
Математическое ожидание времени прохождения дуг 2, 8,..., 11
М2, 11 = Mв = M2 + M8 + M9 + M10 + M11 = 0,l + 0,2 + 0,5 + 0,5 + l,0 = 2,3 с,
дисперсия
σ22, 11 = σ2в = σ22 + σ28 + σ29 + σ210 + σ211 = 0,01 + 0,04 + 0,25 + 0,25 + 1,0 = 1,55 с2.
Полагая, что допустимое время восстановления работы системы после отказа подсистемы τдоп = 10 с, можно оценить вероятность невосстановления системы за это время
Qвτ = σв2/(Мв - τдоп)2 = 1,55/(2,3 - 10)2 = 0,026.
При создании отказоустойчивых систем стремятся к достижению необходимого их уровня надежности с помощью минимальных средств. Задачи нахождения оптимального решения в отказоустойчивых ЭС решаются аналогично задачам оптимального резервирования.