Понятие диагностических параметров и признаков
Диагностические параметры – это параметры сигналов, регистрируемых контрольно – измерительной аппаратурой, или измеряемые физические характеристики процессов, протекающих в диагностируемом объекте, они зависят от того, в каком из возможных состояний находится объект, и меняющие свое значения при переходе его из одного состояния в другое. В качестве примеров можно назвать температуру теплоносителя, зависящую от энерговыделения и условий теплосъёма с твэлов в активной зоне энергетического ядерного реактора, параметры спектральной плотности акустических шумов, сопровождающих работу насоса, меняющихся при отклонениях от нормального режима работы, концентрацию металлических частиц в масле, связанную с величиной износа двигателя внутреннего сгорания, и т.д. Если в процессе диагностики регистрируется набор диагностических параметров {xl,x2,...,xn}, то говорят о диагностическом пространстве, координатами которого являются эти параметры, а состояние объекта характеризуется вектором параметровх = (xl,x2,...,xn).
Пусть установлено, что при переходе объекта из одного состояния в другое с большой вероятностью наблюдаются некоторые явления или выполняются определенные условия. Например, происходит смена режимов течения жидкости от ламинарного к турбулентному, вскипание теплоносителя или диагностический параметр, хi принимает какое – то значение из диапазона хi0<хi< хi1. В этом случае говорят о наличии простого диагностического признака ki,представляющего некоторое утверждение относительно наблюдаемых явлений или формулировку условия. Появление признаков указывает на изменение состояния диагностируемого объекта, поэтому они могут быть использованы для постановки диагноза. Если признак kjнаблюдается при диагностике, ему можно формально приписать некоторое значение, например kj1 =1, а если отсутствует – kj2=0. Отсутствие признака kj иногда в литературе обозначают как kj. Признак, который может принимать два значения или, как говорят, находится в двух состояниях, например, наблюдаться или не наблюдаться в процессе диагностики, называют двухразрядным. Если признак может находится в трех состояниях, его называют трехразрядным и т. д. Например, температура теплоносителя на выходе активной зоны реактора Т может быть пониженная Т<Т1, допустимая T1<T<T2и повышенная Т>Т2. В этом случае можно ввести признак kj,который находится в одном из трех состояний: kjl, kj2 и kj3, в зависимости от того, в какой интервал попадает температура теплоносителя. Каждому состоянию признака можно формально приписать некоторое значение, например:
kj1 =-1, kj2=0 и kj3=1.
Если для диагностируемого объекта удается установить набор признаков {k1, k2, ..., km}, то говорят, что объект характеризуется сложным или комплексным признаком k = (k1, k2,..., km). В этом случае можно говорить о пространстве диагностических признаков. Таким образом, если, например, при диагностике объекта из набора двухразрядных признаков {k1, k2, ..., km} обнаружены все признаки кроме первого, то комплексный признак можно записать в виде k = (k1, k2,..., km) или k = (0, 1,...,1).
Метод Байеса
Метод Байеса принятия решений о состоянии диагностируемых объектов основан на использовании обобщенной формулы Байеса. Для ее применения требуется большой объем предварительной информации, которая может быть накоплена в процессе эксплуатации объектов или в результате специально организованных экспериментальных исследований. При наличии необходимых данных с помощью метода Байеса можно оценить состояние объектов с высоким уровнем распознавания (см. ниже), поэтому его относят к эффективным методам принятия решений.
Будем считать, что диагностируемый объект может находиться в одном из возможных состояний Di (i=0, 1,...,N) и характеризуется сложным признаком k=(k1, k2,..., km). В соответствии с методом Байеса рассчитываются условные вероятности P(Di / k) = P(Di / kl, k2,...,km). Это –апостериорные, то есть установленные после диагностирования, вероятности состояний Di при условии, что объект обладает признаком k. Решающее правило – правило принятия решения о нахождении объекта в состоянии Di – состоит в том, что объект с комплексным признаком k относят к указанному состоянию, если апостериорная вероятность этого состояния максимальна
P(Di/k) >P(Dj/k), j = 0,1,..., N; i ¹j (1)
Это правило усиливают введением уровня распознавания Р* , обычно Р*³0,9. Решение о диагнозе Di принимается, если выполнены условия (1) и P(Di/k)³ Р*.
При этом вероятность альтернативных диагнозов не превышает 1–Р*. В ином случае отказываются от постановки диагноза, для постановки которого требуется дополнительная информация.
Рассмотрим процедуру определения апостериорных вероятностей P(Di/k). Вероятность двух событий – нахождения объекта в состоянии Diи наличия у него сложного признака k– определяется формулами теории вероятностей
P(Di, k) = P(Di) P(k/Di)=P(k) P(Di/k) (3)
где P(Di) – априорная (известная до диагностирования по результатам специально проведенных предварительных исследований) вероятность состоянияDi; P(k/Di) – условная вероятность наличия у объекта признака k, если он находится в состоянии Di, P(k) – вероятность наличия у объекта комплексного признака k независимо от его состояния. Поскольку объект при любом k может находиться только в одном состоянии, то
(4)
Просуммировав обе части правого равенства в (3)по i, определим вероятность наличия у объекта признака k:
(5)
С учетом этого равенства из (3)следует обобщенная формула Байеса для вычисления апостериорных вероятностей диагнозовDi:
(6)
Вероятности, входившие в обобщенную формулу Байеса, определяются из очевидных соображений:
(7)
Здесь - общее число продиагностированных объектов, из которых - число объектов с диагнозом ; - количество объектов с диагнозом , имеющих комплексный признак ; - число объектов во всех состояниях с признаком .
Если компоненты комплексного признака статически независимы, то согласно формулам теории вероятности
(8)
В ином случае
Обобщенная формула Байеса в случае независимости компонентов комплексного признака записывается в виде
(9)
Задача 1. Для диагностики подшипника в машиностроении используются два диагностических признака: – повышение температуры подшипника на 15°С и более; – повышение уровня вибраций на 6 дБ и более. Появление этих признаков может быть связано с неисправностями в системе смазки подшипника – состояние , либо с износом деталей подшипника – состояние . Известно, что при нормальном состоянии подшипника (состояние ) признак не наблюдается, а признак наблюдается в 1% случаев. На этапе предварительных исследований также установлено, что 90% подшипников вырабатывают ресурс в нормальном состоянии, 2% подшипников – в состоянии , а 8% – в состоянии . Кроме того, известно, что признак встречается в состоянии в 60% случаях, а в состоянии в 20%. Признак в состоянии встречается в 30%, а в состоянии – в 80% случаях. Необходимо установить вероятности состояний подшипника при различных сочетаниях наблюдаемых признаков и их отсутствии, полагая признаки независимыми, то есть один из них может наблюдаться независимо от другого.
Исходные данные сведем в табл. 1. Так как признак (j=1,2) либо наблюдается, либо не наблюдается – событие , при диагностике подшипника может быть установлен один из четырех комплексных признаков, компонентами которых являются и , (j=1,2): =( ); =( ); =( ); =( ).
Таблица 1
Вероятности признаков и априорные вероятности появлений
состояний подшипника
0,0 | 0,01 | 0,90 | |
0,60 | 0,30 | 0,02 | |
0,20 | 0,80 | 0,08 |
Поскольку наблюдение признака и его отсутствие – взаимоисключающие события, условная вероятность отсутствия признака определяется равенством
. (10)
Применяя обобщенную формулу Байеса (6) с учетом соотношений (8) и (10), определяем апостериорные вероятности диагнозов при наличии указанных сочетаний признаков. Например,
и т.д. Результаты расчетов сведены в табл.2.
Таблица 2
Апостериорные вероятности состояний подшипника
0,00 | 0,14 | 0,00 | 0,98 | |
0,22 | 0,04 | 0,72 | 0,01 | |
0,78 | 0,82 | 0,78 | 0,01 |
Из данных, приведенных в табл.2, следует, что даже в отсутствии признаков и , то есть при наличии комплексного признака =( ), вероятности состояний и – и , отличны от нуля. Это означает, что неисправности в системе смазки и износ деталей подшипника могут и не вызвать повышение температуры и уровня вибраций подшипника. Эти признаки не являются достаточными для постановки диагнозов и . Хотя вероятности таких событий очень малы.
При наличии обоих признаков достоверно можно утверждать, что подшипник неисправен. Наиболее вероятным состоянием является износ деталей подшипника – состояние . В отсутствие признаков наиболее вероятно исправное состояние (вероятность его равна 0,98). При наличии признака и отсутствии вероятность износа – состояния больше. При наличии признака и отсутствии больше вероятность неисправности в системе смазки – состояние . Если задать уровень распознания , то следует констатировать, что для достоверного определения типа неисправности подшипника недостаточно данных, и необходимы дополнительные исследования.
Метод последовательного анализа
Метод последовательного анализа, или метод Вальда, используется в основном при дихотомии, то есть тогда, когда по результатам диагностики необходимо принять решение о нахождении объекта в одном из двух возможных состояний: – исправное состояние и – неисправное состояние.
Для пояснения сущности данного метода рассмотрим отношение апостериорных вероятностей диагнозов и при наличии у объекта сложного признака , состоящего из независимых компонент. Прежде всего отметим, что в случае дихотомии по методу Байеса согласно (1) становится диагноз , если
(11)
В ином случае – диагноз . Отношение условных вероятностей обнаружить у диагностируемого объекта сложного признака , находящегося в состояниях и :
называется отношением правдоподобия. Через него можно выразить правило (11).
При
ставиться диагноз , если выполняется обратное неравенство – .
По методу Вальда проводится последовательное обследование объекта по компонентам сложного признака k. На первом этапе определяется отношение правдоподобия по первому диагностическому признаку и выбираются верхние и нижние границы принятия решения и .
Если
(13)
делается заключение о состоянии .
Если
(14)
ставится диагноз .
Если же
(15)
информации недостаточно для определения состояния объекта, и обследование проводится по следующей компоненте . Процедура продолжается до тех пор, пока на каком-то этапе не будет выполнено одно из неравенств вида (13) или (14). Если в результате обследования все компоненты сложного признака исчерпаны, но ни одно из неравенств (13) и (14) не выполняется, отказываются от постановки диагноза. Диагностических признаков недостаточно для определения состояния объекта.
Для удобства вычислений обычно рассматривают не отношение правдоподобия, а его монотонную функцию – логарифм. Тогда условие постановки диагнозов и , исправного и неисправного состояния соответственно, после – го обследования принимает соответственно вид
(16)
Заметим, что если обследование проводится по диагностическим параметрам, являющимся непрерывными случайными величинами, то в вышеприведенных соотношениях надо условные вероятности распределения признаков заменить на условные плотности вероятности распределения параметров.
При постановке диагноза возможны ошибочные решения. Если в результате диагностики принято решение, что объект находится в неисправном состоянии , когда, на самом деле, он исправен (состояние D0), считается, что допущена ошибка 1-го рода. Её называют еще ложной тревогой, её вероятность обозначим через PF.
Если принимается решение, что объект исправен, то есть находится в состоянии D0, когда его действительное состояние неисправное D1, допускается ошибка 2-го рода. Другое ее название – пропуск сигнала. Вероятность ошибки 2-го рода будем обозначать как Рм.
Ошибочные решения о состоянии диагностируемого объекта, как правило, приводят к потерям. Если допускается ошибка 1-го рода, и исправный объект выводится из эксплуатации, то потери могут быть связаны с затратами на ремонтные работы, в которых нет необходимости, или с недополученной выручкой от реализации продукции, производство которой приостановлено. Эти потери, выраженные в денежных единицах, обозначим через П01. В случае ошибки 2-го рода потери могут быть обусловлены затратами на ликвидацию аварии и ее последствий, если допущенный к дальнейшей эксплуатации неисправный технический объект выходит из строя, а также недополученными средствами от продажи продукции из-за остановки производства. Потери, связанные с ошибкой 2-го рода, обозначим П10. Если можно оценить выгоду при правильной постановке диагноза, то вводят выигрыши П00<0 и П11<0 – отрицательные потери. Если определить выигрыши невозможно, их полагают равными нулю. Названия, обозначения и стоимости (потери) от ошибочных решений при определении состояния диагностируемых объектов, указаны в табл.3.
Таблица 3
Ошибки и их стоимости при определении состояния технических объектов
Поставленный диагноз | Истинное состояние | Название ошибки | Вероятность ошибки | Обозначения потерь при принятии решений |
D0 | D0 | – | – | П00 |
D1 | D1 | – | – | П11 |
D1 | D0 | 1-го рода (ложная тревога) | РF | П01 |
D0 | D1 | 2-го рода (пропуск сигнала) | РM | П01 |
Если принимается решение о диагнозе D0, то вероятность правильного решения равна 1-РM. Вероятность отнесения объекта к состоянию D1 в этом случае будет равна PF. В силу (13) вероятность диагноза D0 по крайней мере в А раз превышает вероятность диагноза D1, следовательно,
(17)
Аналогично можно получить следующую оценку
(18)
,где РF – вероятность ошибки 1-ого рода, РM – вероятность ошибки 2-ого рода.
Соотношения (17) и (18), рассматриваемые как строгие равенства, позволяют определить верхнюю и нижнюю границы принятия решения А и В в (13)–(15) при заданных вероятностях ошибок первого и второго рода PF и РM .
ИСПОЛЬЗОВАНИЕ МЕТОДОВ СТАТИСТИЧЕСКОЙ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ
При использовании методов статистической теории принятия решений правило постановки диагноза определяют из условия минимизации риска (см. ниже) или вероятностей ошибочных решений при диагностировании. Выбор того, какие из указанных величин минимизируются, зависит от наличия априорной информации для постановки диагноза.
Рассмотрим случай дихотомии. Будем считать, что решение о состоянии объекта принимается на основе анализа диагностических параметров в n-мерном пространстве, состояние объекта в котором определяется вектором диагностических параметров x = (xl,x2,..., хп). Правило принятия решения о состоянии диагностируемого объекта сводится к определению в диагностическом пространстве граничной поверхности, разделяющей его на две области S0 и S1. Если вектор х, полученный при обследовании объекта, принадлежит S0, (х S1), то ставится диагноз D0. Если x S1, принимают, что объект находится в состоянии D1.
Обозначим через w(x/Di) = w(xl,x2,...,xn/Di), (i = 0,1) условные плотности вероятности распределения вектора параметров для состояний D0 и D1. Вероятности правильно поставленных диагнозов при разбиении пространства на области S0 и S1, определяются соотношениями
(19)
где –условные вероятности принадлежности вектора х области Si, когда объект находится в состоянии Di; Р(Di) – априорная вероятность диагноза Di; Dx = Dx1 Dx2...Dxn. Вероятности ошибок 1-го и 2-го рода вычисляются по формулам:
(20)
где – условные вероятности принадлежности вектора х области Si, когда объект находится в состоянии Dj.
Рис. 1. Условные плотности вероятности распределения параметра х в состояниях D0 и D1.
На рис. 1 показаны плотности вероятности распределения одного диагностического параметра х для двух различных состояний объекта. Область S0, включающая значения х<х*, отвечает диагнозу D0, область S1 (х>х*) – диагнозу D1; х*– значение диагностического параметра, разделяющего области S0 и S1. Площади различным образом заштрихованных областей пропорциональны ошибкам 1-го и 2-го рода.
Метод минимального риска
Если известны априорные вероятности P(D0) и Р(D1) и стоимости потерь от неправильно принятых решений о состоянии диагностируемого объекта и выигрыши при правильной постановке диагноза – Пij (i , j = 0,1) (табл. 1), можно вычислить средний риск или математическое ожидание потерь при диагностике. Он складывается из потерь от ошибочных решений и выигрышей от правильных диагнозов:
(21)
или с учетом (19) и (20)
(22)
Разбиение диагностического пространства на области S0 и S1 проводится из условия, чтобы средний риск R был минимален. Для этого необходимо, чтобы S0 – область диагноза D0 – включала все значения х, для которых выполняется неравенство
Следовательно, область S0 содержит значения х, для которых отношение правдоподобия (х) превышает пороговое значение :
(23)
Уравнение
(24)
определяет граничную поверхность между областями S0 и S1 диагностического пространства. Правило постановки диагноза можно записать в виде cложного неравенства:
(25)
то есть, если выполняется верхнее неравенство, принимается решение, что объект находится в состоянии D0, если нижнее – в состоянии D1 .Ошибки 1-го и 2-го рода при использовании этого правила вычисляются по формулам (20) с учетом разбиения диагностического пространства на области S0 и S1 .
Метод минимального числа ошибочных решений t (метод Зигерта-Котельникова, критерий идеального наблюдателя)
Этот метод применяется, если неизвестны стоимости потерь и выигрышей при постановке диагноза. Правило постановки диагноза находится из условия минимума доли ошибочных решений. Вероятность таких решений определяется соотношением
Можно показать [5], что она минимальна, если область S0 диагноза D0 содержит значения х, для которых
(26)
При указанном пороговом значении соотношение (24) определяет граничную поверхность в диагностическом пространстве, а (25) – правило постановки диагноза. Таким образом, метод минимального числа ошибочных решений является частным случаем метода минимального риска при условии
П10-П11=П01-П00
Кроме того, он совпадает с методом Байеса (см. (12)), так как из (26) следует Р(D0/х)>Р(D1/х), что является условием постановки диагноза D0 по методу Байеса.
Недостаток метода минимального числа ошибочных решений – игнорирование различия последствий ошибок диагностирования. Поскольку потери от пропуска сигнала, как правило, превышают потери от ложной тревоги, применение критерия идеального наблюдателя может привести к экономически не обоснованным решениям. Поэтому этот метод рекомендуется применять, если известно, что потери от ошибочных решений примерно одинаковы.