Постановка задач технической диагностики

Вводные замечания. Пусть требуется определить состояние шлицевого соединения валов редуктора в эксплуатационных условиях. При большом износе шлицев появляются перекосы и усталостные разрушения. Непосредственный осмотр шлицев невозможен, так как требует разборки редуктора, т. е. прекращения эксплуатации. Неисправность шлицевого соединения может повлиять на спектр колебаний корпуса редуктора, акустические колебания, содержание железа в масле и другие параметры.

Задача технической диагностики состоит в определении степени износа шлицев (глубины разрушенного поверхностного слоя) по данным измерений ряда косвенных параметров. Как указывалось, одной из важных особенностей технической диагностики является распознавание в условиях ограниченной информации, когда требуется руководствоваться определенными приемами и правилами для принятия обоснованного решения.

Состояние системы описывается совокупностью (множеством) определяющих ее параметров (признаков). Разумеется, что множество определяющих параметров (признаков) может быть различным, в первую очередь, в связи с самой задачей распознавания. Например, для распознавания состояния шлицевого соединения двигателя достаточна некоторая группа параметров, но она должна быть дополнена, если проводится диагностика и других деталей.

Распознавание состояния системы — отнесение состояния системы к одному из возможных классов (диагнозов). Число диагнозов (классов, типичных состояний, эталонов) зависит от особенностей задачи и целей исследования.

Часто требуется провести выбор одного из двух диагнозов (дифференциальная диагностика или дихотомия); например, «исправное состояние» и «неисправное состояние». В других случаях необходимо более подробно охарактеризовать неисправное состояние, например повышенный износ шлицев, возрастание вибраций лопаток и т. п. В большинстве задач технической диагностики диагнозы (классы) устанавливаются заранее, и в этих условиях задачу распознавания часто называют задачей классификации.

Так как техническая диагностика связана с обработкой большого объема информации, то принятие решений (распознавание) часто осуществляется с помощью электронных вычислительных машин (ЭВМ).

Совокупность последовательных действий в процессе распознавания называется алгоритмом распознавания. Существенной частью процесса распознавания является выбор параметров, описывающих состояние системы. Они должны быть достаточно информативны, чтобы при выбранном числе диагнозов процесс разделения (распознавания) мог быть осуществлен.

Математическая постановка задачи. Взадачах диагностики состояние системы часто описывается с помощью комплекса признаков

K =(k_l,k₂,..., k_j,..., k_v), (5.1)

где k_j —признак, имеющий m_j разрядов.

Пусть, например, признак k_j представляет собой трехразрядный признак (m_j = 3), характеризующий величину температуры газа за турбиной: пониженная, нормальная, повышенная. Каждый разряд (интервал) признака k_j обозначается k_js, например повышенная температура за турбиной k_j_з. Фактически наблюдаемое состояние соответствует определенной реализации признака, что отмечается верхним индексом *.Например, при повышенной температуре реализация признака k*_j =k_j_з.

Вобщем случае каждый экземпляр системы соответствует некоторой реализации комплекса признаков:

K* = (k₁^*, k₂^*,..., k_j^*,..., k_v^*). (5.2)

Во многих алгоритмах распознавания удобно характеризовать систему параметрами x_j, образующими v - мepный вектор или точку в v-мepнoм пространстве:

X =(x_l, x₂, , x_j, , x_v). (5.3)

Вбольшинстве случаев параметры x_j имеют непрерывное распределение. Например, пусть x_j —параметр, выражающий температуру за турбиной. Предположим, что соответствие между параметром x_j (^°C) итрехразрядным признаком k_j таково:

< 450 к_j_l

450 — 550 к_j₂

> 500 к_j₃

Вданном случае с помощью признака k_j получается дискретное описание, тогда как параметр x_j дает непрерывное описание. Отметим, что при непрерывном описании обычно требуется значительно больший объем предварительной информации, но описание получается более точным. Если, однако, известны статистические законы распределения параметра, то необходимый объем предварительной информации сокращается.

Из предыдущего ясно, что принципиальных отличий при описании системы с помощью признаков или параметров нет, и в дальнейшем будут использованы оба вида описания.

Как указывалось, в задачах технической диагностики возможные состояния системы —диагнозы D_i —считаются известными.

Существуют два основных подхода к задаче распознавания: вероятностный идетерминистский. Постановка задачи при вероятностных методах распознавания такова. Имеется система, которая находится в одном из ислучайных состояний D_i. Известна совокупность признаков (параметров), каждый из которых с определенной вероятностью характеризует состояние системы. Требуется построить решающее правило, с помощью которого предъявленная (диагностируемая) совокупность признаков была бы отнесена к одному из возможных состояний (диагнозов). Желательно также оценить достоверность принятого решения и степень риска ошибочного решения.

При детерминистских методах распознавания удобно формулировать задачу на геометрическом языке. Если система характеризуется v-мерным вектором X, то любое состояние системы представляет собой точку в v-мерном пространстве параметров (признаков). Предполагается, что диагноз D, соответствует некоторой области рассматриваемого пространства признаков. Требуется найти решающее правило, в соответствии с которым предъявленный вектор X* (диагностируемый объект) будет отнесен к определенной области диагноза. Таким образом задача сводится к разделению пространства признаков на области диагнозов.

При детерминистском подходе области диагнозов обычно считаются «непересекающимися», т.е. вероятность одного диагноза (в область которого попадает точка) равна единице, вероятность других равна нулю. Подобным образом предполагается, что и каждый признак либо встречается при данном диагнозе, либо отсутствует.

Вероятностный и детерминистский подходы не имеют принципиальных различий. Более общими являются вероятностные методы, но они часто требуют и значительно большего объема предварительной информации. Детерминистские подходы более кратко описывают существенные стороны процесса распознавания, меньше зависят от избыточной, малоценной информации, больше соответствуют логике мышления человека.

В последующих главах излагаются основные алгоритмы распознавания в задачах технической диагностики.

Метод Байеса

Среди методов технической диагностики метод, основанный на обобщенной формуле Бaйeca_, занимает особое место благодаря простоте и эффективности.

Разумеется, метод Байеса имеет недостатки: большой объем предварительной информации, «угнетение» редко встречающихся диагнозов и др. Однако в случаях, когда объем статистических данных позволяет применить метод Байеса, его целесообразно использовать как один из наиболее надежных и эффективных методов.

Основы метода. Метод основан на простой формуле Байеса. Если имеется диагноз D_i и простой признак k_j, встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния D_i и признака k_j)

P (D_ik_j) = P (D_i) P (k_j/D_i) = P (k_j) P (D_i/k_j). (5.4)

Из этого равенства вытекает формула Байеса (см. гл. 11)

P(D_i/k_j) = P(D_i) P(k_i/D_i)/P(k_j) (5.5)

Очень важно определить точный смысл всех входящих в эту формулу величин.

P(D_i) —вероятность диагнозаD_i, определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у N_i объектов имелось состояние D_i, то

P(D_i) = N_i/N. (5.6)

P (k_j/D_i) —вероятность появления признакаk_jу объектов с состоянием D_i. Если среди N_i объектов, имеющих диагнозD_i, у N_ij проявился признак k_j, то

P(k_j/D_i) = N_ij/N_i. (5.7)

P(k_j) —вероятность появления признакаk_j во всех объектахнезависимо от состояния (диагноза)объекта. Пусть изобщего числа N объектов признакk_j был обнаружену N_j объектов, тогда

P(k_j) = N_j/N. (5.8)

Для установления диагноза специальное вычисление P(kj)не требуется. Как будет ясно из дальнейшего,значения P(D_i)и P (k_j/D_i),известные для всех возможных состояний, определяют величину P (k_j).

Вравенстве (3.2) P (D_i/k_j)—вероятность диагноза D_i послетого, как сталоизвестно наличие у рассматриваемого объекта признака k_j (апостериорная вероятность диагноза).

Обобщенная формула Байеса.Эта формула относится к случаю, когда обследование проводится по комплексу признаков К,включающему признаки k₁, k₂, ..., k_v.Каждый из признаков k_jимеет m_j разрядов (k_j_l, k_j₂, ..., k_js, ..., Постановка задач технической диагностики - student2.ru ). В результате обследования становитсяизвестной реализация признака

k_j^*= k_js(5.9)

и всего комплекса признаков K*. Индекс *,как и раньше, означаетконкретное значение (реализацию) признака. Формула Байеса для комплексапризнаков имеет вид

P(D_i/К*)= P(D_i)P(К*/D_i)/P(К*)(i = 1, 2, ..., n), (5.10)

где P (D_i/К*) —вероятность диагноза D_i после того, какстали известны результаты обследования по комплексу признаков К,P (D_i) —предварительная вероятность диагноза D_i (по предшествующей статистике).

Формула (5.10) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний ипотому

Постановка задач технической диагностики - student2.ru (5.11)

В практических задачах нередко допускается возможность существования нескольких состояний А₁, ..., А_r, причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов D_i следует рассматривать отдельные состояния D₁ = А₁, ..., D_r = А_r и их комбинации D_r₊₁ = А₁ ^ А₂, … и т. п.

Перейдем к определению P (К*/D_i). Если комплекс признаков состоит из v признаков, то

P(К*/D_i) = P(k₁*/D_i)P (k₂*/k₁*D_i)...P (k_v*/k_l*...k*_v-₁D_i), (5.12)

где k_j* =k_js —разряд признака, выявившийся в результате обследования. Для диагностически независимых признаков

P (К*/D_i) = P (k₁*/D_i) P (k₂*/D_i)... P (k_v*/D_i). (5.13)

В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.

Вероятность появления комплекса признаковК*

P(К*)= Постановка задач технической диагностики - student2.ru P(D_s)P(К*/D_s).(5.14)

Обобщенная формула Байеса может быть записана так:

P(D_i/K*) Постановка задач технической диагностики - student2.ru (5.15)

где P (К*/D_i)определяется равенством (5.12) или (5.13). Изсоотношения (5.15) вытекает

Постановка задач технической диагностики - student2.ru P(D_i/К*)=l, (5.16)

что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.

Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-гo диагноза и данной реализации комплекса признаков

P(D_iК*) = P(D_i)P(К*/D_i) (5.17)

и затем апостериорную вероятность диагноза

P (D_i/К*) = P(D_iК*)/ Постановка задач технической диагностики - student2.ru P(D_sК*). (5.18)

Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (5.15), так как выражение (5.13) содержит произведения малых величин.

Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза D_p, то этот комплекс не встречается при других диагнозах:

Постановка задач технической диагностики - student2.ru

Тогда, в силу равенства (5.15)

Постановка задач технической диагностики - student2.ru (5.19)

Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть — непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.

Диагностическая матрица. Для определения вероятности диагнозов по методу Байеса необходимо составить диагностическую матрицу (табл. 5.1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах.

Таблица 5.1

Диагностическая матрица в методе Байеса

Диагноз D_i

Признак k_j

P(D_i)

k₁

k₂

k₃

P(k₁₁/D_i)

P(k₁₂/D_i)

P(k₁₃/D_i)

P(k₂₁/D_i)

P(k₂₂/D_i)

P(k₂₃/D_i)

P(k₂₄/D_i)

P(k₃₁/D_i)

P(k₃₂/D_i)

D₁

0,8

0,2

0,1

0,6

0,2

0,8

0,3

D₂

0,1

0,7

0,2

0,3

0,7

0,1

0,9

0,1

…

Если признаки двухразрядные (простые признаки «да — нет»), то в таблице достаточно указать вероятность появления признака Р (k_i/D_i). Вероятность отсутствия признака Р ( Постановка задач технической диагностики - student2.ru /D,-) = 1 - Р (k_i/D_i).

Однако более удобно использовать единообразную форму, полагая, например, для двухразрядного признака Р (k_j/D_i) = Р (k_i₁/D_i); Р ( Постановка задач технической диагностики - student2.ru /D,) = Р (k_i₂/D_i).

Отметим, что Постановка задач технической диагностики - student2.ru P(k_js/Di) = 1, где т, — число разрядов признака k_j. Сумма вероятностей всех возможных реализаций признака равна единице.

В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения P(k_js/Di), но и следующие величины: N — общее число объектов, использованных для составления диагностической матрицы; N_i — число объектов с диагнозом D_i; N_ij — число объектов с диагнозом D_i, обследованных по признаку k_j. Если поступает новый объект с диагнозом D_μ, то проводится корректировка прежних априорных вероятностей диагнозов следующим образом:

Постановка задач технической диагностики - student2.ru (5.20)

Далее вводятся поправки к вероятностям признаков. Пусть у нового объекта с диагнозом D_μ выявлен разряд r признака k_j. Тогда для дальнейшей диагностики принимаются новые значения вероятности интервалов признака k_j при диагнозе D_μ:

Постановка задач технической диагностики - student2.ru (5.21)

Условные вероятности признаков при других диагнозах корректировки не требуют.

Пример.Поясним метод Байеса. Пусть при наблюдении за газотурбинным двигателем проверяются два признака: k₁— повышение температуры газа за турбиной более чем на 50 °С и k₂ — увеличение времени выхода на максимальную частоту вращения более чем на 5 с. Предположим, что для данного типа двигателей появление этих признаков связано либо с неисправностью топливного регулятора (состояние D₁,), либо с увеличением радиального зазора в турбине (состояние D₂).

При нормальном состоянии двигателя (состояние D₃)признак k₁не наблюдается, а признак k₂наблюдается в 5% случаев. На основании статистических данных известно, что 80% двигателей вырабатывают ресурс в нормальном состоянии, 5% двигателей имеют состояние D₁и 15% - состояние D₂. Известно также, что признак k₁встречается при состоянии D₁в 20% , а при состоянии D₂ в 40% случаев; признак k₂ при состоянии D₁встречается в 30%, а при состоянии D₂ - в 50% случаев. Сведем эти данные в диагностическую таблицу (табл. 5.2).

Найдем сначала вероятности состояний двигателя, когда обнаружены оба признака k₁и k₂. Для этого, считая признаки независимыми, применим формулу (5.15).

Вероятность состояния

Постановка задач технической диагностики - student2.ru

Аналогично получим Р (D₂/k₁k₂) = 0,91; Р (D₃/k₁k₂) = 0.

Определим вероятность состояний двигателя, если обследование показало, что повышение температуры не наблюдается (признак k₁), но увеличивается время выхода на максимальную частоту вращения (признак k₂ наблюдается). Отсутствие признака k₁ есть признак наличия Постановка задач технической диагностики - student2.ru (противоположное событие), причем Р ( /Di) = 1 - Р (k₁/Di).

Для расчета применяют также формулу (5.15), но значение Р (k₁/Di) в диагностической таблице заменяют на Р ( Постановка задач технической диагностики - student2.ru /Di). В этом случае

Постановка задач технической диагностики - student2.ru

и аналогично Р (D₂/ Постановка задач технической диагностики - student2.ru k₂) = 0,46; Р (D₃/ k₂) = 0,41. Вычислим вероятности состояний в том случае, когда оба признака отсутствуют. Аналогично предыдущему получим

Постановка задач технической диагностики - student2.ru

Отметим, что вероятности состояний D₁ и D₂ отличны от нуля, так как рассматриваемые признаки не являются для них детерминирующими. Из проведенных расчетов можно установить, что при наличии признаков k₁ и k₂ в двигателе с вероятностью 0,91 имеется состояние D₁, т.е. увеличение радиального зазора. При отсутствии обоих признаков наиболее вероятно нормальное состояние (вероятность 0,92). При отсутствии признака k₁ и наличии признака k₂ вероятности состояний D₂ и D₃ примерно одинаковы (0,46 и 0,41) и для уточнения состояния двигателя требуется проведение дополнительных обследований.

Таблица 5.2

Вероятности признаков и априорные вероятности состояний

D_i	P(k₁/D_i)	P(k₂/D_i)	P(D_i)
D₁	0,2	0,3	0,05
D₂	0,4	0,5	0,15
D₃	0,0	0,05	0,80

Решающее правило— правило, в соответствии с которым принимается решение о диагнозе. В методе Байеса объект с комплексом признаков К* относится к диагнозу с наибольшей (апостериорной) вероятностью

K* Постановка задач технической диагностики - student2.ru D_i,если P(D_i/K*) > P(D_j/K*) (j = 1, 2,..., n; i ≠ j). (5.22)

Символ Постановка задач технической диагностики - student2.ru , применяемый в функциональном анализе, означает принадлежность множеству. Условие (5.22) указывает, что объект, обладающий данной реализацией комплекса признаков К* или, короче, реализация К* принадлежит диагнозу (состоянию) D_i. Правило (5.22) обычно уточняется введением порогового значения для вероятности диагноза:

P (D_i/K*) ≥ P_i, (5.23)

где P_i. — заранее выбранный уровень распознавания для диагноза D_i. При этом вероятность ближайшего конкурирующего диагноза не выше 1 – P_i. Обычно принимается P_i ≥ 0,9. При условии

P(D_i/K*)<P_i (5.24)

решение о диагнозе не принимается (отказ от распознавания) и требуется поступление дополнительной информации.

Процесс принятия решения в методе Байеса при расчете на ЭВМ происходит достаточно быстро. Например, постановка диагноза для 24 состояний при 80 многоразрядных признаках занимает на ЭВМ с быстродействием 10 - 20 тысяч операций в секунду всего несколько минут.

Как указывалось, методу Байеса присущи некоторые недостатки, например погрешности при распознавании редких диагнозов. При практических расчетах целесообразно провести диагностику и для случая равновероятностных диагнозов, положив

P(D_i) = l / n (5.25)

Тогда наибольшим значением апостериорной вероятности будет обладать диагноз D_i, для которого Р (K*/D_i) максимальна:

K* Постановка задач технической диагностики - student2.ru D_i,если P(K*/D_i) > P(K*/D_j) (j = 1, 2,..., n; i ≠ j). (5.26)

Иными словами, устанавливается диагноз D_i если данная совокупность признаков чаще встречается при диагнозе D_i, чем при других диагнозах. Такое решающее правило соответствует методу максимального правдоподобия. Из предыдущего вытекает, что этот метод является частным случаем метода Байеса при одинаковых априорных вероятностях диагнозов. В методе максимального правдоподобия «частые» и «редкие» диагнозы равноправны.

Для надежности распознавания условие (5.26) должно быть дополнено пороговым значением

P(K*/D_i) ≥ P_i, (5.27)

где P_i — заранее выбранный уровень распознавания для диагноза D_i.

РАЗДЕЛ №6