Задание и методические указания к решению задачи №2 по диагностике (к курсовой работе)
1. Теоретическая часть
Метод Байеса является одним из наиболее простых и мощных методов. Этот метод основан на вычислении условной вероятности появления такого события как диагноз Di при появлении конкретной реализации комплекса признаков К* . Рассмотрим первоначально основные положения этого метода на простейшем случае, когда имеется диагноз Di и один бинарный признак Кj, встречающийся при появлении этого диагноза. Определим некоторые понятия
1. P(Di) - априорная (до опытная) вероятность появления диагноза Di . Эту вероятность определяют по статистическим данным на начальном этапе применения метода исходя из следующих соображений. Если при обследовании N объектов диагноза установлено, что из них Ni имеют диагноз Di, то вероятность появления этого диагноза определяется соотношением
2. Р(Кj/Di) - априорная условная вероятность появления признака Кj у объектов имеющих техническое состояние (диагноз) Di. Эта вероятность так же определяется на начальном этапе по имеющимся статистическим данным. Если из N обследованных объектов Ni находилось в диагнозе Di, а из них Nij объектов имели признак Kj, то условная вероятность появления признака Кj у объектов с диагнозом Di вычисляется следующим образом
3. P(Kj) - априорная вероятность появления признака Kj у всех объектов независимо от их состояния. То есть, если из N объектов независимо от их технического состояния у Nj был обнаружен признак Kj, то эта вероятность определяется следующим соотношением
Напомним некоторые положения теории вероятностей. Пусть мы имеем два события А и В. Известны вероятности появления этих событий Р(А) и Р(В), а также условная вероятность появления события А при уже состоявшемся событии В Р(А/В) и условная вероятность появления события В при уже состоявшемся событии А Р(В/А). Тогда вероятность одновременного появления событий А и В Р(А,В) определяется следующей формулой
Р(А,В) = Р(А) Р(В/А) = Р(В) Р(А/В).
Воспользовавшись этой формулой и данными выше понятиями можно записать вероятность одновременного появления диагноза Di и признака Kj следующим образом
P(Di,Kj)=P(Di) P(Kj/Di)=P(Kj) P(Di/Kj).
В этом выражении величина P(Di/Кj) - это условная вероятность существования диагноза Di при обнаружении признака Kj, то есть это та величина, которая ищется при вероятностном подходе к решению задачи распознавания диагнозов. После соответствующих преобразований из последнего выражения получим формулу Байеса
P(Di/Kj)={P(Di) P(Kj/Di)}/ P(Kj). (1)
Формула (1) получена для случая, когда при постановке диагноза используется один простой признак.
Для принятия решения о диагнозе при использовании набора (комплекса) признаков применяется обобщенная формула Байеса, которую можно получить из следующих соображений. Если диагностирование проводится по комплексу признаков, то в результате обследования мы получаем конкретную реализацию каждого j-того признака Kj* и, следовательно, конкретную реализацию комплекса признаков К* в целом. В этом случае формула Байеса предстанет в виде:
(2)
где P(Di/К*) - условная вероятность нахождения объекта диагностики в диагнозе Di при условии, что в ходе обследования была получена реализация К* комплекса признаков К; Р(К*) -вероятность появления конкретной реализации К* комплекса признаков К у всех диагностируемых объектов, независимо от их технического состояния; Р(К*/Di) - условная вероятность появления конкретной реализации К* комплекса диагностических признаков К для объектов, находящихся в диагнозе Di.
Преобразуем последние выражения с учетом следующих соображений.
Примем, что система может находится только в одном из n технических состояний, тогда
Будем считать, что отдельные диагностические признаки, входящие в состав комплекса признаков, независимые. Такое допущение вполне справедливо для реальных условий при большом числе влияющих факторов. Тогда условную вероятность Р(К*/Di) в соответствии с известными положениями теории вероятностей можно представить как произведение
где P(K*j/Di) - условная вероятность появления конкретной реализации К*j j-того признака при нахождении объекта диагностики в диагнозе Di; j= 1... l.
Вероятность же появления конкретной реализации комплекса признаков при нахождении объекта во всех диагнозах Р(К*) можно представить следующим образом
.
С учетом последних соотношений уравнение (2) перепишем в окончательном виде
(3)
Полученное уравнение называется обобщённой формулой Байеса.
В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними и тогда (4)
Для определения вероятности диагноза по методу Байеса составляется исходная диагностическая матрица (табл. 1.1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков P(Kjs/Di) при различных диагнозах. Если признаки двухразрядные (простые признаки "да-нет"). то в табл. 1.1 достаточно указать вероятность появления признака P(Kj/Di). Вероятность отсутствия признака (5)
Сумма вероятностей всехреализаций признака Кjравна единице .
При методе Байеса используется следующее правило: объект с комплексом признаков К* относится к диагнозу (классу) с наибольшей вероятностью К*ÎDi, если P(Di/K*)>P(Dj/K*), j=1, 2, …l; i¹j.
Таблица 1.1
Диагностическая матрица
Диагнозы Di | Признаки | P(Di) | |||
К1 | К2 | ||||
P(K11/Di) | P(K12/Di) | P(K21/Di) | P(K22/Di) | ||
D1 | |||||
… | |||||
… | |||||
… | |||||
Dn |
2. Пример
При диагностировании степени электрокоррозии арматуры железобетонных опор с помощью прибора АДО-2М проверяются два признака: K1 – заниженное значение потенциала арматуры и К2- завышенное значение декремента колебаний опоры. Появление этих признаков связано либо с образованием трещин в опоре (состояние D1), либо наличием коррозии в арматуре опоры (состояние D2). При нормальном состоянии опоры (состояние D3) признак К1 не наблюдается, а признак К2 наблюдается в 4% случаях. В состоянии D2 признак K1 встречается в 18%, а признак К2 -в 31% случаев. В состоянии D2 признак K1 встречается в 38%, а признак К2-в 49% случаях. Известно, что по окончанию срока службы 73% опор имеют нормальное состоянии, 6% опор имеют состояние D1 и 17% - состояние D2 . Требуется определить состояние опоры (поставить диагноз) при возможных сочетаниях проверяемых признаков.
1. Сведем исходные данные в диагностическую таблицу (табл. 1.2). При этом вероятности отсутствия признаков вычислим по формуле (5).
Таблица 1.2
Вероятности признаков и априорные вероятности состояний
Di | P(K1/Di) | P( /Di) | P(K2/Di) | P( /Di) | P(Di) |
D1 | 0.18 | 0.82 | 0.31 | 0.69 | 0.1 |
D2 | 0.38 | 0.62 | 0.49 | 0.51 | 0.17 |
D3 | 0.0 | 1.0 | 0.04 | 0.96 | 0.73 |
2. Найдём вероятности, когда обнаружены оба признака P(Di/K1K2). Считая признаки независимыми, применим формулы (3) и (4). Вероятность состояния D1 при наличии признаков К1 и К2:
Аналогично получим P(D2/K1K2)=0.904; P(D3/K1K2)=0.
3. Определим вероятности нахождения опоры в различных состояний, если обследование показало, что потенциал в норме (признак К1 отсутствует), но увеличен декремент колебаний (признак К2 наблюдается). Используем те же формулы (3) и (4):
Аналогично получим P(D2/ K2)=0.537; P(D3/ K2)=0.304.
4. Вычислим вероятности состояний, когда признак К1 наблюдается, а признак К2 – отсутствует (формулы 3 и 4)
Соответственно P(D2/K1 )=0.816; P(D3/ K1 )=0.0.
5. Для случая, когда не наблюдаются оба признака:
P(D1/ )=0.043; P(D2/ )=0.068; P(D3/ )=0.889.
Сведём результаты в табл. 1.3.
Таблица 1.3
Результаты диагноза
Di | P(Di/K1K2) | P(Di/ K2) | P(Di/K1 ) | P(Di/ ) |
D1 | 0,10 | 0,16 | 0,18 | 0,04 |
D2 | 0,90 | 0,54 | 0,82 | 0,07 |
D3 | 0,00 | 0,30 | 0,00 | 0,89 |
3. Анализ приведённых результатов позволяет установить:
- При наличии признаков К1 и К2 опора с вероятностью 0,90 имеется состояние D2 (повышенная коррозия арматуры).
- При отсутствии обоих признаков наиболее вероятно нормальное состояние (вероятность 0,89).
- При наблюдении только признака К1 наиболее вероятно состояние D2 .
- При наблюдении только признака К2 однозначно дать ответ о техническом состоянии опоры нельзя, требуется проведение дополнительного обследования, т.к. связь признака с состояниями опоры выражена нечётко.