Статистические методы распознавания. Метод Бейеса.

Основное преимущество статических методов распознавания состоит в возможности одновременного учета признаков различной физической природы, т.к. они характеризуются безразмерными величинами - вероятностями их появления при различных состояниях системы.

Метод Байесса.

Среди методов ТД, метод основанный на обобщенной формуле Б. который занимает особое место благодаря простоте и эффективности.

Основные недостатки: большой объем предварительной информации, угнетение редко встречающихся диагнозов и др.

Основы метода.

Метод основан на простой формуле Байесса. Если имеется диагноз Статистические методы распознавания. Метод Бейеса. - student2.ru и простой признак Статистические методы распознавания. Метод Бейеса. - student2.ru , встречающийся при этом диагнозе, то вероятность совместного появления событий:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (1)

Из этого равенства формула Байесса:

Статистические методы распознавания. Метод Бейеса. - student2.ru , (2)

где Статистические методы распознавания. Метод Бейеса. - student2.ru - вероятность диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru , определяемая по статистическим данным (априорная вероятность диагноза). Так если предварительно обследовано Статистические методы распознавания. Метод Бейеса. - student2.ru объектов и у Статистические методы распознавания. Метод Бейеса. - student2.ru имелось состояние Статистические методы распознавания. Метод Бейеса. - student2.ru , то

Статистические методы распознавания. Метод Бейеса. - student2.ru . (3)

Статистические методы распознавания. Метод Бейеса. - student2.ru -вероятность появления признака у объектов с состоянием Статистические методы распознавания. Метод Бейеса. - student2.ru . Если среди Статистические методы распознавания. Метод Бейеса. - student2.ru объектов, имеющих диагноз Статистические методы распознавания. Метод Бейеса. - student2.ru , у Статистические методы распознавания. Метод Бейеса. - student2.ru появился признак Статистические методы распознавания. Метод Бейеса. - student2.ru , то

Статистические методы распознавания. Метод Бейеса. - student2.ru . (4)

Статистические методы распознавания. Метод Бейеса. - student2.ru -вероятность появления признака Статистические методы распознавания. Метод Бейеса. - student2.ru во всех объектах независимо от состояния объекта. Пусть из общего числа Статистические методы распознавания. Метод Бейеса. - student2.ru объектов признак Статистические методы распознавания. Метод Бейеса. - student2.ru был обнаружен у Статистические методы распознавания. Метод Бейеса. - student2.ru объектов, тогда:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (5)

Статистические методы распознавания. Метод Бейеса. - student2.ru -вероятность диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru после того как стало известно наличие у рассматриваемого объекта признак Статистические методы распознавания. Метод Бейеса. - student2.ru .

Обобщенная формула Байесса.

Эта формула относится к случаю когда обследование проводится по комплексу признаков Статистические методы распознавания. Метод Бейеса. - student2.ru , включающему признаки Статистические методы распознавания. Метод Бейеса. - student2.ru . Каждый из признаков Статистические методы распознавания. Метод Бейеса. - student2.ru имеет Статистические методы распознавания. Метод Бейеса. - student2.ru разрядов Статистические методы распознавания. Метод Бейеса. - student2.ru . В результате обследования становится известной реализация признака

Статистические методы распознавания. Метод Бейеса. - student2.ru , (6)

и всего комплекса Статистические методы распознавания. Метод Бейеса. - student2.ru (*-означает конкретное значение признака).

Формула Байесса для комплекса признаков:

Статистические методы распознавания. Метод Бейеса. - student2.ru , (7)

где Статистические методы распознавания. Метод Бейеса. - student2.ru -вероятность диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru , после того как стали известны результаты обследования по комплексу признаков Статистические методы распознавания. Метод Бейеса. - student2.ru .

Статистические методы распознавания. Метод Бейеса. - student2.ru -предварительная вероятность диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru (по предшествующей статистике). Здесь предполагается, что система находится только в одном из состояний и

Статистические методы распознавания. Метод Бейеса. - student2.ru . (8)

Если комплекс признаков состоит из Статистические методы распознавания. Метод Бейеса. - student2.ru признаков, то

Статистические методы распознавания. Метод Бейеса. - student2.ru . (9)

Для диагностически независимых признаков:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (10)

Вероятность появления комплекса признаков Статистические методы распознавания. Метод Бейеса. - student2.ru :

Статистические методы распознавания. Метод Бейеса. - student2.ru . (11)

Обобщенная формула Байесса может быть записана в виде:

Статистические методы распознавания. Метод Бейеса. - student2.ru (12)

где Статистические методы распознавания. Метод Бейеса. - student2.ru определяется по (9) или (10). Из соотношения вытекает:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (13)

Следует отметить, что знаменатель формулы Байесса одинаков для всех диагнозов. Это позволяет определить сначала вероятность совместного появления i-го диапазона и данной реализации:

Статистические методы распознавания. Метод Бейеса. - student2.ru , (14)

и затем апостериорную вероятность диагноза:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (15)

Если реализация некоторого комплекса признаков Статистические методы распознавания. Метод Бейеса. - student2.ru является детерминирующей для диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru , то этот комплекс не встречается при других диагнозах:

Статистические методы распознавания. Метод Бейеса. - student2.ru

Тогда

Статистические методы распознавания. Метод Бейеса. - student2.ru (15)

Для определения вероятности диагнозов по методу Байесса необходимо составить диагностическую матрицу, которая формируется на основе предварительного статистического материала:

Диагноз Признак kj  
Di k1 k2 k3 P(Di)
  P(k11/Dj) P(k12/Dj) P(k13/Dj) P(k21/Dj) P(k22/Dj) P(k23/Dj) P(k24/Dj) P(k31/Dj) P(k32/Dj)  
D1 0,8 0,2 0,1 0,1 0,6 0,2 0,2 0,8 0,3
D2 0,1 0,7 0,2 0,3 0,7 0,1 0,9 0,1
                   

В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байесса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения Статистические методы распознавания. Метод Бейеса. - student2.ru , но и следующие величины: Статистические методы распознавания. Метод Бейеса. - student2.ru -общее число объектов, использованных при составлении матрицы; Статистические методы распознавания. Метод Бейеса. - student2.ru -число объектов с диагнозом Статистические методы распознавания. Метод Бейеса. - student2.ru ; Статистические методы распознавания. Метод Бейеса. - student2.ru -число объектов с диагнозом Статистические методы распознавания. Метод Бейеса. - student2.ru , обследованных по признаку Статистические методы распознавания. Метод Бейеса. - student2.ru . Если поступает новый объект с диагнозом Статистические методы распознавания. Метод Бейеса. - student2.ru , то производится корректировка прежних априорных вероятностей диагнозов:

Статистические методы распознавания. Метод Бейеса. - student2.ru (17)

Далее вводятся поправка к вероятностням признаков

Статистические методы распознавания. Метод Бейеса. - student2.ru Статистические методы распознавания. Метод Бейеса. - student2.ru , (18)

где Статистические методы распознавания. Метод Бейеса. - student2.ru - разряд признака Статистические методы распознавания. Метод Бейеса. - student2.ru Статистические методы распознавания. Метод Бейеса. - student2.ru .

Пример 1.

Пусть при наблюдении за газотурбинным двигателем проверяются два признака: Статистические методы распознавания. Метод Бейеса. - student2.ru -повышение температуры газа за турбиной более чем на 500 С и

Статистические методы распознавания. Метод Бейеса. - student2.ru - увеличение времени выхода на максимальную частоту вращения более чем на

5 с. Предположим, что для данного типа двигателей появление этих признаков связано либо с неисправностью топливного регулятора(состояние Статистические методы распознавания. Метод Бейеса. - student2.ru ), либо с увеличение радиального зазора в турбине(состояние Статистические методы распознавания. Метод Бейеса. - student2.ru ).

При нормальном состоянии двигателя (состояние Статистические методы распознавания. Метод Бейеса. - student2.ru ) признак Статистические методы распознавания. Метод Бейеса. - student2.ru не наблюдается, а признак Статистические методы распознавания. Метод Бейеса. - student2.ru наблюдается в 5% случаев. На основании статистических данных известно, что 80% двигателей вырабатывают ресурс в нормальном состоянии, 5% двигателей имеют состояние Статистические методы распознавания. Метод Бейеса. - student2.ru и 15% - состояние Статистические методы распознавания. Метод Бейеса. - student2.ru . Известно также, что признак Статистические методы распознавания. Метод Бейеса. - student2.ru встречается при состоянии Статистические методы распознавания. Метод Бейеса. - student2.ru в 20%. а при состоянии Статистические методы распознавания. Метод Бейеса. - student2.ru в 40%случаев; признак Статистические методы распознавания. Метод Бейеса. - student2.ru при состоянии Статистические методы распознавания. Метод Бейеса. - student2.ru встречается в 30%, а при состоянии Статистические методы распознавания. Метод Бейеса. - student2.ru -в 50% случаев. Сведем эти данные в диагностическую таблицу(таблица 2).

Найдем сначала вероятности состояний двигателя, когда обнаружены оба признака Статистические методы распознавания. Метод Бейеса. - student2.ru и Статистические методы распознавания. Метод Бейеса. - student2.ru . Для этого, считая признаки независимыми, применим формулу (12).

Вероятность состояния

Статистические методы распознавания. Метод Бейеса. - student2.ru

Аналогично получим Статистические методы распознавания. Метод Бейеса. - student2.ru

Определим вероятность состояний двигателя, если обследование показало, что повышение температуры не наблюдается(признак Статистические методы распознавания. Метод Бейеса. - student2.ru отсутствует), но увеличивается время выхода на максимальную частоту вращения(признак Статистические методы распознавания. Метод Бейеса. - student2.ru наблюдается). Отсутствие признака Статистические методы распознавания. Метод Бейеса. - student2.ru есть признак наличия Статистические методы распознавания. Метод Бейеса. - student2.ru , причем Статистические методы распознавания. Метод Бейеса. - student2.ru Для расчета применяют также формулу (12), но значение Статистические методы распознавания. Метод Бейеса. - student2.ru в диагностической таблице заменяют на Статистические методы распознавания. Метод Бейеса. - student2.ru . В этом случае

Статистические методы распознавания. Метод Бейеса. - student2.ru

и аналогично Статистические методы распознавания. Метод Бейеса. - student2.ru Вычислим вероятности состояний в том случае, когда оба признака отсутствуют. Аналогично предыдущему получим

Статистические методы распознавания. Метод Бейеса. - student2.ru

Статистические методы распознавания. Метод Бейеса. - student2.ru

Отметим. что вероятности состояний Статистические методы распознавания. Метод Бейеса. - student2.ru и Статистические методы распознавания. Метод Бейеса. - student2.ru отличны от нуля, так как рассматриваемые признаки не являются для них детерминирующими. Из проведенных расчетов можно установить, что при наличии признаков Статистические методы распознавания. Метод Бейеса. - student2.ru и Статистические методы распознавания. Метод Бейеса. - student2.ru в двигателе с вероятностью 0,91 имеется состояние Статистические методы распознавания. Метод Бейеса. - student2.ru , т.е. увеличение радиального зазора. При отсутствии обоих наиболее вероятно нормальное состояние(вероятность 0,92). При отсутствии признака Статистические методы распознавания. Метод Бейеса. - student2.ru и наличии признака Статистические методы распознавания. Метод Бейеса. - student2.ru вероятности состояний Статистические методы распознавания. Метод Бейеса. - student2.ru и Статистические методы распознавания. Метод Бейеса. - student2.ru примерно одинаковы(0,46 и 0,41) и для уточнения состояния двигателя требуется проведение дополнительных обследований.

Таблица 2.

Вероятности признаков и априорные вероятности состояний.

Di P(k1/Di) P(k2/Di) P(Di)
D1 D2 D3 0,2 0,4 0,0 0,3 0,5 0,05 0,05 0,15 0,80

Решающее правило.

Правило, в соответствии с которым принимается решение о диагнозе. В методе Байесса объект с комплексом признаков Статистические методы распознавания. Метод Бейеса. - student2.ru относится к диагнозу с наибольшей(апостериорной) вероятностью:

Статистические методы распознавания. Метод Бейеса. - student2.ru . (19)

Пороговое значение для вероятности диагноза: Статистические методы распознавания. Метод Бейеса. - student2.ru , (20)

где Статистические методы распознавания. Метод Бейеса. - student2.ru -заранее выбранный уровень распознавания для диагноза Статистические методы распознавания. Метод Бейеса. - student2.ru .

При: Статистические методы распознавания. Метод Бейеса. - student2.ru (21)

- решение о диагнозе не принимается (отказ от распознавания) и требует поступления новой информации.

При практических расчетах целесообразно провести диагностику и для случая равновероятностных диагнозов, положив

Статистические методы распознавания. Метод Бейеса. - student2.ru . (22)

Тогда наибольшим значением апостериорной вероятности будет обладать Статистические методы распознавания. Метод Бейеса. - student2.ru , для которого Статистические методы распознавания. Метод Бейеса. - student2.ru максимальна.

Статистические методы распознавания. Метод Бейеса. - student2.ru (23)

Такое решающее правило соответствует методу максимального правдоподобия.

Пороговое значение для (23):

Статистические методы распознавания. Метод Бейеса. - student2.ru (24)

Наши рекомендации