Методы статистических решений
В методах статистических решений основным условием решающего правила принимается минимум риска. Следует различать понятия: диагноз D, как действительное техническое состояние объекта, и принятое решение Н, которое может быть как правильным (истинным), так и ошибочным (ложным).
Продолжим анализ процесса распознавания при наличии одного диагностического параметра на базе предыдущего примера: обнаружение неисправного подшипника по признаку перегрева его корпуса. Очевидно, что вероятность распознавания зависит от правильности выбора значения параметра – перегрев корпуса подшипника по отношению к температуре окружающей среды.
Обозначим этот выбираемый параметр как искомую величину x. Задача состоит в выборе диагностического признака k = xо таким образом, что при x> xо следует принимать решение о дефектации подшипника, а при x< xо допускать дальнейшую эксплуатацию. Запишем это правило в аналитической форме:
при x< xо xÎ D1;
при x> xо xÎ D2. (1.20)
Перегрев корпуса неоднозначно характеризует состояние подшипника – у исправного подшипника перегрев корпуса зависит от переизбытка смазки в приработочный период, от зазоров, теплоотдачи, загрузки вагона, скорости и режима движения поезда и других условий. В то же время подшипник может иметь опасные дефекты, не приводящие какое-то время к перегреву (ослабление торцевого крепления, трещина кольца и др.). В зависимости от этих обстоятельств статистические распределения плотности вероятности диагностического параметра x для дефектных D2 и исправных D1 подшипников имеют вид, показанный на рис.1.13.
Так как области D1 и D2 пересекаются, то, в принципе, невозможно выбрать значение xо, при котором всегда соблюдалось бы правило (1.20) и не было ошибочных решений. Поэтому практическая задача состоит в выборе оптимального xо по каким либо критериям. Рассмотрим сначала возможные ошибки при принятии решения.
Ложная тревога – случай, когда принимается решение о наличии дефекта, а в действительности объект находится в исправном состоянии.
Пропуск дефекта – случай принятия решения об исправном состоянии, в то время когда объект содержит дефект.
Обозначим Hij возможные решения по правилу (1.20) (первый индекс соответствует принятому решению, второй – действительному состоянию, 1 – соответствует исправному состоянию, 2 – дефекту), тогда:
Н11 – правильное решение об исправном состоянии;
Н22 – правильное решение о дефектном состоянии;
Н12 – пропуск дефекта;
Н21 – ложная тревога.
Вероятность ложной тревоги Р(Н21), случай, когда при x> xо объект является исправным, но по правилу (1.20) оценивается как дефектный, равна вероятности произведения двух событий: диагноз D1 и значение x> xо при исправном состоянии.Вероятность x> xо при исправном состоянии (условная вероятность ложной тревоги) определяется площадью, ограниченной кривой плотности вероятности исправного состояния при x> xо:
, (1.21)
тогда вероятность ложной тревоги будет равна произведению вероятностей диагноза D1 и значения x> xо:
, (1.22)
где Р1=P(D1) – априорная вероятность диагнозаD1, принимается на базе статистических данных.
Аналогично находится вероятность пропуска дефекта:
. (1.23)
Очевидно, что . Для выбора оптимального xо необходимо дать оценку той и другой ошибке. После этого можно использовать различные методы выбора, то есть принятия решения на основе оценки возможного риска.
Для определения среднего риска принимаем цену ложной тревоги С21 и цену пропуска дефекта С12, тогда средний риск определится выражением:
, (1.24)
где С21 и С12 – условные значения, оценивающие последствия пропуска дефекта и ложной тревоги, как правило, принимается С12>> С21.
В общем случае вводят цену правильных решений, умножая ее, соответственно, на вероятности соответствующих правильных решений, при этом цена правильного решения принимается отрицательной. Выражение (1.24) представляет собой среднее значение (математическое ожидание) риска при заданном значении х0. Но для оптимизации решения необходимо задаться каким-то критерием, и в этом случае наиболее оправдан критерий минимального риска.
4.1. Метод минимального риска
Метод минимального риска: найдем условие минимума среднего риска. Дифференцируя (1.24) по xо и приравнивая производную нулю, получаем условие экстремума:
, (1.25)
В практических задачах сложно дать численную оценку стоимости ошибок, но проще задаться их соотношением, тогда из формулы (1.25) имеем:
. (1.26)
Это условие может определять два значения xо – по минимуму и по максимуму. Для того, чтобы получить не только необходимое, но и достаточное условие минимума, вторая производная должна быть больше нуля , .
Для одномодальных распределений можно ограничиться выбором х0 в пределах:
(1.27)
В соответствии с правилом (1.20) по методу наименьшего риска принимается следующее решение о состоянии объекта, имеющего данное значение параметра x:
, (1.28)
, (1.29)
где представляет собой пороговое значение для отношения правдоподобия–отношение плотностей вероятностей распределения x при двух состояниях.
Данные соотношения выведены для одномерных систем, они могут быть обобщены и на многомерные системы (с несколькими диагностическими параметрами). Основное правило обобщения состоит в том, что одномерные плотности распределения заменяются многомерными.
В нашем примере: Р2=0,002; Р1=0,998, примем отношение С12/С21 = 1000, получим l = 2,004. Соответственно при С12/С21 = 100 получим l = 0,2004. На рис. 1.13 эти значения дают наглядное представление о соотношении вероятностей той или иной ошибки при выборе данных решений.
Метод минимального риска является наиболее оптимальным и общим. Когда сложно, либо невозможно, дать оценку соотношения цены ложной тревоги и пропуска дефекта, либо нет априорных данных для определения вероятности того или иного состояния объекта, используют другие методы.
4.2. Метод минимального числа ошибочных решений
Метод минимального числа ошибочных решений позволяет принимать решение без оценки последствий ошибок.
Вероятность ошибочного решения для решающего правила (1.20):
. (1.30)
Для значений (1.27) получим условие минимума ошибочных решений:
, (1.31)
или
, (1.32)
Тогда принимаем следующие решения:
; (1.33)
. (1.34)
Соотношения (1.32–1.34) являются частным случаем метода минимального риска при условии, что . Это условие часто называют «условием идеального наблюдателя» и оно может быть оправдано для некоторых задач контроля в условиях производства, когда пропуск не приводит к тяжелым последствиям и обнаруживается на последующих технологических операциях, но для условий работы подвижного состава этот метод неприемлем, так как последствия ошибочных решений, как правило, несоизмеримы.
4.3. Метод минимакса
Метод минимакса применим для ситуации, когда отсутствуют предварительные статистические данные о вероятности диагнозов D1 и D2. При этом выбирают значение х0 таким образом, чтобы при наименее благоприятных значениях Р1 («наихудший случай») потери, связанные с ошибочными решениями, были бы минимальными. Исходя из условия Р2 = (1–Р1), будем считать, что величина риска является функцией х0 и Р1,
. (1.35)
Минимизируем риск, приравнивая нулю частные производные:
. (1.36)
В результате получаем:
, (1.37)
. (1.38)
Решая уравнения (1.37) и (1.38), определяем х0 соотношением функций распределения, которые определяют площади условных вероятностей ошибок на рис. 1.13.
(1.39)
(1.40)
Зависимость (1.40) выражает равенство условных рисков ошибочных решений.
4.4. Метод наибольшего правдоподобия
Метод наибольшего правдоподобия дает решение, не требующее знания точных значений стоимости ошибок и вероятностей состояния, а только качественно отражающее их соотношение. Тогда правило решения принимается следующим:
(1.41)
,
То есть, граничное значение находится в точке пересечения кривых плотностей вероятностей из условия:
, . (1.42)
Условие (1.40) можно использовать, когда заранее известно, что С12>> С21, Р1>> Р2.
В условиях работы подвижного состава бывает очень сложно дать количественную оценку последствий пропуска дефекта. Например, в нашем примере, дефект буксового подшипника вагона может привести к задержке поезда (браку в работе), к аварии, последствия которой более тяжелые и, наконец, к крушению поезда, последствия которого могут быть катастрофическими.
В то же время ложная тревога поддается более точной оценке потерь, связанных в нашем случае с обнаружением ошибки в принятии решения. Более того, можно определить допустимый уровень частоты появления ложной тревоги, не влияющий существенно на работу транспорта в целом.
В данном случае полезно использовать метод Неймана-Пирсона, в соответствии с которым минимизируется вероятность пропуска цели (дефекта). Если задан максимально допустимый уровень вероятности ложной тревоги L, то условием наименьшейвероятности пропуска дефекта будет:
. (1.43)
Условие (1.36) однозначно определяет величину xо для заданного уровня вероятности ложной тревоги L. В ряде случаев можно исходить из заданного значения вероятности пропуска дефекта F и минимизировать вероятность ложной тревоги:
. (1.44)
В нашем примере значение L будет зависеть от конкретных условий эксплуатации. Приборы обнаружения перегретых букс располагаются, как правило, перед станцией не менее, чем за 3 км от входного сигнала с тем, чтобы в случае обнаружения опасного перегрева была возможность остановить поезд на станции и снизить скорость перед въездом на стрелки до 20 км/ч, применяя при этом только служебное регулировочное торможение.
Цена ложной тревоги зависит от того, перед какой станцией расположен прибор. Если прибор расположен перед участковой станцией, на которой не предусмотрена графиком остановка поезда, то цена ложной тревоги высока, более того, в случае частых задержек поездов движение на участке может быть парализовано. Если прибор расположен перед сортировочной станцией, где предусмотрено техническое обслуживание вагонов и имеется достаточное путевое развитие, а также имеется механизированный пункт текущего ремонта, цена ложной тревоги мала и связана в основном с контрольной проверкой показаний аппаратуры.
Поэтому в практике эксплуатации приборов обнаружения перегретых букс для каждой станции устанавливается уровень порога температуры с учетом конкретных условий.