Прогнозирование методами статистической классификации
Статистическая классификация базируется на теории распознавания образов. Распознавание образов предполагает отнесение изучаемого явления или объектапо их изображению к одному из известных классов объектов или явлений. При этом считается, что каждый класс характеризуется некоторым образом, присущим каждому изображению из множества изображений, составляющих этот класс.
Для этого необходимо решение двух задач. Формирование классов, что часто трактуется как обучение, при котором на основе изучения изображений каждого класса определяется мера подобия или дается описание класса, и собственно распознавание, при котором определяется также мера подобия классу изображения.
По полученным результатам принимаются решения об отнесении изображений к тому классу, мера подобия ОД которому максимальна.
Принадлежность изображения к определенному классу характеризуется функцией подобия, с помощью которой определяется вероятность принадлежности к этому классу. Следует заметить, что отнесение изображения к определенному классу может основываться в принципе не на подобии (близости), а на различиях между классами.
При решении задачи прогнозирования ОД рассматриваются классы , , которые разделяются на (рис.9.11):
параметрические : ,
где – интервал в поле допуска;
временные : ,
где Тi...Тj – временной интервал.
Множество и размеры класса определяются спецификой ОД. Они объединяют объекты, имеющие идентичные параметры состояния, совокупность свойств и т.п. Каждый временной класс характеризует долговечность, а параметрический – запас работоспособности.
Классы представляют собой своего рода эталоны (образцы, портреты). Они задаются на основе испытаний. При этом определяются экстраполяционные связи , соединяющие значения диагностических параметров с классами.
Классы необходимо разделить между собой. Если классы сильно различаются, то границу найти легко; если перекрываются, то трудно. На границе состояние распознаваемо. Задать границы классов (рис.9.12) можно методом зон, используя решающее правило
Чем больше зона "0", тем надежнее распознавание.
Если состояние объекта оценивается n параметрами, то мера близости рассчитывается как сумма
Для примера (см. рис.9.12), если d<0, то ОД относится к классу R1, если d>0, то – к классу R2. Если d = 0, то ОД не может быть классифицирован с помощью этого метода.
Задача прогнозирования при использовании метода статистической классификации (распознавания объектов) формулируется следующим образом.
Состояние объекта характеризуется совокупностью из m диагностических параметров: , (в простейшем случае – одним). Известны значения в момент времени to или в ограниченный интервал времени [to,tl]. Необходимо принять решение о принадлежности объекта по состоянию к одному из известных классов .
Подобная постановка задачи прогнозирования предполагает, что каждой совокупности значений диагностических параметров , , характеризующей определенный класс состояний, соответствуют определенные долговечность или степень работоспособности объекта.
Процедура прогнозирования состояния методами статической классификации предусматривает:
1) определение обучающей выборки N объектов с гарантированными сроками сохранения работоспособности Тг. Каждому объекту выборки N соответствует определенный срок сохранения работоспособности ti, ;
2) в зависимости от соотношения величин Тг и ti объекты разбиваются на классы;
3) описание каждого объекта диагностирования m-мерным вектором состояния;
4) выбор или построение функции распознавания или решающего правила d;
5) собственно распознавание, т.е. отнесение объекта к определенному классу по его состоянию.
Первые два действия относятся, как было сказано выше, к решению задачи обучения, вследствие чего их часто называют этапом обучения, а последние три соответствуют этапу распознавания и называются основными.