Выбор решающего правила
Основной задачей в теории распознавания образов (ТРО) является построение решающего правила (РП) – математического выражения, позволяющего отличить один класс от другого. Одним из способов построения РП является построение линейных разделяющих поверхностей вида:
Y = alxl+a2x2+a3x3+...anxn, (1.11),
где a1...an – настраиваемые параметры, x1..xn – классификационные признаки. Уравнение (1.11) представляет собой ничто иное как каноническое уравнение плоскости в пространстве вида alxl+a2x2+a3x3+...anxn+C=0, в котором свободный член уравнения С вынесен в правую часть и обозначен через Y. Таким образом, при изменении параметра Y уравнение (1.11) задает семейство параллельных плоскостей, при этом параметры al.. .an, определяют углы наклона плоскости к осям координат, Y есть параметр, пропорциональный Евклидову расстоянию от начала координат до плоскости (или гиперплоскости, в зависимости от размерности пространства). В другой постановке задачи, при подстановке в уравнение (1.11) классификационных признаков xl...хn, будет получено расстояние Y, пропорциональное расстоянию от начала координат до плоскости, проходящей через точку xl...xn. Параметр Y, в данном случае, будет являться решающим правилом, на основании которого принимается решение о принадлежности объекта с координатами xl...xn к классу wk. Приведем геометрическую интерпретацию разделения классов поверхностью, пусть классификационные признаки - оси n-мерного пространства. Каждый объект (наблюдение), является точкой этого пространства с координатами, представляющими собой наблюдаемые значения этой переменной. Если классы отличаются друг от друга по наблюдаемым переменным, их можно представить как скопление точек. Так как классы частично пересекаются, соответствующие им "территории" не совпадают. Для определения положения класса можно использовать их центры (центроиды).
Роль числа классов становится понятной, если обратиться к геометрическим аналогам. Для любых пространств, где применимы аксиомы Евклидовой геометрии, 2 точки определяют положение прямой линии, 3 – плоскость, 4 – 3-х мерную поверхность и т.д. Принцип сводится к тому, что точки определяют пространство (линию, плоскость и т.д.), имеющие размерность на единицу меньшую, чем число точек.
Процесс нахождения настраиваемых параметров a1...an называется процессом обучения. При этом подбираются такие значения параметров, при которых будет достигнут верхний критерий качества разделения классов. Данная задача может решаться как аналитически (например, с использованием методов аналитической геометрии в пространстве), так и итерационно. В последнем случае производится пошаговое настраивание параметров модели до достижения верхнего экстремума качества. При использовании аналитических методов можно использовать следующий подход. Плоскость, проходящая через точку M(0)(x0,y0,z0) и перпендикулярная к вектору N(A,B,C) представляется уравнением вида
A(x-x0)+B(y-y0)+C(z-z0)=0 (1.12),
или
Ax+By+Cz+D=0, (1.13),
где через D обозначена величина – (Ax0+By0+Cz0). Вектор N(A,B,C) называется нормальным вектором разделяющей плоскости. Полученное уравнение вида (1.13) легко преобразуется в уравнение (1.11) путем изменения обозначений переменной и переноса свободного члена уравнения (1.13) в правую часть. Рассмотренный случай с использованием 3-х мерного пространства может быть перенесен на пространство размерностью n.
Еще одним методом классификации является построение решающего правила в виде эталонных классификаторов. Эталоны, как правило, состоят из набора элементарных замкнутых объемов многомерного пространства, образованного выбранными, на этапе предварительного анализа данных, классификационными переменными. Чаще всего эталоны представляют в виде гиперкубов, гиперпараллелепипедов, гиперсфер, гиперэллипсоидов и т.д.
В практических приложениях используют гиперпараллелепипеды, описываемые системой неравенств типа (1.14) и гиперсферы (1.15).
(1.14)
где i - номер классификационной переменной,
aik и bik - нижняя и верхняя граница ограничения Wk по признаку хi.
(1.15)
где mi - коэффициент, определяющий центр гиперсферы,
Rk – ее радиус. На рисунке 1.1 и 1.2 представлена геометрия гиперобъемов, формируемых системой выражений типа (1.14) и (1.15) соответственно.
Классы со сложной геометрической структурой могут быть представлены в виде целого набора элементарных гиперобъемов, например, так, как это представлено на рисунке 1.3.
Рис. 1.3. Представление классов со сложной геометрической структурой наборами элементарных гиперобъемов.
Построение решающих правил в виде эталонных классификаторов сводится к нахождению настраиваемых параметров модели типа 1.14 и 1.15. Для гиперкуба 1.14 – настраиваются параметры aik и bik, которые представляют собой максимальное и минимальное значения элементов ТЭД для k-го класса i-го признака, для гиперсферы типа 1.15 определяются параметры центра гиперсферы, например как центр масс данного класса, а также радиуса Rk. Нахождение данного параметра сводится к поиску наиболее удаленной от центра точки в ТЭД для класса номер k. При этом найденное расстояние и будет соответствовать заданному параметру.
В данном курсовом проекте будет использоваться второй метод получения решающего правила.
Расчетная часть
Исходные данные в табл. 2.1 – это таблица экспериментальных данных, разбитая по пяти признакам и сгруппированная в два класса.
Таблица 2.1