Методика дискриминантного анализа

Дискриминантный анализ – это совокупность методов, позволяющих решать задачи идентификации объектов по заданному набору характерных признаков.

Весь процесс проведения дискриминантного анализа разбивается на два этапа и каждый из них можно рассматривать как совершенно самостоятельный метод.

Первый этап – выявление и формальное описание различий между существующими множествами (группами) наблюдаемых объектов.

Второй этап – непосредственная классификация новых объектов, т.е. отнесение каждого объекта к одному из существующих множеств.

Пусть имеется множество единиц наблюдения, каждая из которых характеризуется несколькими признаками (переменными): Методика дискриминантного анализа - student2.ru – значения j-й переменной у i-гообъекта Методика дискриминантного анализа - student2.ru ; Методика дискриминантного анализа - student2.ru .

Предположим, что все множество объектов разбито на несколько подмножеств (два и более). Из каждого подмножества взята выборка объемом Методика дискриминантного анализа - student2.ru , где Методика дискриминантного анализа - student2.ru – номер подмножества (класса) Методика дискриминантного анализа - student2.ru .

Признаки, которые используются для того, чтобы отличать одно подмножество от другого, называются дискриминантными переменными.

Число дискриминантных переменных не ограничено, но на практике выбор должен осуществляться на основании логического анализа исходной информации. Число объектов наблюдения должно превышать число дискриминантных переменных, т.е. Методика дискриминантного анализа - student2.ru . Предполагается, что дискриминантные переменные – линейно независимые нормально распределенные многомерные величины.

Рассмотрим случай для двух дискриминантных переменных. Функция Методика дискриминантного анализа - student2.ru называется канонической дискриминантной функцией, а величины Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru – дискриминантными переменными

Методика дискриминантного анализа - student2.ru . (1.1)

Дискриминантная функция может быть как линейной, так и нелинейной. Выбор вида этой функции зависит от геометрического расположения разделяемых классов в пространстве дискриминантных переменных.

Коэффициенты дискриминантной функции ( Методика дискриминантного анализа - student2.ru ) определяются таким образом, чтобы Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru как можно больше отличались между собой.

Вектор коэффициентов дискриминантной функции ( Методика дискриминантного анализа - student2.ru ) определяется по формуле

Методика дискриминантного анализа - student2.ru . (1.2)

Полученные значения коэффициентов подставляют в формулу (1.1) и для каждого объекта в обоих множествах вычисляют дискриминантные функции Методика дискриминантного анализа - student2.ru , затем находят среднее значение для каждой группы ( Методика дискриминантного анализа - student2.ru ). Таким образом, каждому Методика дискриминантного анализа - student2.ru -му наблюдению, которое первоначально описывалось Методика дискриминантного анализа - student2.ru -переменными, будет соответствовать одно значение дискриминантной функции, и размерность признакового пространства снижается.

Классификация при наличии двух обучающих выборок.Перед тем как приступить непосредственно к процедуре классификации, нужно определить границу, разделяющую два множества. Такой величиной может быть значение функции, равноудаленное от Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru , т.е.

Методика дискриминантного анализа - student2.ru . (1.3)

Величина с называется константой дискриминации.

Объекты, расположенные над разделяющей поверхностью Методика дискриминантного анализа - student2.ru находятся ближе к центру множества Методика дискриминантного анализа - student2.ru ,следовательно, могут быть отнесены к первой группе, а объекты, расположенные ниже этой поверхности, ближе к центру второго множества, т.е. относятся ко второй группе. Если граница между группами будет выбрана как сказано выше, то вэтом случае суммарная вероятность ошибочной классификации будет минимальной.

Классификация при наличии Методика дискриминантного анализа - student2.ru -обучающих выборок.Рассмотрим особенности классификации объектов, возникающие при наличии Методика дискриминантного анализа - student2.ru-обучающих выборок (Методика дискриминантного анализа - student2.ru>2). Как и в случае с двумя обучающими выборками, предполагается, что каждое множество является нормально распределенным с различными векторами средних значений. Оценка совместной ковариационной матрицы Методика дискриминантного анализа - student2.ru рассчитывается по следующей формуле:

Методика дискриминантного анализа - student2.ru , (1.4)

где Методика дискриминантного анализа - student2.ru– количество обучающих выборок; Методика дискриминантного анализа - student2.ru – матрица ковариации для i-й выборки; Методика дискриминантного анализа - student2.ru – численность i-й выборки.

В этом случае каждому множеству ставится в соответствие своя дискриминантная функция вида

Методика дискриминантного анализа - student2.ru .

Вектор коэффициентов этой функции Методика дискриминантного анализа - student2.ru ( Методика дискриминантного анализа - student2.ru ) рассчитывается по формуле Методика дискриминантного анализа - student2.ru , а свободный член Методика дискриминантного анализа - student2.ru .

Новый классифицируемый объект с переменными Методика дискриминантного анализа - student2.ru будет отнесен к тому множеству Методика дискриминантного анализа - student2.ru , для которого величина Методика дискриминантного анализа - student2.ru будет максимальной.

В заключение необходимо отметить, что в данном параграфе рассмотрен только один из методов проведения дискриминантного анализа. Более подробно другие методы и алгоритмы дискриминантного анализа описаны в специальной литературе.

1.2. Примеры решения типовых задач

Пример 1. Имеются следующие данные по двум группам промышленных предприятий (таблица 1.1).

Таблица 1.1

Первая группа (Методика дискриминантного анализа - student2.ru) Вторая группа (Методика дискриминантного анализа - student2.ru)
Номер предприятия Удельный вес потерь от брака, % ( Методика дискриминантного анализа - student2.ru ) Фондоотдача активной части основных фондов, ден. ед. ( Методика дискриминантного анализа - student2.ru ) Номер предприятия Удельный вес потерь от брака, % ( Методика дискриминантного анализа - student2.ru ) Фондоотдача активной части основных фондов, ден. ед. ( Методика дискриминантного анализа - student2.ru )
0,15 1,91 0,48 0,88
0,34 1,68 0,41 0,62
0,09 1,89 0,62 1,09
0,21 2,30 0,50 1,32
      1,20 0,68
Методика дискриминантного анализа - student2.ru =0,198 Методика дискриминантного анализа - student2.ru = 1,945 Методика дискриминантного анализа - student2.ru = 0,642 Методика дискриминантного анализа - student2.ru =0,918

1. На основании приведенных данных следует найти оценки векторов средних Методика дискриминантного анализа - student2.ru , Методика дискриминантного анализа - student2.ru и ковариационных матриц ( Методика дискриминантного анализа - student2.ru , Методика дискриминантного анализа - student2.ru )а также оценку суммарной ковариационной матрицы ( Методика дискриминантного анализа - student2.ru ) и обратной к ней ( Методика дискриминантного анализа - student2.ru ).

2. Рассчитайте вектор оценок коэффициентов дискриминантной функции (А)и определите ее средние значения для каждого множества. Определите константу дискриминации ( Методика дискриминантного анализа - student2.ru ).

Вычислите оценки значений дискриминантной функции для предприятия, у которого переменные принимают значения: удельный вес потерь от брака ( Методика дискриминантного анализа - student2.ru )равен 0,2%; фондоотдача активной части основных фондов ( Методика дискриминантного анализа - student2.ru )равна 0,75 ден. ед.

Определите, к какой из двух групп следует отнести данное предприятие.

Решение. 1. Для каждой группы предприятий рассчитаем ковариационные матрицы.

Первая группа (Методика дискриминантного анализа - student2.ru):

Методика дискриминантного анализа - student2.ru

Методика дискриминантного анализа - student2.ru ,

Методика дискриминантного анализа - student2.ru .

Вторая группа (Методика дискриминантного анализа - student2.ru ):

Методика дискриминантного анализа - student2.ru

Методика дискриминантного анализа - student2.ru ,

Методика дискриминантного анализа - student2.ru .

Совместная ковариационная матрица Методика дискриминантного анализа - student2.ru и обратная матрица Методика дискриминантного анализа - student2.ru будут иметь следующий вид:

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

2. Вектор коэффициентов дискриминантной функции (А)равен

Методика дискриминантного анализа - student2.ru .

Вектор значений дискриминантной функции для первого подмножества

Методика дискриминантного анализа - student2.ru .

Вектор значений дискриминантной функции для второго подмножества

Методика дискриминантного анализа - student2.ru .

Средние значения дискриминантной функции и константа дискриминации

Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru .

3. Рассчитаем значение дискриминантной функции для предприятия со значениями переменных равными Методика дискриминантного анализа - student2.ru ; Методика дискриминантного анализа - student2.ru

Методика дискриминантного анализа - student2.ru .

Так как полученное значение дискриминантной функции для рассматриваемого предприятия Методика дискриминантного анализа - student2.ru =8,844<с=16,770, его следует отнести ко второму подмножеству.

Пример 2. Рассмотрим пример проведения дискриминантного анализа при наличии трех обучающих выборок.

Для того чтобы проще было изобразить на рисунке объекты каждого из подмножества, предположим, что каждый объект (предприятие) характеризуется только двумя переменными:

Первое подмножество

Номер объекта Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru
9,4 1,9
9,9 1,7
9,1 2,3
10,0 2,6
9,4 2,0
9,0 1,9
  Методика дискриминантного анализа - student2.ru =9,47 Методика дискриминантного анализа - student2.ru =2,07

Второе подмножество

Номер объекта Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru
7,4 1,09
6,7 1,23
6,6 1,33
7,0 1,25
7,5 1,15
  Методика дискриминантного анализа - student2.ru =7,04 Методика дискриминантного анализа - student2.ru =1,21

Третье подмножество

Номер объекта Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru
5,5 0,9
5,1 0,88
5,4 1,20
5,8 1,25
  Методика дискриминантного анализа - student2.ru =5,45 Методика дискриминантного анализа - student2.ru =1,06

Здесь: Методика дискриминантного анализа - student2.ru – выработка продукции на одного работающего, тыс. ден. ед.: Методика дискриминантного анализа - student2.ru – фондоотдача основных производственных фондов, ден. ед.

Для каждого подмножества объектов определяем ковариационную матрицу:

- для первого подмножества

Методика дискриминантного анализа - student2.ru ;

- для второго подмножества

Методика дискриминантного анализа - student2.ru ;

- для третьего подмножества

Методика дискриминантного анализа - student2.ru .

Для каждой из существующих пар подмножеств рассчитаем совместные ковариационные матрицы и матрицы, обратные к ним.

Совместная ковариационная матрица и обратная к ней матрица для первого и второго подмножеств

Методика дискриминантного анализа - student2.ru

Методика дискриминантного анализа - student2.ru .

Определяем разность векторов средних величин Методика дискриминантного анализа - student2.ru .

Совместная ковариационная матрица и обратная к ней матрица для первого и третьего подмножеств

Методика дискриминантного анализа - student2.ru

Методика дискриминантного анализа - student2.ru .

Разность векторов средних значений Методика дискриминантного анализа - student2.ru .

Наконец, совместная ковариационная матрица и обратная к ней матрица для второго и третьего подмножеств

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

Разность векторов средних значений Методика дискриминантного анализа - student2.ru .

На основании обратных матриц Методика дискриминантного анализа - student2.ru , Методика дискриминантного анализа - student2.ru , Методика дискриминантного анализа - student2.ru и разностей векторов средних значений определим для каждой пары подмножеств векторы коэффициентов дискриминантных функций:

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

Определяем значения дискриминантных функций по матрице значений исходных переменных в каждом подмножестве.

Для разграничения первого и второго подмножеств имеем

Методика дискриминантного анализа - student2.ru ;

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для первого подмножества Методика дискриминантного анализа - student2.ru .

Методика дискриминантного анализа - student2.ru

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для второго подмножества Методика дискриминантного анализа - student2.ru .

Для первого и второго подмножеств константа дискриминации Методика дискриминантного анализа - student2.ru равна:

Методика дискриминантного анализа - student2.ru

Для разграничения первого и третьего подмножеств имеем

Методика дискриминантного анализа - student2.ru ;

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для первого подмножества Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru ;

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для третьего подмножества Методика дискриминантного анализа - student2.ru .

Для разграничения первого и третьего подмножеств константа дискриминации Методика дискриминантного анализа - student2.ru равна:

Методика дискриминантного анализа - student2.ru .

Для разграничения второго и третьего подмножеств имеем

Методика дискриминантного анализа - student2.ru ;

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для второго подмножества Методика дискриминантного анализа - student2.ru .

Методика дискриминантного анализа - student2.ru ;

- среднее значение дискриминантной функции Методика дискриминантного анализа - student2.ru для третьего подмножества Методика дискриминантного анализа - student2.ru .

Для разграничения второго и третьего подмножеств константа дискриминации Методика дискриминантного анализа - student2.ru равна:

Методика дискриминантного анализа - student2.ru .

В общем виде дискриминантные функции для трех подмножеств имеют вид:

Методика дискриминантного анализа - student2.ru

Следовательно, границы трех классов будут определяться системой уравнений

Методика дискриминантного анализа - student2.ru (1.5)

Чтобы начать классификацию новых объектов, подставим значения исходных переменных в выражение (1.5) и сравним полученные результаты с нулем,

если Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru , то объект принадлежит первому множеству;

Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru , то объект принадлежит второму множеству;

Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru , то объект принадлежит третьему множеству.

Пример 3. По результатам анализа финансовой устойчивости предприятий экспертным путем были выделены три группы предприятий, характеризующиеся двумя переменными: Методика дискриминантного анализа - student2.ru – рентабельность основной деятельности предприятия; Методика дискриминантного анализа - student2.ru – коэффициент абсолютной ликвидности (таблица 1.2).

Таблица 1.2

I группа II группа III группа
Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru
8,7
7,5
9,8
   
   
       
       

Примечание.

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

Решение.

1. Для каждой из групп рассчитаем вектор средних значений и матрицу ковариаций:

- для I группы Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru ;

- для II группы Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru ;

- для III группы Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru Методика дискриминантного анализа - student2.ru .

2. Рассчитаем три дискриминантные функции:

I группа

Вектор коэффициентов дискриминантной функции:

Методика дискриминантного анализа - student2.ru ;

свободный член

Методика дискриминантного анализа - student2.ru .

Дискриминантная функция будет иметь следующий вид:

Методика дискриминантного анализа - student2.ru .

II группа

Вектор коэффициентов дискриминантной функции:

Методика дискриминантного анализа - student2.ru ;

свободный член

Методика дискриминантного анализа - student2.ru .

Дискриминантная функция будет иметь следующий вид:

Методика дискриминантного анализа - student2.ru .

III группа

Вектор коэффициентов дискриминантной функции:

Методика дискриминантного анализа - student2.ru ;

свободный член

Методика дискриминантного анализа - student2.ru .

Дискриминантная функция будет иметь следующий вид:

Методика дискриминантного анализа - student2.ru .

Итак, получены три дискриминантные функции:

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

Теперь можно начинать процедуру классификации новых объектов. Предположим, что рассматривается предприятие, которое имеет следующие значения дискриминантных переменных: Методика дискриминантного анализа - student2.ru , Методика дискриминантного анализа - student2.ru .

Подставляем поочередно эти значения в каждую из дискриминантных функций:

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru ;

Методика дискриминантного анализа - student2.ru .

Так как Методика дискриминантного анализа - student2.ru и Методика дискриминантного анализа - student2.ru , новый объект следует отнести ко второй группе предприятий.

Техническое задание на разработку программного средства

Введение

Настоящее техническое задание распространяется на разработку информационно-аналитической системы на основе методов теории статистических решений в различных предметных областях.

Широкий круг задач разработки приложений систем поддержки принятия решений относятся к классу теории статистических решений, методы решения которых, как правило, имеют экспоненциальную вычислительную сложность.

В то же время эти методы и алгоритмы не систематизированы, оценки их вычислительной и емкостной сложности и сведения о возможной точности получаемых решений неполны и разбросаны по многим источникам. В рамках единой системы не существует программной реализации даже для ограниченного круга алгоритмов решения основных задач теории статистических решений

Создание системы, в рамках которой были бы реализованы наиболее часто упоминаемые методы и алгоритмы решения задач теории статистических решений, позволит как оценивать и исследовать отдельные методы и алгоритмы, так и сравнивать их с точки зрения затрат вычислительных ресурсов и точности получаемых решений

Основание для разработки

Приложение для информационно-аналитической системы разрабатывается на основании учебного плана подготовки бакалавров по по дисциплине «Системы автоматизации разработки программного обеспечения».

Назначение

Первая версия системы предназначена для решения небольшого круга задач теории статистических решений (проверка статистических гипотез, корреляционны анализ, кластерный анализ). В следующих версиях предполагается увеличение количества решаемых задач.

Пользователями могут выступать научные работники и инженеры, занимающиеся разработкой систем поддержки принятия решений. Пользователями могут также быть и специалисты других предметных областей, которым приходится решать подобные задачи.

Наши рекомендации