Дискриминантный параметрический анализ

Будем считать, что каждый Sj класс является р-мерной нормальной генеральной совокупностью с вектором средних значений Дискриминантный параметрический анализ - student2.ru = Дискриминантный параметрический анализ - student2.ru и общей ковариационной матрицей Дискриминантный параметрический анализ - student2.ru = Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru ; Дискриминантный параметрический анализ - student2.ru . Тогда в качестве функций Дискриминантный параметрический анализ - student2.ru следует использовать р-мерные нормальные плотности. Правило классификации наблюдений для двух классов эквивалентно следующему: наблюдение Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru относится к классу Дискриминантный параметрический анализ - student2.ru тогда, когда

Дискриминантный параметрический анализ - student2.ru .

Рекомендуемая литература [3, с. 19-37].

Пример 4. Имеется 12 предприятий, характеризуемых тремя экономическими показателями: производительностью труда; удельным весом потерь от брака (%) и фондоотдачей активной части основных производственных фондов. Из этих предприятий получены две обучающие выборки, первая из которых включает nх = 4 предприятия группы А, а вторая – ny = 5 предприятий группы В. С использованием данных табл. 16 требуется вычислить оценки значений дискриминантной функции для оставшихся предприятий и провести их классификацию. Дать экономическую интерпретацию результатов дискриминации.

Таблица 16

№ предприятия Предприятия Показатель  
Производительность труда Удельный вес потерь от брака Фондоотдача
Группы А, X 9,4 9,9 9,1 9,4 0,15 0,34 0,09 0,21 1,91 1,68 1,89 2,30
Группы В, Y 6,6 4,3 7,4 6,6 5,5 0,48 0,41 0,62 0,50 1,20 0,88 0,62 1,09 1,32 0,68
           

Окончание табл. 16

Подлежат дискриминации, Z 2,5 5,7 10,0 0,05 0,66 0,32 1,02 1,43 2,62

Решение

Найдем оценки векторов средних значений

Дискриминантный параметрический анализ - student2.ru ; Дискриминантный параметрический анализ - student2.ru и соответственно Дискриминантный параметрический анализ - student2.ru ; Дискриминантный параметрический анализ - student2.ru .

Найдем для класса А матрицу Х0j = Дискриминантный параметрический анализ - student2.ru , затем Х0jТ и Дискриминантный параметрический анализ - student2.ru .

Х01 Х01Т S1

-0,05 -0,05 -0,03   -0,05 0,45 -0,35 -0,05   0,33 0,10 -0,12
0,45 0,14 -0,27   -0,05 0,14 -0,11 0,01   0,10 0,03 -0,03
-0,35 -0,11 -0,05   -0,03 -0,27 -0,05 0,36   -0,12 -0,03 0,20
-0,05 0,01 0,36                  

Для класса В: Х02 Х02Т

0,52 -0,16 -0,04   0,52 -1,78 1,32 0,52 -0,58  
-1,78 -0,23 -0,30   -0,16 -0,23 -0,02 -0,14 0,56  
1,32 -0,02 0,17   -0,04 -0,30 0,17 0,40 -0,24  
0,52 -0,14 0,40   0,52 -1,78 1,32 0,52 -0,58  
-0,58 0,56 -0,24              

S2

5,79 -0,10 1,08
-0,10 0,41 -0,12
1,08 -0,12 0,34
5,79 -0,10 1,08
     

Дискриминантный параметрический анализ - student2.ru Дискриминантный параметрический анализ - student2.ru .

Найдем обратную матрицу Дискриминантный параметрический анализ - student2.ru .

Получим вектор оценок коэффициентов дискриминации

Дискриминантный параметрический анализ - student2.ru .

Найдем Дискриминантный параметрический анализ - student2.ru .

Запишем дискриминантную функцию

Дискриминантный параметрический анализ - student2.ru .

Тогда Дискриминантный параметрический анализ - student2.ru < Д класс В; Дискриминантный параметрический анализ - student2.ru > Д класс A; Дискриминантный параметрический анализ - student2.ru > Д класс A.

Компонентный анализ

В исследовательской и практической статистической работе приходится сталкиваться с ситуациями, когда общее число p признаков Дискриминантный параметрический анализ - student2.ru , регистрируемых на каждом из множества обследуемых объектов (стран, городов, семей и т.д.), очень велико Дискриминантный параметрический анализ - student2.ru Нормируем исходные данные Дискриминантный параметрический анализ - student2.ru Дискриминантный параметрический анализ - student2.ru Дискриминантный параметрический анализ - student2.ru . Возникает вопрос: можно ли каждое из наблюдений заменить векторами Дискриминантный параметрический анализ - student2.ru некоторых вспомогательных показателей с существенно меньшим, чем p, числом компонент так, чтобы система новых показателей сохранила в своей существенной части ту информацию, которая содержится в исходных данных. Пусть признаки F являются линейными комбинациями признаков X:

Дискриминантный параметрический анализ - student2.ru

В матричной форме система имеет вид Дискриминантный параметрический анализ - student2.ru .

Элементы матрицы L будем искать, используя корреляционную матрицу Дискриминантный параметрический анализ - student2.ru вектора X. Все собственные числа этой матрицы положительны. Расположим их в порядке убывания l1>l2>…lr > 0. Найдем для каждого числа li нормированный собственный вектор Дискриминантный параметрический анализ - student2.ru . Тогда компонента Дискриминантный параметрический анализ - student2.ru вектора F, найденная по вектору Дискриминантный параметрический анализ - student2.ru li, называется первой главной компонентой. Затем для собственного числа Дискриминантный параметрический анализ - student2.ru строится вторая строка матрицы L и вторая главная компонента f(2) и т.д. Таким образом, строится ортогональная матрица L и найдется вектор главных компонент F.

Критерий информативности может быть представлен в виде

Дискриминантный параметрический анализ - student2.ru .

Анализируя изменение относительной доли дисперсии, вносимой первыми p’ главными компонентами, в зависимости от числа этих компонент можно определить число компонент, которые целесообразно оставить в рассмотрении.

Матрица А, определяемая по формуле Дискриминантный параметрический анализ - student2.ru , называется матрицей нагрузок главных компонент на исходные признаки. Она дает экономическую интерпретацию полученным главным компонентам.

Рекомендуемая литература [3, с. 55-83].

Пример 5. Экономическая деятельность предприятий машиностроения характеризуется следующими показателями (табл. 17).

Требуется:

1. Найти главные компоненты, дать экономическую интерпретацию полученным результатам.

2. Ранжировать предприятия по первой главной компоненте. Дать экономическую интерпретацию полученным результатам.

3. Приняв за результативный показатель у рентабельность, построить уравнение регрессии на главной компоненте, наиболее тесно связанной с у, с помощью Пакета Анализ Данных в Microsoft Excel.

Таблица 17

№ п/п Удельный вес покупных изделий, Дискриминантный параметрический анализ - student2.ru Коэффициент сменности оборудования, Дискриминантный параметрический анализ - student2.ru Премии и вознаграждения на одного работника, Дискриминантный параметрический анализ - student2.ru Y
    0,30 0,56 0,42 0,26 0,16 0,45 0,31 0,08 0,63 0,03 1,40 1,20 1,15 1,09 1,26 1,36 1,15 1,87 2,17 1,61 0,67 0,98 1,16 0,54 1,23 0,78 1,16 2,44 1,06 2,13 9,8 13,2 17,3 7,1 11,5 12,1 15,2 31,3 11,6 30,1

Решение

1. Построим главные компоненты. С этой целью найдем выборочные средние Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru ; средние квадратические отклонения Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru , Дискриминантный параметрический анализ - student2.ru ; построим матрицу нормированных данных Х0:

Х0 = Дискриминантный параметрический анализ - student2.ru

и найдем матрицу корреляции Дискриминантный параметрический анализ - student2.ru

Используя программу Maple, найдем собственные значения λ1 = 1,766, λ2 = 1,047, λ3 = 0,188 и нормированные собственные векторы корреляционной матрицы Дискриминантный параметрический анализ - student2.ru .

Следовательно, первая главная компонента, построенная по нормированным значениям первоначальных признаков, имеет вид

Дискриминантный параметрический анализ - student2.ru .

Соответственно вторая и третья главные компоненты равны Дискриминантный параметрический анализ - student2.ru ; Дискриминантный параметрический анализ - student2.ru . Для проверки критерия информативности построим табл. 18.

Таблица 18

Главные компоненты f (i) f (2) f (2) f (3)
Собственные значения λi 1,766 1,047 0,188
Вклад i-й главной компоненты (%) в суммарную дисперсию 58,851 34,884 6,264
Суммарный вклад первых главных компонент 58,851 93,736

Для анализа были оставлены две первые главные компоненты (р’=2), на которые приходится 94% суммарной вариации.

Выясним экономический смысл первой и второй главных компонент. С этой целью построим матрицу нагрузок:

Дискриминантный параметрический анализ - student2.ru

Звездочкой отмечены элементы Дискриминантный параметрический анализ - student2.ru по столбцу, которые следует учитывать при интерпретации главных компонент f (1) и f (2). Из вида матрицы нагрузок А следует, что первая главная компонента наиболее тесно связана с показателем х(3), вторая главная компонента Дискриминантный параметрический анализ - student2.ru - с х(2.) Следовательно, первой главной компоненте можно придать экономический смысл –премии и вознаграждения на одного работника. Второй главной компоненте можно придать экономический смысл –коэффициент сменности оборудования.

2. Подставим последовательно в уравнения главных компонент нормированные значения признаков Х, в результате получим Дискриминантный параметрический анализ - student2.ru и далее аналогично получим табл. 19.

Таблица 19

№ п/п f1 f1 Yнор
-0,747 -0,286 -0,78009
0,610 -0,215 -0,34671
0,315 0,367 0,175903
-1,043 0,442 -1,12425
-0,568 0,783 -0,5634
-0,052 -0,471 -0,48692
-0,093 0,631 -0,09178
0,604 0,421 1,960427
0,926 -2,597 -0,55065
0,047 0,926 1,807468

Ранжируем эти значения в порядке их возрастания. Наименьшее значение первой главной компоненты - премии и вознаграждения - на четвертом предприятии, наибольшее - на девятом предприятии. Наименьшее значение второй главной компоненты - коэффициент сменности оборудования - на девятом предприятии, наибольшее - на десятом.

3. С помощью Пакета Анализ Данных в Microsoft Excel построим уравнение регрессии без свободного члена, взяв в качестве входного интервала У нормированное его значение.

ВЫВОД ИТОГОВ  
Регрессионная статистика  
Множественный R 0,798  
R2 0,636  
Нормированный R2 0,465  
Стандартная ошибка 0,675  
Наблюдения  
Дисперсионный анализ
df SS MS F Р(F)
Регрессия 6,36 3,18 6,989 0,021
Остаток 3,64 0,455  
Итого  
Коэффициенты Стандартная ошибка t-статистика P-значение Нижние 95% Верхние 95%
F1 1,338 0,402 3,331 0,010 0,4112 2,265
F2 0,775 0,25 3,095 0,015 0,198 1,352
                         

Р(Fi) < 0,05, коэффициенты регрессии статистически значимы. Так как Р(F) < 0,05, то существует линейное уравнение регрессии tY = 0,77tf1 + 0,56tf2.

Вопросы для самоконтроля

1. Объясните необходимость многомерной классификации и типологизации в проблемах моделирования экономических систем.

2. Приведите примеры экономических задач и используемые для них методы классификации.

3. Какими причинами вызвано снижение размерности многомерного признака?

4. Какова общая математическая модель смеси распределений и какие предположения должны быть высказаны для ее применения?

5. Как определяется функция потерь неправильной классификации?

6. Сформулируйте методы параметрического дискриминантного анализа в случае нормальных классов.

7. Укажите алгоритм нахождения главных компонент.

8. Сформулируйте критерий информативности.

9. Являются ли главные компоненты центрированными и коррелированными?

10. Что называется матрицей нагрузок и какими свойствами она обладает?

11. Поясните геометрическую интерпретацию метода главных компонент.

12. Сформулируйте свойства главных компонент.


Наши рекомендации