Многомерная классификация регионов РФ по услугам транспорта
Проектная работа
по курсу эконометрика
на тему: «Многомерная классификация регионов РФ по услугам транспорта за 2009 год»
Выполнили:
Галкина Е.,
Саушкина Т.,
Группа: 38 МО
Научный руководитель:
Д.э.н. Платонова И. В.
Москва 2012
Многомерная классификация регионов РФ по услугам транспорта
Полученные результаты многомерной классификации позволят выделить кластер субъектов РФ с наиболее высоким уровнем развития исследуемого рынка транспорта РФ.
Для проведения дальнейшего исследования были отобраны 11 показателей (по данным Росстата на начало 2010 года ).
x1 -- Отправление грузов железнодорожным транспортом общего пользования (млн. тонн)
x2 -- Перевозки грузов автомобильным транспортом организации, всех видов деятельности (в мил. тонн).
x3 -- Грузооборот автомобильного транспорта организаций всех видов деятельности (миллионов тонно-километров)
x4 -- Отправление пассажиров железнодорожным транспортом общего пользования (тыс. чел.)
x5 -- Перевозки пассажиров автобусами общего пользования (мил. чел.)
x6 -- Пассажирооборот автобусов общего пользования (миллионов пассажиро-километров)
x7 -- Число автобусов общего пользования на 100 000 человек населения.
x8 -- Густота железнодорожных путей общего пользования (на конец года; километров путей на 10000 квадратных километров территории)
x9 -- Густота автомобильных дорог общего пользования с твердым покрытием (на конец года; километров путей на 10000 квадратных километров территории)
x10 -- Удельный вес автомобильных дорог с твердым покрытием в общей протяженности автомобильных дорог общего пользования (на конец года)
x11 -- Удельный вес автомобильных дорог с усовершенствованным покрытием в протяженности автомобильных дорог с твердым покрытием (на конец года)
Х12- Число дорожно-транспортных происшествий и пострадавших в них
(на 100 000 человек населения)
Х13- Число дорожно-транспортных происшествий и погибших в них
(на 100 000 человек населения)
Проведем визуальное исследование распределения объектов исходной совокупности в осях всех признаков попарно. На каждой из графических иллюстраций четко выделилось ядро эллипсовидной формы. Это подтверждает то, что рассматриваемая выборка взята из нормально распределенной совокупности. Однако некоторые объекты Московская область, г. Санкт-Петербург, г. Москва и многие другие выделились из общей массы как аномальные объекты. Пример рис.1
Рис.1
При проведении корреляционного анализа на выявление дублированной и тесной связи между показателями, так же были удалены из исследования признаки: х1, х2, х3, х5, х6, х8, х9. Так как теснота связи превышала норму > 0,7. Это указано в таблице №2:
Таблица №2
x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | x10 | x11 | Х12 | x13 | |
x1 | 0,74 | 0,5 | 0,31 | 0,32 | 0,36 | 0,2 | -0,12 | -0,28 | 0,16 | -0,12 | -0,03 | -0,31 | |
x2 | 0,74 | 0,79 | 0,42 | 0,51 | 0,58 | 0,17 | -0,2 | -0,16 | 0,03 | -0,2 | -0,03 | -0,28 | |
x3 | 0,5 | 0,79 | 0,45 | 0,47 | 0,56 | 0,09 | 0,03 | 0,07 | -0,11 | 0,03 | -0,16 | -0,32 | |
x4 | 0,31 | 0,42 | 0,45 | 0,41 | 0,44 | 0,08 | 0,01 | 0,02 | -0,12 | -0,08 | -0,04 | -0,18 | |
x5 | 0,32 | 0,51 | 0,47 | 0,41 | 0,94 | 0,47 | 0,02 | 0,15 | -0,18 | 0,15 | 0,04 | -0,23 | |
x6 | 0,36 | 0,58 | 0,56 | 0,44 | 0,94 | 0,43 | 0,05 | 0,21 | -0,15 | 0,16 | 0,01 | -0,22 | |
x7 | 0,2 | 0,17 | 0,09 | 0,08 | 0,47 | 0,43 | 0,1 | 0,17 | -0,23 | 0,02 | 0,19 | -0,07 | |
x8 | -0,12 | -0,2 | 0,03 | 0,01 | 0,02 | 0,05 | 0,1 | 0,75 | 0,23 | 0,64 | 0,22 | 0,28 | |
x9 | -0,28 | -0,16 | 0,07 | 0,02 | 0,15 | 0,21 | 0,17 | 0,75 | 0,02 | 0,57 | 0,14 | 0,38 | |
x10 | 0,16 | 0,03 | -0,11 | -0,12 | -0,18 | -0,15 | -0,23 | 0,23 | 0,02 | 0,03 | 0,11 | ||
x11 | -0,12 | -0,2 | 0,03 | -0,08 | 0,15 | 0,16 | 0,02 | 0,64 | 0,57 | 0,03 | 0,01 | 0,09 | |
x12 | -0,03 | -0,03 | -0,16 | -0,04 | 0,04 | 0,01 | 0,19 | 0,22 | 0,14 | 0,01 | 0,39 | ||
x13 | -0,31 | -0,28 | -0,32 | -0,18 | -0,23 | -0,22 | -0,07 | 0,28 | 0,38 | 0,11 | 0,09 | 0,39 |
Оставшаяся исходная совокупность была стандартизована в связи с разными единицами измерения исходных признаков и существенным различием в вариации показателей.
Далее применялись иерархические агломеративные методы кластерного анализа и метод «К- средних».
Разбиение выбирали в пространстве 6 стандартизованных признаков на основании значений функционалов качества, сравнительного анализа полученных классификаций с учетом дальнейшей содержательной интерпретации. В результате на расстоянии объединения, равном 6 единицам, были определены три кластера, полученные методом дальнего соседа.
На рис. 2 Дендрограмма полученного разбиения.
Рис.2
Состав: | |
1 кластер | 22,52,40,20,60,12,36,10,9,8,55,29,34,16,19,51,6 Итог = 17 |
2 кластер | 26,25,33,45,32,41,23,13,4,48,57,14,49,5,15,11,3 Итог =17 |
3 кластер | 54,53,39,56,24,59,58,17,50,47,42,35,37,31,38,18,7,21,46,28,30,2,43\ Итог = 23 |
На расстоянии объединения, равном 15 единицам, были определены три кластера, полученные методом Уорда и использованием евклидовой метрики. На рис. 3 представлена дендрограмма полученного разбиения.
Рис. 3 Дендрограмма классификации регионов РФ по уровню развития рынка услуг транспорта, полученная методом Уорда.
Состав: | |
1 кластер | 22,40,52,20,60,12,48,57,14,49,5,26,25,10,9,8,13,4,15,11,3 Итог = 21 |
2 кластер | 54,53,50,39,55,29,16,35,37,31,38,34,18,7,45,32,19,51,6 Итог =19 |
3 кластер | 56,24,59,58,17,36,33,41,23,21,42,46,28,47,30,2,43,44,21,1 Итог = 20 |
Все кластеры имею средние размеры по отношению к друг другу. Наибольший является кластер под №1