Населения Ульяновской области
В данном исследовании используется совокупность показателей, характеризующих уровень жизни населения городов и сельских районов Ульяновской области в 2007 году. По нашему мнению, исходя из приведенной системы показателей можно комплексно оценить уровень жизни Ульяновской области.
При проведении многомерного статистического анализа уровня жизни населения городов и сельских районов Ульяновской области были применены следующие методы:
- содержательный анализ;
- разведочный (предварительный анализ);
- анализ степени взаимосвязи отобранных факторов (корреляционный анализ);
- регрессионный анализ;
- ранжирование городов и районов Ульяновской области в соответствии с системой показателей комплексной оценки уровня жизни методом "Паттерн";
- группировка городов и районов Ульяновской области методом кластерного анализа.
Содержательный анализ проводится с целью формирования системы показателей и определения результативного признака (моделируемого или зависимого) и факторных (независимых) признаков. В качестве результативных признаков нами были выбраны статистические показатели Y1 - объем платных услуг на душу населения и Y2 - среднемесячная номинальная заработная плата. В качестве факторных признаков мы выбрали основные показатели, характеризующие рынок труда и занятость, масштабы производства, возрастной состав населения, доходы населения, благоустройство жилищного фонда и масштабы населенного пункта, среднегодовая численность работников и фонд заработной платы занятых на предприятиях и в организациях. Необходимо
отметить, что масштабы производства характеризовались разными факторными признаками для двух разных моделируемых признаков (прил. 23 и 24).
Разведочный анализ проводится с целью определения степени неоднородности статистической совокупности и повышения однородности за счет исключения "выбросов". Он состоит из следующих этапов:
- получение основных статистических характеристик;
- определения степени однородности статистической совокупности;
- определение "выбросов";
- определение эмпирического распределения и степени соответствия его нормальному закону распределения.
В пакете анализа Excel нами рассчитаны основные статистические характеристики (описательные статистики), такие как среднее значение совокупности ( ) и среднее квадратическое отклонение ( ). Далее определяем коэффициент вариации, характеризующий степень однородности совокупности, по формуле:
(1)
При совокупность считается неоднородной. Коэффициент вариации исследуемых совокупностей, рассчитанный по формуле (1)
,
.
Как видно, совокупность Y2 - среднемесячная номинальная заработная плата - однородная. Признак Y1 - объем платных услуг на душу населения - представляет собой неоднородную совокупность, так как 70,86% > 33%. Необходимо определить город, "вносящий" эту неоднородность, то есть точку "выброса".
Точки "выбросов" - это объекты с сильно отличающимися значениями исследуемого показателя. "Выбросы" определяются визуально с помощью линейных графиков. Подтверждается "выброс" определенными критериями, например критерием "четырех сигм".
На рисунке 5 представлен линейный график распределения объема платных услуг на душу населения по городам и сельским районам Ульяновской области.
Рис. 5. Линейный график для определения точки "выброса"
Из рисунка 5 видно, что значение показателя в городе Ульяновск значительно отличается от остальных значений. Проверим его на выброс с помощью критерия "четырех сигм" по следующему алгоритму:
1. определяем среднее значение и среднее квадратическое отклонение совокупности без учета значения показателя, "подозреваемого выбросом", то есть город Ульяновск. В результате получаем среднее значение и среднее квадратическое отклонение ;
2. вычисляем верхнюю и нижнюю границы по формулам:
(2)
(3)
Подставляем среднее значение и среднее квадратическое отклонение совокупности без учета значения показателя, "подозреваемого выбросом", в формулы (2) и (3) и получаем:
,
;
· точка считается "выбросом", если и .
Так как для города Ульяновск , а , то данное значение является "выбросом" и его следует исключить из исследования. Коэффициент вариации для признака Y1 без учета значения города Ульяновск рассчитываем по формуле (1):
Как видим, после исключения из исследования "выброса" совокупность не стала однородной. Следовательно, проверим на "выброс" значение признака Y1 в точке 15361 (Ульяновский район) по описанному выше алгоритму. Получаем
,
.
Так как для Ульяновского района и , то данное значение является "выбросом" и его следует исключить из исследования. Коэффициент вариации для признака Y1 без учета значения Ульяновского района рассчитываем по формуле (1):
32,78 < 33%, следовательно, совокупность однородна.
Последним этапом разведочного анализа является исследование
совокупности на соответствие нормальному закону распределения. Проверку закона распределения признаков Y1 и Y2 осуществим графически. На рисунках 6 и 7 представлены гистограммы эмпирических распределений рассматриваемых совокупностей.
Рис. 6. Эмпирическое распределение объема платных услуг