Методические указания к выполнению контрольной работы. Пункт 1. Для формирования таблицы исходных данных из списка федеральных округов отбираются для анализа те из них
Пункт 1. Для формирования таблицы исходных данных из списка федеральных округов отбираются для анализа те из них, которые соответствуют номеру варианта задания в таблице 1. По каждому федеральному округу выбираются экономические показатели по всем субъектам федерации (область, округ, край и пр.), которые входят в анализируемые федеральные округа. Значения социально-экономических показателей по субъектам федерации принимаются за последний год из имеющихся в статистике данных.
Российская Федерация включает 9 федеральных округов:
1. Центральный федеральный округ
2. Северо-Западный федеральный округ
3. Южный федеральный округ
4. Северо-Кавказский федеральный округ
5. Приволжский федеральный округ
6. Уральский федеральный округ
7. Сибирский федеральный округ
8. Дальневосточный федеральный округ
9. Крымский федеральный округ
Таблица 1. Номера федеральных округов по вариантам
Номер варианта | Номера федеральных округов | Номер варианта | Номера федеральных округов | Номер варианта | Номера федеральных округов |
3, 4, 6, 8 | 1, 3, 6, 7 | 1, 2, 3, 4 | |||
1, 2, 4, 6 | 2, 3, 4, 6 | 2, 3, 4, 8 | |||
3, 5, 6, 7 | 1, 4, 7, 8 | 1, 3, 4, 7 | |||
1, 3, 5, 6 | 1, 2, 3, 6 | 3, 5, 6, 8 | |||
2, 4, 5, 8 | 2, 4, 6, 7 | 1, 2, 3, 5 | |||
1, 2, 5, 7 | 1, 3, 4, 6 | 2, 5, 6, 7 | |||
1, 5, 6, 7 | 2, 4, 5, 7 | 2, 5, 6, 8 | |||
2, 3, 5, 6 | 2, 3, 5, 7 | 1, 4, 6, 7 | |||
3, 5, 7, 8 | 1, 2, 3, 5 | 1, 3, 4, 5 | |||
1, 3, 5, 8 | 3, 4, 7, 8 | 3, 4, 5, 6 |
Пункт 2. Для характеристики вариации количественного показателя можно использовать среднее квадратическое отклонение и коэффициент вариации.
Среднее квадратическое отклонение характеризует вариацию признака, т.е. показывает, на сколько единиц в среднем отклоняются значения анализируемого показателя от их средней величины. Среднее квадратическое отклонение вычисляется по формуле:
; ,
где – значения ВРП по анализируемым субъектам федерации;
– среднее значение ВРП по всем анализируемым субъектам федерации;
n – количество анализируемых субъектов федерации;
В относительном выражении вариацию признака характеризуеткоэффициент вариации, который представляет собой отношение среднего квадратического отклонения к средней величине признака:
.
Чем меньше коэффициент вариации, тем однороднее совокупность, тем точнее средняя отражает значения варьирующего признака, для которого она вычислена. Считается, что если , то это свидетельствует о большой вариации признака в изучаемой совокупности
Пункт 3. Дисперсионный анализ позволяет оценить влияние одного или нескольких факторных признаков (в т.ч. атрибутивных, неколичественных) на результативный признак. В данном пункте задания определяется, существует ли зависимость ВРП субъекта федерации от территориального расположения, т.е. от принадлежности к тому или иному федеральному округу. Это можно установить при помощи однофакторного дисперсионного анализа.
Аналитическая группировка позволяет выявить взаимосвязь между результативным и факторным признаком. В данном случае необходимо установить, существует ли зависимость между объемом валового регионального продукта и местом расположения субъекта федерации на территории России (от федерального округа, поскольку федеральный округ объединяет субъекты федерации на определенной территории). Постройте аналитическую группировку по форме 1. (в качестве группировочного обычно выбирается факторный признак).
Форма 1
Аналитическая группировка субъектов федерации
Федеральный округ | Количество субъектов федерации в федеральном округе | Средний уровень ВРП в федеральном округе |
Средний уровень ВРП в федеральном округе определяется:
,
где – среднее значение ВРП в j-м федеральном округе;
– значения ВРП по субъектам федерации в j-м федеральном округе;
– количество субъектов федерации в j-м федеральном округе.
Групповые средние, как правило, отличаются одна от другой и от общей средней, т.е. варьируют.
На основании данных таблицы напишите вывод о наличии (или отсутствии) взаимосвязи размера валового регионального продукта от расположения субъектов федерации на территории России (от принадлежности с тому или иному федеральному округу).
Аналитическая группировка дает возможность разложить общую дисперсию, характеризующую общую вариацию ВРП (как и среднеквадратическое отклонение), на межгрупповую (факторную) и остаточную (внутригрупповую).
Общая дисперсия измеряет вариацию результативного признака (ВРП), вызванную действием на него всех без исключения факторов. Она может быть вычислена следующим образом:
,
где – значения ВРП по анализируемым субъектам федерации;
– среднее значение ВРП по всем анализируемым субъектам федерации;
n – количество анализируемых субъектов федерации;
Межгрупповая дисперсия отражает вариацию признака, которая возникает под воздействием признака-фактора, положенного в основу группировки. В данном случае она показывает, как размер ВРП субъекта федерации зависит от его расположения на территории России. Межгрупповая дисперсия определяется:
,
где – среднее значение ВРП по всем анализируемым субъектам федерации и в j-м федеральном округе;
– количество субъектов федерации в j-м федеральном округе.
Когда совокупность разбита на группы, то для каждой группы может быть определена своя дисперсия, характеризующая вариацию внутри группы. Остаточная (внутригрупповая) дисперсия характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием других факторов и не зависит от факторного признака, положенного в основание группировки (в данном случае не зависит от федерального округа). Она вычисляется по формуле:
,
где – значения ВРП субъектов федерации и среднее их значение в j-м федеральном округе;
– количество субъектов федерации в j-м федеральном округе.
Остаточная дисперсия для всей аналитической группировки находится как средняя из групповых дисперсий:
.
Правило сложения дисперсий: общая дисперсия признака всегда равна сумме межгрупповой дисперсии и остаточной:
.
Исходя из правила сложения дисперсий, зная две из них, можно определить третью дисперсию. Зная дисперсии можно определить относительные показатели тесноты связи.
Тесноту связи между результативным признаком у (ВРП) и факторным признаком z, положенным в основание группировки (федеральный округ) характеризует эмпирический коэффициент детерминации (дисперсионное отношение), вычисляемое на основании имеющихся дисперсий:
.
Эмпирическое корреляционное отношение характеризует тесноту кор-реляционной зависимости, т.е. степень ее приближения к функциональной связи:
.
Эмпирическое корреляционное отношение принимает значения , при этом, если
– связь функциональная ( – внутригрупповой вариации нет, следовательно, вариация у полностью определяется вариацией группировочного признака);
– связь отсутствует ( – все групповые средние равны, межгрупповой вариации нет, и группировочный признак не оказывает никакого влияния на у).
– связь слабая.
– связь тесная.
Поскольку анализу подвергается не вся (генеральная) совокупность, а только часть ее (выборка), то необходима оценка существенности связи, т.е. оценка того, что установленная связь не случайна. Для этой цели можно использовать критерий Фишера (F-критерий):
,
где ; – общее количество анализируемых субъектов федерации; – число групп (число анализируемых федеральных округов).
Полученное фактическое значение критерия Фишера сравнивается с критическим (табличным) значением : если , то существенность связи подтверждается. Табличное (критическое) значение критерия Фишера можно найти, используя типовой пакет Excel: fx // FРАСПОБР (для ).
Пункт 4. Корреляционный анализ.
4.1. Корреляционное поле строится для каждой пары признаков:
… . Для этой цели целесообразно использовать типовой пакет Excel. В поле страницы Excel строятся два столбца исходных данных (столбец факторного признака слева, а результативного признака – справа). Мышкой выделяются оба столбца // Вставка // Диаграммы (точечная). Расположение точек в корреляционном поле показывает наличие, направление и примерную форму связи (линейная или нелинейная). Отразите это в выводах.
4.2. Затем изучается влияние поочередно каждого из факторов на размер ВРП при использовании коэффициентов корреляции.
Коэффициент корреляции (линейный коэффициент корреляции) определяется из выражения:
.
В экономике условно принимается следующая классификация взаимосвязей по значению коэффициента корреляции:
– функциональная зависимость;
– сильная (тесная) взаимосвязь;
– средняя взаимосвязь;
– слабая взаимосвязь;
– очень слабая взаимосвязь;
– корреляции нет (линейной).
Как и в дисперсионном анализе, необходима проверка существенности связи. Она выполняется при использовании критерия Стьюдента (t-критерия):
.
Эмпирическое значение t-критерия сравнивается с критическим его значением, которое находится по таблицам или при использовании типового пакета Excel: fx // Статистические // СТЬЮДРАСПОБР (Вероятность = 0,05; Степени свободы = ).
В результате их сравнения устанавливается существенность связи между результативным и каждым из факторных признаков:
- если , то взаимосвязь между x и y не случайна и действительно имеет место;
- если , то признается, что коэффициент корреляции незначим, и случайные величины x и y не взаимосвязаны.
Результаты расчетов представьте в таблице и отразите в выводах.
Для характеристики тесноты связи применяется также коэффициент корреляции рангов (коэффициент Спирмена):
,
где – разница рангов по двум признакам;
y – ранг, т.е. порядковый номер в ряду;
n – количество рангов.
Вычислите коэффициент корреляции рангов для одного из факторных признаков. Для расчета этого показателя случайные величины х и у нумеруются по отдельности в порядке возрастания (или убывания), т.е. им присваивается определенный ранг – порядковый номер в ряду. Если встречается несколько одинаковых значений х (или у), то каждому значению присваивается ранг, равный частному от деления суммы рангов, приходящихся на эти значения, на число этих равных значений. Затем ранги отдельных значений факторного признака сопоставляют с рангами значений результативного признака:
- если ранги результативного признака полностью совпадают с рангами факторного признака, и можно говорить о почти полной прямой связи;
- если ранги идут в строго противоположном направлении, т.е. первому рангу х соответствует последний ранг признака у, то это свидетельствует о почти полной обратной связи между х и у ;
- если же связь отсутствует, то ;
- во всех остальных промежуточных значениях интерпретируется также как коэффициент корреляции.
Полученные результаты отразите в выводах.
4.3. Тесноту влияния каждого из факторов на результат позволяют оценить частные коэффициенты корреляции. Применение частных коэффициентов корреляции вызвано необходимостью оценить взаимосвязь между результативным признаком и одним из факторов при условии неизменности остальных переменных. Частные коэффициенты корреляции оценивают степень связи одного фактора с другим, взятым в отдельности при исключении влияния третьих факторов. Это позволяет выполнить ранжирование факторов по степени влияния на результативный признак.
Выбираются два факторных признака, имеющих наибольшие значения коэффициентов корреляции. Обозначим эти факторные признаки . Расчет линейных частных коэффициентов корреляции для случая двух факторов выполняется следующим образом:
- коэффициент частной корреляции между у и v1 при фиксированном v2:
;
- коэффициент частной корреляции между у и v2 при фиксированном v1:
;
- коэффициент частной корреляции между v1 и v2 при неизменном признаке у:
,
где , , – парные коэффициенты корреляции между соответствующими факторами.
Частные коэффициенты корреляции изменяются в пределах от 0 до 1.
На основании частных коэффициентов корреляции необходимо сделать вывод об обоснованности включения переменной в регрессионную модель:
- если частный коэффициент корреляции между факторными признаками мал или незначим, следовательно, связь между факторами слаба и оба фактора можно включать в уравнение регрессии;
- если частный коэффициент корреляции между факторным и результативным признаком мал или незначим, следовательно, связь между данным фактором и результативным признаком либо очень слаба, либо совсем отсутствует, поэтому фактор можно исключить из модели без ущерба для ее качества.
Сравните значения парной и частной корреляции, объясните имеющиеся различия.
Литература