Построение ранжированного и интервального рядов распределения по индексу производства продукции сельского хозяйства
Статистическая группировка – это объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.
Посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов и предположить силу их влияния на результативные показатели.
По данным об индексах производства продукции сельского хозяйства (приложение А), выделим типические группы стран, используя метод статистических группировок. Расположим страны в порядке возрастания индекса производства продукции сельского хозяйства, т.е. построим ранжированный ряд. Результаты представлены в таблице 1.1.
Оценим характер различий между странами и попытаемся выделить существенно отличные группы стран. Обозначим за Х индекс производства продукции сельского хозяйства. В данном случае максимальное и минимальное значения группировочного признака в совокупности, соответственно, составляют:
Xmax = 141 и Xmin = 83.
Между странами имеются существенные различия в соотношении между городским и сельским населением:
- во-первых, размах колебаний составляет:
R = Xmax - Xmin = 141-83= 58 (%)
- во-вторых, индекс производства продукции сельского хозяйства страны №23 (Беларусь) превышает аналогичный показатель страны №1 (Греция) в 1,7 раз. (141 / 83= 1,7)
Таблица 1.1
Ранжированный ряд распределения стран по индексу производства продукции сельского хозяйства, %
№ | Государство | Индекс производства продукции сельского хозяйства, % |
Греция | ||
Италия | ||
Финляндия | ||
Грузия | ||
Швеция | ||
Франция | ||
Норвегия | ||
США | ||
Швейцария | ||
Германия | ||
Польша | ||
Австралия | ||
Израиль | ||
Казахстан | ||
Литва | ||
Армения | ||
Эстония | ||
Украина | ||
Россия | 124,2 | |
Бразилия | ||
Индия | ||
Латвия | ||
Беларусь |
По данным таблицы 1.1 построим график ранжированного ряда (рис. 1.1).
Рис. 1.1. График ранжированного ряда распределения стран по величине индекса производства продукции сельского хозяйства
Так как возрастание индекса производства продукции сельского хозяйства от страны к стране происходит плавно, без больших скачков, то выделить типические группы на основании анализа ранжированного ряда в данном случае невозможно.
Построим интервальный вариационный ряд распределения стран по индексу производства продукции сельского хозяйства.
Число группn определим по формуле Стеджерса [4 , C.52]:
n = 1 + 3,32 log n (1.1)
n = 1 + 3,32 log 23 = 6.
Величина интервала составит:
. (1.2)
(%)
Нижняя граница первого интервала равна Xmin. Верхняя граница последнего – Xmax. Интервалы группировки будут следующими:
83,0 | - 92,7 |
92,7 | - 102,4 |
102,4 | - 112,1 |
112,1 | - 121,8 |
121,8 | - 131,5 |
131,5 | - 141,2 |
Подсчитаем количество стран, попавших в тот или иной интервал. Результаты группировки представлены в таблице 1.2.
Таблица 1.2
Результаты группировки стран по индексу производства продукции сельского хозяйства
Группы стран по величине индекса производства продукции сельского хозяйства, % | № единицы наблюдения (страны) | Частота fi |
83 – 92,7 | Греция, Италия, Финляндия, Грузия | |
92,7 – 102,4 | Швеция, Франция | |
102,4 – 112,1 | Норвегия, США, Швейцария, Германия, Польша, Австралия, Израиль, Казахстан | |
112,1 – 121,8 | Литва, Армения | |
121,8 – 131,5 | Эстония, Украина, Россия, Бразилия, Индия | |
131,5 – 141,2 | Латвия, Беларусь |
Для расчета характеристик ряда распределения составим расчетную таблицу (табл. 1.3).
Таблица 1.3
Расчетная таблица
Группы стран по величине индекса производства продукции сельского хозяйства, Х, % | Середины интервалов, xi | Частоты интервалов, fi | xi · fi | xi - xср | (xi - xср)2 | (xi - xср)2fi | Накопленные частоты, fiнак |
83 – 92,7 | 87,9 | 351,4 | -22,77 | 518,6511 | 2074,6045 | ||
92,7 – 102,4 | 97,6 | 195,1 | -13,07 | 170,9272 | 341,8544 | ||
102,4 – 112,1 | 107,3 | -3,37 | 11,3833 | 91,0663 | |||
112,1 – 121,8 | 117,0 | 233,9 | 6,33 | 40,0194 | 80,0388 | ||
121,8 – 131,5 | 126,7 | 633,25 | 16,03 | 256,8355 | 1284,1773 | ||
131,5 – 141,2 | 136,4 | 272,7 | 25,73 | 661,8316 | 1323,6631 | ||
Итого | 2544,35 | 5195,4043 |
Определяем характеристики ряда распределения.
Средний индекс производства продукции сельского хозяйства определим по формуле средней арифметической взвешенной:
(1.3)
Определим моду (Мо) и медиану (Ме).
Мода – это наиболее часто встречающееся значение признака у единиц совокупности. Медиана – значение признака, находящееся в середине ранжированного ряда распределения [8 , c.95].
Используем формулы:
(1.4)
(1.5)
где , - нижняя граница медианного и модального интервалов соответственно;
- величина интервала;
- накопленная частота интервала, предшествующего медианному;
- частоты медианного и модального интервалов соответственно.
- частоты интервалов – предшествующего и следующего за модальным соответственно.
Определяем медиану. Полусумма накопленных частот находится в интервале 102,4 – 112,1, следовательно, этот интервал является медианным.
Величина интервала h =9,7.
Нижняя граница интервала: =102,4.
Частота медианного интервала: =8.
Полусумма частот ряда: =23/2 = 11,5
Накопленная частота интервала, предшествующего медианному:
= 6.
Медиана составляет:
(%)
Наибольшую частоту имеет интервал 102,4 – 112,1, следовательно, этот интервал является модальным.
=102,4; , =2, =2, h =9,7.
Мода равна:
(%)
Размах вариации:
R = Xmax - Xmin (1.6)
R = 141-83= 58 (%)
Дисперсия:
(1.7)
Среднее квадратическое отклонение:
(1.8)
Коэффициент вариации:
(1.9)
Рассчитываем по данным таблицы 1.2:
Дисперсия:
Среднее квадратическое отклонение: (%)
Коэффициент вариации:
Важное место в современном статистическом анализе социально-экономических явлений и процессов занимает графический метод. Без графиков не обходиться не одно статистическое исследование – они позволяют с наименьшими временными затратами выявить закономерности в развитии явления и его структуры, а также наглядно представить взаимосвязи показателей [9 , C.41].
Представим распределение стран по доле индексу производства продукции сельского хозяйства графически.
Гистограмма распределения – это ступенчатая фигура, состоящая из прямоугольников, в основании которых – длины интервалов группировки, а высоты равны – частотам интервалов распределения (рис.1.2).
При помощи гистограммы можно определить графически моду ряда распределения. На гистограмме распределения находим прямоугольник с наибольшей частотой. Соединяя отрезками прямых вершины этого прямоугольника с соответствующими вершинами двух соседних прямоугольников, получим точку пересечения этих отрезков (диагоналей), абсцисса которой и будет модой вариационного ряда. Мо 107,3%.
Рис. 1.2. Гистограмма распределения стран по индексу производства продукции сельского хозяйства
Полигон частот представляет собой ломаную, в которой концы отрезков прямой имеют координаты (xi,f), где xi – середины соответствующих интервалов (рис.1.3).
Рис. 1.3. Полигон частот распределения стран по индексу производства продукции сельского хозяйства
Кумулятивная кривая (кумулята) – кривая накопленных частот. Для интервального ряда кумулята начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте, равной нулю [16 , С.101]. Другие точки этой ломаной соответствуют концам интервалов (рис.1.4).
Рис. 1.4. Кумулята распределения стран индексу производства продукции сельского хозяйства
Определим медиану графически. На рис.1.4 проведем горизонтальную прямую y=15, соответствующую половине накопленных частот, до пересечения с кумулятой. Абсцисса точки пересечения и будет медианой вариационного ряда: Ме 30,2%.
1.2 Анализ промежуточной аналитической группировки единиц совокупности
Рассмотрим по группам интервального ряда наиболее важные факторы, влияющие на объем импорта страны.
Величина признака каждого объекта определяется как общими для всей совокупности факторами, так и индивидуальными, часто случайными, его особенностями. При осреднении значений влияние индивидуальных причин погашается и в величине средней проявляется размер признака, обусловленный общими для данной совокупности условиями.
Поэтому по каждой группе стран посчитаем общую сумму и средние по группам значения соответствующих показателей.
Для расчета средних групповых значений используем среднюю арифметическую простую. То есть, суммарный показатель делим на количество стран в группе.
Для подсчета средних значений по всей совокупности используем формулу средней арифметической взвешенной, где весами будут количество стран в группе, а индивидуальными значениями – значения групповых средних.
Промежуточная таблица представлена в приложении Б. Осредненные результаты по группам содержатся в таблице 1.4.
Таблица 1.4
Аналитическая группировка стран по индексу производства продукции сельского хозяйства
Номер группы | Индекс производства с/х продукции, % | Число стран в группе | Средние групповые показатели | ||||||||
Нижняя граница | Верхняя граница | Удельный вес отдельных стран в мировом экспорте, % | Экспорт на душу населения, тыс. долл. США | Коэффициент демографической нагрузки, % | Экспорт, на 1 кв км территории | Доля экономически активного населения, % | Уровень инфляции, % | ВВП на душу населения, млн долларов США | Общая численность безработных, тыс. чел. | ||
92,7 | 0,9 | 0,481 | 0,043 | 45,5 | 0,0 | 21589,14 | |||||
92,7 | 102,4 | 0,93 | 72,3 | 0,05 | 48,8 | -0,1 | 39150,85 | ||||
102,4 | 112,1 | 2,6 | 0,985 | 62,6 | 0,124 | 50,8 | 0,7 | 32457,93 | 62212,5 | ||
112,1 | 121,8 | 0,1 | 0,37 | 54,6 | 0,018 | 47,7 | 0,5 | 6429,45 | |||
121,8 | 131,5 | 1,2 | 0,256 | 59,3 | 0,008 | 47,6 | 18,0 | 10068,68 | |||
131,5 | 141,2 | 0,2 | 0,352 | 57,7 | 0,013 | 50,1 | 8,0 | 6889,57 | |||
По совокупности | 1,5 | 0,626 | 61,7 | 0,1 | 48,7 | 4,9 | 21795,79 | 98765,2 |
Для выявления наличия связи между факторным признаком, положенным в основу группировки и остальными показателями изобразим графически результаты группировки (приложение В).
Из данных приложения В, исходя из графического изображения представленных средних групповых показателей можно сделать следующие выводы:
- возможно наличие прямой зависимости индекса производства продукции сельского хозяйства с такими показателями как: доля экономически активного населения; уровень инфляции; общая численность безработных
- предполагается обратная зависимость индекса производства продукции сельского хозяйства с такими показателями как: экспорт, на 1 кв км территории, коэффициент демографической нагрузки , ВВП на душу населения, экспорт на душу населения и удельный вес отдельных стран в мировом экспорте.
1.3 Анализ типических групп стран по доле в мировом импорте товаров
Составим групповую таблицу, в которой рассчитаем показатели импорта по типическим группам и в среднем по всей совокупности стран. Выполним укрупнение интервалов группировки таблицы 1.4. В I группу войдут страны с индексом производства сельскохозяйственной продукции от 83 до 102,4, во вторую – страны с индексом производства сельскохозяйственной продукции от 102,4 до 121,8, а в третью – от 121,8 до 141,2. Укрупнение интервалов группировки позволит более точно увидеть связь показателей с индексом производства продукции сельского хозяйства.
Из таблицы 1.5 видно, средний коэффициент демографической нагрузки в I группе по сравнению с III группой в 66,1/ 58,9= 1,12 раз больше. Уровень инфляции в III группе превышает аналогичный показатель I группы в тысячи раз (поскольку уровень инфляции первой группы очень близок к нулю). ВВП на душу населения в I группе по сравнению с III группой в 27443,04/ 9160,36= 3,00 раз больше.
Таблица 1.5
Показатели в типических группах в среднем по совокупности
Показатели | Группы стран по индексу производства с/х продукции, % | Итого/В среднем по совокупности | ||
I Низшая (83 – 102,4) | II Средняя (102,4 – 121,8) | III Высшая (121,8 – 141,2) | ||
Число стран | ||||
Удельный вес отдельных стран в мировом экспорте, % | 1,2 | 2,1 | 0,9 | 1,5 |
Экспорт на душу населения, тыс. долларов США | 0,631 | 0,862 | 0,284 | 0,626 |
Экспорт, на 1 кв км территории | 0,046 | 0,103 | 0,010 | 0,060 |
Коэффициент демографической нагрузки, % | 66,1 | 61,0 | 58,9 | 61,7 |
Доля экономически активного населения, % | 46,6 | 50,2 | 48,3 | 48,7 |
Уровень инфляции, % | 0,00 | 0,64 | 15,18 | 4,90 |
ВВП на душу населения, млн. долларов США | 27443,04 | 27252,24 | 9160,36 | 21795,79 |
После выполнения вторичной группировки путем укрупнения групп можно сказать, что подтверждается обратная связь индекса производства сельскохозяйственной продукции с такими показателями как ВВП на душу населения и коэффициент демографической нагрузки и прямая связь с уровнем инфляции.
Наличие связи индекса производства сельскохозяйственной продукции с долей отдельных стран в мировом экспорте, экспортом на душу населения, экспортом на 1 кв. км. территории и долей экономически активного населения не прослеживается.
Можно заключить, что аналитическая группировка позволяет сделать предварительный вывод о наличии и направлении связи между показателями, но не позволяет при этом измерить силу выявленной зависимости. Для этого необходимо применять другие методы, например, корреляционно-регрессионный анализ.
ГЛАВА 2 СТАТИСТИКО – ЭКОНОМИЧЕСКИЙ АНАЛИЗ показателей, характеризующих мировой импорт товаров
2.1 Комбинированная группировка стран по доле в мировом импорте в зависимости от доли в мировом экспорте
Проследить зависимость между факторами можно на основе комбинационной группировки. Комбинационная группировка осуществляется одновременно по двум и более показателям, взятым в сочетании. При этом группировочные признаки принято располагать, начиная с атрибутивного, в определенной последовательности, исходя из логики предполагаемой взаимосвязи показателей (табл. 2.1).
Разобьем страны на 4 группы по доле в мировом экспорте, затем в пределах каждой группы выделим группы стран по удельному весу в мировом импорте
Таблица 2.1
Комбинированная группировка стран по удельному весу в мировом экспорте и мировом импорте
№ группы | Группы стран по доле в мировом экспорте, % | Число стран | В том числе с долей в мировом импорте, % | |||
менее 1 | 1-2 | 2-3 | свыше 3 | |||
менее 1 | - | - | ||||
1-2 | - | - | ||||
2-3 | - | |||||
свыше 3 | - | - | - | |||
Итого |
Большинство стран характеризуется долями экспорта и импорта в размере до 1%. Удельный вес в мировом экспорте, превышающий 3% имеют две страны – Германия и США, эти же страны характеризуются наибольшими долями импорта.
Наличие зависимости между показателями можно проследить по максимальным значениям частот в каждом столбце (или в строке). В данном случае наибольшие частоты каждой строки и каждого столбца располагаются вдоль диагонали таблицы 2.1, идущей от левого верхнего угла таблицы к правому нижнему, следовательно связь между рассматриваемыми признаками (доля в мировом экспорте и доля в мировом импорте) является прямой и близкой к линейной.
Отметим, что комбинационная группировка позволяет сделать вывод о наличии и направлении зависимости между разными показателями. Однако увеличение числа группировочных признаков приводит к уменьшению наглядности, что снижает эффективность использования статистической информации.
2.2 Индексный анализ динамики средней по совокупности величины импорта в расчете на душу населения
Статистический индекс – это относительная величина сравнения сложных совокупностей и отдельных их единиц. При этом под сложной понимается такая статистическая совокупность, отдельные элементы которой не подлежат суммированию. Индексы делятся на индивидуальные и общие.
Индивидуальные индексы показывают, каково соотношение между отчетным (со знаком «1») и базисным (со знаком «0») показателями или во сколько раз увеличилась (уменьшилась) индексируемая величина.
Изменение доли страны в мировом импорте может быть охарактеризовано индивидуальным индексом [13 , c.121]:
i = y1 / y0 (2.1)
где y1 — уровень показателя за отчетный период;
y0 — уровень за базисный период.
Общие индексы ( ) характеризуют изменение индексируемого показателя в целом по сложной совокупности, отдельные элементы которой несоизмеримы в физических единицах (например, индекс валового сбора культуры, индекс урожайности и т.п.).
Индексы переменного и фиксированного состава используются при анализе динамики средних показателей.
Индексом переменного состава ( ) называют отношение двух средних уровней. Если индексируемую величину обозначить через , а веса через , то в общем виде индекс переменного состава можно записать как
. (2.2)
Очевидно, что средняя величина показателя ( ) может меняться как за счет изменения значений осредняемого признака (х) у отдельных единиц, так и за счет изменения их весов ( ), т.е. за счет изменения состава (структуры) совокупности. Это и является основанием для именования данного отношения средних величин индексом переменного состава [18 , C.173].
Если при расчете средних величин за два периода зафиксировать веса одного и того же периода, то при сравнении таких средних влияние изменения структурного фактора будет устранено, и этот индекс называютиндексом фиксированного (или постоянного) состава ().
Веса при этом фиксируются, как правило, на уровне текущего периода ( ), т.е.
. (2.3)
Нетрудно заметить, что при сокращении на этот индекс можно записать как
. (2.3')
Индекс фиксированного состава характеризует среднее изменение самого осредняемого признака при постоянстве структуры совокупности.
При сравнении средних показателей можно принять неизменными значения , тогда на динамику средних будет оказывать влияние только изменение весов, т.е. структуры совокупности. Этот индекс условно называют индексом структуры (или индексом структурных сдвигов) ( )[18 , C.174]:
(2.4)
Между вышеназванными индексами существует следующая взаимосвязь:
(2.5)
т.е. индекс структуры можно получить, разделив индекс переменного состава на индекс фиксированного состава.
Индекс структуры показывает, в какой степени изменение средней величины индексируемого показателя произошло за счет изменения структуры (состава) совокупности.
Характеристика динамики импорта в расчете на душу населения дается при помощи системы взаимосвязанных индексов.
Обозначим через - значение среднедушевого импорта в базисном и отчетном годах соответственно; - численность населения страны в базисном и отчетном годах соответственно.
Составим расчетную таблицу для вычисления промежуточных показателей (приложение Г), по данным которой, используя формулы (2.1)-(2.4), находим
Индекс средней величины импорта в расчете на душу населения (индекс переменного состава):
или 96,4%
Индекс величины импорта в расчете на душу населения (индекс фиксированного состава):
или 93,8%
Индекс структуры (индекс структурных сдвигов):
или 102,8%
Изменение среднего значения импорта в расчете на душу населения в абсолютном выражении:
- за счет изменения среднедушевого импорта по отдельным странам:
(тыс.долл.США/чел.)
- за счет изменения в структуре совокупности:
(тыс.долл.США/чел.)
Общее изменение среднего среднедушевого импорта:
(тыс.долл.США/чел.)
Индекс переменного состава показывает снижение в 2013 году по сравнению с 2012 г.среднего среднедушевого импорта на 3,6% (96,4%-100 = -3,6%) или на 0,01 тыс.долл.США/чел. в абсолютном выражении.
Индекс среднедушевого импорта постоянного состава показывает, что снижение среднедушевого импорта, обусловленное его изменением по отдельным странам составило 6,2% (93,8%-100%=-6,2%) или 0,017 тыс.долл.США/чел. в абсолютном выражении.
Индекс структурных сдвигов указывает на то, что в результате изменений в структуре совокупности, средний размер среднедушевого импорта вырос на 2,8% (102,8%-100%= 2,8%) или на 0,007 тыс.долл.США/чел. в абсолютном выражении.
Совокупное действие обоих факторов (изменение среднедушевого импорта отдельных стран и структурные сдвиги) обусловили общее снижение среднедушевого импорта на 0,01 тыс.долл.США/чел.
2.3 Корреляционно-регрессионный анализ удельного веса стран в мировом импорте
Статистические показатели международной или любой другой деятельности могут состоять между собой в следующих основных видах связи: балансовой, компонентной, факторной [12 , C.215 ].
Балансовая связь показателей характеризует зависимость между источниками формирования ресурсов (средств) и их использованием.
Компонентные связи показателей характеризуются тем, что изменение статистического показателя определяется изменением компонентов, входящих в этот показатель.
Факторные связи в какой-либо деятельности характеризуются тем, что они проявляются в согласованной вариации изучаемых показателей. При этом одни показатели выступают как факторные, а другие - как результативные. По своему характеру этот вид связи является причинно-следственной (детерминированной) зависимостью.
В свою очередь, факторные связи могут рассматриваться как функциональные и корреляционные [ 19 , C.189].
При функциональной связи изменение результативного признака всецело обусловлено действием факторного признака х:
(2.6)
При корреляционной связи изменение результативного признака у обусловлено влиянием факторного признака х не всецело, а лишь частично, так как возможно влияние прочих факторов :
(2.7)
При изучении связи показателей применяются различного вида уравнения прямолинейной и криволинейной связи. Вычисление по исходным данным параметров уравнений осуществляется способом выравнивания эмпирических данных методом наименьших квадратов. В основу этого метода положено требование минимальности сумм квадратов отклонений эмпирических данных от выровненных .
Оценка практической значимости построенных моделей осуществляется с помощью показателей тесноты связи между признаками х и у.
Для статистической оценки тесноты связи применяются следующие показатели [18 , C.186]:
1) общая дисперсия результативного признака , отображающая совокупное влияние всех факторов:
(2.8)
2) факторная дисперсия результативного признака , отображающая вариацию у только от воздействия изучаемого фактора х:
. (2.9)
3) остаточная дисперсия , отображающая вариацию результативного признака у от всех прочих, кроме х, факторов:
. (2.10)
Мера тесноты связи между признаками х и y (индекс детерминации):
(2.11)
Тогда индекс корреляции R:
(2.12)
Для оценки значимости индекса корреляции R применяется F-критерий Фишера:
(2.13)
где m - число параметров уравнения регрессии.
Величина сравнивается с критическим значением , которое определяется по таблице -критерия с учетом принятого уровня значимости и числа степеней свободы и . Если > , то величина индекса корреляции признается существенной.
По значению показателя тесноты связи можно посредством t-критерия произвести оценку значимости коэффициента регрессии ( ):
. (2.14)
Сравнивая исчисленное значение с табличным , получают заключение о существенности основного параметра уравнения связи-коэффициента регрессии ( ).
Когда требуется охарактеризовать связь множества независимых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии.
Линейная модель множественной регрессии имеет вид [18 , C.201].
(2.15)
Здесь — коэффициенты регрессии, каждый из которых показывает, на сколько единиц изменится Y с изменением соответствующего признака Х на единицу при условии, что остальные признаки останутся на прежнем уровне.
Параметры уравнения множественной регрессии, как правило, находятся методом наименьших квадратов.
Предполагаем, что доля страны в мировом импорте (у) линейно зависит от набора факторов ( ):
,
где x1 - экспорт, на 1 кв км территории;
x2 - удельный вес отдельных стран в мировом экспорте, %;
x3 - индексы производства продукции сельского хозяйства, %.
Построим матрицу парных коэффициентов корреляции с использованием корреляционного анализа Пакета анализа в Excel.
Исходные данные по 23 странам для проведения корреляционно-регрессионного анализа представлены в приложении А.
Выполним команду Excel Данные – Анализ данных – Корреляция и в диалоговом окне Корреляция заполним необходимые поля (приложение Д).
Результат корреляционного анализа (матрица парных коэффициентов корреляции) представлен в таблице 2.2.
Таблица 2.2
Матрица парных коэффициентов корреляции
Y | X1 | X2 | X3 | |
Y | 1,000 | |||
X1 | 0,192 | 1,000 | ||
X2 | 0,941 | 0,347 | 1,000 | |
X3 | -0,141 | -0,219 | -0,147 | 1,000 |
Анализируя полученные данные, можно сделать вывод, что наиболее сильно доля страны в мировом импорте зависит от доли отдельных стран в мировом экспорте, т.е. от фактора х2. Об этом свидетельствует близкое к единице значение коэффициента парной корреляции между переменными y и x2 (ry,x2=0,941).
Отметим, что в данном наборе факторов тесной зависимости факторов между собой (мультиколлинеарность) не наблюдается.
Построим модель множественной регрессии с факторами х1, х2, х3.
Выполним команду Excel Данные – Анализ данных – Регрессия и в диалоговом окне Корреляция заполним необходимые поля (рис.2.1).
Рис. 2.1. Диалоговое окно «Регрессия»
Результаты регрессионного анализа представлены на рисунке 2.2.
Рис. 2.2. Вывод итогов по результатам регрессионного анализа
Полученная модель множественной регрессии будет следующей:
Интерпретация коэффициентов модели состоит в следующем.
- с ростом величины экспорта на 1 кв. км. территории на 1 млн.долл.США ее доля в мировом импорте снижается в среднем на 4,18% (а1= - 4,180);
- с ростом удельного веса страны в мировом экспорте на 1% ее доля в мировом импорте увеличивается в среднем на 1,25% (а2= 1,252);
- с ростом индекса производства продукции сельского хозяйства доля страны в мировом импорте снижается в среднем на 0,006% (а3= -0,006).
Выполним оценку качества и адекватности построенной модели.
Показатель «Множественный R» представляет собой коэффициент множественной корреляции. В данном случае R=0,952 близок к единице, что означает, что между долей страны в мировом импорте и включенными в модель факторами xi существует очень сильная по силе линейная корреляционная зависимость.
Показатель «R-квадрат» - это коэффициент множественной детерминации. R2=0,907 говорит об очень хорошем качестве уравнения регрессии, поскольку 90,7% вариации доли страны в мировом импорте учтено в модели и обусловлено вариацией включенных в модель факторов. На долю неучтенных факторов приходится 9,3% вариации доли мирового импорта страны.
Значимость коэффициентов регрессии оценивается с помощью t-критерия Стьюдента (столбец t-статистики на рис.2.2). Для значимых факторов показатель P-значения должны быть менее 0,05. Таким образом, значимым является лишь фактор x2 (удельный вес страны в мировом экспорте). Этот вывод подтверждают и границы доверительных интервалов для коэффициентов регрессии – для значимых факторов доверительные интервалы не должны содержать нулевых значений.