Методика множественного регрессионного анализа

В множественном регрессионном анализе исследуется связь между несколькими независимыми переменными (предикторами) Методика множественного регрессионного анализа - student2.ru и результативным признаком (откликом) . Следовательно,

Методика множественного регрессионного анализа - student2.ru .

Обычно предполагается, что случайная величина ( Методика множественного регрессионного анализа - student2.ru ) имеет нормальный закон распределения с условным математическим ожиданием и постоянной, не зависящей от аргументов дисперсией Методика множественного регрессионного анализа - student2.ru . В анализе чаще всего используются уравнения регрессии линейного вида

Методика множественного регрессионного анализа - student2.ru

Коэффициенты регрессии Методика множественного регрессионного анализа - student2.ru показывают, на какую величину в среднем изменяется результативный признак , если независимая переменная , изменяется на единицу ее измерения.

В матричной форме регрессионная модель имеет вид

Методика множественного регрессионного анализа - student2.ru ,

где Методика множественного регрессионного анализа - student2.ru – случайный вектор-столбец размерности ( ) наблюдаемых значений результативного признака ( ); X – матрица размерности ( Методика множественного регрессионного анализа - student2.ru ) наблюдаемых значений аргументов. Элемент матрицы рассматривается как неслучайная величина ( ; ; ); А – вектор-столбец размерности ( Методика множественного регрессионного анализа - student2.ru )неизвестных параметров, подлежащих оценке в ходе регрессионного анализа (вектор коэффициентов регрессии); Методика множественного регрессионного анализа - student2.ru - случайный вектор-столбец размерности ( ) – вектор остатков, которые являются независимыми нормально распределенными случайными величинами с нулевым математическим ожиданием ( Методика множественного регрессионного анализа - student2.ru ) и неизвестной дисперсией .

На практике рекомендуется, чтобы число наблюдений (n)превышало число анализируемых признаков (m) не менее, чем в пять-шесть раз.

Для расчета вектора оценок коэффициентов регрессии Методика множественного регрессионного анализа - student2.ru по методу наименьших квадратов используется формула

Методика множественного регрессионного анализа - student2.ru , (2.4)

где

Методика множественного регрессионного анализа - student2.ru ; ; ;

Методика множественного регрессионного анализа - student2.ru

где

Методика множественного регрессионного анализа - student2.ru – транспонированная матрица X;

Методика множественного регрессионного анализа - student2.ru – матрица, обратная матрице .

Для устранения влияния различия дисперсий и единиц измерения отдельных переменных на результаты регрессионного анализа в ряде случаев целесообразно вместо исходных значений переменных Методика множественного регрессионного анализа - student2.ru использовать нормированные значения . В этом случае уравнение множественной линейной регрессии будет иметь следующий вид:

Методика множественного регрессионного анализа - student2.ru (1.5)

где Методика множественного регрессионного анализа - student2.ru – нормированное значения отклика ;

Методика множественного регрессионного анализа - student2.ru – нормированные значения предикторов (независимых переменных – ,);

Методика множественного регрессионного анализа - student2.ru — нормированные коэффициенты регрессии, которые могут быть вычислены исходя из следующей системы уравнений:

Методика множественного регрессионного анализа - student2.ru

Если решать данную систему по правилу Крамера, то Методика множественного регрессионного анализа - student2.ru равно

Методика множественного регрессионного анализа - student2.ru , (2.6)

где Методика множественного регрессионного анализа - student2.ru – определитель матрицы системы уравнений;

Методика множественного регрессионного анализа - student2.ru – определитель матрицы системы линейных уравнений, в которой j-й столбец заменен столбцом свободных членов уравнений системы ( Методика множественного регрессионного анализа - student2.ru ).

Когда уравнение построено в нормированном масштабе, коэффициенты регрессии Методика множественного регрессионного анализа - student2.ru показывают, за сколько нормированных отклонений изменится при изменении каждой из на одно нормированное отклонение.

Между коэффициентами Методика множественного регрессионного анализа - student2.ru и существует следующая зависимость:

Методика множественного регрессионного анализа - student2.ru . (2.7)

Кроме того, при помощи коэффициентов Методика множественного регрессионного анализа - student2.ru можно рассчитать частный ( ) и множественный ( )коэффициенты детерминации

Методика множественного регрессионного анализа - student2.ru ;

Методика множественного регрессионного анализа - student2.ru ,

причем

Методика множественного регрессионного анализа - student2.ru .

После того как рассчитано само уравнение регрессии и перечисленные выше характеристики корреляционных связей, необходимо убедиться в адекватности полученных результатов.

Значимость уравнения регрессии в целом, т.е. нулевая гипотеза Методика множественного регрессионного анализа - student2.ru , проверяется по F-критерию Фишера. Его наблюдаемое значение определяется по формуле

Методика множественного регрессионного анализа - student2.ru , (2.8)

где Методика множественного регрессионного анализа - student2.ru ,

Методика множественного регрессионного анализа - student2.ru .

По таблице распределения значений F-критерия Фишера, при заданных Методика множественного регрессионного анализа - student2.ru , , ,находят .Гипотеза отклоняется с вероятностью , если . Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии существенно отличен от нуля.

Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотез Методика множественного регрессионного анализа - student2.ru , где , используют t-критерий Стьюдента, фактическое значение которого вычисляют следующим образом:

Методика множественного регрессионного анализа - student2.ru ; ; , (2.9)

где Методика множественного регрессионного анализа - student2.ru – средняя ошибка коэффициента регрессии , – оценка среднего квадрата ошибки; – соответствующие коэффициенту Методика множественного регрессионного анализа - student2.ru диагональные элементы матрицы .

По таблице значений t-критерия Стьюдента для заданного уровня значимости и числа степеней свободы ( Методика множественного регрессионного анализа - student2.ru ) находят . Значимость проверяемого коэффициента подтверждается, если . В противном случае коэффициент регрессии незначим, и соответствующая ему переменная не должна входить в модель.

Аналогичным образом осуществляется проверка значимости парных и частных коэффициентов корреляции. При этом табличное значение определяется для числа степеней свободы, равного ( Методика множественного регрессионного анализа - student2.ru ), а расчетное значение критерия начисляется по формуле

Методика множественного регрессионного анализа - student2.ru . (2.10)

Значимость множественного коэффициента детерминации ( Методика множественного регрессионного анализа - student2.ru ) и соответственно множественного коэффициента корреляции ( ) оценивается по F- критерию Фишера. Расчетное значение этого критерия определяется по формуле

Методика множественного регрессионного анализа - student2.ru . (2.11)

Гипотеза о значимости множественного коэффициента детерминации принимается в том случае, если Методика множественного регрессионного анализа - student2.ru для заданного уровня значимости и числа степеней свободы , и .

Пример. На основании приведенных данных таблицы 2.2 по районам области постройте линейную регрессионную модель валового выпуска продукции сельского хозяйства в целом по области.

Таблица 2.2

Район
	12,22	121,0
	8,96	43,0
	11,69	69,0
	5,38	21,0
	8,66	58,0
	9,35	29,0
	8,92	66,0
	7,61	54,0
	11,32	86,0
	9,53	81,0
	6,75	52,0
	7,00	35,0
	6,58	27,0
	6,79	74,0
	9,12	83,0
	4,79	57,0

Здесь: Методика множественного регрессионного анализа - student2.ru – нагрузка пашни на одного работника, га; – производительность труда одного работника, тыс. ден. ед.; – валовая продукция, млн. ден. ед.

1. Рассчитать уравнение множественной линейной регрессии.

2. Оценить тесноту связи между анализируемыми признаками с помощью коэффициентов корреляции и детерминации (парных и множественных).

3. Оценить значимость коэффициентов регрессии по t-критерию Стьюдента и качество модели по F-критерию Фишера. Поясните экономический смысл полученных результатов.

Решение.

1 Для оценки коэффициентов уравнения регрессии воспользуемся методом наименьших квадратов (МНК).

С этой целью строим систему нормальных уравнений для матрицы исходных значений переменных:

Методика множественного регрессионного анализа - student2.ru

Методика множественного регрессионного анализа - student2.ru ; ; ;

Методика множественного регрессионного анализа - student2.ru ; ;

Методика множественного регрессионного анализа - student2.ru ;

Методика множественного регрессионного анализа - student2.ru ; .

Система уравнений будет иметь вид

Методика множественного регрессионного анализа - student2.ru

Методика множественного регрессионного анализа - student2.ru ; ; .

Уравнение регрессии можно записать следующим образом:

Методика множественного регрессионного анализа - student2.ru .

Рассмотрим экономический смысл полученных коэффициентов регрессии для нашего примера. Первый коэффициент Методика множественного регрессионного анализа - student2.ru показывает, что при увеличении нагрузки пашни на одного работника на 1 га объем выпуска продукции сельского хозяйства уменьшится на 1,6 млн. ден. ед. Второй коэффициент регрессии Методика множественного регрессионного анализа - student2.ru показывает, что при увеличении производительности труда одного работника на 1 тыс. ден. ед., объем выпуска продукции увеличится на 6,8 млн. ден. ед. при прочих равных условиях.

2 Для расчетов коэффициентов корреляции и детерминации (парных и множественных) проведем, прежде всего, стандартизацию исходных переменныхи рассчитаем матрицу корреляций Методика множественного регрессионного анализа - student2.ru

Методика множественного регрессионного анализа - student2.ru ,

где Методика множественного регрессионного анализа - student2.ru – матрица стандартизованных значений переменных

Методика множественного регрессионного анализа - student2.ru

Матрица Методика множественного регрессионного анализа - student2.ru будет иметь следующий вид:

Методика множественного регрессионного анализа - student2.ru , а матрица корреляций будет равна

Методика множественного регрессионного анализа - student2.ru .

Теперь рассчитаем множественный коэффициент детерминации (R²)и множественный коэффициент корреляции Методика множественного регрессионного анализа - student2.ru

Методика множественного регрессионного анализа - student2.ru ,

Методика множественного регрессионного анализа - student2.ru .

Полученные результаты позволяют сделать следующий вывод: вариация объема выпуска продукции на 58,8 % зависит от исследуемых признаков-факторов; связь между результативным признаком (откликом) достаточно тесная, поскольку множественный коэффициент корреляции близок к единице Методика множественного регрессионного анализа - student2.ru .

Пример. На основе приведенных данных таблицы 2.3 по десяти промышленным предприятиям проведите регрессионный анализ зависимости себестоимости произведенной продукции Методика множественного регрессионного анализа - student2.ru (млн. ден. ед.) от объема произведенной продукции (млн. ден. ед.) и уровня производительности труда рабочих (тыс. ден. ед. на человека).

Таблица 2.3

№ п/п		2'									Итого
	3,3	4,2	5,0	5,6	5,8	5,1	6,2	7,0	10,8	15,0
	1,7	1,5	1,4	1,3	1,3	1,5	1,6	1,2	1,3	1,2
	2,5	2,7	3,7	4,0	4,3	4,6	5,0	6,0	7,2	10,0

Решение.

1 Вектор оценок коэффициентов регрессии Методика множественного регрессионного анализа - student2.ru определяется из уравнения

Методика множественного регрессионного анализа - student2.ru .

Согласно методу наименьших квадратов, вектор Методика множественного регрессионного анализа - student2.ru расчитывается из выражения ,

где Методика множественного регрессионного анализа - student2.ru , , ;

Методика множественного регрессионного анализа - student2.ru ; .

Для того чтобы рассчитать все необходимые элементы матрицы Методика множественного регрессионного анализа - student2.ru вектора заполним таблицу 2.4.

Таблица 2.4

№ п/п
	3,3	1,7	2,5	10,89	2,89	8,25	4,25	5,61	2,59
	4,2	1,5	2,7	17,64	2,25	11,34	4,05	6,37	3,25
	5,0	1,4	3,7	25,00	1,96	18,50	5,18	7,0	3,79
	5,6	1,3	4,0	31,36	1,69	22,40	5,20	7,28	4,21
	5,8	1,3	4,3	33,64	1,69	24,94	5,59	7,54	4,32
	5,1	1,5	4,6	26,01	2,25	23,46	6,90	7,65	3,78
	6,2	1,6	5,0	38,44	2,56	31,00	8,00	9,92	4,35
	7,0	1,2	6,0	49,00	1,44	42,00	7,20	8,40	5,10
	10,8	1,3	7,2	116,64	1,69	77,76	9,36	14,04	7,26
	15,0	1,2	10,0	225,00	1,44	150,0	12,0	18,00	9,79
Итого				573,62	19,86	409,65	67,73	91,74	48,5

Методика множественного регрессионного анализа - student2.ru .

Рассчитываем элементы обратной матрицы Методика множественного регрессионного анализа - student2.ru и вектор оценок коэффициентов регрессии .Определитель матрицы | |=169,456, а обратная матрица равна

Методика множественного регрессионного анализа - student2.ru ,

и оценку уравнения регрессии Методика множественного регрессионного анализа - student2.ru . Получаем

Методика множественного регрессионного анализа - student2.ru .

Тогда несмещенная оценка остаточной дисперсии равна

Методика множественного регрессионного анализа - student2.ru ,

а оценка среднеквадратического отклонения составит Методика множественного регрессионного анализа - student2.ru .

Проверяем на уровне значимости Методика множественного регрессионного анализа - student2.ru =0,05 адекватность уравнения регрессии,т.е. гипотезу . Для этого вычисляем наблюдаемое значение F-критерия

Методика множественного регрессионного анализа - student2.ru .

По таблице F-распределения для заданного уровня значимости Методика множественного регрессионного анализа - student2.ru =0,05 и числа степеней свободы =3 и =7 находим =4,35.

Так как Методика множественного регрессионного анализа - student2.ru (418,2>4,35), гипотеза отвергается с вероятностью ошибки 0,05. Таким образом, уравнение является значимым, т.е. хотя бы один из рассчитанных коэффициентов регрессии отличен от нуля.

Перед проверкой значимости отдельных коэффициентов регрессии найдем оценкуковариационной матрицы вектора коэффициентов регрессии ( Методика множественного регрессионного анализа - student2.ru ):

Учитывая, что на главной диагонали ковариационной матрицы находятся дисперсии коэффициентов регрессии, получаем следующие несмещенные оценки этих дисперсий:

Методика множественного регрессионного анализа - student2.ru ( );

и оценку корреляционной матрицы Методика множественного регрессионного анализа - student2.ru с элементами, определяемыми по формуле

Методика множественного регрессионного анализа - student2.ru ,

где Методика множественного регрессионного анализа - student2.ru – элементы матрицы , стоящие на пересечении j-строки и k-столбца, j, k=1,2,3.

Находим оценку корреляционной матрицы Методика множественного регрессионного анализа - student2.ru

Методика множественного регрессионного анализа - student2.ru .

Для проверки значимости отдельных коэффициентов регрессии, т.е. гипотез Методика множественного регрессионного анализа - student2.ru , где находим по таблицам -распределения для =0,05, , критическое значение .

Вычисляем Методика множественного регрессионного анализа - student2.ru для каждого и коэффициентов регрессии по формуле

Методика множественного регрессионного анализа - student2.ru , . Подставляя данные, получаем

Методика множественного регрессионного анализа - student2.ru ; .

Так как Методика множественного регрессионного анализа - student2.ru > , то коэффициент регрессии значимо отличается от нуля. Для коэффициента выполняется неравенство < , поэтому данный коэффициент можно считать незначимым.