О б о б щ е н н а я с х е м а

Число: 2112

Р Е Г Р Е С С И О Н Н О Г О А Н А Л И З А

ГЕТЕРОСКЕДАСТИЧНОСТЬ

Расчетные формулы

1.3.1.1. Оценка коэффициентов обобщенной регрессии:

о б о б щ е н н а я с х е м а - student2.ru .

1.3.1.2. Тест Уайта. Сначала с помощью обычного МНК строится регрессионная модель, и находятся остатки о б о б щ е н н а я с х е м а - student2.ru , . После чего строится регрессия квадратов этих остатков на все регрессоры, их квадраты и попарные произведения. В предположении, что гипотеза о б о б щ е н н а я с х е м а - student2.ru (отсутствие гетероскедастичности) имеет место, величина асимптотически имеет распределение , где – коэффициент детерминации, а – число регрессоров второй модели. Если о б о б щ е н н а я с х е м а - student2.ru , то отвергается.

1.3.1.3. Тест Голдфельда – Куандта:

1) данные упорядочиваются по убыванию той независимой переменной, от которой в соответствии с предположением зависит дисперсия ошибки;

2) о б о б щ е н н а я с х е м а - student2.ru наблюдений, расположенных в средине упорядоченного ряда, исключаются ( рекомендуется брать равным четверти общего числа наблюдений);

3) по первым о б о б щ е н н а я с х е м а - student2.ru и последним строятся независимо друг от друга два регрессионных уравнения и с их помощью рассчитываются соответствующие вектора остатков о б о б щ е н н а я с х е м а - student2.ru и ;

4) из полученных остатков рассчитывается статистика о б о б щ е н н а я с х е м а - student2.ru . Если верна гипотеза , то имеет распределение Фишера с степенями свободы. Если статистика больше табличного значения, то гипотеза о б о б щ е н н а я с х е м а - student2.ru отвергается.

1.3.1.4. Тест Бреуша – Пагана:

1) строится обычная регрессия и с ее помощью рассчитываются компоненты вектора остатков о б о б щ е н н а я с х е м а - student2.ru ;

2) рассчитывается оценка дисперсии о б о б щ е н н а я с х е м а - student2.ru ;

3) строится регрессионное уравнение о б о б щ е н н а я с х е м а - student2.ru ,

где о б о б щ е н н а я с х е м а - student2.ru – вектор независимых переменных; – неизвестные параметры.

Для этого уравнения рассчитывается объясненная часть вариации, т.е. сумма квадратов отклонений расчетных значений от среднего значения, обозначаемая обычно RSS;

4) статистика RSS/2 сравнивается с табличным значением о б о б щ е н н а я с х е м а - student2.ru и, если RSS/2 превосходит табличное значение, то нуль-гипотеза (отсутствие гетероскедастичности) отбрасывается.

Решение типовых задач

Задание 3.1.2.1. В табл. 3.1.2.1 представлены данные о потребительских расходах (у,у.е.) и располагаемом доходе (х,у.е.) тридцати семей. Проверьте эти данные на наличие гетероскедастичности, используя: 1) критерий Уайта; 2) критерий Бреуша – Пагана.

Т а б л и ц а 3.1.2.1

№ п.п.	У	х	№ п.п.	у	х	№ п.п.	У	х
1.			11.			21.
2.			12.			22.
3.			13.			23.
4.			14.			24.
5.			15.			25.
6.			16.			26.
7.			17.			27.
8.			18.			28.
9.			19.			29.
10.			20.			30.

Решение с помощью табличного процессора Excel

1. Ввод исходных данных.

2. Построение регрессионного уравнения с помощью пакета анализа (см. Вывод 3.1.2.1)

ВЫВОД ИТОГОВ 3.1.2.1

Регрессионная статистика
Множественный R	0,984083
R-квадрат	0,968419
Нормированный R-квадрат	0,967291
Стандартная ошибка	420,4049
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		1,52E+08	1,52E+08	858,6118	1,49E-22
Остаток			176740,3
Итого		1,57E+08

	Коэффи-циенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение		447,5552	3,530291	0,001457	663,2238	2496,776
Переменная X 1	0,78303	0,026723	29,30208	1,49E-22	0,728291	0,837769

3. Получение расчетных значений о б о б щ е н н а я с х е м а - student2.ru и вычисление остатков и , . Оформление результатов расчетов в виде табл. 3.1.2.2.

Т а б л и ц а 3.1.2.2

№ п.п.			№ п.п.
1.	10976,36	76376,86	16.	14891,52	71,99
2.	11759,39	129164,00	17.	15674,55	647,93
3.	12542,42	58769,51	18.	16457,58	1799,82
4.	13325,45	105920,66	19.	17240,61	67285,22
5.	14108,48	95162,90	20.	18023,64	50013,22
6.	14891,52	241587,14	21.	10976,36	50013,22
7.	15674,55	455011,57	22.	11759,39	116012,49
8.	16457,58	310890,73	23.	12542,42	432405,88
9.	17240,61	116012,49	24.	13325,45	75375,21
10.	18023,64	678376,86	25.	14108,48	8375,02
11.	10976,36	5831,40	26.	14891,52	166859,87
12.	11759,39	3527,64	27.	15674,55	526284,30
13.	12542,42	3314,97	28.	16457,58	195739,21
14.	13325,45	647,93	29.	17240,61	738557,94
15.	14108,48	11768,96	30.	18023,64	226922,31

4. Построение графика квадратов остатков (см. рис. 3.1.2.1). График зависимости квадратов остатков регрессии от независимой переменной имеет вид, вынуждающий предполагать гетероскедастичность.

о б о б щ е н н а я с х е м а - student2.ru

Р и с. 3.1.2.1. График зависимости квадратов остатков от величины дохода

5. Проверка данных с помощью теста Уайта.

5.1. Вычисление о б о б щ е н н а я с х е м а - student2.ru и построение регрессионного уравнения (см. Вывод итогов 3.1.2.2) .

5.2. Расчет о б о б щ е н н а я с х е м а - student2.ru и сравнение этой величины с критическим значением . Результаты сравнения позволяют отвергнуть нуль-гипотезу (отсутствие гетероскедастичности).

ВЫВОД ИТОГОВ 3.1.2.2

Регрессионная статистика
Множественный R	0,440291
R-квадрат	0,193856
Нормированный R-квадрат	0,134142
Стандартная ошибка	190982,8
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		2,37E+11	1,18E+11	3,246397	0,054521
Остаток		9,85E+11	3,65E+10
Итого		1,22E+12

	Коэффи-циенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	427676,8		0,333329	0,741461	-2204919
Переменная X 1	-64,7853	158,8192	-0,40792	0,68655	-390,655	261,0846
Переменная X 2	0,002874	0,004799	0,598982	0,554178	-0,00697	0,01272

6. Проверка данных с помощью теста Бреуша – Пагана.

6.1. Вычисление оценки дисперсии

о б о б щ е н н а я с х е м а - student2.ru .

6.2. Расчет о б о б щ е н н а я с х е м а - student2.ru и построение регрессионного уравнения (см. Вывод итогов 3.1.2.3) .

ВЫВОД ИТОГОВ 3.1.2.3

Регрессионная статистика
Множественный R	0,427954
R-квадрат	0,183144
Нормированный R-квадрат	0,153971
Стандартная ошибка	1,144436
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		8,222216	8,222216	6,27778	0,018316
Остаток		36,67252	1,309733
Итого		44,89474

	Коэффи-циенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%
Y-пересечение	-2,0074	1,218345	-1,64764	0,110604	-4,50307	0,488272
Переменная X 1	0,000182	7,27E-05	2,50555	0,018316	3,33E-05	0,000331

6.3. Вычисление среднего, расчетных значений, квадратов отклонений расчетных значений от среднего и RSS как суммы квадратов этих отклонений. Оформление результатов расчетов в виде табл. 3.1.2.3.

Т а б л и ц а 3.1.2.3

№ п.п.					№ п.п.
1.		0,4630	0,1798	0,6727	16.	0,0004	1,0911	0,0083
2.		0,7830	0,3621	0,4070	17.	0,0039	1,2734	0,0747
3.		0,3563	0,5443	0,2076	18.	0,0109	1,4557	0,2076
4.		0,6421	0,7266	0,0747	19.	0,4079	1,6379	0,4070
5.		0,5769	0,9089	0,0083	20.	0,3032	1,8202	0,6727
6.		1,4645	1,0911	0,0083	21.	0,3032	0,1798	0,6727
7.		2,7584	1,2734	0,0747	22.	0,7033	0,3621	0,4070
8.		1,8847	1,4557	0,2076	23.	2,6213	0,5443	0,2076
9.		0,7033	1,6379	0,4070	24.	0,4569	0,7266	0,0747
10.		4,1124	1,8202	0,6727	25.	0,0508	0,9089	0,0083
11.		0,0354	0,1798	0,6727	26.	1,0115	1,0911	0,0083
12.		0,0214	0,3621	0,4070	27.	3,1904	1,2734	0,0747
13.		0,0201	0,5443	0,2076	28.	1,1866	1,4557	0,2076
14.		0,0039	0,7266	0,0747	29.	4,4773	1,6379	0,4070
15.		0,0713	0,9089	0,0083	30.	1,3756	1,8202	0,6727
	СРЗНАЧ	RSS
1,0000	8,2222

6.4. Вычисление статистики RSS/2= 8,22/2 = 4,11. При нулевой гипотезе отсутствия гетероскедастичности эта статистика имеет распределение о б о б щ е н н а я с х е м а - student2.ru , 95%-критическое значение которой равно 3,84. Поскольку 4,11 > 3,84, гипотеза о гомоскедастичности отвергается.

Задание 3.1.2.2. По данным табл. 3.1.2.4 постройте линейную регрессионную модель, характеризующую зависимость показателя о б о б щ е н н а я с х е м а - student2.ru от факторов и .

Т а б л и ц а 3.1.2.4

№				№
1.				11.
2.				12.
3.				13.
4.				14.
5.				15.
6.				16.
7.				17.
8.				18.
9.				19.
10.				20.

Построение модели следует начать с тестирования на гетероскедастичность. Считая наиболее вероятной ситуацию с двухуровневой дисперсией, используйте для проверки тест Голдфельда – Куандта. Если проверкой будет установлена неоднородность данных, то при построении модели примените многоэтапную процедуру оценивания ее коэффициентов с помощью доступного МНК.

Решение с помощью табличного процессора Excel

1. Ввод исходных данных.

2. Проверка данных с помощью теста Голдфельда – Куандта.

2.1. Упорядочивание исходных данных по переменной о б о б щ е н н а я с х е м а - student2.ru в предположении, что уровень дисперсии зависит от этой переменной, и удаление шести наблюдений, оказавшихся в середине выборки. Представление результатов в виде табл. 3.1.2.5.

Т а б л и ц а 3.1.2.5

№				№
1.				14.
2.				15.
3.				16.
4.				17.
5.				18.
6.				19.
7.				20.

2.2. Построение по упорядоченным данным двух регрессионных уравнений по первым семи наблюдениям (первое регрессионное уравнение, см. Вывод итогов 3.1.2.4) и по последним семи наблюдениям (второе регрессионное уравнение, см. Вывод итогов 3.1.2.5).

ВЫВОД ИТОГОВ 3.1.2.4

Регрессионная статистика
Множественный R	0,965091
R-квадрат	0,931401
Нормированный R-квадрат	0,897101
Стандартная ошибка	16,65463
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		15064,2081	7532,104	27,1548	0,0047059
Остаток		1109,50616	277,3765
Итого		16173,7143

	Коэффициенты	Стандартная ошибка	t-статис- тика	P-Значение	Нижние 95%	Верхние 95%

Y-пересечение	13,86422	26,6435024	0,52036	0,630286	-60,11015	87,838598
Переменная X 1	0,889493	0,39236032	2,267031	0,086009	-0,199876	1,978862
Переменная X 2	0,89948	0,13496104	6,66474	0,002633	0,5247676	1,274193
ВЫВОД ИТОГОВ 3.1.2.5

Регрессионная статистика
Множественный R	0,99412
R-квадрат	0,988274
Нормированный R-квадрат	0,982411
Стандартная ошибка	5,576546
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		10483,6085	5241,804	168,5583	0,000138
Остаток		124,391476	31,09787
Итого

	Коэффициенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%

Y-пересечение	23,49446	6,3630766	3,692312	0,020976	5,827693	41,161232
Переменная X 1	1,476582	0,11317714	13,04665	0,000199	1,162351	1,7908128
Переменная X 2	0,826054	0,07856709	10,51399	0,000463	0,607916	1,0441916

2.3. Получение расчетных значений и вычисление остатков о б о б щ е н н а я с х е м а - student2.ru и , с помощью которых составляется статистика . Оформление результатов в виде табл. 3.1.2.6.

Т а б л и ц а 3.1.2.6

№
1.	304,97	36,41
2.	202,65	385,93
3.	213,25	85,55
4.	182,85	447,46
5.	210,27	10,70
6.	167,42	112,03
7.	149,61	31,43
	=1109,51
14.	166,46	20,57
15.	132,98	24,78
16.	196,42	6,66
17.	111,10	1,21
18.	78,21	0,62
19.	146,78	46,02
20.	92,05	24,53
	=124,39

о б о б щ е н н а я с х е м а - student2.ru ; .

Так как о б о б щ е н н а я с х е м а - student2.ru , то гипотеза отвергается и, следовательно, в данных наблюдается гетероскедастичность с двухуровневой дисперсией. Поэтому для построения регрессии по данным табл. 3.1.2.4 необходимо применить многоэтапную процедуру доступного МНК.

3. Построение регрессии с помощью доступного взвешенного МНК.

3.1. Построение регрессии обычным МНК по данным табл. 3.1.2.4 (см. Вывод итогов 3.1.2.6).

ВЫВОД ИТОГОВ 3.1.2.6

Регрессионная статистика
Множественный R	0,968969836
R-квадрат	0,938902544
Нормированный R-квадрат	0,931714608
Стандартная ошибка	13,07464604
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		44658,7117	22329,36	130,622	4,8E-11
Остаток		2906,08827	170,9464
Итого		47564,8

	Коэффициенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%

Y-пересечение	36,78068243	9,43676522	3,897594	0,001158	16,87082	56,690545
Переменная X 1	1,191842832	0,16975113	7,021119	2,06E-06	0,833699	1,5499869
Переменная X 2	0,760391162	0,04869436	15,61559	1,63E-11	0,657655	0,8631274

3.2. Получение расчетных оценок о б о б щ е н н а я с х е м а - student2.ru и вычисление абсолютных значений отклонений. Оформление результатов в виде табл. 3.1.2.7.

Т а б л и ц а 3.1.2.7

№
-1-	-2-	-3-	-4-	-5-	-6-	-7-
1.				84,971	-5,971	5,971
2.				112,734	-2,734	2,734
3.				94,361	2,639	2,639
4.				161,356	9,644	9,644
5.				184,912	19,088	19,088
6.				183,510	-9,510	9,510
7.				178,538	5,462	5,462
8.				297,385	13,615	13,615
9.				184,518	21,482	21,482
10.				134,047	-6,047	6,047
11.				228,331	-21,331	21,331
12.				146,315	5,685	5,685
13.				184,411	14,589	14,589
14.				155,051	-11,051	11,051
15.				140,228	-0,228	0,228

О к о н ч а н и е т а б л. 3.1.2.7

-1-	-2-	-3-	-4-	-5-	-6-	-7-
16.				201,209	-18,209	18,209
17.				178,025	-0,025	0,025
18.				196,928	-11,928	11,928
19.				142,637	9,363	9,363
20.				218,531	-14,531	14,531

3.3. Деление наблюдений с помощью Автофильтрана две группы о б о б щ е н н а я с х е м а - student2.ru и со значениями остатков, по абсолютной величине превосходящих и не превосходящих заданный уровень. (Анализ последнего столбца табл. 3.1.2.7 позволил в качестве такого уровня выбрать 7.)

3.4. Расчет среднеквадратических ошибок по остаткам, не превосходящих заданный уровень, и среднеквадратических ошибок по остаткам, превосходящих заданный уровень.

о б о б щ е н н а я с х е м а - student2.ru ; .

3.5. Преобразование исходных данных путем деления зависимой и независимых переменных каждого наблюдения первой группы на о б о б щ е н н а я с х е м а - student2.ru , а второй группы – на и оформление результатов в виде табл. 3.1.2.8.

Т а б л и ц а 3.1.2.8

№
1.	3,014	9,968	18,314
2.	6,491	12,982	25,500
3.	7,650	5,564	22,487
4.	2,771	6,465	11,281
5.	0,792	11,611	13,458
6.	2,903	8,180	11,479
7.	8,346	30,137	42,655
8.	2,177	19,198	20,517
9.	2,243	9,302	13,590
10.	4,868	22,023	29,673
11.	3,826	10,621	13,656
12.	5,332	25,037	35,237
13.	4,552	5,674	13,128
14.	0,528	9,434	9,500
15.	13,909	9,736	32,455
16.	0,726	13,128	12,073
17.	6,027	33,614	41,264
18.	4,024	7,587	12,205
19.	1,187	7,323	10,028
20.	1,979	12,666	13,458

3.6. Построение регрессионной модели по преобразованным данным табл. 3.1.2.8 Использование преобразованных данных для построения регрессионной модели эквивалентно применению взвешенного МНК к исходным данным (см. Вывод итогов 3.1.2.7).

ВЫВОД ИТОГОВ 3.1.2.7

Регрессионная статистика
Множественный R	0,985102
R-квадрат	0,970425
Нормированный R-квадрат	0,966946
Стандартная ошибка	1,948194
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		2117,1754	1058,588	278,9088	1,01E-13
Остаток		64,5228463	3,795462
Итого		2181,69825

	Коэффициенты	Стандартная ошибка	t-статис-тика	P-Значение	Нижние 95%	Верхние 95%

Y-пересечение	0,148364	0,95183574	0,155871	0,877971	-1,85984	2,1565644
Переменная X 1	1,818385	0,14250896	12,75979	3,91E-10	1,517717	2,1190528
Переменная X 2	0,915585	0,05632975	16,25403	8,6E-12	0,79674	1,034431