О б о б щ е н н а я с х е м а

Р Е Г Р Е С С И О Н Н О Г О А Н А Л И З А

ГЕТЕРОСКЕДАСТИЧНОСТЬ

Расчетные формулы

1.3.1.1. Оценка коэффициентов обобщенной регрессии:

о б о б щ е н н а я с х е м а - student2.ru .

1.3.1.2. Тест Уайта. Сначала с помощью обычного МНК строится регрессионная модель, и находятся остатки о б о б щ е н н а я с х е м а - student2.ru , о б о б щ е н н а я с х е м а - student2.ru . После чего строится регрессия квадратов этих остатков на все регрессоры, их квадраты и попарные произведения. В предположении, что гипотеза о б о б щ е н н а я с х е м а - student2.ru (отсутствие гетероскедастичности) имеет место, величина о б о б щ е н н а я с х е м а - student2.ru асимптотически имеет распределение о б о б щ е н н а я с х е м а - student2.ru , где о б о б щ е н н а я с х е м а - student2.ru – коэффициент детерминации, а о б о б щ е н н а я с х е м а - student2.ru – число регрессоров второй модели. Если о б о б щ е н н а я с х е м а - student2.ru , то о б о б щ е н н а я с х е м а - student2.ru отвергается.

1.3.1.3. Тест Голдфельда – Куандта:

1) данные упорядочиваются по убыванию той независимой переменной, от которой в соответствии с предположением зависит дисперсия ошибки;

2) о б о б щ е н н а я с х е м а - student2.ru наблюдений, расположенных в средине упорядоченного ряда, исключаются ( о б о б щ е н н а я с х е м а - student2.ru рекомендуется брать равным четверти общего числа наблюдений);

3) по первым о б о б щ е н н а я с х е м а - student2.ru и последним о б о б щ е н н а я с х е м а - student2.ru строятся независимо друг от друга два регрессионных уравнения и с их помощью рассчитываются соответствующие вектора остатков о б о б щ е н н а я с х е м а - student2.ru и о б о б щ е н н а я с х е м а - student2.ru ;

4) из полученных остатков рассчитывается статистика о б о б щ е н н а я с х е м а - student2.ru . Если верна гипотеза о б о б щ е н н а я с х е м а - student2.ru , то о б о б щ е н н а я с х е м а - student2.ru имеет распределение Фишера с о б о б щ е н н а я с х е м а - student2.ru степенями свободы. Если статистика больше табличного значения, то гипотеза о б о б щ е н н а я с х е м а - student2.ru отвергается.

1.3.1.4. Тест Бреуша – Пагана:

1) строится обычная регрессия и с ее помощью рассчитываются компоненты вектора остатков о б о б щ е н н а я с х е м а - student2.ru ;

2) рассчитывается оценка дисперсии о б о б щ е н н а я с х е м а - student2.ru ;

3) строится регрессионное уравнение о б о б щ е н н а я с х е м а - student2.ru ,

где о б о б щ е н н а я с х е м а - student2.ru – вектор независимых переменных; о б о б щ е н н а я с х е м а - student2.ru – неизвестные параметры.

Для этого уравнения рассчитывается объясненная часть вариации, т.е. сумма квадратов отклонений расчетных значений от среднего значения, обозначаемая обычно RSS;

4) статистика RSS/2 сравнивается с табличным значением о б о б щ е н н а я с х е м а - student2.ru и, если RSS/2 превосходит табличное значение, то нуль-гипотеза (отсутствие гетероскедастичности) отбрасывается.

Решение типовых задач

Задание 3.1.2.1. В табл. 3.1.2.1 представлены данные о потребительских расходах (у,у.е.) и располагаемом доходе (х,у.е.) тридцати семей. Проверьте эти данные на наличие гетероскедастичности, используя: 1) критерий Уайта; 2) критерий Бреуша – Пагана.

Т а б л и ц а 3.1.2.1

№ п.п. У х № п.п. у х № п.п. У х
1. 11. 21.
2. 12. 22.
3. 13. 23.
4. 14. 24.
5. 15. 25.
6. 16. 26.
7. 17. 27.
8. 18. 28.
9. 19. 29.
10. 20. 30.

Решение с помощью табличного процессора Excel

1. Ввод исходных данных.

2. Построение регрессионного уравнения с помощью пакета анализа (см. Вывод 3.1.2.1)

ВЫВОД ИТОГОВ 3.1.2.1        
             
Регрессионная статистика          
Множественный R 0,984083          
R-квадрат 0,968419          
Нормированный R-квадрат 0,967291          
Стандартная ошибка 420,4049          
Наблюдения          
             
Дисперсионный анализ        
df SS MS F Значимость F
Регрессия 1,52E+08 1,52E+08 858,6118 1,49E-22  
Остаток 176740,3      
Итого 1,57E+08        
             
Коэффи-циенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%
Y-пересечение 447,5552 3,530291 0,001457 663,2238 2496,776
Переменная X 1 0,78303 0,026723 29,30208 1,49E-22 0,728291 0,837769

3. Получение расчетных значений о б о б щ е н н а я с х е м а - student2.ru и вычисление остатков о б о б щ е н н а я с х е м а - student2.ru и о б о б щ е н н а я с х е м а - student2.ru , о б о б щ е н н а я с х е м а - student2.ru . Оформление результатов расчетов в виде табл. 3.1.2.2.

Т а б л и ц а 3.1.2.2

№ п.п. о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru № п.п. о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 10976,36 76376,86 16. 14891,52 71,99
2. 11759,39 129164,00 17. 15674,55 647,93
3. 12542,42 58769,51 18. 16457,58 1799,82
4. 13325,45 105920,66 19. 17240,61 67285,22
5. 14108,48 95162,90 20. 18023,64 50013,22
6. 14891,52 241587,14 21. 10976,36 50013,22
7. 15674,55 455011,57 22. 11759,39 116012,49
8. 16457,58 310890,73 23. 12542,42 432405,88
9. 17240,61 116012,49 24. 13325,45 75375,21
10. 18023,64 678376,86 25. 14108,48 8375,02
11. 10976,36 5831,40 26. 14891,52 166859,87
12. 11759,39 3527,64 27. 15674,55 526284,30
13. 12542,42 3314,97 28. 16457,58 195739,21
14. 13325,45 647,93 29. 17240,61 738557,94
15. 14108,48 11768,96 30. 18023,64 226922,31

4. Построение графика квадратов остатков (см. рис. 3.1.2.1). График зависимости квадратов остатков регрессии от независимой переменной имеет вид, вынуждающий предполагать гетероскедастичность.

о б о б щ е н н а я с х е м а - student2.ru

Р и с. 3.1.2.1. График зависимости квадратов остатков от величины дохода

5. Проверка данных с помощью теста Уайта.

5.1. Вычисление о б о б щ е н н а я с х е м а - student2.ru и построение регрессионного уравнения (см. Вывод итогов 3.1.2.2) о б о б щ е н н а я с х е м а - student2.ru .

5.2. Расчет о б о б щ е н н а я с х е м а - student2.ru и сравнение этой величины с критическим значением о б о б щ е н н а я с х е м а - student2.ru . Результаты сравнения позволяют отвергнуть нуль-гипотезу (отсутствие гетероскедастичности).

ВЫВОД ИТОГОВ 3.1.2.2        
             
Регрессионная статистика          
Множественный R 0,440291          
R-квадрат 0,193856          
Нормированный R-квадрат 0,134142          
Стандартная ошибка 190982,8          
Наблюдения          
             
Дисперсионный анализ        
df SS MS F Значимость F
Регрессия 2,37E+11 1,18E+11 3,246397 0,054521  
Остаток 9,85E+11 3,65E+10      
Итого 1,22E+12        
             
Коэффи-циенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%
Y-пересечение 427676,8 0,333329 0,741461 -2204919
Переменная X 1 -64,7853 158,8192 -0,40792 0,68655 -390,655 261,0846
Переменная X 2 0,002874 0,004799 0,598982 0,554178 -0,00697 0,01272

6. Проверка данных с помощью теста Бреуша – Пагана.

6.1. Вычисление оценки дисперсии

о б о б щ е н н а я с х е м а - student2.ru .

6.2. Расчет о б о б щ е н н а я с х е м а - student2.ru и построение регрессионного уравнения (см. Вывод итогов 3.1.2.3) о б о б щ е н н а я с х е м а - student2.ru .

ВЫВОД ИТОГОВ 3.1.2.3        
             
Регрессионная статистика          
Множественный R 0,427954          
R-квадрат 0,183144          
Нормированный R-квадрат 0,153971          
Стандартная ошибка 1,144436          
Наблюдения          
             
Дисперсионный анализ        
df SS MS F Значимость F
Регрессия 8,222216 8,222216 6,27778 0,018316  
Остаток 36,67252 1,309733      
Итого 44,89474        
             
Коэффи-циенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%
Y-пересечение -2,0074 1,218345 -1,64764 0,110604 -4,50307 0,488272
Переменная X 1 0,000182 7,27E-05 2,50555 0,018316 3,33E-05 0,000331

6.3. Вычисление среднего, расчетных значений, квадратов отклонений расчетных значений от среднего и RSS как суммы квадратов этих отклонений. Оформление результатов расчетов в виде табл. 3.1.2.3.

Т а б л и ц а 3.1.2.3

№ п.п. о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru № п.п. о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 0,4630 0,1798 0,6727 16. 0,0004 1,0911 0,0083
2. 0,7830 0,3621 0,4070 17. 0,0039 1,2734 0,0747
3. 0,3563 0,5443 0,2076 18. 0,0109 1,4557 0,2076
4. 0,6421 0,7266 0,0747 19. 0,4079 1,6379 0,4070
5. 0,5769 0,9089 0,0083 20. 0,3032 1,8202 0,6727
6. 1,4645 1,0911 0,0083 21. 0,3032 0,1798 0,6727
7. 2,7584 1,2734 0,0747 22. 0,7033 0,3621 0,4070
8. 1,8847 1,4557 0,2076 23. 2,6213 0,5443 0,2076
9. 0,7033 1,6379 0,4070 24. 0,4569 0,7266 0,0747
10. 4,1124 1,8202 0,6727 25. 0,0508 0,9089 0,0083
11. 0,0354 0,1798 0,6727 26. 1,0115 1,0911 0,0083
12. 0,0214 0,3621 0,4070 27. 3,1904 1,2734 0,0747
13. 0,0201 0,5443 0,2076 28. 1,1866 1,4557 0,2076
14. 0,0039 0,7266 0,0747 29. 4,4773 1,6379 0,4070
15. 0,0713 0,9089 0,0083 30. 1,3756 1,8202 0,6727
  СРЗНАЧ RSS
1,0000 8,2222

6.4. Вычисление статистики RSS/2= 8,22/2 = 4,11. При нулевой гипотезе отсутствия гетероскедастичности эта статистика имеет распределение о б о б щ е н н а я с х е м а - student2.ru , 95%-критическое значение которой равно 3,84. Поскольку 4,11 > 3,84, гипотеза о гомоскедастичности отвергается.

Задание 3.1.2.2. По данным табл. 3.1.2.4 постройте линейную регрессионную модель, характеризующую зависимость показателя о б о б щ е н н а я с х е м а - student2.ru от факторов о б о б щ е н н а я с х е м а - student2.ru и о б о б щ е н н а я с х е м а - student2.ru .

Т а б л и ц а 3.1.2.4

о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 11.
2. 12.
3. 13.
4. 14.
5. 15.
6. 16.
7. 17.
8. 18.
9. 19.
10. 20.

Построение модели следует начать с тестирования на гетероскедастичность. Считая наиболее вероятной ситуацию с двухуровневой дисперсией, используйте для проверки тест Голдфельда – Куандта. Если проверкой будет установлена неоднородность данных, то при построении модели примените многоэтапную процедуру оценивания ее коэффициентов с помощью доступного МНК.

Решение с помощью табличного процессора Excel

1. Ввод исходных данных.

2. Проверка данных с помощью теста Голдфельда – Куандта.

2.1. Упорядочивание исходных данных по переменной о б о б щ е н н а я с х е м а - student2.ru в предположении, что уровень дисперсии зависит от этой переменной, и удаление шести наблюдений, оказавшихся в середине выборки. Представление результатов в виде табл. 3.1.2.5.

Т а б л и ц а 3.1.2.5

о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 14.
2. 15.
3. 16.
4. 17.
5. 18.
6. 19.
7. 20.

2.2. Построение по упорядоченным данным двух регрессионных уравнений по первым семи наблюдениям (первое регрессионное уравнение, см. Вывод итогов 3.1.2.4) и по последним семи наблюдениям (второе регрессионное уравнение, см. Вывод итогов 3.1.2.5).

ВЫВОД ИТОГОВ 3.1.2.4              
                 
Регрессионная статистика              
Множественный R 0,965091              
R-квадрат 0,931401              
Нормированный R-квадрат 0,897101              
Стандартная ошибка 16,65463              
Наблюдения              
                 
Дисперсионный анализ                
df SS MS F Значимость F    
Регрессия 15064,2081 7532,104 27,1548 0,0047059      
Остаток 1109,50616 277,3765          
Итого 16173,7143            
                 
Коэффициенты Стандартная ошибка t-статис- тика P-Значение Нижние 95% Верхние 95%    
   
Y-пересечение 13,86422 26,6435024 0,52036 0,630286 -60,11015 87,838598    
Переменная X 1 0,889493 0,39236032 2,267031 0,086009 -0,199876 1,978862    
Переменная X 2 0,89948 0,13496104 6,66474 0,002633 0,5247676 1,274193    
ВЫВОД ИТОГОВ 3.1.2.5  
 
Регрессионная статистика            
Множественный R 0,99412            
R-квадрат 0,988274            
Нормированный R-квадрат 0,982411            
Стандартная ошибка 5,576546            
Наблюдения            
               
Дисперсионный анализ              
df SS MS F Значимость F  
Регрессия 10483,6085 5241,804 168,5583 0,000138    
Остаток 124,391476 31,09787        
Итого          
               
Коэффициенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%  
 
Y-пересечение 23,49446 6,3630766 3,692312 0,020976 5,827693 41,161232  
Переменная X 1 1,476582 0,11317714 13,04665 0,000199 1,162351 1,7908128  
Переменная X 2 0,826054 0,07856709 10,51399 0,000463 0,607916 1,0441916  
                           

2.3. Получение расчетных значений и вычисление остатков о б о б щ е н н а я с х е м а - student2.ru и о б о б щ е н н а я с х е м а - student2.ru , с помощью которых составляется статистика о б о б щ е н н а я с х е м а - student2.ru . Оформление результатов в виде табл. 3.1.2.6.

Т а б л и ц а 3.1.2.6

о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 304,97 36,41
2. 202,65 385,93
3. 213,25 85,55
4. 182,85 447,46
5. 210,27 10,70
6. 167,42 112,03
7. 149,61 31,43
        о б о б щ е н н а я с х е м а - student2.ru =1109,51
14. 166,46 20,57
15. 132,98 24,78
16. 196,42 6,66
17. 111,10 1,21
18. 78,21 0,62
19. 146,78 46,02
20. 92,05 24,53
        о б о б щ е н н а я с х е м а - student2.ru =124,39

о б о б щ е н н а я с х е м а - student2.ru ; о б о б щ е н н а я с х е м а - student2.ru .

Так как о б о б щ е н н а я с х е м а - student2.ru , то гипотеза о б о б щ е н н а я с х е м а - student2.ru отвергается и, следовательно, в данных наблюдается гетероскедастичность с двухуровневой дисперсией. Поэтому для построения регрессии по данным табл. 3.1.2.4 необходимо применить многоэтапную процедуру доступного МНК.

3. Построение регрессии с помощью доступного взвешенного МНК.

3.1. Построение регрессии обычным МНК по данным табл. 3.1.2.4 (см. Вывод итогов 3.1.2.6).

ВЫВОД ИТОГОВ 3.1.2.6          
             
Регрессионная статистика          
Множественный R 0,968969836          
R-квадрат 0,938902544          
Нормированный R-квадрат 0,931714608          
Стандартная ошибка 13,07464604          
Наблюдения          
             
Дисперсионный анализ            
df SS MS F Значимость F
Регрессия 44658,7117 22329,36 130,622 4,8E-11  
Остаток 2906,08827 170,9464      
Итого 47564,8        
             
Коэффициенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%
Y-пересечение 36,78068243 9,43676522 3,897594 0,001158 16,87082 56,690545
Переменная X 1 1,191842832 0,16975113 7,021119 2,06E-06 0,833699 1,5499869
Переменная X 2 0,760391162 0,04869436 15,61559 1,63E-11 0,657655 0,8631274

3.2. Получение расчетных оценок о б о б щ е н н а я с х е м а - student2.ru и вычисление абсолютных значений отклонений. Оформление результатов в виде табл. 3.1.2.7.

Т а б л и ц а 3.1.2.7

о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
-1- -2- -3- -4- -5- -6- -7-
1. 84,971 -5,971 5,971
2. 112,734 -2,734 2,734
3. 94,361 2,639 2,639
4. 161,356 9,644 9,644
5. 184,912 19,088 19,088
6. 183,510 -9,510 9,510
7. 178,538 5,462 5,462
8. 297,385 13,615 13,615
9. 184,518 21,482 21,482
10. 134,047 -6,047 6,047
11. 228,331 -21,331 21,331
12. 146,315 5,685 5,685
13. 184,411 14,589 14,589
14. 155,051 -11,051 11,051
15. 140,228 -0,228 0,228

О к о н ч а н и е т а б л. 3.1.2.7

-1- -2- -3- -4- -5- -6- -7-
16. 201,209 -18,209 18,209
17. 178,025 -0,025 0,025
18. 196,928 -11,928 11,928
19. 142,637 9,363 9,363
20. 218,531 -14,531 14,531

3.3. Деление наблюдений с помощью Автофильтрана две группы о б о б щ е н н а я с х е м а - student2.ru и о б о б щ е н н а я с х е м а - student2.ru со значениями остатков, по абсолютной величине превосходящих и не превосходящих заданный уровень. (Анализ последнего столбца табл. 3.1.2.7 позволил в качестве такого уровня выбрать 7.)

3.4. Расчет среднеквадратических ошибок по остаткам, не превосходящих заданный уровень, и среднеквадратических ошибок по остаткам, превосходящих заданный уровень.

о б о б щ е н н а я с х е м а - student2.ru ; о б о б щ е н н а я с х е м а - student2.ru .

3.5. Преобразование исходных данных путем деления зависимой и независимых переменных каждого наблюдения первой группы на о б о б щ е н н а я с х е м а - student2.ru , а второй группы – на о б о б щ е н н а я с х е м а - student2.ru и оформление результатов в виде табл. 3.1.2.8.

Т а б л и ц а 3.1.2.8

о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru о б о б щ е н н а я с х е м а - student2.ru
1. 3,014 9,968 18,314
2. 6,491 12,982 25,500
3. 7,650 5,564 22,487
4. 2,771 6,465 11,281
5. 0,792 11,611 13,458
6. 2,903 8,180 11,479
7. 8,346 30,137 42,655
8. 2,177 19,198 20,517
9. 2,243 9,302 13,590
10. 4,868 22,023 29,673
11. 3,826 10,621 13,656
12. 5,332 25,037 35,237
13. 4,552 5,674 13,128
14. 0,528 9,434 9,500
15. 13,909 9,736 32,455
16. 0,726 13,128 12,073
17. 6,027 33,614 41,264
18. 4,024 7,587 12,205
19. 1,187 7,323 10,028
20. 1,979 12,666 13,458

3.6. Построение регрессионной модели по преобразованным данным табл. 3.1.2.8 Использование преобразованных данных для построения регрессионной модели эквивалентно применению взвешенного МНК к исходным данным (см. Вывод итогов 3.1.2.7).

ВЫВОД ИТОГОВ 3.1.2.7          
             
Регрессионная статистика          
Множественный R 0,985102          
R-квадрат 0,970425          
Нормированный R-квадрат 0,966946          
Стандартная ошибка 1,948194          
Наблюдения          
             
Дисперсионный анализ            
df SS MS F Значимость F
Регрессия 2117,1754 1058,588 278,9088 1,01E-13  
Остаток 64,5228463 3,795462      
Итого 2181,69825        
             
Коэффициенты Стандартная ошибка t-статис-тика P-Значение Нижние 95% Верхние 95%
Y-пересечение 0,148364 0,95183574 0,155871 0,877971 -1,85984 2,1565644
Переменная X 1 1,818385 0,14250896 12,75979 3,91E-10 1,517717 2,1190528
Переменная X 2 0,915585 0,05632975 16,25403 8,6E-12 0,79674 1,034431

Таким образом, уравнение регрессии, построенное с учетом гетероскедастичности, имеет вид

о б о б щ е н н а я с х е м а - student2.ru .

Наши рекомендации