Коррекция на гетероскедастичность

Рассмотрим модель:

Коррекция на гетероскедастичность - student2.ru .

Пусть ошибки uiне коррелированны, но характеризуются разной дисперсией:

Коррекция на гетероскедастичность - student2.ru ,

то есть модель гетероскедастична.

Матрица ковариаций W вектора ошибок u имеет вид:

Коррекция на гетероскедастичность - student2.ru .

Формула обобщенного метода наименьших квадратов

Коррекция на гетероскедастичность - student2.ru

сводится к взвешенному методу наименьших квадратов, так как матрица W-1 имеет простой вид:

Коррекция на гетероскедастичность - student2.ru .

Если s2i– известны, то получить модель с гомоскедастичными остатками можно, использовав в качестве весов наблюдений величины 1/si.

Разделим каждую строку матрицы данных на si:

Коррекция на гетероскедастичность - student2.ru . (6.4)

В результате получим преобразованную модель:

Коррекция на гетероскедастичность - student2.ru . (6.5)

Найдем дисперсию D(ei):

Коррекция на гетероскедастичность - student2.ru .

В итоге получим пересмотренную модель:

Коррекция на гетероскедастичность - student2.ru , (6.6)

где Коррекция на гетероскедастичность - student2.ru .

Заметим, что модель (6.6) не включает свободный член, bi– коэффициент регрессии при новой переменной h.

На практике дисперсии ошибок почти никогда не известны.

Однако, иногда можно предположить, что s2iпропорциональны некоторой переменной Zi.

Коррекция на гетероскедастичность - student2.ru

Коррекция на гетероскедастичность - student2.ru

Коррекция на гетероскедастичность - student2.ru .

Тогда в качестве весов наблюдений следует использовать величину 1/zi:

Коррекция на гетероскедастичность - student2.ru .

В итоге получим пересмотренную модель:

Коррекция на гетероскедастичность - student2.ru , (6.7)

где

Коррекция на гетероскедастичность - student2.ru . (6.8)

Подобрать простое преобразования для того, чтобы добиться гомоскедастичности удается не всегда.

Часто гетероскедастичность является сигналом о неправильной функциональной форме модели.

В общем случае для коррекции гетероскедастичности используют следующую процедуру:

1. Рассчитывают МНК-оценки коэффициентов регрессии.

2. Находят остатки ei.

3. Находят квадраты остатков ei2.

4. Находят логарифмы квадратов остатков ln(ei2).

5. Рассчитывают регрессию

6. ln(ei2) = g0+g0zi1+g0zi2+…+g0zik+ui.

7. Получают прогноз ln(ei2)пр.

8.

9. Находят веса наблюдений Коррекция на гетероскедастичность - student2.ru .

10.

11. Полученные веса wiиспользуют во взвешенном методе наименьших квадратов.

Пример 6.4

Для регрессии, рассчитанной по таблице 5.1 сделать коррекцию на гетероскедастичность.

Решение

Регрессия, рассчитанная в примере 5 имеет вид:

Коррекция на гетероскедастичность - student2.ru

Модель гетероскедастична согласно тесту Бреуша-Пагана (пример 6.2).

Возможно, что модель имеют неправильную форму.

Построим модель

Коррекция на гетероскедастичность - student2.ru

и модель

Коррекция на гетероскедастичность - student2.ru .

Проверим для каждой гипотезу о гетероскедастичности тестом Бреуша-Пагана. Проделайте это самостоятельно, для нахождения логарифмов воспользуйтесь функцией: fx®Математические®LOG.

Сделаем коррекцию на гетероскедастичность, используя взвешенный метод наименьших квадратов.

Рассчитываем МНК-оценки коэффициентов регрессии, найдем остатки ei (не забудьте при нахождении регрессии поставить флажок «Остатки» в параметрах Регрессии).

Найдем квадраты остатков ei2, логарифмы квадратов остатков ln(ei2) (рис.6.10).

Коррекция на гетероскедастичность - student2.ru

Рис. 6.10. Нахождение логарифмов квадратов остатков

Построим регрессию

от логарифмов остатков, независимые переменные – значения Х1, Х2, Х3, Х4, Х5, Х6.

ln(ei2) = g0+g0zi1+g0zi2+…+g0zik+ui.

Найдем

прогноз ln(ei2)привеса наблюдений Коррекция на гетероскедастичность - student2.ru (рис. 6.11).

Коррекция на гетероскедастичность - student2.ru

Рис. 6.11. Нахождение весов wi

Рассчитанные веса wiиспользуют во взвешенном методе наименьших квадратов.

Преобразуем имеющиеся по условию данные. Поделим каждое значение таблицы на соответствующие веса, при этом по строке деление на вес не меняется, а по столбцу – меняется. Не забудьте клавишу F4 - при необходимости нажмите на нее два или три раза.

Получим преобразованные данные рис. 6.12 (обратите внимание на строку формул). Дополнительно необходимо построить столбец 1/Вес.

Коррекция на гетероскедастичность - student2.ru

Рис. 6.12. Преобразование данных

Построим регрессию без свободного члена. Для этого в окне «Константа-ноль» поставьте флажок.

Получим результаты регрессии (рис. 6.13). Это модель гомоскедастична, ее коэффициенты имеют ту же самую интерпретацию, а стандартные ошибки более точные:

Коррекция на гетероскедастичность - student2.ru

Как видно из модели значения коэффициентов поменялось незначительно, однако переменная х5 стала значимой, а х6 – поменяла знак.

Коррекция на гетероскедастичность - student2.ru

Рис. 6.13. Регрессия, построенная взвешенным МНК

На значение коэффициента детерминации при взвешенном МНК обращать внимание не следует.

Задачи для самостоятельного решения

1-10. На основании данных о приросте курса акций за 10 месяцев и изменении валютного курса (%), приведенных в таблице в зависимости от варианта:

Изменение валютного курса х Курс акций у в зависимости от варианта


и предположения, что генеральное уравнение регрессии имеет вид

у = b0+ b1х + e, требуется:

а) Найти оценку и проверить на 5% уровне значимость уравнения регрессии, то есть гипотезу Н0:b1=0;

б) Построить таблицу дисперсионного анализа для расчета F-критерия Фишера;

в) Найти коэффициент детерминации R2;

г) Найти интервальную оценку для прогноза при x=11;

д) построить прямую линейной регрессии на диаграмме рассеивания.

12. По 30 наблюдениям проведено исследование зависимости результативного признака У производительности труда от объясняющих факторов: Х1 – фондовооруженности и Х2 – объема заработной платы. Построено уравнение регрессии: у=23,55+7,14х1-0,58х2 и найдены значения Sb0=2,58, Sb1=7,85, Sb2=0,74. Можно ли утверждать на уровне значимости 0,05, что х1 и х2 оказывают влияние на У.

13. Регрессия зависимой переменной У на три независимые переменные на основе 18 наблюдений дала следующие результаты:

У = 5,3 + 58 х1 + 7,8 х2 - 7 х3
Стандартные ошибки ( ) (1,4) (1,0) (1,8)
t- значения (2,1) ( ) ( ) ( )
95% доверительные границы ( ) ( ) ( ) ( )

а) Заполните пропуски. б) Ход решения поясните.

в) Сделайте выводы о значимости коэффициентов регрессии

14. Построить регрессионную модель зависимости данных об объеме продаж У в зависимости от:

Х1 – результат теста способностей к продаже;

Х2 – возраст;

Х3 – результат теста тревожности;

Х4 – опыт работы;

Х5 – средний балл школьного аттестата.

А) Постройте уравнение регрессии для составления способности кандидата стать хорошим продавцом.

Б) Сформулируйте выводы по полученному уравнению.

В) Оцените значимость уравнения регрессии и каждого коэффициента.

Д) спрогнозируйте результат объема продаж продавца без опыта работы, возрастом 22 года, имеющего средний балл аттестата 3,5 и с результатом теста тревожности 50.

Г) определите наилучшее уравнение для прогноза.

Объем продаж в месяц, в тыс. руб) Результат теста способностей к продаже Возраст Результат теста тревожности Опыт работы Средний балл школьного аттестата
22,1 4,9 2,4
22,5 3,0 2,6
23,1 1,5 2,8
24,0 0,6 2,7
22,6 1,8 2,0
21,7 3,3 2,5
23,8 3,2 2,5
22,0 2,1 2,3
22,4 6,0 2,8
22,6 1,8 3,4
21,1 3,8 3,0
22,5 4,5 2,7
22,2 4,5 2,8
24,8 0,1 3,8
22,6 0,9 3,7
20,5 4,8 2,1
21,9 2,3 1,8
20,5 3,0 1,5
20,8 0,3 1,9
20,0 2,7 2,2
23,3 4,4 2,8
21,3 3,9 2,9
22,9 1,4 3,2
22,3 2,7 2,4
22,6 2,7 2,4
22,4 2,2 2,6
23,8 0,7 3,4
20,6 3,1 2,3
24,4 0,6 4,0
25,0 4,6 3,6

15. Постойте модель для прогноза годового объема продаж автомобилей в регионе по данным таблицы.

Регион Годовой объем продаж автомобилей, млн. долл. Количество пунктов обслуживания Количество зарегистрированных автомобилей
52,3 24,6
26,0 22,1
20,2 7,9
16,0 12,5
30,0 9,0
46,2 11,5
35,0 20,5
3,5 4,1
33,1 8,9
25,2 6,1
38,2 9,5

Сформулируйте выводы по полученной модели. Проверьте значимость модели и полученных оценок коэффициентов регрессии.

Спрогнозируйте годовой объем продаж для 12 региона с 2500 пунктами обслуживания и 20,2 млн зарегистрированных автомобилей.

16. По результатам двух предварительных экзаменов Х1 и Х2, среднего значения текущих оценок Х3 и результата окончательного экзамена У для 20 студентов, получена следующая таблица.

Х1 Х2 Х3 у
2,7
3,3
3,5
3,7
2,8
3,1
3,1
3,0
3,8
3,7
3,2
3,1
3,6
3,5
3,8
2,8
3,6
3,1
2,9
3,3

Определите:

А) уравнение регрессии для прогноза окончательного экзамена на основе оценок двух предварительных экзаменов и текущего среднего балла. Является ли регрессия значимой. Поясните ответ.

Б) спрогнозируйте результат окончательного экзамена для студента с предварительными оценками 86 и 77 и средним баллом 3,4.

В) найдите наилучшую модель методом пошаговой регрессии. Сравните полученную регрессию. На основании F-критерия обоснуйте выбор модели

17. Приведена информация о 25 уже существующих горнолыжных лагерях в шт.

Вашингтон. Анали­зировались следующие переменные.

У — стоимость одного дня пребывания в лагере;

Х1 — общая площадь лагеря в акрах;

Х2 — количество жилых помещений;

Х3 — наличие смывных туалетов;

X4 — наличие плавательного бассейна;

X5 — наличие канатных подъемников;

X6 — количество дополнительных мест развлечения.

Лагерь У Х1 Х2 Х3 X4 X5 X6
7,00
8,50
9,00
8,00
8,00
7,00
7,75
8,00
8,50
8,50
9,00
7,00
9,00
8,50
9,00
7,50
8,50 . 0
9,00
8,00
9,50
7,50
7,50
7,50 0.
9,00
7,50

Построить уравнение регрессии зависимости стоимости проведенного дня. Построить уравнение регрессии, проверить его значимость и значимость каждого коэффициента. Сделать выводы по полученным коэффициентам.

18. Построить уравнение регрессии по данным таблицы 1 приложения зависимость объема продаж от численности работников, стоимости материальных и нематериальных ресурсов, издержек на производство, оплатой труда, расходов на рекламу и исследований на разработки и рекламу. Сформулировать выводы о значимости модели и значениях коэффициентов.

19. Построить модель зависимости логарифма заработной платы от возраста, образования, профессиональных данных, общего стажа, срока пребывания в должности, рыночной стоимости фирмы, процента собственности в фирме, доходов фирмы и объемами продаж по данным таблицы 2 приложения.

20. Построить модель зависимости заработной платы, премий и других выплат от возраста, образования, профессиональных данных, общего стажа, срока пребывания в должности, рыночной стоимости фирмы, процента собственности в фирме, доходов фирмы и объемами продаж по данным таблицы 2 приложения.

21. Построить модель зависимости общих выплат от возраста, образования, профессиональных данных, общего стажа, срока пребывания в должности, рыночной стоимости фирмы, процента собственности в фирме, доходов фирмы и объемами продаж по данным табл. 2 приложения.

Приложения

Таблица 1

Наши рекомендации