Врахування випадкового відхилення
Для одержання якісних оцінок істотну роль грає виконання певних передумов МНК для випадкових відхилень. Найбільш важливі з них вимагають, щоб відхилення uі були нормально розподіленими випадковими величинами з нульовим математичним сподіванням і сталою дисперсією s2 , а також не корелювали один з одним.
Для опису можливих проблем із випадковим відхиленням скористаємося моделлю Y = аХβ, доповнивши її випадковим фактором, який може входити у співвідношення по-різному. Розглянемо три можливих випадки: Y = аХ βеи (*) Y = аХ βu (**) Y = аХ β + u (***)
Дані моделі є нелінійними щодо параметрів (точніше, параметра β) При логарифмувавши кожне із цих співвідношень, відповідно одержимо:
1п Y = β0 + β 1пХ + u, (#)
1п Y = β0 + β 1пХ + 1п u, (# #)
1п Y = 1п (аХ β + u). (# # #) .
· Використання (#) для оцінки параметрів в (*) не викликає ускладнень, пов'язаних із випадковим відхиленням.
· Перетворення (**) до (# #) призводить до перетворення випадкових відхилень uі у 1п uі. Використання МНК в (# #) вимагає, щоб відхилення 1п uі задовольняли передумовам МНК: N(0, s2).
· Логарифмування співвідношення (***) не призводить до лінеаризації співвідношення щодо параметрів.
Лабораторна робота № 3 «Оцінювання параметрів нелінійної моделі»
Мета роботи:
1. Лінеаризація нелінійної моделі.
2. Оцінювання параметрів лінеаризованої моделі на основі МНК.
3. Вибір між лінійною та нелінійною специфікацією моделі.
Завдання:
1. Розрахувати різні види економетричних моделей між факторами Y, Х1, Х2:
· однофакторна: лінійна, поліноміальна, показникова;
· багатофакторна: лінійна, показникова.
2. Провести аналіз отриманих результатів на статистичну значущість.
3. Обрати кращу модель для прогнозування значень залежного фактора.
Y – обсяг молочної продукції (тис. т) , запропонованої на ринку,
Х1 – витрати на податки( ум. гр. од.) , Х2 – ціна за 1 л молока ( ум. гр. од.)
Y | Х1 | Х2 |
3,600 | 1,470 | 1,200 |
3,800 | 1,200 | 1,000 |
3,800 | 1,140 | 0,900 |
5,300 | 1,080 | 1,200 |
5,600 | 1,050 | 1,300 |
5,700 | 0,900 | 1,400 |
5,800 | 0,840 | 1,500 |
6,300 | 0,780 | 1,600 |
6,600 | 0,750 | 1,200 |
7,100 | 0,630 | 1,100 |
7,600 | 0,580 | 1,100 |
8,100 | 0,570 | 1,200 |
8,600 | 0,570 | 1,000 |
9,100 | 0,540 | 2,000 |
9,600 | 0,510 | 1,900 |
ЛІНIЛИ | ЛИНЕЙН | -6,172 | 11,629 |
0,620 | 0,550 | ||
0,884 | 0,676 | ||
99,144 | 13,000 | ||
45,332 | 5,944 |
1. Лінійна модель парної регресії: Ŷ = Х+ û
Лінійна модель парної регресії:
Ŷ = x + û = 11,629 – 6,117 х + û,
2. Коефіцієнт детермінаціїR2 = 0,884: на 88,4% зміна обсягу молочної продукції (тис. т) формується зміною витрат на податки, 11,6 % припадає на невраховані фактори.
3. Перевірка загальної статистичної значущості моделі за F- критерієм:
F = > Fтаб =4,67 − модель є статистично значущою.
4. Перевірка статистичної значущості оцінки параметрів ậ0 та ậ1 моделі за Т- критерієм: t ậ0 = 11,63 / 0,55 = 21,145, t ậ1 =6,172 / 0,62 = 9,95 > tтаб =2,160
− оцінки параметрів моделі ậ0 та ậ1 є статистично значущими.
2. Квадратична модель парної регресії:Ŷ = Х + Х2 + û,
Проводимо лінеаризацію моделі - вводиться заміна Х2 = Z, в результаті чого модель матиме вигляд: Ŷ = Х + Z + û, параметри якої можна розрахувати за допомогою функції «ЛІНIЙН»:
Х | Z=X^2 | Y | Yм | u = Y- Ŷ | u^2 | Y-Yс | (Y-Yс)^2 |
1,47 | 2,161 | 3,600 | 3,652 | -0,052 | 0,003 | -2,840 | 8,066 |
1,20 | 1,440 | 3,800 | 4,141 | -0,341 | 0,116 | -2,640 | 6,970 |
1,14 | 1,300 | 3,800 | 4,357 | -0,557 | 0,310 | -2,640 | 6,970 |
1,08 | 1,166 | 5,300 | 4,611 | 0,689 | 0,474 | -1,140 | 1,300 |
1,05 | 1,103 | 5,600 | 4,753 | 0,847 | 0,718 | -0,840 | 0,706 |
0,90 | 0,810 | 5,700 | 5,607 | 0,093 | 0,009 | -0,740 | 0,548 |
0,84 | 0,706 | 5,800 | 6,017 | -0,217 | 0,047 | -0,640 | 0,410 |
0,78 | 0,608 | 6,300 | 6,466 | -0,166 | 0,027 | -0,140 | 0,020 |
0,75 | 0,563 | 6,600 | 6,704 | -0,104 | 0,011 | 0,160 | 0,026 |
0,63 | 0,397 | 7,100 | 7,757 | -0,657 | 0,431 | 0,660 | 0,436 |
0,58 | 0,336 | 7,600 | 8,241 | -0,641 | 0,411 | 1,160 | 1,346 |
0,57 | 0,325 | 8,100 | 8,341 | -0,241 | 0,058 | 1,660 | 2,756 |
0,57 | 0,325 | 8,600 | 8,341 | 0,259 | 0,067 | 2,160 | 4,666 |
0,54 | 0,292 | 9,100 | 8,648 | 0,452 | 0,204 | 2,660 | 7,076 |
0,51 | 0,260 | 9,600 | 8,964 | 0,636 | 0,404 | 3,160 | 9,986 |
3,291 | 51,276 | ||||||
5,393 | -16,211 | 15,830 | ЛІНI | ||||
1,734 | 3,263 | 1,416 | |||||
0,936 | 0,524 | #Н/Д | |||||
87,488 | 12,000 | #Н/Д | Y cер | Yс =6,440 | R2 | R2=0,936 | |
47,985 | 3,291 | #Н/Д | |||||
1. Квадратична модель парної регресії: Ŷ = 15,83 -16,21∙Х + 5,393∙Х2 + û,
2. Коефіцієнт детермінаціїR2 = 0,936: на 93,6 % зміна обсягу молочної продукції (тис. т) формується зміною витрат на податки (ум.гр.од.), 6,4 % припадає на невраховані фактори. Причому значення коефіцієнта детермінації, розраховані за означенням і за допомогою функції «ЛІНIЙН», співпадають.
3. Перевірка загальної статистичної значущості моделі за F- критерієм:
F = > Fтаб = 3,89 − модель є статистично значущою.
4. Перевірка статистичної значущості оцінки параметрів ậ0 , ậ1 та ậ2 моделі за Т- критерієм: tậ0 = 15,83 / 1,416 = 11,179, tậ1 =16,211 / 3,263 = 4,97, tậ2= 5,393 /1,734 = 3,11 > tтаб =2,179 − оцінки параметрів моделі ậ0 , ậ1 та ậ2 є статистично значущими.
· Показникова модель: Ŷ =
Для дослідження моделі Ŷ = проводиться лінеаризація − логарифмування залежності: .
Для використання функції ЛIНIЙН, робиться заміна:
Z = lnŶ, = , = , = ,
отримуємо модель простої регресії Z = ,
За МНК (функцією «ЛИНЕЙН») можна визначити незміщені оцінки коефіцієнтів і .
Але коефіцієнт детермінації розраховується не для фактичних зміннихYі Х, а для їхлогарифмів. Тобто для оцінювання якості розрахованої моделі потрібно додатково розрахувати коефіцієнт детермінації:
R2 = 1- = , Dу = , = .
№ п/п | Х | Y | Y- | (Y- )2 | |||
Σ | → 0 |
При цьому функція ЛIНIЙН виводить значення змінних та і тому потрібно знайти значення та , де , а . Коефіцієнт є константою, яка характеризує сталу, тобто процентну, зміну Y для даної процентної зміни X.
X | V = ln x | Y | Z = ln Y | Y | Yм | u^ =Y-Yл | (u^)2 | Y - Yс | (Y-Yс) 2 |
1,47 | 0,385 | 3,600 | 1,281 | 3,600 | 3,536 | 0,064 | 0,004 | -2,840 | 8,066 |
1,20 | 0,182 | 3,800 | 1,335 | 3,800 | 4,249 | -0,449 | 0,202 | -2,640 | 6,970 |
1,14 | 0,131 | 3,800 | 1,335 | 3,800 | 4,451 | -0,651 | 0,424 | -2,640 | 6,970 |
1,08 | 0,077 | 5,300 | 1,668 | 5,300 | 4,675 | 0,625 | 0,391 | -1,140 | 1,300 |
1,05 | 0,049 | 5,600 | 1,723 | 5,600 | 4,796 | 0,804 | 0,647 | -0,840 | 0,706 |
0,90 | -0,105 | 5,700 | 1,740 | 5,700 | 5,514 | 0,186 | 0,035 | -0,740 | 0,548 |
0,84 | -0,174 | 5,800 | 1,758 | 5,800 | 5,870 | -0,070 | 0,005 | -0,640 | 0,410 |
0,78 | -0,248 | 6,300 | 1,841 | 6,300 | 6,277 | 0,023 | 0,001 | -0,140 | 0,020 |
0,75 | -0,288 | 6,600 | 1,887 | 6,600 | 6,505 | 0,095 | 0,009 | 0,160 | 0,026 |
0,63 | -0,462 | 7,100 | 1,960 | 7,100 | 7,617 | -0,517 | 0,268 | 0,660 | 0,436 |
0,58 | -0,545 | 7,600 | 2,028 | 7,600 | 8,210 | -0,610 | 0,372 | 1,160 | 1,346 |
0,57 | -0,562 | 8,100 | 2,092 | 8,100 | 8,340 | -0,240 | 0,058 | 1,660 | 2,756 |
0,57 | -0,562 | 8,600 | 2,152 | 8,600 | 8,340 | 0,260 | 0,067 | 2,160 | 4,666 |
0,54 | -0,616 | 9,100 | 2,208 | 9,100 | 8,759 | 0,341 | 0,116 | 2,660 | 7,076 |
0,51 | -0,673 | 9,600 | 2,262 | 9,600 | 9,225 | 0,375 | 0,141 | 3,160 | 9,986 |
Сума 2,739 | Сума 51,276 | ||||||||
ЛІНIЛИНЕЙН | |||||||||
-0,906 | 1,612 | a0ааа | а0 = 5,01 | ||||||
0,068 | 0,027 | a1 | а1= -0,91 | ||||||
0,932 | 0,085 | R2 | R2= 0,95 | ||||||
179,075 | 13,000 | ||||||||
1,307 | 0,095 |
1. Показникова модель парної регресії: Ŷ = 5,112 ∙Х -0,906 ∙ ,
2. Коефіцієнт детермінаціїR2 = 0,947: на 94,7 % зміна обсягу молочної продукції (тис. т) формується зміною витрат на податки (ум. гр. од. ), 5,3 % припадає на невраховані фактори.
3. Перевірка загальної статистичної значущості моделі за F- критерієм:
F = > Fтаб = 3,89 − модель є статистично значущою.
4. Коефіцієнт = - 0,906 є константою, яка характеризує сталу, тобто процентну зміну Y для процентної зміни фактора Х1 – витрат на податки.
4.Лінійна економетрична багатофакторна модель: Y = а0 + а1 X1 + а2X2 + u.
За МНК (функцією «ЛИНЕЙН») можна визначити незміщені оцінки коефіцієнтів цієї моделі
1,09 | -5,69 | 9,80 |
0,55 | 0,61 | 1,05 |
0,91 | 0,61 | #Н/Д |
62,53 | 12,00 | #Н/Д |
46,79 | 4,49 | #Н/Д |
1. Лінійна модель множинної регресії:
Ŷ = Х1 + Х2 + û = 9,80 – 5,69 Х1 + 1,09 Х2 + û,
2. Коефіцієнт детермінаціїR2 = 0,91: на 91% зміна обсягу молочної продукції (тис. т) формується зміною витрат на податки і ціною молока, 9 % припадає на невраховані фактори.
3. Перевірка загальної статистичної значущості моделі за F- критерієм:
F = > Fтаб =3,89 − модель є статистично значущою.
4. Перевірка статистичної значущості оцінки параметрів моделі ậ0 , ậ1 та ậ2 моделі за Т- критерієм: tậ0 = 9,80 / 1,05 = 9,33, tậ1 =5,69 / 0,61 = 9,32 7> tтаб =2,179,
tậ3 = 1,09 /0,55 = 1,98 < tтаб =2,179
− оцінки параметрів моделі ậ0 та ậ1 є статистично значущими,
оцінка параметру ậ2 є статистично незначущою.
Висновок: Результати лабораторної роботи вказують на те, що найдоцільнішою для використання є нелінійна економетрична багатофакторна модель, коефіцієнт детермінації якої є найбільшим, він дорівнює 0,957.