Тема 2. Нелинейная регрессия
1. Рассчитать параметры следующих функций:
- степенной;
- равносторонней гиперболы;
- показательной.
2. Найти показатели тесноты связи по каждой модели.
3. Оценить каждую модель через показатель детерминации, F – критерий Фишера, ошибку аппроксимации и выбрать наилучшую из них.
Регрессия в виде степенной функции имеет вид: .
Для оценки параметров модели линеаризуем модель путем логарифмирования:
.
Обозначим . Тогда получим: . Для расчетов составим таблицу 3.
Таблица 3.
Номер региона | X | Y | ХY | ||||||
1,504 | 4,231 | 6,364 | 2,262 | 17,901 | 4,228 | 68,6 | 0,04 | 0,29 | |
1,775 | 4,066 | 7,217 | 3,151 | 16,532 | 4,071 | 58,6 | 0,09 | 0,51 | |
1,740 | 4,137 | 7,198 | 3,029 | 17,115 | 4,092 | 59,9 | 7,29 | 4,31 | |
1,974 | 3,953 | 7,803 | 3,897 | 15,626 | 3,957 | 52,3 | 0,04 | 0,38 | |
1,825 | 3,948 | 7,296 | 3,329 | 15,984 | 4,042 | 56,9 | 5,76 | 4,40 | |
1,792 | 4,045 | 7,249 | 3,211 | 16,362 | 4,062 | 58,1 | 1,00 | 1,75 | |
2,054 | 3,932 | 8,076 | 4,219 | 15,461 | 3,910 | 49,9 | 1,21 | 2,16 | |
Сумма | 12,664 | 28,362 | 51,203 | 23,098 | 114,98 | 28,362 | 404,3 | 15,43 | 13,80 |
Среднее значение | 1,809 | 4,052 | 7,315 | 3,300 | 16,426 | - | - | - | - |
Запишем систему нормальных уравнений:
.
Отсюда , ; ,
Получаем уравнение регрессии: .
Выполнив потенцирование, получим:
.
Параметр означает коэффициент эластичности, который показывает, что с ростом зарплаты на 1 % доля расходов на продовольствие снижается на 0,58 %.
Теоретические значения зависимой переменной получим, подставив в уравнение значения х и потенцируя значения . В таблице 3. представлены и .
Показателем тесноты связи выступает индекс корреляции:
.
Величина представлена в таблице 3: .
.
В результате имеем:
.
Коэффициент детерминации равен: , т.е. 93,93 % вариации у объясняется вариацией х, на долю прочих факторов приходится 6,07 %.
F – критерий Фишера составит:
.
Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии статистически значимо.
Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 3.
т.е. среднее отклонение фактических и расчетных значений у составляет 2 %, что свидетельствует о хорошем качестве модели.
Регрессия в виде показательной функции имеет вид: .
Для оценки параметров модели линеаризуем модель путем логарифмирования:
.
Обозначим . Тогда получим: . Для расчетов составим таблицу 4.
Таблица 4.
Номер региона | х | Y | xY | y- | (y- )2 | (y- )2 | ||||
4,5 | 4,23 | 19,04 | 20,25 | 4,21 | 67,35 | 1,45 | 2,11 | 121,63 | 2,111464 | |
5,9 | 4,07 | 23,99 | 34,81 | 4,08 | 59,06 | -0,76 | 0,57 | 0,28 | 1,296827 | |
5,7 | 4,14 | 23,58 | 32,49 | 4,10 | 60,17 | 2,43 | 5,88 | 23,32 | 3,873993 | |
7,2 | 3,95 | 28,46 | 51,84 | 3,96 | 52,27 | -0,17 | 0,03 | 32,17 | 0,33356 | |
6,2 | 4,00 | 24,79 | 38,44 | 4,05 | 57,42 | -2,92 | 8,51 | 10,70 | 5,351722 | |
4,04 | 24,27 | 4,07 | 58,50 | -1,40 | 1,97 | 0,45 | 2,459651 | |||
7,8 | 3,93 | 30,67 | 60,84 | 3,90 | 49,41 | 1,59 | 2,52 | 45,85 | 3,113949 | |
Сумма | 43,3 | 28,36 | 174,80 | 274,67 | 28,36 | 404,19 | 21,60 | 234,39 | 18,54 | |
Средняя | 6,19 | 4,05 | 24,97 | 39,24 |
Запишем систему нормальных уравнений:
.
В результате:
Получаем уравнение регрессии: . Теперь потенцируем оба параметра, чтобы получить уравнение регрессии в форме показательной кривой:
.
Теоретические значения зависимой переменной получим, подставив в уравнение значения х и потенцируя значения . В таблице 4. представлены и .
Показателем тесноты связи выступает индекс корреляции:
.
Величина представлена в таблице 4: .
.
В результате имеем:
.
Коэффициент детерминации равен: , т.е. 90,24 % вариации у объясняется вариацией х, на долю прочих факторов приходится 9,76 %.
F – критерий Фишера составит:
.
Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии статистически значимо.
Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 4.
т.е. соответствие фактических и расчетных значений зависимой переменной хорошее и соответственно хорошее качество модели.
Регрессия в виде равносторонней гиперболы имеет вид: .
Чтобы оценить параметры уравнения приведем модель к линейному виду, заменив . Тогда . Применяя МНК, получаем систему нормальных уравнений:
Для расчета параметров составим таблицу 5.
Таблица 5.
Номер региона | у | yz | ||||||
68,8 | 0,222 | 15,289 | 0,049 | 69,9 | -1,1 | 1,21 | 1,60 | |
58,3 | 0,170 | 9,881 | 0,029 | 58,5 | -0,2 | 0,04 | 0,34 | |
62,6 | 0,175 | 10,983 | 0,031 | 59,8 | 2,8 | 7,84 | 4,47 | |
52,1 | 0,139 | 7,236 | 0,019 | 51,9 | 0,1 | 0,01 | 0,19 | |
54,5 | 0,161 | 8,790 | 0,026 | 56,7 | -2,2 | 4,84 | 4,04 | |
57,1 | 0,167 | 9,517 | 0,028 | 57,9 | -0,8 | 0,64 | 1,40 | |
51,0 | 0,128 | 6,538 | 0,016 | 49,6 | 1,4 | 1,96 | 2,75 | |
Сумма | 404,4 | 1,162 | 68,234 | 0,198 | 404,4 | 16,54 | 14,79 |
Запишем систему нормальных уравнений:
.
Отсюда , ; ,
Получаем уравнение регрессии: .
Показателем тесноты связи выступает индекс корреляции:
.
Величина представлена в таблице 5: .
.
В результате имеем:
.
Коэффициент детерминации равен: , т.е. 92,94 % вариации у объясняется вариацией х, на долю прочих факторов приходится 7,06 %.
F – критерий Фишера составит:
.
Эта величина превышает табличное значение на 5 %-м уровне значимости (Fтабл=6,61). Следовательно, найденное уравнение регрессии статистически значимо.
Для расчета средней ошибки аппроксимации воспользуемся последней графой таблицы 5.
т.е. среднее отклонение фактических и расчетных значений у составляет 2 %, что свидетельствует о хорошем качестве модели.
Выберем наилучшую модель, для чего объединим результаты построения парных регрессий в одну таблицу.
Таблица 6. - Сводная таблица построенных уравнений
Уравнение регрессии | Коэффициент детерминации | F – критерий Фишера | Средняя ошибка аппроксимации, % |
0,9393 | 77,4 | 1,97 | |
0,9024 | 46,24 | 2,65 | |
0,9294 | 65,8 | 2,11 |
Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать степенной функции, для которой значение коэффициента детерминации наибольшее, а ошибка аппроксимации – наименьшая.