Тема 5. Нелинейные модели и процедуры их спецификации методом линеаризации переменных
Практическое занятие: Построение и оценка параметров нелинейной регрессии; прогноз, его ошибки и доверительный интервал.
Задача.
По территориям Южного федерального округа РФ приводятся данные:
Территории федерального округа | Валовой региональный продукт, млрд. руб., Y | Инвестиции в основной капитал, млрд. руб., X |
1. Респ. Адыгея | 5,1 | 1,264 |
2. Респ. Дагестан | 13,0 | 3,344 |
3. Респ. Ингушетия | 2,0 | 0,930 |
4. Кабардино-Балкарская Респ. | 10,5 | 2,382 |
5. Респ. Калмыкия | 2,1 | 6,689 |
6. Карачаево-Черкесская Респ. | 4,3 | 0,610 |
7. Респ. Северная Осетия – Алания | 7,6 | 1,600 |
8. Краснодарский край1) | 109,1 | 52,773 |
9. Ставропольский край | 43,4 | 15,104 |
10. Астраханская обл. | 18,9 | 12,633 |
11. Волгоградская обл. | 50,0 | 10,936 |
12. Ростовская обл. | 69,0 | 20,014 |
Итого, S | 225,9 | 75,506 |
Средняя | 20,536 | 6,8642 |
Среднее квадратическое отклонение, s | 21,852 | 6,4427 |
Дисперсия, D | 477,50 | 41,5079 |
1) Предварительный анализ исходных данных выявил наличие одной территории (Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Значения показателей в итоговых строках приведены без учёта указанной аномальной единицы.
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции , степенной функции , равносторонней гиперболы , параболы второго порядка .
4. Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r2yx и η2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости a=0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
7. По лучшему уравнению регрессии рассчитайте теоретические значения результата ( ), по ним постройте теоретическую линию регрессии и определите среднюю ошибку аппроксимации - ε'ср., оцените её величину.
8. Рассчитайте прогнозное значение результата , если прогнозное значение фактора ( ) составит 1,062 от среднего уровня ( ).
9. Рассчитайте интегральную и предельную ошибки прогноза (для a=0,05), определите доверительный интервал прогноза ( ; ), а также диапазон верхней и нижней границ доверительного интервала ( ), оценив точность выполненного прогноза.
Тема 6. Множественные линейные регрессионные модели: построение, оценка, использование при прогнозировании
Практическое занятие: Построение, оценка и использование множественной линейной регрессии
Задача 1.
Проводится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ:
Y – Валовой региональный продукт, млрд. руб.;
X1 – Инвестиции данного года в основной капитал, млрд. руб.;
X2 – Среднегодовая стоимость основных фондов в экономике, млрд. руб.;
X3 – Кредиты, предоставленные в данном году предприятиям, организациям, банкам и физическим лицам, млрд. руб.
Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.
Предварительный анализ исходных данных по 10 территориям выявил наличие одной территории (г.Санкт-Петербург) с аномальными значениями признаков. Эта единица должна быть исключена из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанной аномальной единицы.
При обработке исходных данных получены следующие значения:
А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:
N=9.
Y | X1 | X2 | X3 | |
Y | 0,7677 | 0,8653 | 0,4237 | |
X1 | 0,7677 | 0,8897 | 0,0157 | |
X2 | 0,8653 | 0,8897 | -0,0179 | |
X3 | 0,4237 | 0,0157 | -0,0179 | |
Средняя | 31,92 | 8,87 | 121,18 | 0,5683 |
σ | 14,61 | 5,198 | 48,19 | 0,6942 |
Б) - коэффициентов частной корреляции
Y | X1 | X2 | X3 | |
Y | -0,1462 | 0,8737 | 0,8791 | |
X1 | -0,1462 | 0,5562 | 0,1612 | |
X2 | 0,8737 | 0,5562 | -0,7842 | |
X3 | 0,8791 | 0,1612 | -0,7842 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Проведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (b) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (b) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям b-коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .
4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости a=0,05).
5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 102,1 процента от их среднего уровня.
6. Основные выводы оформите аналитической запиской.
Задача 2
Приводятся значения социально-экономических показателей по территориям Центрального федерального округа РФ.
Требуется изучить влияние факторов на стоимость валового регионального продукта.
Территории | Валовой региональный продукт, млрд. руб. | Объём про-мышлен-ной продукции, млрд. руб. | Инвестиции в основной капитал, млрд. руб. | Доля занятых в экономике от численности населения, % |
А | Y | X1 | X2 | X3 |
1. Респ. Марий Эл | 6,6 | 6,8 | 1,4 | 41,4 |
2. Респ. Мордовия | 9,3 | 10,3 | 2,1 | 42,3 |
3. Чувашская респ. | 12,1 | 14,3 | 3,3 | 40,8 |
4. Кировская обл. | 16,9 | 23,0 | 3,5 | 42,9 |
5. Нижегородская обл.1) | 52,7 | 73,2 | 12,5 | 44,9 |
6. Белгородская обл. | 19,6 | 30,2 | 7,2 | 40,6 |
7. Воронежская обл. | 23,9 | 23,8 | 5,5 | 40,3 |
8. Курская обл. | 16,8 | 19,8 | 4,4 | 43,1 |
9. Липецкая обл. | 17,0 | 39,4 | 3,7 | 41,5 |
10. Тамбовская обл. | 10,5 | 9,1 | 1,9 | 37,5 |
11. Респ. Калмыкия. | 1,7 | 0,9 | 0,5 | 37,1 |
12. Респ. Татарстан1) | 67,7 | 100,5 | 19,8 | 42,2 |
13. Астраханская обл. | 10,8 | 10,6 | 5,4 | 39,2 |
14. Волгоградская обл. | 30,9 | 41,3 | 6,1 | 40,4 |
15. Пензенская обл. | 11,1 | 13,4 | 2,6 | 41,4 |
16. Самарская обл.1) | 72,7 | 108,1 | 13,4 | 43,8 |
17. Саратовская обл. | 28,7 | 30,4 | 7,3 | 43,0 |
18. Ульяновская обл. | 16,5 | 20,7 | 2,7 | 40,6 |
Итого, S1) | 232,4 | 294,0 | 57,6 | 612,1 |
Средняя1) | 15,49 | 19,6 | 3,84 | 40,81 |
Среднее квадратическое отклонение, s1) | 7,710 | 11,49 | 2,017 | 1,744 |
Дисперсия, D1) | 59,45 | 132,0 | 4,069 | 3,042 |
1) Предварительный анализ исходных данных выявил наличие 3 единиц с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения показателей в итоговой строке приведены без учёта аномальных единиц.
Задание:
1. По значениям линейных коэффициентов парной корреляции r выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности -Эyx и бета коэффициентов (b) и выявите сильно и слабо влияющие факторы.
3. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости a=0,10).
4. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 102,8 процента от их среднего уровня.
5. Основные выводы оформите аналитической запиской.