Требования к исходной информации
Анализ временных рядов, отражающих развитие экономических процессов, начинается с оценки данных. Уровни исследуемого показателя обязательно должны быть сопоставимыми, однородными и устойчивыми, а их число должно быть достаточно велико.
Сопоставимость достигается в результате одинакового подхода к наблюдениям на разных этапах формирования динамического ряда.
Однородность данных означает отсутствие сильных изломов тенденций, а также аномальных (т.е. резко выделяющихся, нетипичных для данного ряда) наблюдений. Аномальные наблюдения проявляются в виде сильного изменения уровня – скачка или спада – с последующим приблизительным восстановлением предыдущего уровня. Наличие аномалии резко искажает результаты моделирования. Поэтому аномальные наблюдения необходимо исключить из временного ряда, заменив их расчетными значениями.
Устойчивость характеризуется преобладанием закономерности над случайностью в изменении уровней ряда. На графиках устойчивых временных рядов закономерность прослеживается визуально, на графиках неустойчивых рядов изменения последовательных уровней представляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.
Требование полноты данных обусловливается тем, что закономерность может обнаружиться лишь при наличии минимально допустимого объема наблюдений.
Этапы построения прогноза по временным рядам
Экстраполяционное прогнозирование экономических процессов, представленных одномерными временными рядами, сводится к выполнению следующих основных этапов:
1) предварительный анализ данных;
2) построение моделей: формирование набора аппроксимирующих функций (кривых роста) и численное оценивание параметров моделей;
3) проверка адекватности моделей и оценка их точности;
4) выбор лучшей модели;
5) расчет точечного и интервального прогнозов.
На первомэтапе производится:
· выявление аномальных наблюдений;
· проверка наличия тренда;
· сглаживание временных рядов;
· расчет показателей развития динамики экономических процессов.
Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномалий данных. В качестве примера аномалии может служить скачок курса доллара, зафиксированный в «черный вторник».
Следующая процедура этапа предварительного анализа данных – выявление наличия тенденций в развитии исследуемого показателя. Отметим, что тенденция прослеживается не только в увеличении или уменьшении среднего текущего значения временного ряда, но она присуща и другим его характеристикам: дисперсии, автокорреляции, корреляции с другими показателями и т.д. Тенденцию среднего визуально можно определить из графика исходных данных, а более точно – с помощью метода Фостера–Стьюарта, метода проверки существенности разности средних, подробное описание которых дано в работе.
Наличие тенденции среднего уровня на графике становится более заметным, когда на нем отражены сглаженные значения исходных данных.
Процедура сглаживания необходима при построении некоторых математических моделей и для устранения аномальных наблюдений. Чаще всего для сглаживания применяются методы простой скользящей средней, взвешенной скользящей средней и экспоненциального сглаживания.
Традиционными показателями, характеризующими развитие экономических процессов, были и остаются показатели роста и прироста. Для характеристики динамики изменения экономических показателей все чаще используется понятие автокорреляции, которая характеризует не только взаимозависимость уровней одного и того же ряда, относящихся к разным моментам наблюдений, но и степень устойчивости развития процесса во времени, величину оптимального периода прогнозирования и т.п.
Второй, третий, четвертый и пятый этапы построения модели и прогноза по временным рядам рассмотрим на примере (задача 8).
Типичные примеры анализа моделей
Задача 1
Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена следующими данным[1] (табл. 3).
Таблица 3
№ мага-зина | Среднее число посетителей в день, тыс. чел, х | Годовой товарооборот, млн руб., у | № мага-зина | Среднее число посетителей в день, тыс. чел, х | Годовой товарооборот, млн руб., у |
8,25 | 19,76 | 12,36 | 75,01 | ||
10,24 | 38,09 | 10,81 | 89,05 | ||
9,31 | 40,95 | 9,89 | 91,13 | ||
11,01 | 41,08 | 13,72 | 91,26 | ||
8,54 | 56,29 | 12,27 | 99,84 | ||
7,51 | 68,51 | 13,92 | 108,55 |
Задания:
1. Построить линейную модель y = b0 + b1x, параметры которой оценить методом наименьших квадратов.
2. Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, найти коэффициент детерминации и пояснить его смысл.
3. Проверить значимость уравнения регрессии на 5%-м уровне по
F-критерию, проверить значимость коэффициента регрессии по
t-статистике.
Решение:
При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы – Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.
Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:
1) щелкнуть правой кнопкой мыши по ряду данных;
2) в динамическом меню выбрать команду Добавить линию тренда. На экране появится окно Линия тренда (рис. 2);
3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;
4) перейти на вкладку Параметры. В поле Показать уравнение на диаграмме установить подтверждение;
5) в случае необходимости можно задать остальные параметры.
Изобразим полученную зависимость графически точками координатной плоскости (рис. 2). Такое изображение статистической зависимости называется полем корреляции.
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными х и у.
По данным табл. 2 найдем уравнение регрессии у по х. Расчеты произведем в Excel по формулам (4) – (10), промежуточные вычисления представим в табл. 4.
Рис. 3. Поле корреляции
Таблица 4
N | X | Y | X*Y | X*X | Y*Y |
8,25 | 19,76 | 163,02 | 68,0625 | 390,4576 | |
10,24 | 38,09 | 390,0416 | 104,8576 | 1450,848 | |
9,31 | 40,95 | 381,2445 | 86,6761 | 1676,903 | |
10,01 | 41,08 | 411,2108 | 100,2001 | 1687,566 | |
8,54 | 56,29 | 480,7166 | 72,9316 | 3168,564 | |
7,51 | 68,51 | 514,5101 | 56,4001 | 4693,62 | |
12,36 | 75,01 | 927,1236 | 152,7696 | 5626,5 | |
10,81 | 89,05 | 962,6305 | 116,8561 | 7929,903 | |
11,89 | 91,13 | 1083,536 | 141,3721 | 8304,677 | |
13,72 | 91,26 | 1252,087 | 188,2384 | 8328,388 | |
12,27 | 99,84 | 1225,037 | 150,5529 | 9968,026 | |
13,92 | 108,55 | 1511,016 | 193,7664 | 11783,1 | |
Сумма | 128,83 | 819,52 | 9302,173 | 1432,684 | 65008,55 |
Среднее | 10,73583333 | 68,2933 | 775,1811 | 119,3903 | 5417,38 |
Дисперсия | 4,132174306 | 753,4001222 | b1 | 10,163 | |
Cov(x,y) | 41,99527222 | b0 | -40,8149 |
Итак, уравнение регрессии у по х:
= -40,81 + 10,16x.
Из полученного уравнения регрессии следует, что при увеличении среднего числа посетителей на 1 тыс. чел. годовой товарооборот увеличивается в среднем на 10,16 млн руб.
По исходным данным вычислим коэффициент корреляции.
Расчеты произведем в Excel, промежуточные вычисления см. табл. 4 и формулы (11), (12).
= 0,753,
т.е. связь между переменными достаточно тесная.
Оценим на уровне значимости a = 0,05 значимость уравнения регрессии у по х.
1-й способ. Используя данные табл. 5 вычислим необходимые суммы по формулам табл. 1:
= 9040,801 (см. столбец 6);
QR = = 5121,574 (см. столбец 7);
Qe = Q - QR = 9040,801 – 5121,574 = 3919,228
По формуле (19)
F = = 13,07.
По статистическим таблицам F-распределения F0,05;1;10 = 4,96. Так как
F > F0,05;1;26, то уравнение регрессии значимо.
Таблица 5
N | X | Y | Yрег | Yi-Yрег | (Yi-Yср)^2 | (Yрег-Yср)^2 | (Xi-Xcp)^2 |
8,25 | 19,76 | 43,03 | -23,2698 | 2355,484 | 638,2452 | 6,179367 | |
10,24 | 38,09 | 63,254 | -25,1642 | 912,2413 | 25,39306 | 0,245851 | |
9,31 | 40,95 | 53,802 | -12,8526 | 747,6579 | 209,9815 | 2,033001 | |
10,01 | 41,08 | 60,916 | -19,8367 | 740,5655 | 54,41484 | 0,526834 | |
8,54 | 56,29 | 45,977 | 10,3129 | 144,08 | 498,0148 | 4,821684 | |
7,51 | 68,51 | 35,509 | 33,0008 | 0,046944 | 1074,799 | 10,406 | |
12,36 | 75,01 | 84,799 | -9,7897 | 45,11361 | 272,4612 | 2,637917 | |
10,81 | 89,05 | 69,047 | 20,0029 | 430,8392 | 0,568147 | 0,005501 | |
11,89 | 91,13 | 80,023 | 11,1069 | 521,5133 | 137,588 | 1,332101 | |
13,72 | 91,26 | 98,621 | -7,3614 | 527,4678 | 919,7921 | 8,905251 | |
12,27 | 99,84 | 83,886 | 15,9549 | 995,1922 | 243,102 | 2,353667 | |
13,92 | 108,55 | 100,654 | 7,8960 | 1620,599 | 1047,213 | 10,13892 | |
Сумма | 128,83 | 819,52 | 0,00 | 9040,801 | 5121,574 | 49,58609 | |
Среднее | 10,736 | 68,293 | |||||
b1 | 10,163 | ||||||
b0 | -40,8149 |
2-й способ. Учитывая, что b1 = 10,163, = 49,586
(табл. 4), = =391,92 (табл. 1), по формуле (20)
t = = 3,61.
По таблице t-распределения t0,95;10 = 2,23. Так как t > t0,95;26, то коэффициент регрессии b1, а значит, и уравнение парной линейной регрессии значимо.
Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR = 5121,574, Q = 9040,801. По формуле (22) = 0,5665 (или R2 = r2 = 0,7532 = 0,95665). Это означает, что изменения зависимой переменной у – годовой товарооборот – на 56,7% объясняется вариацией объясняющей переменной х – численностью покупателей.
Задача 2.
При изучении зависимости потребления материалов у от объема производства продукции х по 20 наблюдениям были получены следующие варианты уравнения регрессии:
1. у = 3 + 2х + е.
(6,48)
2. lnу = 2,5 + 0,2lnx + e, r2 = 0,68.
(6,19)
3. у = 1,1 + 0,8lnх + е, r2 = 0,69.
(6,2)
4. у = 3 + 1,5х + 0,1х2 + е, r2 = 0,701.
(3,0) (2,65)
В скобках указаны фактические значения t-критерия.
Задания:
1. Определите коэффициент детерминации для 1-го уравнения.
2. Запишите функцию, характеризующую зависимость у от х во 2-м уравнении.
3. Определите коэффициенты эластичности для каждого из уравнений для х0 = 2,5 тыс. шт.
Решение:
1. Чтобы определить коэффициент детерминации воспользуемся формулой (21).
Для уравнения парной линейной регрессии коэффициент детерминации r2 = 0,70.
2. Уравнение 2 – это степенная функция, к которой применили преобразование. В качестве преобразования выполнили логарифмирование. Чтобы записать функцию проведем обратные преобразования.
lnу = 2,5 + 0,2lnx + e Þ у = е2,5 ∙ х0,2 Þ у = 1,28х0,2.
3. Чтобы рассчитать коэффициенты эластичности воспользуемся данными табл. 2. Результаты расчетов объединим в табл. 6.
Таблица 6
Вид функции | Коэффициент эластичности |
Линейная у = 3 + 2х + е | |
Парабола у = 3 + 1,5х + 0,1х2 + е | |
Степенная у = 1,28х0,2 | Э = 1,28 |
Полулогарифмическая у = 1,1 + 0,8lnx |
Рассчитаем точечный коэффициент эластичности для значения
х0 = 2,5.
1. Для линейной модели у = 3 + 2х + е.
= 0,625.
2. Для параболы у = 3 + 1,5х + 0,1х2 + е.
= 0,678.
3. Для степенной функции у = 1,28х0,2.
Э = 1,28.
4. Для полулогарифмической функции у = 1,1 + 0,8lnx.
= 0,436.
Задача 3
По совокупности 30 предприятий торговли изучается линейная зависимость между ценой товара А (тыс. руб.) х и прибылью торгового предприятия (млн ру6.) у.
При оценке регрессионной модели были получены следующие промежуточные результаты:
= 39000,
= 120000.
Задания:
1. Поясните, какой показатель корреляции можно определить по вышеприведенным данным:
2. Постройте таблицу дисперсионного анализа для расчета значения
F-критерия Фишера.
3. Сравните фактическое значение F-критерия с табличным. Сделайте выводы.
Решение:
1. Оценим исходные данные задачи. Величина называется остаточная сумма квадратов (Qe), а - полная сумма квадратов (Q). Исходя из условия задачи, можно рассчитать коэффициент детерминации по формуле (22), а затем индекс корреляции. Тогда,
= 0,675.
R = = 0,822
2. Для дисперсионного анализа воспользуемся табл. 1 и формулами (17), (18). Результаты расчетов приведем в табл. 7.
Таблица 7
Компоненты дисперсии | Сумма квадратов | Число степеней свободы | Дисперсия на одну степень свободы | Fфакт |
Объясненная | QR = 81000 | m – 1 = 1 | 58,15 | |
Остаточная | Qe = 39000 | n – m = 28 | 1392,86 | - |
Общая | Q = 120000 | n – 1 = 29 | - | - |
3. По статистическим таблица представленным в приложении 1 найдем F0,05;1;28 = 4,20. Так как наблюдаемое значение статистики Фишера Fфакт больше табличного (Fфакт > F0,05;1;28), то полученная модель является адекватной.
Задача 4
По 28 предприятиям концерна изучается зависимость дневной выработки (ед.) у от уровня механизации труда (%) х по следующим данным (табл. 8).
Таблица 8
i | x | y | i | x | y | i | x | y |
Задания:
1. Проверьте гипотезу об отсутствии гетероскедастичности в линейной регрессии с помощью теста ранговой корреляции Спирмэна при вероятности 0,95.
2. С помощью теста Гольдфельда-Квандта исследуйте гетероскедастичность остатков.
Решение:
Тест ранговой корреляции Спирмэна
Проранжируем значения хi и абсолютные величины остатков в порядке возрастания, расчеты занесем в табл. 9.
Найдем коэффициент ранговой корреляции Спирмэна:
= 0,108.
Таблица 9
N | X | Ei | Расчет ранговой корреляции | |||
Ранг Х | Ранг |Ei| | d | d^2 | |||
13,27 | -27 | |||||
7,61 | -24 | |||||
-5,71 | -20 | |||||
-5,67 | -18 | |||||
-1,15 | -1 | |||||
-2,15 | -3 | |||||
-0,63 | ||||||
-2,11 | ||||||
2,15 | -1 | |||||
0,41 | ||||||
0,67 | ||||||
-2,03 | ||||||
-2,77 | ||||||
-2,51 | ||||||
-3,25 | -2 | |||||
-2,99 | ||||||
-4,47 | -2 | |||||
-5,43 | -2 | |||||
-2,91 | ||||||
-3,13 | ||||||
-3,87 | ||||||
2,17 | ||||||
-0,31 | ||||||
-1,01 | ||||||
5,77 | ||||||
5,55 | ||||||
6,07 | ||||||
8,11 | ||||||
Сумма | 0,00 |
Найдем t-критерий для ранговой корреляции:
= 0,556.
Сравним полученное значение tr с табличным значением
t0,95; 26 = 2,06. Так как tr < t0,95; 26, то на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.
Тест Голфреда-Квандта
Упорядочим п наблюдений по мере возрастания переменной х. Исключим из рассмотрения С = 6 центральных наблюдений (условие
(п - С)/2 = (28 – 6)/2 = 11 > р = 1 выполняется). Разделим совокупность из (п - С) = (28 – 6) = 22 наблюдений на две группы (соответственно с малыми и большими значениями фактора х по 11 наблюдений) и определим по каждой из групп уравнения регрессии. Для первой группы оно составит = -3,70 + 0,39x. Для второй группы: = 1,16 + 53,11x. Определим остаточные суммы квадратов для первой (S1) и второй (S2) групп. Промежуточные расчеты занесем в табл. 10.
Таблица 10
N | X | Y | Yрег = -3,70 + 0,39Х | e=Y-Yрег | e^2 |
2,15 | 2,85 | 8,1225 | |||
5,66 | 0,34 | 0,1156 | |||
12,68 | -6,68 | 44,6224 | |||
14,24 | -5,24 | 27,4576 | |||
15,02 | -0,02 | 0,0004 | |||
15,02 | -1,02 | 1,0404 | |||
15,8 | 1,2 | 1,44 | |||
16,58 | 0,42 | 0,1764 | |||
16,97 | 5,03 | 25,3009 | |||
17,36 | 3,64 | 13,2496 | |||
S1 | 121,5258 | ||||
N | X | Y | Yрег = -53,11 + 1,16Х | e=Y-Yрег | e^2 |
23,45 | 1,55 | 2,4025 | |||
28,09 | -1,09 | 1,1881 | |||
30,41 | 0,59 | 0,3481 | |||
33,89 | -0,89 | 0,7921 | |||
35,05 | -2,05 | 4,2025 | |||
39,69 | 2,31 | 5,3361 | |||
42,01 | -1,01 | 1,0201 | |||
47,81 | -3,81 | 14,5161 | |||
51,29 | 1,71 | 2,9241 | |||
54,77 | 0,23 | 0,0529 | |||
57,09 | -0,09 | 0,0081 | |||
61,73 | 0,27 | 0,0729 | |||
S2 | 32,8636 |
Найдем отношение R = S1/S2, где S1 > S2.
= 3,69.
Сравним эту величину с табличным значением F-критерия с числом степеней свободы 8 для каждой остаточной суммы квадратов
F0,05;8;8 = 3,44. Так как R > F0,05;8,8, делаем вывод о наличие гетероскедастичности остатков.
Задача 5
Имеются данные среднегодовой стоимости основных фондов,
(млн руб.) х1, среднегодовой стоимости оборотных средств (млн руб.) х2 и величины валового дохода за год (млн руб.) у по 25 предприятиям, которые представлены в табл. 11.
Таблица 11
i | у | х1 | х2 |
Окончание табл. 11
i | у | х1 | х2 |
Задания:
1. Построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров.
2. Рассчитать частные коэффициенты эластичности, а также стандартизированные коэффициенты регрессии; сделать вывод о силе связи результата и фактора.
3. Рассчитать парные, частные коэффициенты корреляции, а также множественный коэффициент корреляции; сделать выводы.
4. Проверить значимость уравнения регрессии на 5%-м уровне по
F-критерию, проверить значимость коэффициентов регрессии по
t-статистике.
Решение:
1. По данным табл. 11 найдем уравнение регрессии у по х1, х2. Расчеты произведем в Excel по формуле (32), промежуточные вычисления представим в табл. 12.
Система уравнений для расчета коэффициентов регрессии примет вид:
Таблица 12
i | х1 | х2 | у | yх1 | yх2 | х1^2 | х2^2 | x1x2 | у^2 |
Сумма |
Решив систему уравнений методом Гаусса, получили следующие значения коэффициентов регрессии b0 = -34,121; b1 = 0,788; b2 = 1,008.
Уравнение множественной линейной регрессии примет вид:
у = -34,121 + 0,788х1 + 1,008х2.
Коэффициент регрессии b1 показывает, что при увеличении на
1 млн руб. среднегодовой стоимости основных фондов (х1) валовой доход (у) в среднем увеличится на 0,788 млн руб. при постоянном значении среднегодовой стоимости оборотных средств (х2). Если же увеличится среднегодовая стоимость оборотных средств (х2) на 1 млн руб., а стоимость основных фондов (х1) в среднем не изменится, то валовой доход (у) увеличится в среднем на 1,008 млн руб.
2. Рассчитаем коэффициенты и Ej для рассматриваемого примера по формуле (33).
Предварительно найдем значения среднеквадратичного отклонения для переменных задачи, используя данные табл. 12.
= 35,702;
= 23,624;
= 55,160.
Тогда,
= 0,510 = 0,432.
= 0,659 = 0,667
С увеличением среднегодовой стоимости основных фондов на 1 % от среднего уровня годовой валовой доход возрастет на 65,9% от своего среднего уровня при фиксированном значении среднегодовой стоимости оборотных средств. С увеличением стоимости оборотных средств на 1 % от среднего уровня годовой валовой доход возрастет на 66,7% от своего среднего уровня при фиксированном значении стоимости основных фондов. Сила влияния стоимости оборотных средств (х2) на доход несколько больше, чем сила влияния стоимости основных фондов (х1).
3. Определим парные коэффициенты корреляции, используя формулу (12) и данные табл. 12.
= 0,602;
= 0,540;
= 0,214.
Парный коэффициент между доходом (у) и стоимостью основных средств (х1) равен 0,602. Парный коэффициент между доходом (у) и стоимостью оборотных средств (х2) равен 0,540. Связь между переменными довольно тесная.
Рассчитаем частные коэффициенты корреляции:
= 0,591;
= 0,527.
При сравнении коэффициентов парной и частной корреляции приходим к выводу, что из-за слабой зависимости между факторами
(rx1x2 = 0,214 – отсутствие мультиколлинеарности) коэффициенты парной и частной корреляции отличаются незначительно.
Рассчитаем коэффициент множественной корреляции по формуле
Коэффициент множественной корреляции больше значений парных коэффициентов корреляции. Совокупность факторов оказывает большее совместное влияние на результативный признак.
Для линейных моделей коэффициент множественной детерминации равен квадрату коэффициента множественной корреляции, тогда
R2 = 0,7352 = 0,54.
4. Для оценки адекватность уравнения регрессии воспользуемся критерием Фишера. Для расчета Fнабл воспользуемся формулой
= 12,92.
По таблицам F-критерия прил. 1 F0,05;2;22 = 3,44. Так как F > F0,05;2;17, то уравнение регрессии значимо.
Чтобы оценить значимость параметров регрессии b1 и b2 необходимо найти значения t-статистики. Используя предыдущие расчеты, найдем частные F-критерии Фишера.
= 12,394;
= 8,881.
Для линейных моделей частный F-критерий Фишера связан с t-критерием Стьюдента следующим соотношением:
.
Выполнив расчеты, получим
= 3,521;
= 2,980.
По таблицам t-распределения прил. 1 t0,95;22 = 2,07. Тогда,
t1 = 3,521 > t0,95;47 = 2,07 – параметр b1 адекватен;
t2 = 2,980 > t0,95;47 = 2,07 – параметр b2 адекватен.
Задача 6
Имеются следующие результаты регрессионного анализа зависимости объема выпуска продукции (млн руб.) у от численности занятых на предприятии (чел.) х1 и среднегодовой стоимости основных фондов (млн руб.) х2 по 20 предприятиям отрасли:
Коэффициент детерминации | 0,81 |
Множественный коэффициент корреляции | ??? |
Уравнение регрессии | ln y = ??? + 0,48 lnx1 + 0,62 lnx2 |
Стандартные ошибки параметров | 2 0,06 ??? |
t-критерий для параметров | 1,5 ??? 5 |
Задания:
1. Напишите уравнение регрессии, характеризующее зависимость у от х1 и х2.
2. Восстановите пропущенные характеристики.
3. Оцените адекватность полученной модели.
Решение:
1. Для данного уравнения примели преобразование, которое приводит модель нелинейную относительно оцениваемых параметров , к линейной модели: .
Чтобы написать уравнение регрессии сначала восстановим значение параметра а. Воспользуемся формулой (20), в которой отношение - обозначим через стандартную ошибку параметра. Тогда
. (39)
Значение параметра а = b0 будет равно
а = b0 = t ∙ Sbj = 2 ∙ 1,5 = 3.
Уравнение будет записано в виде: ln y = 3 + 0,48 lnx1 + 0,62 lnx2.
Проведем обратные преобразования и получим уравнение: .
2. Чтобы восстановить пропущенные значение стандартной ошибки коэффициента регрессии и t-критерия также воспользуемся
формулой (38).
;
.
Так как коэффициент детерминации R2 в линейных моделях равен квадрату множественного коэффициента корреляции R, то .
Запишем исходные данные с восстановленными характеристиками:
Коэффициент детерминации | 0,81 |
Множественный коэффициент корреляции | 0,9 |
Уравнение регрессии | |
Стандартные ошибки параметров | 2 0,06 0,124 |
t-критерий для параметров | 1,5 8 5 |
3. Для оценки адекватность параметров регрессии воспользуемся значениями tнабл. По таблицам t-распределения прил. 1 t0,95;17 = 2,11. Тогда, t1 = 8 > t0,95;17 = 2,11 – параметр b1 адекватен; t2 = 5 > t0,95;17 = 2,11 – параметр b2 адекватен.
Для оценки адекватность уравнения регрессии воспользуемся критерием Фишера. Для расчета Fнабл воспользуемся формулой
= 16,22.
По таблицам F-критерия прил. 1 F0,05;2;17 = 3,59. Так как F > F0,05;2;17, то уравнение регрессии значимо.
Задача 7