Лабораторная работа 2.3 Проверка значимости уравнения линейной регрессии по критерию Фишера
Цель работы. По данным табл. 2.1 оценить при уровне a = 0,05 значимость уравнения регрессии (2.6), построенного в лабораторной работе 2.1. Критерий Фишера (F-критерий). Уравнение парной регрессии значимо при уровне значимости a, если выполняется следующее неравенство:
. (2.9)
Величины Qr , Qe являются факторной и остаточной суммами квадратов соответственно:
, . (2.10)
Величина - табличное значение F-распределения с числами степеней свободы k1 = 1 и k2 = n - 2 квантиля уровня γ= 1 - а (прил. 2). Эту вероятность можно также определить с помощью функции FРАСПОБР:
= FPACПOБP(a; 1; n - 2). (2.11)
Значение F для линейной парной регрессии можно вычислить через коэффициент корреляции:
. (2.12)
Величина = R2 называется коэффициентом детерминации и характеризует долю дисперсии результативного признака y , объясняемую регрессией, в общей дисперсии результативного признака:
где (2.13)
Соответственно величина характеризует долю дисперсии y , вызванную влиянием остальных, не учтенных в модели факторов. Решение. Вычислим значения Qe , Qr = Q - Qe = - и критерий F по данным табл. 2.2. В столбце Iзначения вычисляются по формуле (2.6). Итак, получены следующие значения:
Qe = 8,39, Qr = Q - Qe =33,6 - 8,39=25,21,
По формуле (2.11) при k1 = 1, к2 =8 или по таблице (прил. 2) вычисляем квантиль F0.95; 1; 8 = 5,32. Неравенство (2.9) выполняется, т. е. 24,03 > 5,32, и поэтому уравнение регрессии (2.6) значимо.
Лабораторная работа 2.4 Вычисление коэффициентов
уравнения линейной регрессии
Цель работы. Вычисление коэффициентов уравнения линейной регрессии.
В вычислительной среде табличного процессора MS Excel эта задача решается при помощи статистических функций НАКЛОН (наклон прямой относительно оси Х, коэффициент b) и ОТРЕЗОК (отрезок, отсекаемый прямой на оси Y, коэффициент a).
Для знакомства с этими возможностями введем необходимые исходные данные (табл. 2.3). В столбцах В и С вводятся данные табл. 2.1, записи в столбце Е играют роль подсказок, столбец F заполняется по мере обработки. В ячейку F3 вводится функция НАКЛОН, в ячейку F4 - ОТРЕЗОК. Обе эти функции имеют два аргумента: диапазон ячеек со значениями Y (С3:С12) и диапазон ячеек со значениями Х (В3:В12).
Статистическая функция КВПИРСОН вычисляет значение коэффициента детерминации.
Таблица 2.3
А | в | с | D Е F | |
Линейная зависимость | Обработка | |||
№ X | Y | |||
НАКЛОН 1.0164 | ||||
ОТРЕЗОК -2.754 | ||||
КВПИРСОН 0,7502 | ||||
- - |
Функция ЛИНЕЙН (изв_знач_у; изв_знач_х; константа; стат) вычисляет коэффициенты линейной регрессии, коэффициент детерминации R2, F-статистику. В поле «изв_знач_у» вводится диапазон значений Y (С3:С12); «изв_знач_х» – диапазон значений Х (В3:В12); константа устанавливается на 0, если заранее известно, что свободный член равен 0, и на 1 в противном случае; стат устанавливается на 0, если не нужен вывод дополнительных сведений регрессионного анализа, и на 1 в противном случае.
Порядок использования функции ЛИНЕЙН:
1. Выделить область пустых ячеек 5´2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики и 1´2 для вывода только коэффициентов a, b.
2. Ввести функцию ЛИНЕЙН вручную или через Мастер функций.
3. После корректного ввода функции в левой верхней ячейке выделенной таблицы появится первый итоговый элемент таблицы. Чтобы раскрыть всю таблицу, следует сначала нажать клавишу F2, а затем одновременно нажать клавиши [Ctrl], [Shift], [Enter]. Далее появляется следующая регрессионная статистика,представленная в табл.2.4.
Таблица 2.4
Значение коэффициента b | Значение коэффициента a |
Среднеквадратическое отклонение b | Среднеквадратическое отклонение a |
Коэффициент детерминации R | Среднеквадратическое отклонение у |
F-статистика | Число степеней свободы |
Регрессионная сумма квадратов | Остаточная сумма квадратов |
Решение. В результате выполнения вышеуказанных действий получим табл. 2.5. Значения в табл. 2.5 совпадают со значениями, полученными в лабораторных работах 2.1, 2.3.
Таблица 2.5
Значение коэффициента b | 1,0164 | -2,754 | Значение коэффициента a |
Среднеквадратическое отклонение b | 0,2074 | 1,9759 | Среднеквадратическое отклонение a |
Коэффициент детерминации R | 0,7502 | 1,0243 | Среднеквадратическое отклонение у |
F-статистика | 24,025 | Число степеней свободы | |
Регрессионная сумма квадратов | 25,207 | 8,3934 | Остаточная сумма квадратов |