Проверка статистической значимости оценок
Лабораторная работа №4
Модель парной линейной регрессии
Пример построения модели зависимости себестоимости книги от ее тиража
Тираж (x) (тыс. экз.) | |||||
Себестоимость (y) (у.е.) |
Данные о себестоимости (y) в у.е. экземпляра книги в зависимости от тиража (х) представлены в таблице. Предполагается линейная модель зависимости . Требуется провести регрессионный анализ зависимости y от x.
Задание
- Найти точечные оценки b0, b1 и параметров уравнения регрессии .
- Проверить статистическую значимость коэффициентов на уровне α = 0,05.
- Найти 95% интервальные оценки , и условного математического ожидания в точке x0 = 3, а также интервальную оценку для значения y в точке x0 = 6.
Результаты оформить в виде таблицы
Порядок выполнения
Ввод исходных данных
Заполните таблицу данных согласно рис. 1.
Рис. 1. Таблица исходных данных
Построение диаграммы
Установите курсор в ячейку A1 и нажмите кнопку Мастера диаграмм. Или выполните команду Диаграмма из меню Вставка. Выберите тип диаграммы Точечная и нажмите кнопку Готово. Щелкните правой кнопкой мыши на любой из точек данных на диаграмме и выберите команду Добавить линию тренда из контекстного меню. Готовая диаграмма будет иметь вид как на рис. 2.
Рис. 2. Диаграмма рассеяния исходных данных
Диаграмма рассеяния позволяет визуально оценить наличие и вид функциональной зависимости между переменными. В данном примере визуальная оценка дает линейную зависимость. Диаграмма рассеяния не дает возможности провести более детальный анализ.
Вычисление оценок
Дополнительные характеристики линейной модели можно получить с помощью функции ЛИНЕЙН(). Выделите область 5×2 (D1:E5) и вызовите Мастер функций из меню Вставка. Воспользуйтесь поиском или найдите в категории статистических функций название ЛИНЕЙН и нажмите ОК. Заполните аргументы функции как показано на рис. 3. и нажмите CTRL + SHIFT + ENTER.
Рис. 3. Аргументы функции ЛИНЕЙН
Функция ЛИНЕЙН возвращает не одно число, а сразу массив чисел, поэтому требуется специальное сочетание клавиш при вставке этой функции. Результат вычислений дополнительной регрессионной статистики представлен в таблице 1.
Таблица 1. Регрессионная статистика
-0,7 | 6,5 |
0,1 | 0,331662 |
0,942308 | 0,316228 |
4,9 | 0,3 |
Перечень значений в ячейках, которые выдает функция, представлен в следующей таблице 2.
Таблица 2. Схема регрессионной статистики функции ЛИНЕЙН()
b1 оценка коэффициента b1 | b0 оценка коэффициента b0 |
стандартная ошибка b1 | стандартная ошибка b0 |
R2 коэффициент детерминации | стандартная ошибка регрессии |
F-статистика | df количество степеней свободы |
вариация, обусловленная регрессором | вариация, обусловленная случайной компонентой |
Проверка статистической значимости оценок
Полученные оценки позволяют провести более детальное исследование, например, проверить статистическую значимость полученных эмпирических коэффициентов регрессии. Для этого рассчитаем t-отношения по формуле . Согласно теории, в случае выполнения равенства bi = 0, t-отношение подчиняется распределению Стьюдента с тремя степенями свободы. Проверить справедливость данного утверждения можно с помощью функции СТЬЮДРАСП. Результаты расчетов представлены на рис. 4.
Рис. 4. Расчет статистической значимости коэффициентов регрессии
Из таблицы видно, что наблюдаемое значение t1 является неправдоподобным. Произошло событие, вероятность которого оценивается как 0.005986. Это очень редкое событие, которое не может произойти в одном единственном эксперименте. Следовательно, нам нужно отвергнуть предположение о подчиненности t-отношения распределению Стьюдента, а это влечет за собой отрицание факта равенства нулю коэффициента b1. Таким образом, статистическая значимость коэффициента b1 доказана. Аналогично доказывается статистическая значимость коэффициента b0.
Есть альтернативный способ проверки значимости построенной модели. Используется F-критерий Фишера для отношения вариаций (значение в ячейке D4). Порядок вычислений см. рис. 5.
Рис. 5. Расчет статистической значимости по F-критерию
Полученный результат полностью идентичен предыдущему.