Расчет параметров уравнение регрессии. Технология работы
Для расчета параметров уравнения регрессии воспользуемся следующим примером. В аптеке продается новый препарат для профилактики гриппа. Необходимо выяснить как объем продаж y (число упаковок в день) зависит от а) числа покупателей, которые слышали рекламу этого препарата (их доля от общего числа покупателей x1, %) и работе в торговом зале врача-консультанта (относительное время x2, когда он работал, %). Исходные данные представлены в таблице.
Таблица 2
День продажи | y, уп/день | x1, % | x2, % | День продажи | y, уп/день | x1, % | x2, % |
Разместим исходные данные на лист табличного редактора в следующем виде (рис. 25).
Рис. 25
Режим работы «Регрессия» служит для расчета параметров уравнения линейной регрессии и проверки его адекватности исследуемому процессу. В диалоговом окне данного режима (рис. 26) задаются следующие параметры:
1. Входной интервал Y – вводится ссылка на ячейки, содержащие данные по результативному признаку Диапазон должен состоять из одного столбца.
2. Входной интервал Х – вводится ссылка на ячейки, содержащие факторные признаки. Максимальное число входных диапазонов (столбцов) равно 16.
3.Метки в первой строке/Метки в первом столбце
4. Уровень надежности – установите данный флажок в активное состояние, если в поле, расположенное напротив флажка, необходимо ввести уровень надежности, отличный от уровня 95 %, применяемого по умолчанию. Установленный уровень надежности используется для проверки значимости коэффициента детерминации R2 и коэффициентов регрессии ai.
5. Выходной интервал/Новый рабочий лист/Новая рабочая книга
Рис. 26
После того, как мы нажмем на ОК, получим результат, содержащий большое количество информации (рис. 27). Но выберем только те из них, которые потребуются для последующего анализа. Для этого создадим таблицу, в которой поместим расчетные значения коэффициентов регрессии, стандартную ошибку, величины t-критерия и показатели уровня значимости p. Укажем также (ниже таблицы) рассчитанные показатели для самой функции у.
Рис. 27
Таблица 3
Данные регрессионной статистики
Независимая переменная | Коэффициент | Стандартная ошибка | Критерий t | Уровень значимости p |
Свободный член | 1,91 | 0,92 | 2,09 | 0,05 |
Доля покупателей, слышавших рекламу, % | 0,04 | 0,03 | 1,64 | 0,12 |
Время работы консультанта, % | 0,08 | 0,03 | 2,48 | 0,02 |
Для функции Y: cтандартная ошибка = 0,77; R2-квадрат = 0,56; R2 (нормированный) = 0,51. Таким образом, для рассматриваемого примера уравнение регрессии (или уравнение прогнозирования) будет иметь следующий вид: y (объем продаж, уп/день) =b0+b1x1+b2x2=1,91+0,04 (доля покупателей, слышавших рекламу, %)+1,62(относительное время работы консультанта, %). Запишем полученное уравнение в окончательной редакции: y =1,91+0,04x1+0,08x2