Тема: Определение уравнения парной регрессии
Средствами ЭТ Excel
Цель:
1. Ознакомиться с основными понятиями корреляционного и регрессионного анализа
2. Освоить порядок определения уравнения парной регрессии средствами ЭТ Excel
3. Научиться оценивать достоверность полученных результатов
Теоретические сведения
В математике существуют понятия, отражающие причинно ¾ следственные связи: функциональная и корреляционная зависимость.
Под функциональной зависимостью подразумевается такая связь между величинами, когда значение зависимой величины ¾ функции полностью определяется значением других переменных величин – аргументов. Функциональная связь может быть линейной, изображаемой графически прямой, и нелинейной, изображаемой графически кривой, например параболой, экспонентой, гиперболой и т.д.
Корреляционная зависимость имеет место, когда каждому значению одной величины соответствует множество случайных значений другой, возникающих с определенной вероятностью. При изучении экономических явлений мы имеем дело не с функциональной, а с корреляционной зависимостью. При парной корреляции наблюдается связь между двумя величинами. При множественной корреляции определенным значениям нескольких влияющих величин-факторов соответствует множество случайных значений зависимой результатной величины, распределенных по известному закону.
Можно подобрать некоторую функцию, которая будет приближенно отражать зависимость. Такая функция называется уравнением регрессии, а ее график ¾ линией регрессии. Корреляционный и регрессионный анализ позволяет решать такие задачи, которые пока другими методами выполнить нельзя, как, например, определение совместного и раздельного влияния многих взаимосвязанных и одновременно действующих факторов на результативный признак.
С помощью корреляционного и регрессионного анализа мы можем рассчитать коэффициенты корреляции, которые оценивают силу связи между отдельными признаками (показателями), подобрать уравнение регрессии, которое определяет форму этой связи, и установить достоверность существования связи.
Если зависимости являются линейными, то регрессия называется линейной, в противном случае регрессию называют нелинейной. Очень важной характеристикой регрессионных зависимостей является мера их достоверности, которая оценивается величиной R^2 ¾ квадрат коэффициента корреляции. Квадрат коэффициента корреляции может лежать в пределах 0 £ R^2 £ 1.
При R^2=0 величины, для которых определяются уравнения регрессии, являются независимыми; при R^2=1 имеет место функциональная (а не статическая) зависимость. Принято считать допустимым R^2 ³ 0.7
Чем больше статистических данных, используемых при определении уравнения регрессии, тем точнее будет определена искомая зависимость. Но при этом следует иметь в виду, что количество статистических данных не может обеспечить полученной достоверной зависимости, если в действительности такой зависимости между исследуемыми величинами нет. Вместе с тем, есть минимальное количество К необходимых исходных данных, определяемое методом наименьших квадратов, с помощью которого находится уравнение регрессии. К определяется по формуле
К = М + 2, (6.1)
где М – количество неизвестных величин в искомом уравнении регрессии.
Для уравнения парной регрессии :
- при линейной зависимости
y = b + mx (6.2)
необходимо определить две величины: b и m
- при уравнении регрессии в виде полинома 2-й степени
y = b + m1x + m2x2 (6.3)
необходимо определить три величины: b , m1, m2
Пример выполнения лабораторной работы
2.1 Постановка задачи
Имеются две наблюдаемые величины X и Y, например, объем реализации фирмы, торгующей подержанными автомобилями, за шесть недель ее работы. Значения этих наблюдаемых величин приведены в таблице 6.1, где X – отчетная неделя, а Y – объем реализации за эту неделю.
Таблица 6.1 ¾ Исходные данные для построения модели
X | Y |
Необходимо построить модель, наилучшим образом описывающую наблюдаемые значения.
Ограничимся рассмотрением трех случаев:
1. Y линейно зависит от X
(6.4)
2. Y квадратично зависит от X
(6.5)
3. Y экспоненциально зависит от X
(6.6)
Решение задачи
Алгоритм 6.1 Определение уравнения парной регрессии
1. Создайте форму для решения задачи и введите в нее исходные данные (рисунок 6.1)
2. Постройте точечный график по диапазону ячеек A2:B7.
Ø Выделите A2:B7
Ø Мастер диаграмм
Ø Точечная
Ø Ответить на запросы мастера диаграмм
На экране: рисунок 6.2
3. Построение линии тренда
Ø Курсор на точку графика
Ø М1
Ø МП
Ø Добавить линию тренда….
На экране: Диалоговое окно Линия тренда
Ø Курсор на вкладку Тип
Ø М1
Ø Группа Построение линии тренда (аппроксимация и сглаживание)
Ø Выберите Линейная (или Полиномиальная ¾ Степень: 2, или Экспоненциальная)
Ø Курсор на вкладку Параметры
Рисунок 6.1
Ø М1
Ø Установить флажок Показывать уравнение на диаграмме
Ø Установить флажок Поместить на диаграмму величину достоверности аппроксимации (R^2) (т.е. на диаграмму необходимо поместить значение квадрата коэффициента корреляции).
Флажок Пересечение кривой с осью Y в точке устанавливается только в случае, если эта точка известна. Например, если этот флажок установлен и в его поле введен 0 (при X=0 Y=0), это означает, что ищется функция Y=a1 X для линейной модели.
Ø ОК
4. Постройте еще два точечных графика и линии тренда для экспоненциальной и квадратичной зависимости по приведенному выше алгоритму.
5. Проанализируйте квадрат коэффициента корреляции (R^2) для каждого из графиков и сделайте вывод.
Вывод: В приведенной задаче квадрат коэффициента корреляции экспоненциальной модели (R^2) равен 0,947 , (R^2) квадратичной модели равен 0,974, (R^2) линейной модели равен 0,9723. Таким образом, квадратичная модель более достоверно описывает зависимость между наблюдаемыми величинами.
Уравнение регрессии для выбранной модели (рисунок 6.3):
Y= -0.0536 X2+2.2607 X+4.9
Рисунок 6.2
Рисунок 6.3
Задание
Определите уравнение регрессии для приведенных исходных данных в соответствии с вариантом.
Вариант 1
Неделя | ||||||||
Количество машин |
Вариант 2
Неделя | ||||||||||
Количество машин |
Вариант 3
Неделя | |||||||||
Количество машин |
Вариант 4
Неделя | |||||||||
Количество машин |
Вариант 5
Неделя | |||||||||||
Количество машин |
Вариант 6
Неделя | |||||||||
Количество машин |
Вариант 7
Неделя | ||||||||
Количество машин |
Вариант 8
Неделя | |||||||||
Количество машин |
Вариант 9
Неделя | |||||||||||
Количество машин |
ТРЕБОВАНИЯ К ОТЧЕТУ ПО ЛАБОРАТОРНОЙ РАБОТЕ
Отчет должен содержать:
1. Краткий конспект последовательности определения уравнения парной регрессии
2. Условие и результаты решения задачи.
Лабораторная работа № 7