Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость

Регрессионный и корреляционный анализ позволяет установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X, и делать прогнозы значений Y. Параметр Y, значение которого нужно предсказывать, является зависимой переменной. Параметр X, значения которого нам известны заранее и который влияет на значения Y, называется независимой переменной. Например, X – количество внесенных удобрений, Y – снимаемый урожай; X – величина затрат компании на рекламу своего товара, Y – объем продаж этого товара и т.д.

Корреляционная зависимость Y от X – это функциональная зависимость

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru , (9.1)

где Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – среднее арифметическое (условное среднее) всех возможных значений параметра Y, которые соответствуют значению Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru . Уравнение (9.1) называется уравнением регрессииY на X, функция Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – регрессиейY на X, а ее график – линией регрессииY на X.

Основная задача регрессионного анализа – установление формы корреляционной связи, т.е. вида функции регрессии (линейная, квадратичная, показательная и т.д.).

Метод наименьших квадратов позволяет определить коэффициенты уравнения регрессии таким образом, чтобы точки, построенные по исходным данным Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru , лежали как можно ближе к точкам линии регрессии (9.1). Формально это записывается как минимизация суммы квадратов отклонений (ошибок) функции регрессии и исходных точек

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru ,

где Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – значение, вычисленное по уравнению регрессии; Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – отклонение Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru (ошибка, остаток) (рис.9.1); n – количество пар исходных данных.

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru

Рис.9.1. Понятие отклонения Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru для случая линейной регрессии

В регрессионном анализе предполагается, что математическое ожидание случайной величины Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru равно нулю и ее дисперсия одинакова для всех наблюдаемых значений Y. Отсюда следует, что рассеяние данных возле линии регрессии должно быть одинаково при всех значениях параметра X. В случае, показанном на рис.9.2 данные распределяются вдоль линии регрессии неравномерно, поэтому метод наименьших квадратов в этом случае неприменим.

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru

Рис.9.2. Неравномерное распределение исходных точек вдоль линии регрессии

Основная задача корреляционного анализа – оценка тесноты (силы) корреляционной связи. Теснота корреляционной зависимости Y от X оценивается по величине рассеяния значений параметра Y вокруг условного среднего Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru . Большое рассеяние говорит о слабой зависимости Y от X, либо об ее отсутствии и, наоборот, малое рассеяние указывает на наличие достаточно сильной зависимости.

Коэффициент детерминации Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru показывает, на сколько процентов ( Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru ) найденная функция регрессии описывает связь между исходными значениями параметров X и Y

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru , (9.2)

где Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – объясненная вариация; Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru – общая вариация (рис.9.3).

Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru

Рис.9.3. Графическая интерпретация коэффициента детерминации

для случая линейной регрессии

Соответственно, величина Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком ( Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru ) значении коэффициента детерминации можно делать прогноз Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru для конкретного значения Теоретическое введение. Регрессионный и корреляционный анализ позволяет установить и оценить зависимость - student2.ru .

Наши рекомендации