Корреляционный анализ. Виды уравнений регрессии.
Корреляционный анализ, совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. К. а. экспериментальных данных заключает в себе следующие основные практические приёмы: 1) построение корреляционного поля и составление корреляционной таблицы; 2) вычисление выборочных коэффициентов корреляции или корреляционного отношения; 3) проверка статистической гипотезы значимости связи. Дальнейшее исследование заключается в установлении конкретного вида зависимости между величинами (см. Регрессионный анализ). Зависимость между тремя и большим числом случайных признаков или факторов изучается методами многомерного К. а. (вычисление частных и множественных коэффициентов корреляции и корреляционных отношений).
– сглаженная линия (уравнение прямой) – теоретические значения.
Регрессионный анализ заключается в нахождении формулы для выражения функции , причем эта функция должна быть приведена таким образом, чтобы расхождения между фактическими данными и полученными по формуле были минимальными.
, где – случайности отклонения, т.е.
– сглаживающая линия,
Изломы этой линии (штрих) указывает на действия случайных факторов, которые не учитываются в модели.
Для того чтобы абстрагироваться от влияния случайных факторов используют выравнивание ломаной линии по некоторой плавной сглаживающей кривой.
Эту сглаживающую линию называют теоретической линией регрессии (линия регрессии).
Она отражает теоретическую формулу связи. Эта связь возникает при условии полного взаимопоглощения всех прочих факторов случайных по отношению к фактору x.
Уравнение, которое описывает теоретическую линию регрессии называют уравнением регрессии.
гдеf(x)–какая-то неизвестная функция, а – средняя величина признака, которая изменяется.
f(x) – функция, которая устанавливает вид однозначной зависимости между этими величинами – это расчетные теоретические значения.
Наиболее часто используются следующие типовые функции: линейная
параболическая связь и другие.
Наиболее часто применяется линейная зависимость: , где а0 – свободный член, а1 – коэффициент регрессии, который указывает на сколько единиц в среднем меняется результативный признак при изменении факторного значения на единицу его измерения.
В математической статистике доказано, что
т.е. дает совпадение в сумме:
Используя критерий минимизации можно получить значения неизвестных, коэффициент уравнения регрессии:
Система нормальных уравнений:
и, соответственно расчет коэффициента регрессии a1 и свободного члена a0:
При использовании других типовых функций образуются иные системы нормальных уравнений, для которых определены значения искомых параметров.
Решив уравнение регрессии и получив коэффициент уравнения, их необходимо проверить на неслучайность, т.е. статистическую значимость.