Линейный корреляционно-регрессионный анализ
Для определения тесноты линейной связи между двумя параметрами х и у используется коэффициент корреляции r, вычисляемый по формулам
или
Если коэффициент корреляции rху = 1, то между параметрами х, у существует функциональная зависимость, и поэтому использовать корреляционный анализ в этом случае нельзя. Если rху = 0, то линейная зависимость между х и у отсутствует, но возможна нелинейная зависимость. Чем ближе коэффициент корреляции к 1, тем теснее линейная зависимость. Величина r2 является коэффициентом детерминации, который показывает, какая часть изменения уописывается изменением х.
Существенность тесноты линейной зависимости можно определить, используя таблицы значений коэффициентов корреляции для различных уровней существенности (см. материалы лекций). По этим таблицам видно, что существенность коэффициента корреляции связанно с количеством наблюдений в выборке. Для приведенных в
табл. 1 приложения данных количество наблюдений n = 61, и существенным будет признаваться коэффициент корреляции свыше 0,25.
Если коэффициент корреляции признается существенным, то сама линейная зависимость может быть использована в качестве производственных нормативов.
Параметры линейной формы зависимости у = а + bх, где y – теоретическое значение изучаемого показателя, находятся методом наименьших квадратов:
Рассмотрим коэффициенты корреляции для всех 8 факторов (табл. 1 приложения) х1, х2, …, х8 между собой, сведенные в таблицу – матрицу парных коэффициентов корреляции (табл. 7). Эта матрица имеет треугольную форму, поскольку rxi,xj = rxj, xi.
Таблица 7.1
x1 | x2 | x 3 | x4 | x5 | x6 | x7 | x8 | |
x1 | ||||||||
x2 | –0,50707 | |||||||
x3 | –0411010 | 0,957696 | ||||||
x4 | –0,00520 | –0,25657 | –0,36028 | |||||
x5 | –0,09519 | 0,046817 | 0,014952 | 0,263691 | ||||
x6 | –0,18771 | 0,407014 | 0,512369 | –0,26082 | –0,06788 | |||
x7 | –0,40114 | 0,782969 | 0,667539 | –,08576 | 0,068765 | –0,228719 | ||
x8 | 0,03045 | –0,20181 | –0,28062 | 0,28054 | 0,116644 | –0,621718 | 0,127935 |
Нумерация первой графы означает следующее: 1 – количество перерабатываемой руды; 2 – содержание металла в руде; 3 – выход концентрата; 4 – содержание металла в концентрате; 5 – содержание серы в концентрате; 6 – извлечение; 7 – содержание металла в хвосте; 8 – содержание металла в сульфате.
При сравнении табличного коэффициента значимости, равного 0,349 4 (при N = 30, α = 0,05), с вычисленными значениями r, существенными линейные связи могут быть признаны только для 5 зависимостей из 28 возможных (табл. 1 приложения):
а) между выходом концентрата и содержанием металла в руде (2–3):
Линейная зависимость у = –0,15 + 1,38х
б) между содержанием металла в руде и извлечением(2–6):
Линейная зависимость у = 66,08 + 12,88х
в) между содержанием металла в руде и хвосте (2–7):
Линейная зависимость у = 0,04 + 0,18х
г) между содержанием выходом концентрата и извлечением (3–6):
Линейная зависимость у = 66,27 + 11,27х
д) между выходом концентрата и содержание металла в хвосте (3–7):
Линейная зависимость у = 0,07 + 0,11х
Анализируя графики можно сделать вывод, что линейная связь во всех 5 случаях существенна. Рассчитаем для них остаточную, факторную и общую дисперсии:
зависимости дисперсии | (2–3) | (2–6) | (2–7) | (3–6) | (3–7) |
остаточная | 0,001 7 | 8,090 1 | 0,000 2 | 7,150 9 | 0,000 3 |
факторная | 0,02 | 9,70 | 0,000 5 | 9,70 | 0,000 5 |
общая | 0,02 | 17,79 | 0000 7 | 16,85 | 0,000 8 |