По характеру разброса «наших» точек на плоскости можно предположить, что зависимость между рассматриваемыми рядами будет описываться некоторой кривой линией
3. Проведем пошаговое вычисление числовых характеристик отдельных рядов и выборочного коэффициента парной корреляции:
· Выборочные средние рядов X и Y: | |
· Выборочные дисперсии рядов X и Y: | |
· Выборочное среднее квадратическое отклонение рядов X и Y: | |
· Корреляционный момент: | |
· Выборочный коэффициент парной корреляции: | |
или, с учетом предыдущих вычислений: |
4. По величине коэффициента даем характеристику корреляционной зависимости между выборками.
По величине выборочного коэффициента парной корреляции rXY=0,34 можно сказать, что корреляция между рядами будет прямой и слабой
5. Достоверность коэффициента корреляции проверим по критерию Стьюдента:
При уровне значимости a=0,05 или доверительной вероятности 0,95 найдем критическое значение коэффициента Стьюдента:
ТКРИТ(р=0,95, f=n-2=4-2=2)=4,3,
Экспериментальное значение критерия вычислим по формуле: .
, поэтому утверждать о достоверности коэффициента корреляции с вероятностью 95% мы не можем.
Проанализировав таблицу критических значений критерия Стьюдента, можем утверждать о достоверности коэффициента корреляции лишь с вероятностью 70%, т.к. ТКРИТ(р=0,7, f=n-2=2)=1,34.
Вероятность корреляционной связи часто устанавливается соотношением: . В этом случае корреляционная зависимость между величинами X и Y считается достаточно вероятной.
АЛГОРИТМ РЕГРЕССИОННОГО АНАЛИЗА
Коэффициент корреляции указывает лишь на направление и силу связи между двумя переменными величинами, но не дает возможности судить о том, как количественно меняются величины одного признака по мере изменения величины другого признака.
Ответ на этот вопрос дает применение метода регрессии.
Регрессия – это функция, позволяющая по величине одного коррелирующего признака определить средние величины другого признака.
С помощью регрессии решается задача: как количественно меняется одна величина при изменении другой величины на единицу.
Функция регрессии может иметь любой вид (линейная, степенная, показательная и др.), а методы регрессионного анализа позволяют отыскать внешний вид этой функции. Между коэффициентом корреляции rxy, числовыми характеристиками выборок и коэффициентами уравнения регрессии существует определенная связь.
ЛИНЕЙНАЯ РЕГРЕССИЯ
Линейная регрессия – это регрессия, которая выражается линейной функцией вида , а графиком ее будет прямая линия.
Так как, корреляция выражает влияние отдельных значений одного ряда на среднее значение другого ряда, то уравнение линейной регрессии запишем в виде: .
Коэффициенты этого уравнения определяются из следующих соотношений: и .
Уравнение обратной регрессии имеет вид: , а его коэффициенты: и .
Имея частные решения уравнений линейной регрессии, можно построить их графики: линии регрессии пересекаются в точке , при этом tga=A.
Часто уравнения линейной регрессии представляют в виде прямых среднеквадратической регрессии Y на X и X на Y:
и ,
где и – выборочные коэффициенты регрессии.
По величине выборочных коэффициентов регрессии судят о силе корреляционной связи между изучаемыми величинами. Так, например, чем больше коэффициент A=rух линейной регрессии Y на Х, тем сильнее изменяется среднее значение величины Y при изменении величины X на единицу.