По диаграмме рассеяния

Изучая рис. 4.2., т.е. множество точек с отчетливо выраженной тенденцией, можно сделать выводы:

1. Рис. 4.2.а) соответствует отсутствию корреляционной зависимости. Переменные Х и Y некоррелированы.

2. Рис. 4.2.б) показывает зависимость Y от Х, которая может быть описана параболой, а не прямой линией. С увеличением Х среднее значение Y остается постоянным, следовательно, коэффициент корреляции равен нулю.

3. На рис. 4.2. в) с возрастанием одной величины среднее значение другой тоже возрастает (корреляция положительная), а на рис. 4.2. г) с возрастанием одной величины другая величина в среднем убывает (корреляция отрицательная).

4. Рис.4.2. д) и е) отражают функциональную зависимость между Y и Х , которую можно записать в виде По диаграмме рассеяния - student2.ru , где По диаграмме рассеяния - student2.ru для рис. 4.2. д) и По диаграмме рассеяния - student2.ru для рис. 4.2. е).

Если объем выборки небольшой, то выборочный коэффициент корреляции вычисляется по формуле

По диаграмме рассеяния - student2.ru ,

где По диаграмме рассеяния - student2.ru – средние значения,

По диаграмме рассеяния - student2.ru – средние квадратические отклонения соответственно
Х и У.

Если раскрыть скобки и вычислить сумму, то получим

По диаграмме рассеяния - student2.ru ,

где По диаграмме рассеяния - student2.ru – средняя величина произведения По диаграмме рассеяния - student2.ru , вычисленная по выборке (это смешанный выборочный начальный момент).

Если n велико (n > 30), то часто переходят к двумерной частотной таблице, которая называется корреляционной. В ней результаты наблюдений записаны в порядке возрастания с указанием частот пар По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru , которые обозначаются через nij. Для дискретных случайных величин указано одно значение, для непрерывных – промежуток. Для последующих вычислений, например, вычисления средних и средних квадратических отклонений, берутся середины промежутков.

Из табл. 4.1 видно, что каждому значению Х соответствует не одно значение Y, а распределение Y (строка таблицы). Аналогично, каждому значению Y соответствует распределение Х (столбец таблицы).

Таблица 4.1

Корреляционная таблица

По диаграмме рассеяния - student2.ru Y X [y1 – y2) y1 [y2 – y3) y2 . . . [yl – yl+1) yl По диаграмме рассеяния - student2.ru
[x1 – x2) x1 n11 n12 . . . n1l n1.
[x2 – x3) x2 n21 n22 . . . n2l n2.
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
[xm – xm+1) xm nm1 nm2 . . . nml nm.
По диаграмме рассеяния - student2.ru n.1 n.2 . . . n.l По диаграмме рассеяния - student2.ru


Вычислим для каждого условного распределения Y среднее значение. Очевидно, что оно зависит от Х. Назовем его условным средним и обозначим через По диаграмме рассеяния - student2.ru . В зависимости от фиксированного значения По диаграмме рассеяния - student2.ru получим таблицу.

, где По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru .
Х x1 x2 . . . xm
По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru . . . По диаграмме рассеяния - student2.ru

Аналогично можно вычислить условные средние По диаграмме рассеяния - student2.ru для фиксированного значения По диаграмме рассеяния - student2.ru :

, где По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru .
Y y1 y2 . . . yl
По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru По диаграмме рассеяния - student2.ru . . . По диаграмме рассеяния - student2.ru

Если с изменением Х изменяются По диаграмме рассеяния - student2.ru , то между Х и Y существует корреляционная зависимость. Аналогично определяется зависимость между Y и По диаграмме рассеяния - student2.ru .

По корреляционной таблице можно также визуально определить существование корреляционной зависимости. Так, если не равны нулю частоты, близкие к центру таблицы, то существует корреляционная зависимость. Если таблица заполнена полностью, то корреляционная зависимость или слабая, или отсутствует.

Оценка парного коэффициента корреляции по корреляционной таблице вычисляется по формуле

По диаграмме рассеяния - student2.ru , где

По диаграмме рассеяния - student2.ru

По диаграмме рассеяния - student2.ru

В качестве По диаграмме рассеяния - student2.ru берутся середины соответствующих интервалов.

Наши рекомендации