Элементы теории корреляции .

Теория корреляции изучает связь между несколькими признаками и выявляет направление и тесноту этой связи, а так же позволяет строить модели исследуемых процессов и составлять прогнозы протекания этих процессов.

Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от случайной величины X.

Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой. В частности, статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой. В этом случае статистическую зависимость называют корреляционной.

Корреляционная зависимость может быть двух типов: линейной и криволинейной.

Рассмотрим более подробно линейную корреляционную зависимость.

Линейная корреляционная зависимость (корреляция) между признаками Х и У выражается уравнением вида:

Элементы теории корреляции . - student2.ru

Такое уравнение называется уравнением регрессии У на Х, а соответствующая прямая – выборочной линией регрессии.

Неизвестные параметры Элементы теории корреляции . - student2.ru находят из системы уравнений

Элементы теории корреляции . - student2.ru .

Уравнение корреляционной зависимости можно получить из уравнения вида

Элементы теории корреляции . - student2.ru

где Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru .

Коэффициент корреляции ( Элементы теории корреляции . - student2.ru ) показывает тесноту связи и направления между признаками Элементы теории корреляции . - student2.ru и Элементы теории корреляции . - student2.ru .

Свойства коэффициента корреляции:

1. Элементы теории корреляции . - student2.ru

2. Если Элементы теории корреляции . - student2.ru = 1, то зависимость между признаками Х и У является функциональной

3. Если Элементы теории корреляции . - student2.ru = 0, то признаки Х и У не связаны линейной корреляционной зависимостью, но зависимость может иметь криволинейный характер.

С увеличением Элементы теории корреляции . - student2.ru связь между признаками Х и У становится теснее.

При Элементы теории корреляции . - student2.ru - зависимость между признаками слабая, при Элементы теории корреляции . - student2.ru - средняя, при Элементы теории корреляции . - student2.ru - сильная.

Если Элементы теории корреляции . - student2.ru положителен, то связь между признаками прямая, если Элементы теории корреляции . - student2.ru отрицателен – обратная.

Коэффициент корреляции вычисляется по формуле

Элементы теории корреляции . - student2.ru

Простейшим визуальным способом выявить наличие взаимосвязи между количественными переменными является построение диаграммы рассеяния. Это график, на котором по горизонтальной оси (X) откладывается одна переменная, по вертикальной (Y) другая. Каждому объекту на диаграмме соответствует точка, координаты которой равняются значениям пары выбранных для анализа переменных.

Выборочной линией регрессии Y на X называется график функции Элементы теории корреляции . - student2.ru .

Пример 1. Для выявления корреляционной зависимости оптической плотности Y раствора от концентрации Х растворенного вещества было проведено 10 опытов. Их результаты приведены в таблице.



xi
yi

Полагая, что между признаками X и Y имеет место линейная корреляционная связь, определите выборочное уравнение линейной регрессии и выборочный коэффициент линейной корреляции. Постройте диаграмму рассеяния и линию регрессии. Сделайте вывод о направлении и тесноте связи между X и Y. Используя полученное уравнение линейной регрессии, оцените ожидаемое среднее значение признака Y, при X0 = 55%.

Решение.

Построим диаграмму рассеяния. Для этого на плоскости ХOУ отметим точки с координатами (xi ; yi).

Элементы теории корреляции . - student2.ru

По диаграмме рассеяния видно, что точки (xi ; yi) группируются около некоторой прямой. Поэтому выборочное уравнение линейной регрессии будем искать в виде y = a∙x+b. Параметры a и b найдем методом наименьших квадратов. Составим систему нормальных уравнений:

Элементы теории корреляции . - student2.ru

Вспомогательные вычисления проведем в следующей таблице:

Элементы теории корреляции . - student2.ru

Итак, система нормальных уравнений имеет вид:

Элементы теории корреляции . - student2.ru .

Решим её с помощью определителей (методом Крамера). Определитель системы

Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru , Элементы теории корреляции . - student2.ru .

Выборочное уравнение линейной регрессии имеет вид

y = 0,506819∙x+9,73586.

Чтобы построить линию регрессии найдем координаты двух точек, принадлежащих прямой y = 0,506819∙x+9,73586.

При x=35 y=0,506819∙35+9,73586=27,474529≈27,5.

При x=75 y=0,506819∙75+9,73586=47,747292≈47,7.

Линия регрессии – прямая, проходящая через точки (35; 27,5) и (75; 47,7).

Элементы теории корреляции . - student2.ru

Выборочный коэффициент линейной корреляции найдем по формуле

Элементы теории корреляции . - student2.ru , где Элементы теории корреляции . - student2.ru – наблюдавшиеся значения признаков X и Y; Элементы теории корреляции . - student2.ru – объём выборки; Элементы теории корреляции . - student2.ru – выборочные средние; Элементы теории корреляции . - student2.ru – выборочные среднеквадратические отклонения.

Элементы теории корреляции . - student2.ru . Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru .

Элементы теории корреляции . - student2.ru .

Так как выборочный коэффициент линейной корреляции Элементы теории корреляции . - student2.ru , то корреляция положительная, т. е. с возрастанием x возрастает и y. Так как Элементы теории корреляции . - student2.ru очень близко к единице, то связь между признаками x и y тесная. Поэтому полученное уравнение регрессии y на x можно использовать для прогнозов. Оценим ожидаемое среднее значение y при X0 = 55%.

y=0,506819∙55+9,73586=37,610911≈37,6

Ответ: уравнение регрессии y = 0,506819∙x+9,73586 можно использовать для прогнозов; связь между признаками x и y тесная, положительная. выборочный коэффициент линейной корреляции Элементы теории корреляции . - student2.ru . При концентрации растворенного вещества, равного 55 г средняя оптическая плотность раствора составляет 37,6.

Наши рекомендации