Теоретический материал. Пусть некоторый объект характеризуется двумя признаками

Пусть некоторый объект характеризуется двумя признаками. Между признаками Х и Y могут существовать различные виды зависимостей.

Функциональная зависимость, когда каждому значению признака X соответствует единственное значение признака Y. Зависимость задается в виде функции Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Статистическая зависимость, когда каждому значению признака X соответствует статистическое распределение признака Y. Зависимость задается в виде корреляционной таблицы.

Корреляционная зависимость - это частный случай статистической зависимости, когда каждому значению признака X соответствует среднее значение признака Y: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и связь между ними достаточно хорошо описывается функцией Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , называемой уравнением регрессии Y по X. Аналогично каждому значению Y соответствует среднее значение признака. X: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и эта зависимость описывается в виде функции Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , называемой уравнением регрессии X по Y.

Корреляционная зависимость задается уравнением регрессии.

Две основные задачи теории корреляции:

1) Оценить силу (тесноту) связи между признаками Х и Y;

2) Найти вид (форму) этой связи в виде уравнения регрессии.

Наиболее простой и употребляемый вид связи - линейная связь. Она задается уравнением линейной регрессии Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и изображается на графике в виде прямой регрессии.

Пример

По данным корреляционной таблицы найти условные средние Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru . Оценить тесноту линейной связи между признаками Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и составить уравнения линейной регрессии Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru по Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru по Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru . Оценить силу связи между признаками с помощью корреляционного отношения.

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Решение: В таблице, данной по условию задачи, приведены полученные в результате выборочных наблюдений значения признака X (верхняя горизонтальная строка) и признака Y (первый вертикальный столбец). Каждой паре значений (X;Y) соответствует частота Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , стоящая на пересечении соответствующих строки и столбца. Частота Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru показывает, сколько раз наблюдается каждая пара значений.

Например: пара значений Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru наблюдалась 8 раз, пара значений Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru наблюдалась 40 раз и т.д.

Пустые клетки означают, что соответствующие им пары значений не наблюдались.

В нижней итоговой строке данной таблицы напротив каждого значения признака X проставляется соответствующая ему частота Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , равная сумме всех частот столбца и указывающая, сколько раз всего наблюдается данное значение X. Аналогично в последнем итоговом столбце напротив каждого значения Y записывают соответствующую ему частоту Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , равную сумме частот по строке и указывающую, сколько раз всего наблюдалось данное значение Y. Очевидно, что суммы всех частот для Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и для Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru должны быть равны между собой и показывать объем выборки (количество наблюдаемых пар):

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Объем выборки Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru представляется в последней клетке таблицы.

В таблице каждому значению X соответствует статистическое распределение признака У.

Например, для Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru :

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Отсюда находим среднее значение Y при условии, что Х = 30, или условную среднюю:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Аналогично каждому значению Y соответствует статистическое распределение по X.

Например, для Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru :

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Отсюда находим среднюю условную:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Не выписывая далее статистических распределений, а, беря их непосредственно из данной корреляционной таблицы, найдем все условные средние по формулам: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ,

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Оценка тесноты линейной связи между признаками X и Y производится с помощью коэффициента линейной корреляции Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru :

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Коэффициент Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru может принимать значения от -1 до +1, то есть: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru или Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Знак Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru указывает на вид связи: прямая или обратная. Абсолютная величина Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru указывает на силу (тесноту) связи.

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

При Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru связь прямая, то есть с ростом X растет Y.

При Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru связь обратная, то есть с ростом X убывает Y.

Для нахождения Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru вычислим указанные общие средние: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru а также средние квадратические отклонения Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru . Вычисления удобно поместить в таблицах 2 и 3, куда вписываем также найденные ранее условные средние. Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Контроль: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

В рассматриваемой задаче эта сумма в обеих таблицах равна 234560. Равенство может оказаться приближенным, что связано с приближенными вычислениями условных средних Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru и Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

С помощью таблиц 2 и 3 находим общие средние, средние квадратов, среднюю произведения и средние квадратические отклонения:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Отсюда коэффициент корреляции равен:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ;

Так как Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , то связь обратная, то есть с ростом X убывает Y.

Так как Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , то по таблице 1 определяем, что линейная связь высокая.

Находим линейное уравнение регрессии У по X:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Аналогично находим линейное уравнение регрессии Х по Y:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Данные уравнения устанавливает связь между признаками X и Y, и позволяют найти среднее значение признака Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru для каждого значения X и аналогично среднее значение признака Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru для каждого значения Y.

Если линейная связь слабая, то это не исключает наличия между признаками Х и Y нелинейной (криволинейной) связи. Оценка тесноты любой связи между признаками (линейной и нелинейной) производится с помощью корреляционных отношений Y по Х и Х по Y:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ; Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Дисперсии Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru , называемые внутригрупповыми, определены ранее. Их можно было также посчитать по формулам:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Они характеризуют разброс фактических значений от общих средних.

Все величины Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru называются межгрупповыми дисперсиями и вычисляются по формулам:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Они характеризуют разброс условных средних от общей средней. В данной задаче:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Находим: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ; Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Тогда корреляционные отношения равны:

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru

Замечание. Следует отметить, что корреляционное отношение всегда принимает значение от 0 до 1, причем оно не меньше, чем коэффициент корреляции, взятый по модулю, то есть Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

В нашем примере: 0 < 0.72 < 0.82 < 1; 0 < 0.72 < 0.72 < 1.

Ответ. Корреляционная связь между признаками высокая, ее можно описать линейными уравнениями: Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru ; Теоретический материал. Пусть некоторый объект характеризуется двумя признаками - student2.ru .

Наши рекомендации