В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками

С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками. Для этой цели можно было бы использовать коэффициент регрессии, исходя из его экономического смысла, но данный коэффициент имеет размерность. Поэтому преобразуем коэффициент регрессии:

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

Величина В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru размерности не имеет. Эту величину называют линейным парным коэффициентом корреляции. Так как коэффициент корреляции вычисляется по выборочным данным, то его еще называют выборочным линейным коэффициентом корреляции и обозначают В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . Итак,

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

где В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - выборочные средние; В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - выборочные средние квадратические отклонения.

Из формулы В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru выразим В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Тогда уравнение регрессии можно записать так:

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

Сравнивая формулы расчета В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru и В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , видим, что эти коэффициенты имеют одинаковые знаки.

Выборочный коэффициент корреляции В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru является показателем тесноты взаимосвязи между признаками. Этот коэффициент применяют для оценки тесноты связи между признаками Х и У в линейной корреляционной зависимости.

Отметим свойства выборочного коэффициента корреляции:

1) В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , то есть В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

2) чем ближе В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru к 1, тем взаимосвязь между признаками Х и У будет более тесной, а чем ближе В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru к 0, тем взаимосвязь слабее;

3) если В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru = +1, то связь между признаками Х и У линейная функциональная;

4) если rв <0, то связь между признаками обратная; если rв >0, связь прямая;

5) если В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru =0, то между признаками отсутствует линейная корреляционная зависимость.

Докажем это свойство. Если В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , то В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , следовательно, уравнение регрессии примет вид В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , то есть В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . Поэтому линия регрессии будет параллельна оси абсцисс, и с ростом значений Х условная средняя В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru не меняется. Отсюда следует, что линейная корреляционная зависимость между признаками Х и У отсутствует, что и требовалось доказать.

Замечание. Равенство В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru говорит лишь об отсутствии линейной корреляционной зависимости, а не об отсутствии корреляционной связи вообще. Между признаками может существовать и нелинейная корреляционная связь (например, параболическая или гиперболическая).

В генеральной совокупности показателем линейной корреляционной связи между признаками Х и У является генеральный коэффициент корреляции В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Можно показать, что В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru вычисляется по формуле

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Чем ближе В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru к единице, тем теснее линейная связь между признаками Х и У.

Как правило, генеральный коэффициент корреляции В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru неизвестен. О тесноте линейной связи между признаками судят не по величине В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , а по величине его выборочного аналога, то есть В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . Так как В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru вычисляется по значениям переменных, случайно попавшим в выборку, то величина В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ruменяется от выборки к выборке. Следовательно, в отличие от В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , выборочный коэффициент корреляции В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - величина случайная. Поэтому В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru является оценкой генерального коэффициента корреляции, то есть В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Пусть найденный по выборке коэффициент корреляции В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . Возникает вопрос: чем объясняется такая величина В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ?

Ответов может быть несколько.

1) Действительно существует линейная корреляционная связь между признаками Х и У в генеральной совокупности. Поэтому В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru отражает тот факт, что и В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

2) Вследствие случайности отбора значений признаков в выборку оказалось, что В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . При другом отборе, возможно, В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru или же В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru изменит свой знак.

Для того чтобы выбрать правильный ответ, следует решить, значимо ли В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , найденный по выборке, отличается от нуля. Если выборочный коэффициент корреляции значимо отличается от нуля, то между признаками Х и У в генеральной совокупности действительно существует линейная корреляционная зависимость. Если же выборочный коэффициент корреляции отличается от нуля незначимо, то можно считать, что линейная корреляционная связь между признаками отсутствует.

Задача эта очень важная, так как линейное уравнение регрессии имеет смысл строить только в том случае, если признаки Х и У находятся в тесной линейной корреляционной зависимости между собой.

С этой целью выдвигаются нулевая и конкурирующая гипотезы:

Н0: rген = 0, Н1: rген № 0.

В этом случае рассматривается двусторонняя критическая область.

Нулевая гипотеза проверяется при заданном уровне значимости a с помощью случайной величины Т,имеющей распределение Стьюдента с k = n - 2 степенями свободы:

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

По выборочным данным вычисляют Тнабл, а по таблице критических точек распределения Стьюдента находят tкрит.дв(a, k) с учетом двусторонней критической области. Сравнивают Тнабл и tкрит.дв(a, k).

ЕслиЅТнаблЅ < tкрит.дв(a, k), то есть наблюдаемое значение критерия попало в область принятия гипотезы, то нет оснований отвергать нулевую гипотезу по данным наблюдения rген = 0, признаки Х и Y не коррелированы, rв незначим.

А если Тнабл попало в критическую область, то есть В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , то нулевую гипотезу отвергаем, принимаем конкурирующую Н1: rген № 0, признаки Х и Y коррелированы, rв значим.

Итак, если rв оказался значим, то можно найти коэффициент детерминации по формуле D = В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru Ч 100 % , который показывает, на сколько процентов в среднем вариация результативного признака Y объясняется за счет вариации факторного признака X.

Пример 2. Ранее по корреляционной таблице было установлено, что себестоимость единицы продукции и производительность труда находятся в корреляционной зависимости. Получены следующие данные:

Хi  
В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru 13,80 12,20 11,00 9,73 7,67 .

Требуется провести корреляционно-регрессионный анализ.

Решение. Результативный признак У - себестоимость единицы продукции, р. Факторный признак Х - производительность труда, тыс. шт. Предполагаем, что признаки имеют совместный нормальный закон распределения.

Установим форму корреляционной зависимости. С этой целью строим точки с координатами (хi, уi) (рис. 5).

Эмпирическая линия регрессии изображена на рис. 5. По расположению построенных точек делаем вывод, что корреляционную связь можно считать линейной. Выборочное уравнение регрессии в общем виде: В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru a0 + a1х. Итак, форма связи линейная.

Проведем корреляционный анализ. Вычислим выборочный линейный коэффициент корреляции:

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

Рис. 5

Будем выполнять расчеты, опираясь на исходную корреляционную таблицу:

Себестоимость единицы продукции, В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru Производительность труда, В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru
В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru
   
В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

При вычислении выборочных характеристик признаков Х и У будем учитывать, что данные сгруппированы. Расчеты удобно представить в следующих таблицах:

  В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru
 
Итого    
  В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru
 
Итого    

Тогда

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ;

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ;

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru

Проверим значимость выборочного коэффициента корреляции. Для этого выдвигаем гипотезы:

Н0: rген = 0, Н1: rген № 0. Примем уровень значимости В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Для проверки нулевой гипотезы используем случайную величину В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru , имеющую распределение Стьюдента с k = n - 2 = 48 степенями свободы. По выборочным данным находим наблюдаемое значение критерия Тнабл = В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru . По таблице критических точек распределения Стьюдента находим tкрит.дв(0,05; 48) В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru 2,02. Сравниваем Тнабл и tкрит(0,05; 3). Так как ЅТнаблЅ  tкрит.дв(0,05; 3), то есть Тнабл попало в критическую область, нулевая гипотеза отвергается, принимается конкурирующая гипотеза Н1: rген № 0, rв значим. Признаки Х и Y коррелированы. Так как ЅrвЅ достаточно близок к единице, следовательно, себестоимость единицы продукции и производительность труда находятся в тесной корреляционной зависимости.

Найдем коэффициент детерминации. D = rв2 Ч 100 % В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru 42 %, то есть вариация себестоимости единицы продукции в среднем на 42 % объясняется вариацией производительности труда.

Выразим зависимость между этими признаками приближенно в виде линейного уравнения регрессии:

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » a1(х - В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ),

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ,

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - 11,16 В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - 0,69 (x – 14,68) или В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » - 0,69x + 21,36.

Отсюда следует, что с увеличением производительности труда на 1 тыс. шт. себестоимость единицы продукции снизится в среднем на 0,69 р.

Найдем по уравнению регрессии себестоимость одного изделия, если производительность труда составит 18 тыс. шт.

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » - 0,69 Ч 18+ 21,38 =8,96 (р.).

Пример 3. Для нормирования труда проведено статистическое исследование связи между количеством изготавливаемых изделий (Х, шт.) и затратами времени на обработку одного изделия (Y, мин). Сделана выборка объемом n = 51, и получены следующие данные: rв = 0,8, В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru = 8, sx= 3,2, В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru = 40, sy = 8.

Проверить значимость коэффициента корреляции при a = 0,02. Построить уравнение регрессии.

Решение. Признак Х - количество изготавливаемых изделий, шт. Признак Y - затраты времени на обработку одного изделия, мин.

Предполагаем, что признаки имеют нормальный закон распределения. Они находятся в статистической зависимости, так как затраты времени зависят не только от количества изготавливаемых изделий, но и от многих других факторов, которые здесь не учитываются. В данном случае связь между признаками линейная, так как теснота связи характеризуется линейным коэффициентом корреляции rв = 0,8. Но прежде чем делать вывод о тесноте взаимосвязи, необходимо проверить значимость выборочного коэффициента корреляции. Выдвигаем нулевую гипотезу и ей конкурирующую:

Н0: rген = 0, Н1: rген № 0.

Проверяем нулевую гипотезу с помощью случайной величины, имеющей распределение Стьюдента с k = n - 2 = 49 степенями свободы: В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

По выборочным данным найдем наблюдаемое значение критерия Тнабл = В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » 9,33. По таблице критических точек распределения Стьюдента находим tкрит.дв(a, k) = tкрит.дв(0,02; 49) = 2,40. Сравниваем Тнабл и tкрит.дв(0,02; 49). Так как ЅТнаблЅ > tкрит.дв(0,02; 49), то есть наблюдаемое значение критерия попало в критическую область, нулевая гипотеза отвергается, принимается конкурирующая гипотеза Н1: rген № 0, признаки Х и Y коррелированы, rв значим.

D = В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru Ч 100 % = 64 % , то есть вариация затрат времени на обработку одного изделия в среднем на 64 % объясняется за счет вариации количества изготавливаемых изделий.

Представим эту взаимосвязь аналитически в виде уравнения регрессии вида

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » a1(х - В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru ).

Коэффициент a1 выразим через парный линейный коэффициент корреляции

В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru .

Тогда по выборочным данным будем иметь

a1 = 0,8 Ч 8/32 = 2; В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru - 40 » 2(x - 8) или В парной линейной зависимости. С помощью корреляционного анализа изучают тесноту взаимосвязи между признаками - student2.ru » 24 + 2x .

Отсюда следует, что с увеличением количества выпускаемых изделий на 1 шт. затраченное время в среднем увеличится на 2 мин.

Наши рекомендации