Прямой линии, то можно предположить наличие прямолинейной связи
Между признаками.
Теснота связи показывает меру влияния факторного
Признака на общую вариацию результативного признака.
Для описания корреляционной связи используется зависимость
~y = F(x), которая проявляется только на всей статистической
Совокупности. Так как на результат всегда действует множество факторов,
То для каждой отдельной единицы наблюдения значение результативного
признака состоит из двух частей:
i i i y = ~y +ε ,
где − i y ~ локальная средняя, характеризующая значение
Результативного признака, сформированное под воздействием только
Данного фактора i x ;
i ε
=( ) i i y − ~y - отклонение, характеризующее вариацию
результативного признака под влиянием неучтённых факторов.
Таким образом, теснота связи – это характеристика
соотношения между локальной средней i y ~ и отклонением i
ε . Через
Тесноту связи определяется, в какой степени влияют на результат
учтённые и неучтённые факторы.
На эмпирическом уровне, при проведении корреляционного анализа
Теснота связи измеряется с помощью интегральных показателей,
Построенных на правиле сложения дисперсии. В соответствии с ним
Формат: Список
Общая дисперсия результативного признака разлагается на
внутригрупповую и межгрупповую:
y σ = 2
i σ
+δ 2 ,
Где 2
i σ
- средняя из внутригрупповых дисперсий;
δ 2 - межгрупповая дисперсия.
Через соотношение дисперсий определяются показатели,
Измеряющие степень тесноты связи между результативными и
факторными признаками: коэффициент детерминации η 2 и
эмпирическое корреляционное отношение η .
• Коэффициент детерминации рассчитывается по формуле:
2 1
y
i
y σ
σ
σ
δ
η = = − .
Приведенное отношение определяет удельный вес вариации,
Объясняемой влиянием учтенного фактора на результат, в общей
Вариации результативного признака. Показатель изменяется в диапазоне
от 0 до 1. При η 2 = 0 межгрупповая дисперсия δ 2 =0, - это означает, что
Локальные средние во всех распределениях результативного признака
Строго одинаковы, центры распределений не смещаются; связь между
признаками отсутствует. При η 2 = 1 межгрупповая дисперсия δ 2 равна
общей дисперсии результативного признака δ 2 = 2
y σ ; следовательно, 2
i σ
= 0,
А внутригрупповые значение результативного признака не варьируют, то
есть i i y = ~y . Это означает, что на значения результативного признака
Влияют только учтенные факторы, и связь между признаками является
функциональной: значению факторного признака соответствует
Единственное значение результативного.
Коэффициент детерминации сложно интерпретируется, поэтому
на его основе рассчитывается ещё один показатель тесноты связи –
эмпирическое корреляционное отношение η .
• Эмпирическое корреляционное отношение
рассчитывается по формуле:
2 1
y
i
σ
σ
η = η = − .
Диапазон изменения этого показателя: η = {0 ÷1 }. Нулевое значение
Эмпирического корреляционного отношения означает отсутствие связи
между результативным и факторным признаками, при η = 1 связь
Классифицируется как функциональная.
Формат: Список
Используя численное значение эмпирического корреляционного
отношения η , связь можно классифицировать по шкале Чеддока, таблица
7.1.:
Таблица 7.1.
Шкала Чеддока
η 0÷0,1 0,11 ÷ 0,3
Divide; 0,5
0,51÷ 0,7 0,71÷ 0,9
0,91÷ 0,99 0,991÷1
Хара
Ктери
Стика
Связи
Отсутству
Ет
Слабая умеренна
я
Заметная тесная сильная функциональ
Ная
Если известно, что между результативным и факторным признаком
существует линейная связь, то для оценки её тесноты используется
линейный коэффициент корреляции y x r , , рассчитываемый по формуле:
[ ( ) ] [ ( ) ] x y
Y x
n
X y
Xy
n
y
y
n
x
x
n
X y
Xy
r
σ ⋅σ
⋅
−
=
− ⋅ −
⋅
−
=
Σ Σ Σ
Σ Σ Σ Σ
Σ Σ Σ
. .
Значения линейного коэффициента корреляции важно для
Исследований, в которых распределение признака близко к нормальному.
Он принимает значение в интервале 1 1 , − ≤ ≤ + y x r . Отрицательные значения
Y x r , свидетельствуют о наличии обратной связи между признаками,
положительные – о прямой связи. При y x r , =0 связь между признаками