Правило сложения дисперсий. Для сгруппированной статистической совокупности возможно вычисление 3 видов дисперсий: общей, межгрупповой и внутригрупповой
Для сгруппированной статистической совокупности возможно вычисление 3 видов дисперсий: общей, межгрупповой и внутригрупповой.
Общая дисперсия измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака х от общей средней и может быть вычислена как простая или взвешенная дисперсия.
Межгрупповая дисперсия характеризует систематическую вариацию, обусловленную влиянием факторного признака, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:
.
Внутригрупповая (частная) дисперсия отражает случайную вариацию, т.е. вариацию, обусловленную влиянием неучтенных факторов и не зависящую от факторного признака, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы (х) от средней арифметической этой группы, (групповой средней) и может быть исчислена как простая или как взвешенная дисперсия по формулам:
простая | взвешенная |
Между всеми указанными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий – общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:
.
Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью неизвестную, а также судить о силе влияния группировочного признака. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак.
В связи с этим в статистическом анализе широко используется эмпирический коэффициент детерминации ( ) – показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака:
.
Он принимает значения от 0 до 1 и показывает долю вариации результативного признака у под влиянием факторного признака х (остальная часть общей вариации у обуславливается вариацией прочих факторов).
Например, пусть х – разряд рабочего, у – производительность труда, а =0,66 или 66%, тогда это означает, что на 66% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 34% - случайными факторами.
Корень квадратный из эмпирического коэффициента детерминации называется эмпирическим корреляционным отношением:
.
Оно также может принимать значения от 0 до 1. С его помощью оценивают тесноту связи между факторным и результативным признаком: чем ближе корреляционное отношение к 1, тем теснее связь между признаками.
Вопросы для самоконтроля
1. Что такое вариация признака? Какие виды вариации Вы знаете?
2. Перечислите показатели, характеризующие вариацию признака.
3. Для чего используются относительные показатели рассеивания?
4. Что характеризует коэффициент вариации?
5. Что значит вариация альтернативного признака? Приведите пример.
6. Какие виды дисперсии Вы знаете? Что значит правило сложения дисперсий?
7. Для чего используются эмпирический коэффициент детерминации и эмпирическое корреляционное отношение?