Правило сложения дисперсий
Дисперсия, как показатель вариации, может применяться в статистических рядах, где варианты совокупности сгруппированы по какому-либо признаку. Такой ряд состоит из признака-фактора (группированного) и признака-результата (результативного). Например, в качестве группированного признака для рабочих цеха могут выступать стаж работы, разряд (квалификация), в качестве результативного – выполнение норм выработки, средняя заработная плата.
Для измерения колеблемости результативного признака под влиянием разных условий, действующих в данной совокупности, рассчитывают три дисперсии:
– общую ( );
– межгрупповую ( );
– среднюю из групповых ( ).
Общая дисперсия характеризует вариацию результативного признака под влиянием всех условий, действующих в данной совокупности. В зависимости от вида ряда, общую дисперсию определяют по формулам для несгруппированных или сгруппированных признаков.
Межгрупповая дисперсия характеризует вариацию результативного признака под влиянием – признака-фактора, положенного в основу группировки:
, (7.23)
где – частота вариант в группах.
Для расчета средней из внутригрупповых дисперсий сначала определяют внутригрупповые дисперсии в каждой отдельной группе ( ) по формуле:
. (7.24)
Средняя из внутригрупповых дисперсий, которая характеризует случайную вариацию результативного признака, т.е. вариацию под влиянием всех прочих факторов, кроме группированного, рассчитывается по формуле:
. (7.25)
Поскольку общая колеблемость результативного признака определяется как колеблемость под влиянием группировочного признака и колеблемость под влиянием прочих факторов (кроме группировочного), то закономерно равенство:
. (7.26)
Представленная формула – это правило сложения дисперсий: общая дисперсия равна сумме межгрупповой дисперсии и средней из групповых.
На основе этих дисперсий можно рассчитать эмпирическое корреляционное отношение и коэффициент детерминации (причинности).
Эмпирическое корреляционное отношение ( ) показывает тесноту вязи между факторным и результативным признаками и рассчитывается по формуле:
. (7.27)
Оно изменяется то 0 до 1, и чем его значение ближе к 1, тем связь между признаками теснее.
Коэффициент детерминации (причинности) ( ) характеризует долю вариации результативного признака под влиянием признака-фактора, положенного в основу группировки. Формула расчета:
. (7.28)
Если межгрупповая дисперсия равна 0 ( ), это означает, что и коэффициент детерминации равен 0, следовательно, связь между факторным и результативным признаками полностью отсутствует. Полная связь между этими признаками ( ) будет в случае равенства общей и межгрупповой дисперсий ( ).
Рассмотрим определение разных видов дисперсий на примере 4.
Пример 4. Рабочие цеха сгруппированы по стажу работы в три группы. Со стажем работы связана квалификация рабочих (тарифный разряд). Данные представлены в табл. 7.3.
Таблица 7.3
Таблица группировка рабочих по стажу работы
Группы рабочих по стажу, лет | Тарифный разряд рабочего | Число рабочих, чел. |
1-ая группа 0-5 | ||
2-ая группа 5-10 | ||
3-я группа 10 и более |
Определите:
1.средний разряд рабочих в каждой группе и по трем группам вместе;
2.общую дисперсию тарифного разряда;
3.межгрупповую дисперсию тарифного разряда;
4.групповые дисперсии и среднюю из групповых;
5.коэффициент детерминации, эмпирическое корреляционное отношение.
Объясните смысл каждой дисперсии. Проверьте правило их сложения.
Решение:
1. Поскольку мы имеем дело со сгруппированными данными, отметим элементы ряда: варианты ( ) – тарифный разряд рабочего; частоты ( ) – число рабочих. Для расчета среднего разряда применим формулу средней арифметической взвешенной:
.
Расчет среднего тарифного разряда:
по 1-ой группе:
по 2-ой группе:
по 3-ей группе:
Средний тарифный разряд по всей совокупности рабочих составит:
Расчеты средних тарифных разрядов удобно выполнить во вспомогательной таблице, графа 3. В этой же таблице подготовим сведения для расчета дисперсий.