Сложение дисперсий изучаемого признака
По сравнению с другими показателями вариации дисперсия имеет ряд преимуществ. Главное преимущество получило название закона (правила) сложения дисперсий.
Мы уже неоднократно говорили о том, что даже в качественно однородных массовых явлениях в развитии отдельных групп единиц проявляется своеобразие. Поэтому применяется метод группировки к изучаемой совокупности. Итак:
· по всей совокупности мы можем рассчитать общую среднюю для всей совокупности;
· по отдельным группам соответственно можно рассчитать групповые или частные средние.
Тогда можно вычислить три показателя дисперсии:
1) общую дисперсию;
2) среднюю из внутригрупповых дисперсий;
3) дисперсию групповых средних (или межгрупповую дисперсию).
Величина общей дисперсии ( ) характеризует вариацию признака под влиянием всех условий, вызывающих эту вариацию. Общая дисперсия, как познакомились выше, вычисляется по формуле
.
Изменчивость индивидуальных значений (вариант) признака внутри групп происходит под влиянием других, не учитываемых факторов и не зависит от признака – фактора, положенного в основу группировки. Внутригрупповая дисперсия определяется как взвешенная средняя из дисперсий по отдельным группам, т.е. по формуле
.
Межгрупповая дисперсия (дисперсия средних) отражает различия в величине изучаемого признака в “чистом виде”, т.к. влияние других факторов, специфических для каждой группы, невилированы в групповых средних и определяется по формуле
Рассмотрим пример. Имеются данные о производительности труда в двух группах рабочих, прошедших и не прошедших техническое обучение.
Часовая выработка (в штуках), В | Рабочие, прошедшие техническое обучение | Рабочие, не прошедшие техническое обучение | Всего |
- | |||
- | |||
- | |||
- | |||
Всего |
Определим величину общей дисперсии:
.
Определим величины групповых дисперсий и среднюю их значений:
а) по рабочим, прошедшим техническое обучение:
B | ||||
-0,75 | 0,5625 | 2,250 | ||
0,25 | 0,0625 | 0,125 | ||
1,125 | 1,5625 | 3,125 | ||
Всего | - | - | 5,500 |
= 4,75 шт.;
б) по рабочим, не прошедшим техническое обучение:
B | ||||
-2 | 4,0 | |||
-1 | 3,0 | |||
0,0 | ||||
3,0 | ||||
4,0 | ||||
Всего | - | - | 14,0 |
= 3 шт. .
Отсюда внутригрупповая дисперсия будет равна:
Определим величину межгрупповой дисперсии (дисперсию групповых средних):
Группы рабочих | Число рабочих по группе | Средняя часовая выработка 1 рабочего | |||
прошедшие техническое обучение | 4,75 | 1,05 | 1,1025 | 8,82 | |
не прошедшие техническое обучение | 3,00 | -0,7 | 0,4900 | 5,88 | |
Всего | - | - | 14,7 |
Отсюда .
Нетрудно заметить на этом примере, что указанные дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме величин межгрупповой дисперсии (дисперсии групповых средних) и средней из внутригрупповых дисперсий, т.е.
.
В нашем примере 1,71=0,975+0,735
Это тождество получило название закона (правила) сложения дисперсий.
Опираясь на это правило можно определить, которая часть общей дисперсии формируется под влиянием изучаемого фактора, положенного в основу группировки (отражает так называемую систематическую вариацию) и какая часть – за счет неучтенных факторов.
Средняя из групповых дисперсий ( ) дает обобщенную характеристику случайной вариации изучаемого признака, возникающего под влиянием неучтенных факторов.
Теоретический и практический интерес правила сложения дисперсий заключается в следующем:
1) зная две дисперсии можно всегда определить третий вид дисперсии;
2) зная дисперсию групповых средних (межгрупповую дисперсию) и общую дисперсию можно судить о силе влияния группировочного признака на изучаемое явление.
Например, изучаем влияние на общую урожайность внесения удобрений. Очевидно, чем ближе будет дисперсия групповых средних (когда все земельные участки сгруппированы на удобренные и неудобренные) к общей дисперсии, тем больше будет влияние внесения удобрений на общую урожайность.
В математической статистике для оценки тесноты связи с использованием этого правила обоснована формула корреляционного отношения:
, где .
8.10. Упрощенные способы вычисления средней арифметической и
среднего квадратического отклонения
Основными характеристиками любого статистического исследования, когда статистический материал представлен рядами распределения, являются средняя арифметическая и среднее квадратическое отклонение. При этом следует иметь в виду, что ряды распределения получаются уже при группировке данных. Среднюю арифметическую и среднее квадратическое отклонение можно определять и по необработанным наблюдениям. В этом случае целесообразно воспользоваться упрощенными способами их расчетов (конечно, при совпадении результатов).
Пусть из анализа индивидуальных значений признака установлено начало отсчета отклонений от некоторого индивидуального значении, принятого за условное начало А. В этом случае по свойству средней арифметической имеем:
,
где - называется моментом первого порядка.
Для сгруппированных данных этот подход приводит к формуле вида:
,
где .
В некоторых случаях этот способ рекомендуется реализовать с использованием формулы:
, где .
В качестве А применяется обычно одна из центральных варрант ряда, если ряд имеет нечетное число единиц совокупности. При четном числе признаков берется среднее значение из двух вариант с наибольшей частотой. В качестве i берется общий (наибольший) делитель индивидуальных отклонений. В интервальном ряду в качестве i целесообразно использовать величину интервала.
Аналогичным образом можно вывести формулу упрощенного вычисления среднего квадратического отклонения:
,
т.е. , то имеем
или
.
Поскольку , то можно записать
,
где - момент второго порядка, .
Для сгруппированных данных будет применяться формула
.
В некоторых случаях исходные данные можно и целесообразнее преобразовать, используя . Тогда .
Выбор А и i аналогично как и для упрощенного вычисления средней арифметической.
При таком подходе среднее квадратическое отклонение будет упрощенно определяться по формуле
, .
Такие способы вычисления среднего арифметического и среднего квадратического отклонения получили название способа моментов или способа отсчета от условного нуля.