К вопросу 7. Коэффициент вариации
До сих пор мы изучали показатели, которые были выражены в абсолютных величинах, т. е. в тех же именованных числах, что и варьирующий признак (в данном примере — в килограммах).
Однако квадратическое отклонение, как и всякая абсолютная величина, недостаточно наглядно характеризует колеблемость вариант вокруг средней величины.
О том, насколько велико это отклонение, можно судить только при расчете коэффициента вариации.
Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической и выражается в процентах.
Коэффициент вариации рассчитывается по формулам:
а) для среднего квадратического отклонения (простого):
и в нашем примере составит:
б) для среднего арифметического отклонения (взвешенного):
т.е.
Коэффициент вариации является отвлеченным числом и поэтому он наиболее удобен в измерении вариации признаков.
Кроме того, этот показатель можно использовать для сравнения колеблемости совокупностей как с одинаковыми, так и с различными признаками.
Пример. Предположим, что мы определяем колеблемость веса одной кипы шерсти по двум партиям путем сравнения коэффициентов вариации I и II партий. Это будет сравнение колеблемости совокупностей, имеющих одинаковые признаки. Или, например, требуется сравнить, что больше колеблется: средний объем товарооборота одной торговой фирмы или средний размер площади торгового зала, т. е. сравниваем совокупности с разными признаками и определяем степень колеблемости этих различных признаков путем вычисления коэффициентов вариации.
Дисперсия
Дисперсия — это средний квадрат отклонения всех значений признака ряда распределения от средней арифметической.
Именно дисперсия и среднее квадратическое отклонение являются основными наиболее употребляемыми показателями вариации.
Обозначается дисперсия буквой
где х — значение признака;
- средняя арифметическая;
п — численность совокупности.
Но
Поделив это выражение на п, учтем, что . Тогда
т. е. дисперсия равна разности среднего квадрата вариантов и квадрата их средней (подразумевая здесь под "средней" среднюю арифметическую). И, наконец,
Заменяя в формуле определения дисперсии (Dx) среднее суммами, разделенными на численность совокупности, получим формулу:
имеющую некоторые технические преимущества для ее вычисления. При ее применении округление производится только один раз и в самом конце вычисления.
Пример. В табл. 15 приведены данные для расчета дисперсии и среднего квадратического отклонения на примере стажа продавцов торговой фирмы "Элегант", работающих в двух ее магазинах.
Для 1-го магазина:
Таблица.15
Данные для расчета дисперсии и среднего квадратического отклонения по стажу продавцов в двух магазинах фирмы "Элегант"
п/п | 1-й магазин | 2-й магазин | ||||
Стаж продавцов, лет (x) | отклонения от среднего | Квадрат отклонения | Стаж продавцов, лет (x) | отклонения от среднего | Квадрат отклонения | |
-6,2 | 38,44 | -1,2 | 1,44 | |||
-5,2 | 27,04 | -1,2 | 1,44 | |||
-4,2 | 17,64 | -0,2 | 0,04 | |||
-4,2 | 17,64 | -0,2 | 0,04 | |||
-3,2 | 10,24 | -0,2 | 0,04 | |||
б | 1,8 | 3,24 | -0,2 | 0,04 | ||
2,8 | 7,84 | 0,8 | 0,64 | |||
4,8 | 23,04 | 0,8 | 0,64 | |||
2,8 | 33,64 | 0,8 | 0,64 | |||
7,8 | 60,84 | 0,8 | 0,64 | |||
Итого | 239,60 | 5,6 |
Таким образом, стаж продавцов отклоняется от среднего для первого магазина на 4,9 года, а для второго магазина — 0,75 года. Формула дисперсии для вариационного ряда с вариантами х и частотами/будет иметь вид:
где х — значение признака; — средняя арифметическая; f— частота.
Свойства дисперсии
Дисперсия обладает рядом простых свойств:
1. D(a) = 0 — дисперсия постоянной величины равна нулю.
2. — дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число.
3. — постоянный множитель выносится за знак дисперсии возведенным в квадрат. Или: если все варианты умножить на число а, дисперсия увеличиться в раз.
— это свойство носит название свойства минимальности дисперсии от средней. Дисперсия от средней меньше, чем средний квадрат отклонения от любого числа на .
Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в тех случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство дисперсии, переходят к дисперсии от средней.