Абсолютные показатели вариации
Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называются вариацией. Вариация существует в пространстве и во времени. Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени.
Задача изучения вариации признаков состоит в том, чтобы:
1) определить меру вариации, т. е. количественно измерить (рассчитать показатель вариации);
2) выяснить причины, которые вызвали вариацию признаков. Разложить общий объем вариации по источникам.
Измерение вариации имеет как практическое, так и теоретическое значение: при ее помощи характеризуется однородность, планомерность многих процессов (если в работе предприятия большая вариация, то это ведет к неполному использованию производственных мощностей, к браку, срыву работы смежников, так называемой “штурмовщине”). Очень важны показатели вариации при характеристике выполнения договорных обязательств по отдельным предприятиям.
Для измерения размера вариации в статистике используется система абсолютных и относительных показателей.
К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.Самым простым является размах вариации – это разность между максимальным и минимальным значениями признака (R = xmax – xmin). Основным недостатком этого показателя является то, что он определяется двумя крайними значениями, в то время как вариация признака складывается из всех его значений. Часто размах вариации имеет важное смысловое значение. Им определяются пределы, в которых могут колебаться размеры тех или иных параметров деталей при контроле качества продукции, при анализе устойчивости режима производственного процесса.
На заре статистической науки было предложено брать в качестве меры вариации среднее абсолютное значение отклонений от средней величины значений признака, не принимая во внимание их знаки. Такая мера вариации получила название среднего линейного отклонения d:
. (5.1)
Для вариационного ряда:
. (5.2)
Среднее линейное отклонение представляет средние показатели, полученные из отклонений индивидуальных значений признака от их среднего размера.
Но нельзя построить меру вариации, игнорируя основное свойство отклонений как величин, принимающих и положительные и отрицательные значения. Отсюда основной мерой вариации является дисперсия и среднее квадратическое отклонение.
Дисперсия – это средняя арифметическая квадратов отклонений каждого значения признака от средней величины. В зависимости от исходных данных дисперсия может вычисляться по средней арифметической простой
(5.3)
или взвешенной
. (5.4)
Среднее квадратическое отклонение – показатель степени однородности изучаемой совокупности. Поэтому он может быть использован для оценки надежности средней арифметической. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:
; (5.5)
для вариационного ряда:
. (5.6)
Среднее квадратическое отклонение σ выражается в тех же единицах измерения, что и исходные значения xi. Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности.
Техника вычисления дисперсии сложна, а при больших значениях вариант и частот может быть громоздкой. Расчеты можно упростить, используя свойства дисперсии:
1. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:
. (5.7)
2. Уменьшение всех значений признака в k раз уменьшает дисперсию в k2 раз:
.(5.8)
3. Дисперсия от средней всегда меньше дисперсии, исчисленной от любой другой величины, на квадрат разности средней и условно взятой величины
. (5.9)
При расчете дисперсии используются и другие свойства. Каждое свойство может быть применено самостоятельно или в сочетании с другими. Используя эти свойства и применяя способ моментов, можно достаточно быстро исчислить дисперсию. Этим способом удобно пользоваться, когда значения признака заданы в виде рядов распределения с равными интервалами:
, (5.10)
где h – величина интервала;
А – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой.
В случае, когда А приравнивается к нулю, следовательно не вычисляются отклонения, формула принимает такой вид:
(5.11)
или
. (5.12)
В статистике используют условные моменты m1, m2, m3 и центральные моменты М2, М3, необходимые для расчета дисперсии и среднего квадратического отклонения.
Величину m1 называют моментом первого порядка:
. (5.13)
Величину m2 называют моментом второго порядка:
. (5.14)
Величину m3 называют моментом третьего порядка:
. (5.15)
Используются центральные моменты М2, М3:
; (5.16)
. (5.17)
Учитывая это, формулы дисперсии и среднего квадратического отклонения можно записать так:
; (5.18)
. (5.19)
Пример. По данным о времени горения электроламп, приведенным в табл. 4.1, рассчитать дисперсию по способу моментов.
Решение. По формуле (5.10) рассчитаем дисперсию
Исчислим дисперсию по формуле (5.18) через условные моменты для приведенного примера:
Альтернативными признаками называются признаки, которыми обладают одни единицы совокупности и не обладают другие. Наличие признака обозначим единицей, отсутствие нулем. Долю вариантов, обладающих данным признаком обозначим p, а не обладающих им – q. Так как p + q = 1, то дисперсия альтернативного признака ,
,
где n – число наблюдений;
m – число единиц совокупности, обладающие данным признаком [1, 3–7].