Тема 6. Статистические ряды распределения и их основные характеристики
Вариация признака в совокупности
Составной частью обработки данных статистического наблюдения является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. Различают два типа рядов распределения – атрибутивные и вариационные. Ряды динамики, построенные по качественным признакам, называют атрибутивными. Ряды распределения, построенные по количественному признаку – вариационными. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различают между собой. Такое различие в величине признака носит название вариации.
Вариацией называют колеблемость значений признака при переходе одной единицы совокупности к другой. Вариационный ряд – ряд чисел характеристики распределения совокупности по величине значений определенного признака, который должен быть варьирующим. В общем виде вариационный ряд выглядит следующим образом:
X1 | X2 | … | Xi | … | Xn |
m1 | m2 | … | mi | … | mn |
f1 | f2 | … | fi | … | fn |
где X – вариационный признак. Вариант – значение варьирующего признака;
m – частота повторений значений признака, она определяет сколько раз встречается данное значение признака в совокупности;
f – частость ( ).
Показатели вариации
Показатели вариации делятся на две группы:
- абсолютные (размах вариации, среднее линейное отклонение, среднее квадратическое отклонение);
- относительные (коэффициент колеблемости, коэффициент вариации).
1. Наиболее простым является расчет показателя размаха вариации:
h = x max – x min.
Для более точной оценки колеблемости определяют среднее абсолютное и среднее квадратической отклонение. Смысл этих показателей в общем одинаков: они показывают на сколько в среднем отклоняются отдельные значения признака от их средней величины.
Среднее линейное отклонение имеет две разновидности:
- среднее линейное отклонение простое: ;
- среднее линейное отклонение взвешенное: .
Этому показателю присущ следующий недостаток – он недостаточно четко реагирует на отклонение вариационного признака. Поэтому в статистической практике наиболее часто для оценки колеблемости используют среднее квадратическое отклонение.
Среднее квадратическое отклонение имеет две разновидности:
- среднее квадратическое простое применяется для несгруппированных данных и имеет вид :
;
- среднее квадратическое взвешенное применяется, если данные сгруппированы и рассчитывается по формуле:
.
К относительным показателям вариации относятся:
- коэффициент колеблемости, который рассчитывается следующим образом:
,
где - среднее абсолютное отклонение; - среднее значение для х.
- коэффициент вариации находится по формуле:
Для характеристики вариационных рядов могут использоваться квартили, квантили и децили.
Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3; и остальные 25% превосходят Q3. Квартили определяются по формулам, аналогичным приведенной выше формуле для расчета медианы:
,
где - нижняя граница интервала, в котором находится первая квартиль;
S(-1) – сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;
.
Условные обозначения те же, что и для величины Q1.
При расчете квантиль совокупность разбивается на 5 частей, децилей – на 10 частей.