Атрибутивные и вариационные ряды распределения
В результате сводки и типологической группировки статистических данных по некоторому группировочному признаку составляется статистический ряд распределения – распределение единиц статистической совокупности по однородным группам.
Ряд распределения, образованный по атрибутивному или количественному признаку, называется соответственно атрибутивным или вариационным рядом распределения. Вариационный ряд, образованный по дискретному или непрерывному признаку, называется соответственно дискретным или интервальным.
Любой ряд распределения можно представить в виде таблицы, состоящей из двух граф.
В первой графе таблицы, представляющей дискретный или атрибутивный ряд распределения, записываются значения соответствен-но дискретного или атрибутивного группировочного признака, а во второй графе - для каждого значения указывается частота – число единиц статистической совокупности, имеющих это значение. Значение дискретного признака называется вариантой. Варианты записываются в порядке возрастания или убывания.
В первой графе таблицы, представляющей интервальный ряд распределения, записываются последовательные интервалы значений группировочного непрерывного признака, а во второй графе - для каждого интервала указывается частота – число единиц статисти-ческой совокупности, у которых значения группировочного признака входят в этот интервал.
Интервал записывается в виде a-b и читается от a до b, он содержит левую границу а и не включает правую границу b.
Сумма
n= = (1.5.1)
частот , совпадающая с объемом статистической совокупности, называется объемом ряда распределения.
Отношение частоты к объему ряда распределения называется относительной частотой или частостью. Относительная частота, выраженная в процентах, характеризует варианту или интервал в процентах к итогу.
Если число интервалов значений непрерывного признака и их длины не заданы, то единицы статистической совокупности сначала группируются с помощью равных по длине интервалов. Число интервалов зависит от объема статистической совокупности (N) и определяется по формуле Стерджесса:
, (1.5.2)
а длина интервала - по формуле:
, (1.5.3)
где - наименьшее из данных значений признака;
- число, которое больше наибольшего из данных значений признака на единицу меньшего разряда (при таком выборе числа наибольшее из данных значений признака входит в последний интервал).
Рекомендуется длину интервала округлять с избытком с той точностью, с которой даны значения группировочного признака.
Иногда первый интервал указывается без левой границы, а последний интервал – без правой границы. Для таких интервалов условно определяют длину, равную соответственно длине второго интервала и длине предпоследнего интервала.
Если частоты интервального ряда с равными по длине интервалами возрастают до определенного значения, а затем убывают, то статистическую совокупность можно считать однородной по группировочному признаку, а группировку – правильной. В противном случае, для учета неоднородности статистической совокупности надо, изменяя длины некоторых интервалов, получить возрастающую, а затем убывающую последовательность частот.
Для каждого интервального ряда определяется соответст-вующий ему дискретный ряд с теми же частотами, вариантами которого являются середины интервалов.
В случае, когда дискретный признак имеет большое число различных значений, ряд распределения по этому признаку записывают в виде интервального ряда, у которого интервалы содержат свои границы, а границы смежных интервалов не совпадают. Например, 5-20, 21-22.
Рассмотрим группировку единиц статистической совокупности по дискретному группировочному признаку на следующем примере.
Пример 1.5.1.В результате статистического наблюдения за продажей в обувном магазине мужской обуви были получены следующие данные о размере проданных 40 пар обуви:
38, 40, 42, 41, 39, 40, 38, 40, 43, 41, 40, 39, 38, 40, 42, 42, 42, 41, 40, 41, 39, 41, 40, 38, 37, 44, 43, 42, 39, 44, 41, 40, 42, 41, 42, 41, 41, 40, 41, 39.
Чтобы сгруппировать пары обуви по размеру (группировочный признак - размер обуви), надо для каждого из данных номеров разме-ра обуви подсчитать, сколько раз он встречается в данном ряду чисел, т.е. для каждой варианты найти ее частоту.
Частоты можно находить непосредственным подсчетом, но при большом числе данных можно использовать Microsoft Office Excel.
После запуска Excel появляется лист, состоящий из столбцов и строк. Пересечение строки и столбца (прямоугольник) называется ячейкой. В ячейки можно записывать числа и формулы.
Формула состоит из знака равенства и арифметического или алге-браического выражения, составленного из круглых скобок, цифр (или адресов ячеек, в которых записаны числа), знаков функций и ариф-метических действий: + (сложение), - (вычитание), * (умножение), / (деление), ^ (возведение в степень).
Рис. 1.5.1. Частоты распределения пар обуви по размерам
Для вычисления частот дискретного ряда распределения пар обуви по размерам надо (рис. 1.5.1):
1) в ячейки А1-D10 записать номера размеров пар обуви;
2) в ячейки E1-E8 записать варианты 37, 38, 39, 40, 41, 42, 43, 44;
3) в ячейку F1 записать функцию =ЧАСТОТА() и выбрать ОК;
4) выделить ячейки А1-D10;
5) выбрать Массив интервалов, выделить ячейки E1-E8 и выбрать ОК;
6) выделить ячейки F1-F9 (на 1 ячейку больше, чем было выделено на шаге 5), на клавиатуре нажать клавишу F2и три клавиши Ctrl+Shift+Enter.
Записывая варианты и вычисленные частоты в табл. 1.5.1, получим дискретный ряд распределения пар обуви по размерам.
Таблица 1.5.1
Распределение пар
Обуви по размерам
Размер обуви - | Количество пар обуви - |
Пример атрибутивного ряда распределения приведен в табл. 1.5.2.
Таблица 1.5.2