Сводка и группировка статистических данных
Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группировку материалов, составление таблиц, получение итогов по группам и в целом. Программа сводки включает определение групп и подгрупп, системы показателей и видов таблиц. По технике и способу выполнения сводка может быть ручной либо механизированной.
Группировка – разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов называется классификацией или стандартом, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Метод группировки основывается на двух категориях – группировочном признаке и интервале.
Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует). Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования взаимосвязи факторных и результативных признаков. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная и аналитическая. В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки. Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.
Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:
где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.
В нашем примере про студентов по формуле Стерждесса определим число групп: k = 1 + 3,322lg20 = 5,32. Так как число групп не может быть дробным, то округляем k = 5,32 до ближайшего целого числа по правилам округлений - 5.
Зная число групп, рассчитывают длину (размах) интервала по формуле: