Механизм проведения группировки данных
При разделении исходных данных на группы необходимо придерживаться определенной последовательности действий или механизма.
Прежде всего, необходимо выделить группировочный признак, который будет положен в основание группировки.
Во-вторых, необходимо определить количество групп и величину интервала группировки. Вопрос о числе групп следует решать с учетом множества обстоятельств.
Если в основание группировки положен качественный признак, то групп будет столько, сколько существует градаций этого признака. Например, если в основание группировки рабочих предприятия положен группировочный признак – пол, то групп будет всего две: мужчины и женщины.
Если группировка проводится по количественному признаку, то следует учитывать численность изучаемой совокупности и степень колеблемости группировочного признака.
В случае малой численности, когда статистическая совокупность включает менее 30 единиц, то целесообразно выделить три группы, характеризующие передовую, отстающую части и «золотую середину». Это объясняется тем, что при небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными, что не отвечает требованию закона больших чисел.
Если изучаемая совокупность велика, то число групп определяется по формуле Стерджесса:
,
где N – количество единиц в изучаемой статистической совокупности.
Величина интервалов в этом случае принимается равной для всех групп и определяется по формуле:
,
где xmax и xmin – это максимальное и минимальное значения признака в совокупности;
m – число групп.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот.
Пусть произведена группировка рабочих предприятия по величине производительности труда (деталей за смену) и выделено 5 групп с равными интервалами: 10 - 15; 15 - 20; 20 - 25; 25 - 30; 30 - 35.
На практике может возникнуть случай, когда производительность труда рабочего составляет 20 деталей за смену. Возникает неопределенность: к какой группе его отнести, ко второй или третьей? Для устранения подобного рода неопределенности используют принцип единообразия — левая граница интервала включает в себя обозначенное значение, а правая — не включает. Таким образом, работник, производительность труда которого составляет 20 деталей, должен быть отнесен к третьей группе.
В случае если в основание группировки положено несколько признаков, то необходимо привести описание того, как они комбинируются между собой.