Выбор группировочных признаков. Построение статистических группировок
Признаки, по которым производится распределение единиц совокупности на группы, называются группировочными признаками, или основанием группировки.
Первым и наиболее сложным вопросом теории группировок является правильный выбор этих признаков. При отборе группировочных признаков руководствуются следующими правилами:
1) необходимо брать типичные, существенные признаки, в соответствии с целями исследования:
2) необходимо учитывать конкретные условия места и времени: уместные в одном случае признаки могут оказаться неуместными в другом случае;
3) при изучении сложных явлений группировку следует производить по нескольким признакам.
Т.е. явления необходимо перевести на язык цифр. Напомним, по возможности измерения признаки классифицируются:
Признаки |
Количественные | Атрибутивные (качественные), в т.ч. альтернативные |
прерывные | непрерывные |
Рисунок 3.1 – Классификация признаков по возможности измерений
В случае, когда группировка производится по атрибутивному признаку, количество групп равно количеству вариантов признака (например, по форме обучения – 3: дневная, вечерняя и заочная).
По альтернативному признаку образуется 2 группы с противоположными характеристиками (например, продукция: годная и брак; семейное положение: одинокие и семейные и т.д.).
При составлении группировок по количественным признакам необходимо определить количество групп и величину (ширину) интервала.
Количество образуемых групп зависит:
1) от числа единиц наблюдения;
2) от степени вариации группировочного признака;
3) от задачи исследования и особенностей изучаемого явления.
Число групп может быть задано на основе опыта предыдущих обследований. Если же вопрос приходится решать самостоятельно, то можно использовать формулу американского ученого Стерджесса:
K = 1+3,322 lg n, (3.1)
где K – число групп (всегда целое число);
n – число единиц наблюдения.
Тогда при n = 10
K = 1+3,322 lg 10 = 4,322 (принимается 4).
Соответственно, можно рассчитать:
n | K |
15 – 24 | |
25 – 44 | |
45 – 89 | |
90 – 179 | |
180 – 359 | |
360 – 719 |
Эта формула пригодна при условиях:
а) распределение единиц совокупности по данному признаку приближается к нормальному;
б) интервалы образуются равные.
Интервал – это количественное значение, отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
В зависимости от характера распределения единиц совокупности по определенному признаку интервалы могут быть: равные и неравные.
Равные интервалы образуются в тех случаях, когда вариация признака проявляется в сравнительно узких границах и распределение является практически равномерным. Ширина интервала в этом случае определяется по формуле
, (3.2)
где , – соответственно максимальное и минимальное значение признака,
либо по формуле Стерджесса:
. (3.3)
Например, 10 рабочих характеризуются следующими показателями выполнения норм выработки (НВ):
X, % выполнения норм выработки: 96, 109, 98, 102, 105, 104, 100, 106, 112 ,103.
Ширина интервала группировки для n = 10 и к = 4 определяется по формуле
.
Тогда группировка принимает вид (таблица 3.6):
Таблица 3.6 – Группировка рабочих по степени выполнения норм выработки
% выполнения НВ | Число рабочих |
96 –100 | |
100 –104 | |
104 –108 | |
108 –112 | |
n = 10 |
Неравные интервалы (как правило, прогрессивно возрастающие или прогрессивно убывающие) образуются в тех случаях, когда группировочный признак изменяется неравномерно или в больших пределах.
Например, прибыль организаций города.
X, млн. руб. 520, 3800, 157, 1900, 37850 и т.д.
Интервалы: до 100
100 – 1000
1000 – 10000
10000 – 50000
50000 и более
Образуемые интервалы могут быть: - закрытыми;
- открытыми.
Закрытыми называют интервалы, у которых указаны обе границы.
Открытыми называют интервалы с одной границей: верхней – у первого интервала; нижней – у последнего.
Если закрытым интервалам часто присуще свойство неопределенности при включении в группу тех значений, которые являются границами, то в открытых интервалах эта неопределенность убирается с помощью терминов:
«до»; «выше» или «свыше»; «более» и «менее».
Например, в таблице 3.6 рабочий с % выполнения нормы выработки = 100 % при образовании закрытых интервалов включен во вторую группу исходя их принципа «от» и «до», а рабочий с % выполнения нормы выработки = 112 % – в четвертую группу. Также в четвертую группу отнесен рабочий с % выполнения норм выработки = 108 %.
Если бы образовывались открытые интервалы, то ситуация могла бы быть следующей:
до 100 до 100
100 – 104 100 – 104
104 – 108 104 – 108
108 и более свыше 108
108 %
После того, как выбран группировочный признак, определено количество групп, составлена группировка, необходимо установить перечень показателей, которые будут характеризовать группу. Эти показатели определяют в зависимости от цели исследования и задачи группировки.
Например, по 40 предприятиям промышленности собраны сведения о численности работников, объеме товарной продукции и стоимости основных средств. На основании этой информации может быть составлена аналитическая группировка зависимости фондоотдачи от размера предприятий, макет таблицы которой имеет вид:
Таблица 3.7 – Группировка предприятий по размерам
Группы предприятий по численности работников | Объем товарной продукции | Основные средства | Фондоотдача (гр.2 : гр.4) либо (гр.3 : гр.5) | ||
На группу | На 1 предприятие группы | На группу | На 1 предприятие группы | ||
либо структурная группировка (таблица 3.8), характеризующая долю каждой группы в общих показателях промышленности.
Таблица 3.8 – Группировка предприятий по размерам
Группы предприятий по численности работников | Объем товарной продукции по группе | Доля группы в общем объеме товарной продукции | Основные средства по группе | Доля группы в общей стоимости основных средств |
… ∑ = 100 % | … ∑ = 100 % |