Принципы построения статистических группировок
Приемы проведения статистических группировок весьма разнообразны и зависят от задач, которые в соответствии с целью исследования ставятся перед группировками. Однако, построение группировки почти всегда начинается с определения состава группировочных признаков. Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. В каждом конкретном исследовании включение признака в состав группировочных должно быть теоретически обосновано.
После определения основания группировки решается вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Следует учесть, что с одной стороны большое количество групп, более полно описывает характер исследуемого объекта. С другой стороны большое количество групп затрудняет выявление закономерности при исследовании социально-экономических явлений. Поэтому эта проблема решается в каждом конкретном случае (учитывая, особенности объекта и цели исследования).
Существуют стандартные процедуры, с помощью которых определяются число групп:
1) определение числа групп с использованием формулы Стерджесса (применение формулы даёт хорошие результаты, если совокупность состоит из большого числа единиц):
(3.1)
где n-число групп; N-число единиц совокупности.
2) определение числа групп на основе применения показателя среднего арифметического отклонения (s). Если величина интервала равна 0,5s, то совокупность разбивается на 12 групп, когда величина равна 2/3s и s, то совокупность делится соответственно на 6 и 9 групп.
После определения числа групп следует определить интервалы группировки.
Интервал-это значение варьирующего признака, лежащее в определенных границах. Интервал очерчивает количественные границы групп.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы в зависимости от их величины бывают:
равные, когда разность между max и min значениями в каждом из интервалов одинакова. Величина равного интервала определяется по формуле:
(3.2)
где h- величина равного интервала (шаг интервала);
R=Xmax-Xmin - размах вариации; n-число групп.
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значение, а значение несколько превышающие минимум, и несколько меньше, чем максимум.
Полученную по формуле (3.2) величину округляют, и она будет являться шагом интервала.
Группировку с равными интервалами применяют, когда вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер.
Группировку с неравными интервалами применяют в том случае, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно.
В зависимости от ограниченности различают интервалы:
открытые, когда указана только одна граница (верхняя или нижняя);
закрытыми, когда обозначены обе границы.
Пример
Имеются следующие выборочные данные по 20 предприятиям одной из отраслей промышленности:
№ предприятия | Численность ППП, чел | Выпуск продукции, млн. д.ед. | № предприятия | Численность ППП, чел | Выпуск продукции, млн. д.ед. |
99,0 | 147,0 | ||||
27,0 | 101,0 | ||||
53,0 | 54,0 | ||||
57,0 | 44,0 | ||||
115,0 | 94,0 | ||||
62,0 | 178,0 | ||||
86,0 | 95,0 | ||||
19,0 | 88,0 | ||||
120,0 | 135,0 | ||||
55,0 | 71,0 |
Произведем анализ имеющихся данных, с целью выявления зависимости между размером выпускаемой продукции и численностью промышленно производственного персонала, используя метод группировок.
В качестве группировочного признака примем стоимость выпускаемой продукции.
Для установления числа групп в совокупности воспользуемся формулой Стерджесса (см. 3.1.):
Для образования групп предприятий по выпуску продукции определим величину интервала, используя формулу 3.2.
i = (178,0-19,0)/5 = 159 / 5 = 31,8
Представим группировку предприятий по стоимости производимой продукции в таблице 3.3.
Таблица 3.3