Принципы построения статистических группировок

Приемы проведения статистических группировок весьма разнообразны и зависят от задач, которые в соответствии с целью исследования ставятся перед группировками. Однако, построение группировки почти всегда начинается с определения состава группировочных признаков. Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. В каждом конкретном исследовании включение признака в состав группировочных должно быть теоретически обосновано.

После определения основания группировки решается вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.

Следует учесть, что с одной стороны большое количество групп, более полно описывает характер исследуемого объекта. С другой стороны большое количество групп затрудняет выявление закономерности при исследовании социально-экономических явлений. Поэтому эта проблема решается в каждом конкретном случае (учитывая, особенности объекта и цели исследования).

Существуют стандартные процедуры, с помощью которых определяются число групп:

1) определение числа групп с использованием формулы Стерджесса (применение формулы даёт хорошие результаты, если совокупность состоит из большого числа единиц):

Принципы построения статистических группировок - student2.ru

(3.1)

где n-число групп; N-число единиц совокупности.

2) определение числа групп на основе применения показателя среднего арифметического отклонения (s). Если величина интервала равна 0,5s, то совокупность разбивается на 12 групп, когда величина равна 2/3s и s, то совокупность делится соответственно на 6 и 9 групп.

После определения числа групп следует определить интервалы группировки.

Интервал-это значение варьирующего признака, лежащее в определенных границах. Интервал очерчивает количественные границы групп.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы в зависимости от их величины бывают:

равные, когда разность между max и min значениями в каждом из интервалов одинакова. Величина равного интервала определяется по формуле:

Принципы построения статистических группировок - student2.ru Принципы построения статистических группировок - student2.ru

(3.2)

где h- величина равного интервала (шаг интервала);

R=Xmax-Xmin - размах вариации; n-число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значение, а значение несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют, и она будет являться шагом интервала.

Группировку с равными интервалами применяют, когда вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер.

Группировку с неравными интервалами применяют в том случае, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно.

В зависимости от ограниченности различают интервалы:

открытые, когда указана только одна граница (верхняя или нижняя);

закрытыми, когда обозначены обе границы.

Пример

Имеются следующие выборочные данные по 20 предприятиям одной из отраслей промышленности:

№ предприятия Численность ППП, чел Выпуск продукции, млн. д.ед. № предприятия Численность ППП, чел Выпуск продукции, млн. д.ед.
99,0 147,0
27,0 101,0
53,0 54,0
57,0 44,0
115,0 94,0
62,0 178,0
86,0 95,0
19,0 88,0
120,0 135,0
55,0 71,0

Произведем анализ имеющихся данных, с целью выявления зависимости между размером выпускаемой продукции и численностью промышленно производственного персонала, используя метод группировок.

В качестве группировочного признака примем стоимость выпускаемой продукции.

Для установления числа групп в совокупности воспользуемся формулой Стерджесса (см. 3.1.):

Принципы построения статистических группировок - student2.ru

Для образования групп предприятий по выпуску продукции определим величину интервала, используя формулу 3.2.

i = (178,0-19,0)/5 = 159 / 5 = 31,8

Представим группировку предприятий по стоимости производимой продукции в таблице 3.3.

Таблица 3.3

Наши рекомендации