Построение статистических группировок

1. Выбор группировочного признака – признака, по которому производится разбиение совокупности на отдельные группы. В качестве признака необходимо использовать существенные обоснованные признаки.

По форме выражения группировочные признаки бывают атрибутивными(не имеющими количественного выражения, например, профессия) иколичественными(например, число филиалов, величина дохода). При этом количественные признаки могут бытьдискретными(прерывными, значения которых выражаются только целыми числами, например, число филиалов) инепрерывными(принимающими как целые, так и дробные значения, например, величина дохода).

По характеру колеблемости группировочные признаки бывают альтернативными, которыми одни единицы обладают, а другие – нет (например, товары – качественные или некачественные), и имеющими множество количественных значений (например, число филиалов, величина дохода).

По роли во взаимосвязи изучаемых явлений признаки подразделяются на факторные, воздействующие на другие признаки, ирезультативные, испытывающие на себе влияние других.

2.Выбор количества групп. Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки - количественный признак, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. В каждом конкретном случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования.Если совокупность состоит из большого числа единиц и распределение единиц по группировочному признаку близко к нормальному, используют формулу Стерджесса:

n= 1+3,322 *lgN

3. Определение интервала группировки. Интервал – это значение варьирующего признака, лежащее в определенных границах. Под величиной интервала понимают разность между максимальным и минимальным значениями признака в группе. При этом максимальное значение признака в группе называется верхней границей интервала, а минимальное – нижней границей. В зависимости от степени колеблемости группировочного признака, характера распределения статистической совокупности устанавливаются интервалы равные или неравные. Если вариация признака происходит в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами; величина интервала определяется по формуле:

где xmax – максимальное значение признака в изучаемой совокупности

xmin – минимальное значение признака в изучаемой совокупности

n – количество групп

В экономической практике чаще применяются неравные интервалы, прогрессивно возрастающие или убывающие. Такая необходимость возникает, когда колеблемость признака осуществляется неравномерно и в больших пределах.

Примеры решения задач

Пример 1.Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность сотрудников составляет 120 человек, а минимальный и максимальный доход соответственно равен 500 и 6500 руб.

Решение.

Количество групп равно n=1+3,322*lg120=8

Величина интервала руб.

Интервалы выглядят следующим образом:

№ группы Величина интервала группировки
500-1250
1250-2000
2000-2750
2750-3500
3500-4250
4250-5000
5000-5750
5750-6500

Пример 2.Имеются следующие данные о количестве филиалов каждого из двадцати банков в городе.

Количество филиалов в городе у разных банков: 2, 4, 3, 5, 4, 4, 6,5,4, 3, 4, 3, 4, 5, 3, 4, 6, 3, 5, 4

Построить ряд распределения по имеющимся данным. Дать графическое изображение ряда распределения.

Решение.

Вариация признака носит дискретный характер, число вариант дискретного признака невелико, и значения признака у отдельных единиц совокупности повторяются. Поэтому строится дискретный ряд распределения. Для его построения следует перечислить все встречающиеся варианты значений признака и подсчитать частоту повторения.

Дискретный ряд распределения, построенный по данным, выглядит следующим образом

Количество филиалов в городе организации, х Число банков (или частота, f) Частость, w Накопленная частота, S
1/20=0,05
5/20=0,25 1+5 =6
8/20=0,40 6+8= 14
4/20=0,20 14+4= 18
2/20=0,10 18+2= 20
Итого 1,00  

Частость w рассчитана как отношение соответствующей частоты к общей сумме частот.

По полученному дискретному ряду распределения строится полигон частот.

Для построения кумуляты следует рассчитать накопленные частоты S. Накопленная частота первой варианты равна частоте первого интервала, т.е. всего 1 банк в городе имеет не больше двух филиалов. Накопленная частота второй варианты равна сумме частот первой и второй вариант (или сумме накопленной частоты первой варианты и частоты второй варианты), т.е. не больше трех филиалов имеют 6 городских банков: у пяти из них по 3 филиала, у одного – 2 филиала. Остальные накопленные частоты определяются аналогично. Накопленная частота последней варианты равна сумме всех частот ряда: все банки в городе имеют не больше 6 филиалов.

Пример 3.Имеются следующие данные о размере прибыли двадцати коммерческих банков. Прибыль, млн. руб.:

3,7 4,3 6,7 5,6 5,1 8,1 4,6 5,7 6,4 5,9 5,2 6,2 6,3 7,2 7,9 5,8 4,9 7,6 7,0 6,9

Построить ряд распределения по имеющимся данным. Дать графическое изображение ряда распределения.

Решение.Вариация признака носит непрерывный характер, значения признака у отдельных единиц совокупности не повторяются. Поэтому строится интервальный ряд распределения. Для его построения следует определить количество интервалов и величину интервала.

Т.к. количество интервалов заранее не задано, определим его по формуле Стерджесса: n=1+3,322*lg20=1+3,322*1,3= 5,3 Дробное число, характеризующее количество интервалов, желательно округлять в меньшую сторону. Т.о.,n=5

Величина интервала h=(8,1-3,7)/5=0,88 Число, характеризующее величину интервала, округляется с той же точностью, что и исходные данные. В нашем случае следует округлить до 0,1:h=0,9.

Строим интервальный ряд распределения:

№ группы Группы по размеру прибыли х Число банков (частота) f Частость, w Накопленная частота S
3,7 – 4,6 0,15
4,6 – 5,5 0,15
5,5 – 6,4 0,35
6,4 – 7,3 0,2
7,3 – 8,2 0,15
Итого  

При подсчете частот воспользуемся принципом «включительно», согласно которому единица совокупности, имеющая значение признака, равное границе двух смежных групп (например, банк с прибылью 4,6 млн. руб.), включается в интервал, где он служит верхней границей (банк с прибылью 4,6 млн. руб. включим в группу с размером прибыли от 3,7 до 4,6 млн. руб.).

Расчет частостей и накопленных частот производится аналогично расчету в дискретных рядах распределения.

По полученным значениям частот строится гистограмма распределения, по накопленным частотам – кумулята.

Лабораторная работа №1

Наши рекомендации