Тема 3. Статистическая сводка, группировка, таблицы. Приемы статистических группировок и виды наблюдения. Использование группировок в статистике
В результате проведения статистического наблюдения индивидуальные данные превращаются в упорядоченную систему статистических показателей правовой статистики, дающих возможность в целом оценить политическую, социальную, экономическую обстановку в стране. Следовательно, статистическая сводка - систематизация единичных факторов, позволяющая перейти к обобщающим показателям, относящимся ко всей изучаемой совокупности и ее частям, и осуществлять анализ и прогнозирование изучаемых явлений и процессов. Статистические сводки различаются по ряду признаков: по сложности построения, месту проведения и способу разработки материалов статистического наблюдения.
Группировка - это процесс образования однородных групп на основе расчленения совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам. В математической статистике по юриспруденции обычно выделяют группировки по юридическим, социальным и экономическим признакам, а также по регионам и отраслям народного хозяйства.
При группировке с равными интервалами i применяются формулы:
где п - число групп;
Хтах - максимальное значение признака;
Xmin - минимальное значение признака;
N- количество элементов совокупности.
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения и таблиц. Статистические ряды распределения представляют собой упорядоченное расположение единиц измеряемой совокупности на группы по группировочному признаку.
Ряды распределения, образованные по качественному признаку, называются атрибутивными. При группировке ряда по количественному признаку получаются вариационные ряды. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).Результаты сводки и группировки материалов наблюдения, как правило, представляются в виде статистических таблиц.
Статистическая таблица - это таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.
Статистическая таблица имеет подлежащее и сказуемое. Подлежащее статистической таблицы характеризует объект исследования. В подлежащем дается перечень единиц совокупности либо групп исследуемого объекта по существенным признакам. Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, т. е. подлежащее таблицы.
В зависимости от структуры подлежащего различают статистические таблицы простые, в подлежащем которых дается простой перечень единиц совокупности, и сложные, подлежащее которых содержит группы единиц совокупности по одному (групповые) или нескольким (комбинационные) количественным либо атрибутивным признакам.
Рассмотрим методику построения аналитической группировки на примере 30 коммерческих банков одного из регионов России (табл.1).
В качестве группировочного признака возьмем сумму активов баланса и по этому показателю построим ранжированный ряд от минимального значения до максимального.
Определим число групп с использованием формулы Стерджесса:
где n - число групп;
N - число единиц совокупности.
п = 1 + 3,322 lg30 = 5,90, или примерно 6 групп.
Затем определяем величину интервала по формуле:
Таблица 1. Основные показатели деятельности 30 коммерческих банков одного из регионов России на 1 января 2008г.
№ п/п | Сумма активов баланса, тыс. руб. | Численность занятых, | Балансовая прибыль, |
Существуют следующие правила записи числа интервала. Если величина интервала, рассчитываемая по формуле, представляет собой величину, которая имеет один знак до запятой (например, 0,63; 2,158; 6,74), то полученные значения целесообразно округлить до десятых и использовать в качестве шага интервала.
Если рассчитанная величина имеет две значащие цифры до запятой и несколько знаков после запятой (например, 18,475), то это значение необходимо округлить до целого числа.
В случае, когда величина интервала представляет собой трех- и более знач-ное число, ее следует округлить до ближайшего числа, кратного 100 или 50.
Так как в рассматриваемом примере рассчитанная величина интервала представляет собой четырехзначное число, округлим его до 1100 тыс. руб.
Далее обозначим границы групп с равными интервалами:
- группа 1: до 1 600;
- группа 2: 1 600-2 700;
- группа 3:2 700-3 800;
- группа 4: 3 800-4 900;
- группа 5: 4 900-6 000;
- группа 6: 6 000 и более.
После того как выбран группировочный признак - сумма активов баланса, устанавливаем число групп - 6 и образуем группы.
Затем отбираем показатели, которые характеризуют группы, и определяем величины показателей по каждой группе.
Результаты группировки заносятся в таблицу, определяются общие итоги по совокупности единиц наблюдения по каждому показателю (табл.2).
Таблица 2. Группировка коммерческих банков одного из регионов России по сумме активов баланса на 1 января 2008 г. (итоговая таблица).
№ группы | Группы банков по сумме активов баланса, тыс. руб. | Число банков, ед | Сумма активов бланса, тыс. руб. | Численность занятых, чел. | Балансовая прбыль, тыс. руб. |
До 1600 | |||||
1600-2700 | |||||
2700-3800 | |||||
3800-4900 | |||||
4900-6000 | |||||
6000 и более | |||||
Итого: |
Структурная группировка коммерческих банков на основе данных табл. 2 представлена в табл.3.
Таблица 3. Структурная группировка коммерческих банков одного из регионов России по сумме активов баланса на 1 января 2008 г._
№ группы | Группы банков по сумме активов баланса, тыс. руб | Число банков, ед. | Сумма активов бланса, тыс. руб. | Численность занятых, чел. | Балансовая прбыль, тыс. руб. |
До 1600 | 23,3 | 5,9 | 10,1 | 4,4 | |
1600-2700 | 20,0 | 13,6 | 16,2 | 7,9 | |
2700-3800 | 23,3 | 24,8 | 23,5 | 13,7 | |
3800-4900 | 16,7 | 22,0 | 21,1 | 20,8 | |
4900-6000 | 6,7 | 11,8 | 9,5 | 18,1 | |
6000 и более | 10,0 | 21,9 | 19,5 | 35,1 | |
Итого: |
Из таблицы 3 видно, что в основном преобладают средние банки - 60%, на долю которых приходится 60,4% суммы активов баланса и 60,8% занятых работников.
Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки (табл. 4).
Таблица 4. Аналитическая группировка коммерческих банков одного из регионов России по сумме активов баланса на 1 января 2011г
№ группы | Группы банков по сумме активов баланса, тыс. руб. | Число банков, ед. | В среднем на один банк | |||
Сумма активов бланса, тыс. руб. | Численность занятых, чел. | Балансовая прбыль, тыс руб. | ||||
До 1600 | ||||||
1600-2700 | ||||||
2700-3800 | ||||||
3800-4900 | ||||||
4900-6000 | ||||||
б | 6000 и более | |||||
В среднем на один банк: | - | |||||
Данные табл.4 характеризуют взаимосвязь суммы активов баланса, численности занятых работников и балансовой прибыли банков. Чем больше сумма активов баланса банка, тем больше численность его работников и балансовая прибыль. В шестой группе банков средняя численность занятых в 4,5 раза больше, чем в первой группе, а балансовая прибыль - в 18,7 раз. Следовательно, крупные банки работают эффективнее.
Аналитические группировки позволяют установить связь и определить направление между результативным и факторными признаками. Но часто этого бывает недостаточно, так как на самом деле на изменение величины результативного признака оказывает влияние множество факторов, действующих в разных направлениях. Для изучения таких многофакторных связей используют многомерные группировки. Их целью является расчленение совокупности социально-экономических явлений на качественно однородные группы по большому числу признаков одновременно и определение на основе этих групп влияния факторных признаков на результативный. В основу построения многомерной группировки положен принцип перехода от величин, имеющих определенную размерность (рубли, тонны, гектары и т. д.), к безразмерным относительным величинам. Абсолютные значения результативного признака заменяются отношениями:
где
а абсолютные значения факторных признаков - отношениями:
, где
В результате такой замены получается матрица отношений.
Если связь между результативным и факторными признаками обратная, то для
каждой единицы объекта исследования определяется величина —.
На основе отношений исчисляется показатель,
где k - числофакторных признаков.
Этот показатель и будет основанием многомерной группировки, которая покажет взаимосвязь между множеством исследуемых факторных признаков и одним результативным признаком.
На основе многомерной группировки можно построить уравнение регрессии, которое отразит количественно степень связи между признаками.
Литература [1, 2, 4]
Контрольные задания.
Группировка
Задача № 1. При изучении розничных цен на молочные продукты в коммерческих магазинах города Ставрополя в течение апреля 2006 г. была проведена ежедневная регистрация цен:
4,50 | 4,60 | 3,20 | 4,00 |
3,50 | 6,00 | 4,20 | 3,28 |
5,00 | 4,33 | 4,80 | 5,50 |
3,75 | 3,80 | 5,10 | 4,90 |
Требуется:
1. Составить интервальный ряд распределения розничных цен на молочные продукты, выделив три группы с равными интервалами.
2. Построить гистограмму распределения и определить модальный интервал. 3.Полученные результаты проанализировать.
Задача № 3. При изучении покупательского спроса на обувь зарегистрирована
Для сообщения данных реализованного спроса постройте ряд распределения и проанализируйте полученные результаты, сравнив их с типовой шкалой поставки обуви в магазин.
Типовая шкала поставки обуви:
Размер | Всего | ||||
Число пар в % к итогу |
Данные распределения покупательского спроса и типовой шкалы производства обуви изобразите на графике. Укажите модальную величину ряда распределения. Результаты разработок изложите в таблице и сделайте выводы о соответствии предложения обуви покупательскому спросу.
Задача № 4. По нижеследующим данным построить группировку рабочих по тарифным разрядам
Построить ряды и полигон распределения.
Задача № 5. При изучении покупательского спроса в обувном магазине зареги стрирована продажа следующих размеров мужской обуви:
Построить ряд и полигон распределения мужской обуви по размерам
Задача № 6. Имеется следующий ранжированный ряд 60 рабочих по возрастанию стажа работы (в годах):
0,6 | 0,8 | 1.2 | 1,5 | 2,1 | 2,5 | 3,0 | 3,1 | 3,2 | 4,2 |
4.5 | 4,8 | 5,2 | 5,6 | 5,8 | 6,1 | 6Д | 6,5 | 6,8 | 6,9 |
7,1 | 7,1 | 7,2 | 7,2 | 7,4 | 8,2 | 8,2 | 8,4 | 8,5 | 8,5 |
8,5 | 8,6 | 8,8 | 8,8 | 9,1 | 9,2 | 9.2 | 9.4 | 9,6 | 9,8 |
10,3 | 10,4 | 10,6 | 11,2 | н,з | П,5 | 11,6 | 11,8 | 11,8 | 12,6 |
12,8 | 12,8 | 13,2 | 13,2 | 13,4 | 13,9 | 14,6 | 14,8 | 15,1 | 15,5 |
Построить интервальный ряд и гистограмму распределения рабочих по стажу работы.
Задача №7. Построить интервальный ряд и гистограмму распределения по следующим данным, имеющимся в одном из банков, об остатках на текущих счетах отдельных организаций на конец месяца (млн. руб.):
1028: | ||||
Ряд распределения построить с равными интервалами, при этом необходимо образовать 5 групп.
Задача № 8. Построить интервальный ряд и гистограмму распределения сельскохозяйственных рабочих по дневному сбору клубники (в кг) на основании следующих данных:
16,1 | 17,4 | 17.9 | 18,0 | 18,4 | 19.8 | 19.1 | 15.6 |
16.8 | 21.9 | 15,8 | 18,7 | 16.4 | 17Д | 18.0 | 20,7 |
17,4 | 19,3 | 18.0 | 19,0 | 17,3 | 15,6 | 18.9 | 18,3 |
18.6 | 21,3 | 20.9 | 17,5 | 20,3 | 18.7 | 19,1 | 20,2 |
21.9 | 18,3 | 15,7 | 18,4 | 17.6 | 16,6 | 16,1 | 17,0 |
17.2 | 16,4 | 19,9 | 17,4 | 17,5 | 17,4 | 19.2 | 20,9 |
19.7 | 18.0 |