Сводка и группировка статистических данных
Статистическая сводка – второй этап исследования массовых общественных явлений. Суть его заключается в классификации и агрегировании первичных статистических данных. На этапе сводки элементы совокупности по принципу сходства и различия определенных признаков объединяются в группы; для характеристики выделенных групп используют систему показателей. Результаты сводки оформляются в виде статистических таблиц.
Существуют общепринятые методологические стандарты распределения совокупностей на группы – четко определенные группировочные признаки и сформулированные требования относительно условий формирования групп. Это классификации. Например, классификация отраслей промышленности, форм собственности, организационно-правовых форм субъектов ведения хозяйства.
Для решения конкретных аналитических задач проводятся нестандартные группировки по определенным признакам, которые легко распознаются. В зависимости от цели исследования и сложности массового процесса группировочных признаков может быть один, два и больше. Группировку по одному признаку называют простой, в случае сочетания двух и больше признаков – комбинационным.
На группировку в статистическом анализе возлагаются определенные функции, в частности:
а) изучение структуры и структурных сдвигов;
б) типология социально-экономических явлений;
в) анализ взаимосвязей между явлениями.
В соответствии с этими функциями различают структурные, типологические и аналитические группировки.
Структурная группировка характеризует состав однородной совокупности по определенным признакам, объемы явления и вес отдельных групп. Разновидностью структурной группировки является ряд распределения, характеристиками которого являются варианты и частоты, или доли. Варианты – этоконкретные значения группировочного признака, частоты – количества элементов совокупности, которым свойственны отдельные варианты. Относительные частоты (% к итогу) называют долями.
Типологическая группировка – это распределение качественно неоднородной совокупности на классы, социально-экономические типы, однородные группы. Основное задание такой группировки – идентификация типов, а поэтому первостепенное значение имеет выбор группировочного признака. И структурные, и типологические группировки – описательные, они характеризуют структуру совокупности, выделяя характерные ее черты и особенности, но отличаются по уровню качественных отличий между группами.
При помощи аналитической группировки выявляют наличие и направление связи между двумя признаками, из которых один представляет результат, другой – фактор, влияющий на результат. В классическом варианте аналитической группировки совокупность делится на группы по факторному признаку, и в каждой группе определяется средний уровень результативного признака. При наличии связи между факторным и результативным признаками групповые средние от группы к группе постепенно меняются – увеличиваются или уменьшаются.
При формировании групп встает вопрос об их количестве и границах каждой из них. Количество групп зависит от степени вариации группировочного признака и объема совокупности, в каждом отдельном случае его необходимо обосновать. Если группировочный признак атрибутивный, количество групп в известной степени определяется количеством наименований признака. В табл. 2.1 приведено распределение городских земель по виду застройки. Первые три группы представляют основные виды застройки, четвертая – объединяет остаток менее весомых видов. По аналитической функции – эта структурная группировка, которая характеризует масштабы и долю отдельных видов застройки в границах территории города.
Таблица 2.1
Вид городской застройки | Площадь, га | % к итогу |
Площадь под застройкой в том числе: | 100,0 | |
Промышленная | 22,1 | |
Жилая | 63,5 | |
Общественная | 10,4 | |
Другая | 4,0 |
В процессе формирования групп по вариационному признаку – непрерывному или дискретному, с широким диапазоном вариации – необходимо установить интервалы групп и определить границы каждого из них с такой точностью, чтобы распределение совокупности было однозначным.
Интервалы бывают равные и неравные, открытые и закрытые.
Равные интервалы используют при условии, что значения признака хв диапазоне вариации меняются равномерно. Ширина такого интервала определяется отношением
,
где m –количество групп,
( ) - размах вариации.
Например, прибыльность активов коммерческих банков колеблется от 5 до 45%. При m = 4 ширина интервала составляет а границы интервалов соответственно 5–15; 15–25; 25–35; 35 и больше. Поскольку границы интервалов совпадают, то порядок отнесения к группам граничных значений признака определяют слова последнего открытого интервала "35 и больше", т.е. нижнюю границу закрытого интервала следует считать "включительно", а верхнюю – "исключительно".
Величину интервала для построения интервальных рядов можно также определить по формуле Стерджеса
(N – общее число единиц совокупности)
В случае, когда диапазон значений признака слишком широкий и распределение совокупности по этому признаку неравномерно, используют неравные интервалы. Например, распределение поселков городского типа по количеству жителей, тыс. чел.: до 3; 3–4,9; 5–9,9; 10–19,9; 20–49,9. Поскольку границы интервалов не совпадают, то обе границы (верхнюю и нижнюю) следует считать "включительно".
Неотъемлемым элементом сведения и группировки является статистическая таблица,в которой сводная информация представляется компактно, в удобной для сравнения и анализа форме. В практике статистико-экономических исследований используют таблицы различной сложности, которая зависит от цели и особенностей объекта исследования, объема имеющейся в наличии информации. По логическому содержанию статистическая таблица рассматривается как "статистическое предложение", подлежащим которого является объект исследования, а сказуемым – система показателей, которая характеризует объект. В зависимости от структуры подлежащего статистические таблицы делят на простые, групповые и комбинационные. Подлежащим простой таблицы является перечень элементов совокупности, территориальный или хронологический ряд. В групповой таблице подлежащим является группировка по одному признаку, в комбинационной – по двум и более признакам.
Составление статистической таблицы состоит из двух этапов. На первом проектируется макет таблицы, на втором таблица заполняется статистическими данными. Макет статистической таблицы – это комбинация горизонтальных строк и вертикальных граф, на пересечении которых образуются ячейки. Левые боковые и верхние ячейки предназначены для словесных заглавий – перечня составляющих подлежащего и системы показателей сказуемого, остальные – для числовых данных. Основное содержание таблицы указывается в названии.