Глава 3. Сводка и группировка статистических данных. Ряды распределения

Общее представление о сводке и группировке.

Сводка — особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения. Сводка бывает простая, когда это операция по подсчету итоговых данных по совокупности единиц наблюдения и, соответственно, оформление полученного материала в виде таблицы. Сложная сводка представляет собой комплекс операций, включающих распределение единиц наблюдения изучаемого явления на группы, составление системы показателей для характеристики выделенных групп и подгрупп изучаемой совокупности явлений, подсчет итогов в каждой группе и подгруппе, оформление результатов работы в виде статистических таблиц. Итак, компоненты сложной сводки — это:

§ программа проведения (составления) сводки;

§ группировочный признак и само группирование;

§ система показателей, характеризующая изучаемую совокупность и каждую выделенную группу;

§ подсчет итогов в группах, подгруппах и в целом по совокупности;

§ статистические таблицы, представляющие результаты сводки.

Нередко, упрощая, разбивают проведение сводки на следующие три этапа:

§ предварительный контроль материалов, т.е. проверка исходных данных;

§ группировка данных по заданным признакам и определение производных показателей;

§ оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.

Предварительный контроль включает логическую проверку данных, т.е. смысловую согласованность сведений, исключение нелогичных данных и арифметическую согласованность.

Пример 5.1. Рассогласованные данные

1. При переписи населения в документах указан мальчик 8 лет, состоящий в браке.

2. В документах на предприятии обнаружена арифметическая и логическая рассогласованность.

Заработная плата Возраст Общий стаж Непрерывный стаж
Итого      

3. Арифметическая ошибка — неправильно определена сумма заработной платы.

4. В 3-й строке имеется логическая ошибка — лицо в возрасте 25 лет не может иметь общий стаж 45 лет и, кроме того, непрерывный стаж как часть общего не может его превосходить.

Программа сводки содержит перечень групп, на которые может быть разбита или разбивается совокупность единиц наблюдения по отдельным признакам, а также систему показателей, характеризующих изучаемую совокупность явлений в целом и отдельных ее частей. Программа сводки включает следующие этапы ее проведения:

§ выбор группировочного признака для образования однородных групп;

§ определение порядка формирования и числа групп;

§ разработка системы статистических показателей для характеристики групп и объекта в целом;

§ разработка макетов статистических таблиц для представления результатов сводки.

Кроме программы сводки составляется план проведения сводки. План проведения статистической сводки содержит информацию о последовательности, сроках и технике ее проведения, а также об исполнителях, порядке и правилах оформления ее результатов в виде статистических таблиц.

По форме и способу обработки статистических данных различают децентрализованную и централизованную сводки. Если данные наблюдений обрабатываются на местах, т.е. отчеты предприятий сводятся в единые формы статистическими органами субъектов РФ, а полученные итоговые формы поступают в Госкомстат РФ и в нем определяются итоговые показатели в целом по всей стране, то имеем децентрализованную статистическую сводку. Если же все первичные статистические данные сначала собираются в центральной организации и в ней подвергаются полной обработке от начала и до конца, то имеем централизованную сводку.

Группировочная таблица и виды группировок.

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.

Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Пример 5.2. Основа группировочной таблицы

Название таблицы (общий заголовок)

Содержание строк Наименование граф (верхние заголовки)
А  
Наименование строк (боковые заголовки)            
Итоговая строка           Итоговая графа

Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.

Пример 5.3. Пример группировочной таблицы

Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)

Группы студентов Поддерживаю Не поддерживаю Безразлично
Студенты 1-го курса
Студенты 2-го курса
Студенты 3-го курса
Студенты 4-го курса
Студенты 5-го курса
Итого

Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

§ задачам систематизации данных;

§ числу группировочных признаков;

§ используемой информации.

Статистической группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы явлений, исследовать структуру совокупности или проанализировать взаимосвязи и зависимости между признаками. Группировки являются важнейшим инструментом формирования обобщающих статистических показателей. Группировка — важнейший компонент статистической сводки. В следующих главах мы увидим, что группировка играет весьма важную роль в формировании статистического ряда распределения, а правильное ее использование очень существенно для исчисления взвешенных средних.

По числу группировочных признаков (способу построения) различают простые (по одному признаку) и сложные (по нескольким признакам — комбинационные и многомерные) группировки. Комбинационные группировки строятся путем разбиения каждой группы на подгруппы в соответствии с дополнительными признаками. При построении комбинационных группировок сначала разделяют по атрибутивным признакам, а уже затем разбивают полученные группы на подгруппы по количественному признаку.

Многомерные группировки строятся с помощью специальных алгоритмов, когда ищутся скопления в N-мерном пространстве, где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. Для решения таких сложных задач построения многомерной группировки успешно применяются методы прикладного искусственного интеллекта — методы распознавания образов. Также используется метод последовательного статистического анализа Вальда.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Структурные группировки — это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Наши рекомендации