Виды статистических группировок.
Введение
В практической статистике широко применяется метод классификаций и группировок. Классификация - это систематическое распределение явлений и объектов по определенным группам, классам, разрядам на основании их сходства и различия. Используют классификации: отраслевую; профессиональную; основных фондов; капитальных вложений; строительных машин.
Для дальнейшей обработки собранных в ходе статистического наблюдения первичных данных широко используют и метод группировки.
Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Благодаря группировке можно соотнести сводные показатели по совокупности в целом со сводными показателями по группам. Появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками. Группировка позволяет делать вывод о структуре совокупности и о роли отдельных групп этой совокупности. Именно группировка формирует основу для последующей сводки и анализа данных.
Признаки, по которым проводится группировка, называют группировочными признаками. Группировочный признак иногда называют основанием группировки. Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.).
При определении числа групп, как правило, учитываются задача исследования, объем совокупности и виды признаков, которые берутся в качестве основания группировки. Например, по количественному признаку возраст населения может быть разбит на самые различные группы. Их число будет зависеть от поставленных задач. Например, это могут быть группы по возрасту трудоспособного населения; экономически активного населения и т.д.
Виды статистических группировок.
Значение группировок состоит в том, что этот метод, во-первых, обеспечивает систематизацию и обобщение результатов наблюдения, а во-вторых, метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений.
Метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношения различных факторов и определить силу их влияния на результативные показатели.
Огромное значение и роль группировок в статистическом исследовании вытекает из характера объекта статистики, его специфики. Явления общественной жизни, изучаемые статистикой, отличаются многообразием форм и стадий развития, они состоят из существенно различающихся частей, обладающих многими специфическими свойствами.
Изучая количественную сторону массовых общественных явлений в неразрывной связи с их количественными особенностями, статистика стремится показать совокупность явлений дифференциации в многообразии их типов, рассмотреть взаимосвязи и соотношения между последними. С помощью метода группировок решаются сложные задачи статистического анализа.
Необходимость группировки обусловливается, прежде всего, наличием качественных различий между изучаемыми явлениями, и первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов.
Группировка данныхпроизводится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в виде, доступном для восприятия1.
Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой.
Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.
Пример 1.1. Основа группировочной таблицы
Название таблицы (общий заголовок)
Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Содержание строк | Наименования граф (верхние заголовки) | |||||
А | ... | |||||
Наименования строк (боковые заголовки) | ||||||
Итоговая строка | Итоговая графа |
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком.
Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк.
Подлежащее статистической таблицы - объект, характеризующийся цифрами.
Сказуемое - система показателей, которыми характеризуется объект изучения, т.е. подлежащее.
Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки
(...;-; НС)2.
Пример 1.2 Группировочная таблица
Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2005 года).
Поддерживаю | Не поддерживаю | Безразлично | |
Студенты 1 курса | |||
Студенты 2 курса | |||
Студенты 3 курса | |||
Студенты 4 курса | - | - | |
Студенты 5 курса | - | - | |
Итого |
Таким образом, группировка - это разделение единиц совокупности на группы по выбранным варьирующим признакам.
Группировки различают:
- по задачам систематизации данных;
- по числу группировочных признаков;
- по используемой информации.
По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам — комбинированные и многомерные).
-Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.
-Многомерные- строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в N-мерном пространстве, где каждый объект - точка, т.е. построить многомерную группировку - найти скопление точек.
По задачам систематизации данных различают: типологические, структурные и аналитические.
-Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.
-Структурныегруппировки - это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации.
-Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется.
По используемой информации различают первичные и вторичные группировки.
-Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
-Вторичные - результат объединения или расщепления первичной группировки.
При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки, от объема совокупности, степени вариации признака.
При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака3. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможны два подхода: группировка с равными и неравными интервалами.
Для определения этих параметров в первом случае рекомендуется формула Стэрджесса:
т = 1 + 3,21 -lgN, где N - количество наблюдений.
В этом случае величина интервала:
D= ,
а границы интервалов:
х =x +(i-1) D
х = x +i D, где х - нижняя, а х - соответственно, верхняя граница.
Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует по мере возможности избегать таких группировок4.