Практическое решение задач проведения группировок
ТЕМА 1.3. СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ МАТЕРИАЛОВ
1.3.1. Понятие сводки, группировки статистических данных.
1.3.2. Виды группировок.
1.3.3. Методологические вопросы проведения группировки. Особенности их решения для разных видов группировок.
1.3.4. Практическое решение задач проведения группировок.
1.3.5. Ряды распределения.
1.3.6. Система группировок.
Понятие сводки, группировки статистических данных
После проведения массового статистического наблюдения образуется большой массив зарегистрированных значений ряда признаков у отдельных единиц совокупности. Чтобы перейти от частного, случайного к обобщающим цифрам, характеризующим всю совокупность, необходимо полученные данные систематизировать. Наступает второй этап любого статистического исследования — сводка и группировка.
Научно организованная обработка материалов наблюдения, включающая в себя группировку, составление таблиц, подсчет итогов и обобщающих показателей (средних, относительных величин), называется статистической сводкой.В узком смысле слова сводка — подсчет итогов.
В результате сводки данные «приводятся в порядок» — из единичных сведений формируются статистические совокупности, которые характеризуются итоговыми обобщающими показателями. То есть на этапе сводки появляются первые цифры, устанавливаются количественные соотношения, характеризующие изучаемое явление как совокупность в целом.
Сводка статистических материалов осуществляется на основе научно разработанной программы, которая включает в себя следующие этапы:
— определение групп и подгрупп;
— разработка системы показателей для характеристики групп и всей совокупности в целом;
— оформление результатов в таблицах и графиках.
В основе любой сводки лежит группировкаданных, собранных в
результате статистического наблюдения.
Узаконенная группировка называется классификацией.Классификация основывается на существенных признаках, которые практически не меняются, например: классификация населения по статусу в занятости, группировка предприятий по отраслям. Классификации отражаются в нормативных документах — гак называемых классификаторах.
Основные категории группировки: группировочный признаки интервал. Правильный отбор таких признаков — самый ответственный момент проводимой группировки и, в конечном итоге, сводки.
Группировка одних и тех же данных по различным признакам может привести к противоположным результатам. Чтобы этого не произошло, выбору группировочного признака должен предшествовать качественный анализ, знание сущности изучаемого явления, процессов, в нем происходящих.
В качестве группировочного признака может выступать как качественный, или атрибутивный (пол, образование, форма собственности), так и количественный показатель (возраст, объем производимой продукции, численность населения).
Интервалыбывают открытые и закрытые, равные и неравные. Открытый интервал — интервал, одна из границ которого не определена (1000 и более; менее 5 и т.д.). Закрытый интервал — интервал, в котором определены и верхняя, и нижняя границы (50—100, 20—25). Верхняя граница интервала — минимальное его значение, нижняя граница — максимальное. Равные интервалы применяются в том случае, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова. Неравные интервалы — когда величина интервала от одного к другому изменяется: может либо расти, либо убывать, либо меняться другим образом. Как правило, неравные интервалы отражают структуру совокупности или характеризуют границы изменения каждого типа.
Виды группировок
Все многообразие группировок изучается по различным классификациям:
В соответствии с решаемыми задачами различают три вида группировок — типологическая, структурная и аналитическая. Типологическаягруппировка в значительной степени определяется сложившимися представлениями о типах явлений, образующих совокупность. Например, при проведении группировки предприятий по размеру, выявляют типы предприятий (крупные, средние, мелкие). Эти типы могут определяться в соответствии с действующими нормативами.
Структурная (вариационная) группировкарешает задачу анализа структуры совокупности и структурных сдвигов. Представляет собой распределение типически однородных групп по количественным признакам, которые могут изменяться (варьироваться). Аналитическая (факторная) группировкапроводится с целью выявления взаимосвязи между факторным и результативным признаками. Факторными называют признаки, изменение которых вызывает изменение других признаков — результативных.
По числу группированных признаков различают простые группировки, ряды распределения и многомерные группировки. Простые группировки— группы образованы по одному признаку (группировка населения по полу). Среди простых группировок наиболее часто используются ряды распределения.
Ряды распределения— это группировка, в которой группы характеризуются одним показателем — численностью группы.
Многомерная (сложная) группировка —в качестве группировочного признака используется два и более признаков. Сначала группы формируются по одному признаку, затем эти группы делятся на подгруппы по другому, которые, в свою очередь, делятся по третьему признаку и т.д. Для характеристики социально-экономических явлений желательно использовать именно сложную группировку, так как только совокупность признаков позволяет отразить развитие явления, выявить реальные связи, взаимоотношения отдельных сторон процесса. Эти признаки берутся изолированно друг от друга или в сочетании друг с другом.
Методологические вопросы проведения группировок. Особенности их решения для разных видов группировок.
Для проведения любой группировки необходимо последовательно решить следующие задачи:
— выбор группировочного признака;
— определение числа групп;
— определение величины интервала;
— разработка системы показателей для характеристики групп. В зависимости от вида группировки перечисленные задачи решаются по-разному.
Первая задача — выбор группировочного признака — решается на основании теоретического, качественного, анализа.
При проведении типологической группировкивыбор группировочного признака предваряет наметка типов. Типов должно быть столько, сколько теоретически возможно в данной совокупности. Тип — это множество единиц одного качества. После определения числа типов определяют группировочный признак. В качестве группировочного может быть использован только существенный признак, вернее, все существенные признаки. Но реально группировку с таким множеством группировочных признаков осуществить трудно — происходит излишнее дробление совокупности. Поэтому в качестве группировочных используются два-три наиболее важных признака, которые берутся в комбинации, при этом осуществляется специализация признаков, то ест? разные типы характеризуются различными признаками. Типологическая группировка почти всегда является сложной.
Например, разделим совокупность предприятий на три типа: мелкие, средние и крупные. В качестве группировочного признака будут использованы следующие: численность работников и отраслевая принадлежность предприятия. Сначала проводим группировку предприятий по отраслевому признаку. Выделяем совокупность торговых предприятий, промышленных, автотранспортных и т.д. Затем выделенные группы делим по второму признаку — численность работников. При этом применяется специализация интервалов, то есть мелкие торговые предприятия и мелкие промышленные будут характеризоваться разной численностью, так как промышленность более трудоемкая отрасль, чем торговля. В качестве второго группировочного признака может выступать и объем производимой продукции. В любом случае выбор группировочного признака зависит от целей исследования и является результатом качественного анализа.
Структурная группировкачаще всего осуществляется по одному признаку — это простая группировка. В качестве группировочного признака может быть использован как существенный, так и несущественный признак. Что касается аналитической группировки,то в качестве группировочного почти во всех случаях выступает признак-фактор.
Решение второй задачи — определение числа групп — также варьирует в зависимости от типа проводимой группировки. Если группировка проводится по атрибутивному признаку, то число групп равно числу градаций признака. Как правило, это типологическая группировка. Если группировка проводится по количественному признаку, то нужно обратить внимание на колеблемость значений признака: чем больше варьирует признак, тем больше должно быть групп. В то же время нужно учитывать, что если объем совокупности небольшой — не стоит делать много групп. При проведении структурной группировки число групп должно отражать реальную структуру совокупности, не должно быть пустых групп. Математически число групп может быть определено по формуле (Стерджесса):
где N— количество элементов совокупности.
Третья задача — определение величины интервалов — для разных видов группировок может быть решена следующим образом. При проведении типологических и структурных группировок чаще всего используют неравные интервалы, так как интервал в первом случае должен отражать границы изменения типа, во втором — структуру совокупности. В аналитических группировках берутся как равные, так и неравные интервалы. В том случае, если используются равные интервалы, его величина может быть рассчитана по следующей формуле:
где i — величина интервала;
xmax — максимальное значение признака;
xmin — минимальное значение признака;
п — число групп.
Существуют следующие правила записи шага интервала. Если величина интервала, рассчитанная по вышеприведенной формуле, имеет один знак до запятой, то ее округляют до десятых. Полученные значения 0,25; 1,346; 3,259 округляются до 0,3; 1,3; 3,3. Если рассчитанная величина имеет две цифры до запятой, то значения округляются до целых. Если значения интервала представляют собой трехзначные, четырехзначные и т.д. значения, то их округляют до цифр, кратных 100 или 50. Например, значения интервала 16,78; 254; 557 следует соответственно использовать как 17; 250; 600.
Когда в качестве группировочного используют количественный признак, границы интервала могут быть обозначены по-разному, в зависимости от того — дискретный признак или непрерывный. Если признак непрерывный, например объем продукции, то одно и то же значение выступает и верхней, и нижней границей смежных интервалов: 10—50, 50—60, 60—70 и т.д. В этом случае возникает вопрос: в какую группу будет отнесен признак, значение которого совпадает со значением границ? Как правило, нижняя граница формируется по принципу «включительно», а нижняя — «исключительно». В нашем примере, если признак принимает значения, равные 50, то он будет отнесен ко второй группе с интервалом 50—60.
Если признак дискретный, то есть прерывный, нижняя граница интервала будет равна верхней границе предыдущего интервала, увеличенной на 1. Например, группы торговых предприятий с численностью (чел.): до 5; 6—15; 16—25. При определении границ интервалов следует учитывать, что количественные изменения признака приводят к появлению нового качества, поэтому желательно, чтобы границы интервала отражали переход одного качества в другое.
Например, по малым предприятиям ограничение численности работающих проводится по отраслевому признаку: у предприятий, занимающихся оптовой торговлей, численность ограничена до 30 человек. Поэтому, если проводится группировка предприятий по размеру и в качестве группировочного признака выступает численность работающих, то необходимо учесть этот момент, здесь будет использована спецификация интервалов, то есть для каждой отрасли будет определяться свой интервал.
После того, как в процессе проведения непосредственно группировки формируются группы, их необходимо охарактеризовать при помощи системы показателей. Как правило, рассчитываются средние значения по группе и показатель численности группы.
Практическое решение задач проведения группировок
Пример проведения типологической группировки. Необходимо выделить среди совокупности фермерских хозяйств их типы по величине (табл. 1).