ТЕМА 3. Статистическая сводка и группировка
- Статистическая сводка: понятие, задачи и виды
Статистическая сводка– это научно организованная обработка материалов наблюдения, которая включает в себя систематизацию, группировку материалов, составление таблиц, подсчет групповых и общих итогов, расчет показателей (средних и относительных).
Задача сводки состоит в том, чтобы обобщить результаты наблюдения, выделить типы явлений, установив их взаимосвязи, определить характерные черты, т.е. получить данные, отражающие в целом всю совокупность. В результате сводки осуществляется переход от данных, характеризующих отдельные единицы совокупности, к данным, характеризующим совокупность.
Сводка осуществляется по программе, которая включает определение:
1) группировочного признака;
2) порядка формирования групп
3) системы показателей для характеристики групп и совокупности в целом;
4) макетов таблиц для представления результатов сводки.
Виды сводки:
1) Простая – это подсчет общих итогов по совокупности в целом. Например, подсчет общей численности студентов высших учебных заведений РФ путем сложения численности студентов всех высших учебных заведений РФ.
2) Сложная – включает группировку, подсчет итогов по каждой группе и по всей совокупности в целом и представление результатов в виде таблицы.
Виды сводки по техники (способу выполнения): ручная; механическая (с помощью ЭВМ).
По форме обработки материала сводка бывает:
1) Централизованной - весь первичный материал поступает в одну организацию, где проводится вся обработка материалов статистического наблюдения. Такая сводка используется при обработке данных единовременных статических обследований, в частности переписей населения.
2) Децентрализованной – обработка материалов производится последовательно – начинается в местных статистических организациях и заканчивается в Госкомстате РФ. Такая сводка используется при обработке статистической отчетности.
- Статистическая группировка: понятие, задачи и виды
Статистическая группировка – это деление изучаемой совокупности на группы по каким-либо признакам.
Метод группировок решает следующие задачи:
1. Выделение социально-экономических типов явлений;
2. Изучение структуры совокупности и структурных сдвигов;
3. Выявление наличия, направления и формы связи между факторным и результативным признаками.
Виды группировок в зависимости от решаемых ими задач:
1. Типологические – это разделение единиц совокупности, как правило по качественному признаку на социально-экономические типы.
2. Структурные – это разделение единиц совокупности на группы, характеризующие ее структуру.
3. Аналитические – это разделение единиц совокупности на группы по факторному признаку с целью определения наличия, направления и формы связи между факторным и результативным признаками.
Виды группировок по числу группировочных признаков:
1. Простые – деление единиц совокупности на группы проводится по одному признаку.
2. Комбинированные (сложные) – деление единиц совокупности на группы проводится по 2 и более признакам (как правило, 2-4 признака).
3. Многомерные- деление единиц совокупности на группы проводится по множеству признаков методами кластерного анализа на ЭВМ.
Особым видом группировок является классификация. Классификация– это общепринятая, нормативная группировка. Классификации узаконены, отражаются в нормативных документах, устанавливаются в определенном виде органами государственной и международной статистики и становятся общепринятыми стандартами. Примером классификаций, используемых в экономике, являются классификации отраслей, земельных угодий, основных фондов, населения по статусу занятости и т.д.
- Образование групп и интервалов группировки
При группировке по качественному признаку число групп равно числу градаций, видов, состояний (наименований) явления, если их число не очень велико.
При группировке по количественному признаку, который изменяется прерывно (дискретно), т.е. может принимать только некоторые – чаще целые значения (например, тарифный разряд рабочих), то число групп должно соответствовать количеству значений признака.
При группировке по количественному признаку, который изменяется непрерывно (принимает любые значения, например, стаж работы, возраст) количество групп зависит от целей, задач исследования, особенностей объекта, колеблемости признака (чем больше колеблемость признака, тем больше групп и наоборот), численности совокупности (чем больше совокупность, тем больше групп и наоборот).
При достаточно большой численности совокупности (200 наблюдений) и нормальном распределении единиц совокупности число групп с равными интервалами можно определить по формуле Стерджесса:
,
где - число единиц совокупности.
Рекомендуется брать 2-3 группы при числе наблюдений до 40, 4-5 групп, если число наблюдений будет 40-60.
Интервал –это значение варьирующего признака лежащие в определенных границах «от и до». Каждый интервал имеет верхнюю и нижнюю границы или хотя бы одну из них. Нижняя граница – это наименьшее значение признака в интервале. Верхняя граница – это наибольшее значение признака в интервале.
Виды интервалов:
а) открытые – имеется только либо верхняя, либо нижняя граница;
б) закрытые – имеются нижняя и верхняя границы.
Виды интервалов в зависимости от их величины:
а) неравные – разность между максимальным и минимальным значениями в каждом из интервалов неодинакова (подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные).
б) равные – разность между максимальным и минимальным значениями в каждом из интервалов одинакова. Данные интервалы используются в том, случае, если вариация признака не значительна, а распределение является более или менее равномерным.
Величина равного интервала определяется по формуле:
,
где - соответственно максимальное и минимальное значение признака в совокупности;
- число групп.
Величина равного интервала определяется по формуле Стерджесса (знаменатель округляем до целого числа):
,
Величину интервала округляют до целого (всегда больше) числа, исключение составляют, случае когда изучается малейшие колебания признака.
Способы построения группировки:
1) Способ равного интервала. Суть способа – к минимальному значению признака прибавляют найденную величину интервала , получаем верхнюю границу первой группы. Затем к верхней границы первой группы прибавляют найденную величину интервала, и получаем верхнюю границу второй группы и т.д. Для устранения неопределенности в группировках, открывают один из крайних интервалов или используют принцип единообразия – левое число включает в себя обозначение значение, а правое не включает.
2) Способ равных частот. Суть способа – изучаемая совокупность выстраивается в ранжированный ряд по значению группировочного признака. Далее совокупность расчленяется на заданное количество групп с равным количеством наблюдений в каждой группе.
Ряды распределения
Ряд распределения- это простейший вид структурной группировки, в которой отражены значения признака по группам и численность каждой группы.
Виды рядов распределения в зависимости от признака положенного в основу группировки:
1) Атрибутивные – в основу группировки положен атрибутивный признак (в порядке возрастания или убывания). Например, распределение населения по полу, занятости, национальности, профессиям.
2) Вариационные - в основу группировки положен количественный признак. Например, распределение населения по возрасту и т.д.
Виды вариационных рядов в зависимости от характера вариации:
а) Дискретные (прерывные) – признак принимает только целые значения (например, тарифный разряд рабочих, число детей в семье, число комнат в квартире).
б) Интервальные (непрерывные) - признак принимает любые значения, в том числе и дробные (например, заработная плата, объем производства).
Ряды распределения состоят из двух элементов:
1) Варианта (х) – это отдельное значение признака. Они могут быть положительными, отрицательными, абсолютными и относительными.
2) Частота (f) – это число, показывающее сколько раз встречается отдельное значение признака в ряду распределения. Сумма всех частот называется объемом совокупности. Частоты, выраженные в форме коэффициента или процента, называются частостями. Сумма частостей равна 1 или100%.
Этапы построения вариационных рядов.
1) Ранжирование первичного ряда, т.е. расположение всех вариантов возрастающем или убывающем порядке. Например, стаж работы рабочих характеризуется данными: 10; 5; 2; 1; 5; 6; 5. Ранжированный ряд: 1; 2; 5; 5; 5; 6; 10.
2) Для построение дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты (х), а затем подсчитывается частота повторения каждой варианты (f). Ряд распределения оформляется в виде таблице, состоящей из 2-х колонок или строк, в одной из которых приводятся варианты, а в другой частоты.
3) Для построения интервального ряда необходимо установить оптимальное число групп. При группировки однокачественной совокупности применяются равные интервалы, которые определяются по формуле:
,
где - соответственно максимальное и минимальное значение признака в совокупности;
- число групп.
Наглядно ряды распределения можно представить при помощи их графического изображения. Для этой цели строят полигон, гистограмму, кумулятивную кривую, огиву.