Тема 2. Сводка и группировка данных
Методические указания
В результате первой стадии исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии – упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Это достигается путем сводки и группировки первичного статистического материала.
Сводка – это комплекс операций по обобщению конкретных единичных фактов, образующих совокупность. Служит для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Центральным моментом сводки является группировка.
Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенному существенному для них признаку. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные и аналитические.
Типологические группировки позволяют выделить социально-экономические типы явлений. Выполняются в разнородной совокупности. Например, с помощью этой группировки можно изучить распределение основных фондов по формам собственности; выделить в секторах экономики крупные, средние и мелкие предприятия. Структурные группировки служат для изучения структуры однотипных явлений. Например, группировка населения по возрастным группам, группировка предприятий по размеру основных фондов. Аналитические группировки служат для исследования взаимосвязи между явлениями в однокачественной совокупности. Например, для установления взаимосвязи между энерговооруженностью труда и производительностью труда рабочих.
Группировка показателей производится по определенному признаку. Признаки бывают атрибутивные, альтернативные и количественные. По роли во взаимосвязи явлений признаки подразделяют на факторные (оказывающие влияние) и результативные (изменяющиеся под воздействием факторных).
Методика группировки состоит из следующих этапов:
Ø выбор группировочного признака;
Ø определение числа групп (k);
Ø определение интервала группировки (h);
Ø непосредственно группировка, то есть распределение совокупности по выделенным группам.
Число групп определяется в зависимости от содержания группировочного признака: если признак атрибутивный, число групп определяется по числу разновидностей признака; если признак количественный число групп определяется расчетным путем.
Аналитическая группировка имеет свои особенности:
Ø в качестве группировочного признака выбирается факторный ( );
Ø после распределения единиц совокупности на группы по (х)в каждой группе рассчитывается среднее значение результативного признака ( );
Ø по характеру изменения x и у устанавливают наличие или отсутствие зависимости и её направление.
Интервалы группировки могут быть равные и неравные.
Группировку с равными интервалами выполняют, когда вариация признака невелика, а группировку с неравными интервалами, когда размах вариации признака велик и его значения варьируют неравномерно.
1. При группировке с равными интервалами размер интервала равен:
если количество групп известно: ,
где k - количество групп.
б) если количество групп не известно;
при малом объёме выборки (до 30 единиц), то есть n 30
,
где n – объем совокупности.
когда объем совокупности более 30 единиц, то есть n > 30
.
2. При группировке с неравными интервалами порядок проведения группировки следующий:
- при равнонаполненных интервалах:
Ø количество групп (k) задается или рассчитывается по формуле, как и при группировке с равными интервалами;
Ø определяется количество единиц, которое должно быть в каждой группе: ;
Ø ранжируются единицы совокупности по возрастанию группировочного признака;
Ø проводится непосредственно группировка;
б) при прогрессивно возрастающих или убывающих в арифметической прогрессии интервалах величина i-того интервала:
где h - величина первого интервала: ; i - порядковый номер интервала.
в) если изменение размеров количественного признака приводит к переходу от одного качества к другому, граница интервала устанавливается в том месте, где осуществляется этот переход. Рамки границ зависят от условий места и времени. Например, при группировке предприятий по численности работников на малые, средние и большие устанавливаются более короткие интервалы для малых предприятий, и более длинные – для крупных.
г) специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, распределение предприятий различных видов деятельности по уровню рентабельности.
Если в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности или нужно привести к сопоставимому виду группировки с различными интервалами, выполняют перегруппировку данных (вторичную группировку). Методика проведения вторичной группировки включает последовательное решение двух задач: изменение величины интервалов группировок и пересчет частот или удельных весов групп. В процессе наблюдения и сводки данных получают статистические ряды, которые по содержанию подразделяют на: ранжированные, ряды распределения и ряды динамики.
Расположение признака в порядке возрастания или убывания образует ранжированный ряд. Статистическим рядом распределения называют упорядоченное расположение единиц совокупности по какому-либо группировочному признаку с указанием частоты его появления. Ряды распределения бывают: вариационные (построенные по количественному признаку), атрибутивные.
Вариационные ряды распределения могут быть дискретные (признак представлен в виде отдельных чисел, чаще целых) и интервальные (признак представлен в виде интервала “от … до …”).
Любой ряд распределения состоит из двух элементов: вариантов (признаков) – x и частот – f. Частоты, выраженные в долях единицы или в процентах к итогу, называют частостями, сумма которых равна 1 или 100%. Для рядов с неравными интервалами частоты могут быть представлены в форме плотности распределения .
Анализ рядов распределения можно проводить наглядно на основе их графического изображения. Для этого строят полигон, гистограмму, кумуляту и огиву распределения (см. тему 4 “Графический метод”).
Результаты статистической сводки и группировки удобнее всего располагать в виде таблиц. Таблица, имеющая название, наименование строк и граф, которые ещё не заполнены цифрами, называется макетом таблицы.
Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы - это объект изучения, располагается обычно слева, в виде наименования горизонтальных строк. Сказуемое – это система показателей, которыми характеризуется объект изучения, располагается справа в виде наименования вертикальных граф. В зависимости от построения подлежащего различают следующие виды таблиц: простые, групповые и комбинационные. Простые – таблицы, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных единиц (территориальные таблицы) или периодов времени (хронологические таблицы). Подлежащее может быть представлено сочетанием этих признаков. Пример макета простой перечневой таблицы:
Таблица 2.1
Цены на основные виды горючего в Украине на 1.01.2003 г.
Виды горючего | Средняя цена, грн./т. | Объём партии, т. |
А | 1 | 2 |
Бензин A-76 | ||
Бензин A-92 | ||
Дизельное топливо |
Примером макета территориальной таблицы может служить таблица 2.2:
Таблица 2.2
Территория земного шара, млн. км2.
Части света | Численность населения, млн. чел. | Площадь, км2 |
Европа | ||
Азия | ||
Америка | ||
Африка | ||
Австралия | ||
Антарктида |
Простым хронологическим является макет таблицы 2.3:
Таблица 2.3
Численность населения Украины за период 2000-2003гг.
Годы | Всё население, млн. чел. | В том числе | |
городское | сельское | ||
А | 1 | 2 | 3 |
Групповые таблицы в подлежащем содержат группировку единиц совокупности по одному признаку (таблица 2.4).
Таблица 2.4
Распределение работников фирмы по уровню образования
на 1.01.2003г., чел.
Уровень образования | Всего работников | в том числе | |
мужчин | женщин | ||
А | 1 | 2 | 3 |
Высшее | |||
Средне специальное | |||
Среднее | |||
Итого |
Комбинационные – таблицы, в которых подлежащее содержит группировку единиц совокупности по двум и более признакам, взятым в сочетании (таблица 2.5):
Таблица 2.5
Среднегодовая численность работников предприятия за 2002г., чел.
Группы работников предприятия по уровню образования | Численность работников, чел. | ||
Всего | в том числе | ||
мужчины | женщины | ||
1. Рабочие – всего, | |||
в том числе с образованием: | |||
- средним | |||
- средним специальным | |||
- высшим | |||
2. Служащие – всего, | |||
в том числе с образованием: | |||
- средним | |||
- средним специальным | |||
- высшим |
Показатели сказуемого таблицы могут иметь простую разработку и сложную. В первом случае показатели располагаются последовательно друг за другом, (таблицы 2.1, 2.2), а во втором – показатели даются в комбинации (делятся на группы и подгруппы). Например, таблицы 2.3, 2.4, 2.5. Если в сказуемом показатели даны за один период времени, таблица называется статической. Все приведенные выше макеты таблиц являются по построению сказуемого статическими. Если в сказуемом явление изменяется во времени, таблица называется динамической, например, таблица 2.6.
Таблица 2.6
Состав населения г. Донецка за 1990 и 2000 гг., чел.
Пол | Годы | |
А | 1 | 2 |
Мужчины | ||
Женщины | ||
Итого |
Для анализа взаимосвязей между факторным и результативным признаками строятся таблицы взаимной сопряженности, в подлежащем которых представлена группировка по факторному признаку, а в сказуемом – по результативному. Такие таблицы содержат числовую характеристику изучаемой совокупности по двум и более атрибутивным признакам или комбинации количественных и атрибутивных признаков (таблица 2.7).
Таблица 2.7
Распределение семей по среднедушевому доходу и
уровню потребления фруктов
Группы семей по среднедушевому доходу, грн. | Группы семей по уровню потребления фруктов за год на душу населения, кг. | ||||
До 30 | 30 - 40 | 40 - 50 | 50 - 60 | Свыше 60 | |
До 80 | |||||
80 - 100 | |||||
110 - 140 | |||||
140 - 200 | |||||
Свыше 200 |
Основные правила составления таблиц:
Ø Каждая таблица должна иметь номер и название, в котором указывается содержание таблицы, объект наблюдения и период времени.
Ø Необходимо указывать единицы измерения показателей.
Ø Названия строк и граф должны быть сформулированы ясно и кратко.
Ø Следует нумеровать графы.
Ø Округление чисел нужно производить с одинаковой точностью, если признак меньше принятой точности, то ставится 0,00 или 0,000.
Ø Таблица должна быть замкнутой, то есть иметь итоговые показатели.
Ø Необходимо соблюдать принятые в таблицах условные обозначения:
“-”, если явление отсутствует,
“нет сведений” или “…”, если явление присутствует, но сведения о нем отсутствуют,
“ ”, если пересечение строки и графы не имеет смысла.
Тесты
1. Как называется упорядоченное расположение единиц совокупности по какому либо группировочному признаку:
1) рядом распределения; 2) рядом динамики;
3) ранжированным рядом
2. Какими бывают признаки по роли во взаимосвязи между явлениями:
1) альтернативными; 2) атрибутивными и количественными;
3) факторными и результативными.