Тема 2. Сводка и группировка данных

Методические указания

В результате первой стадии исследования – статистического наблюдения – получают сведения о каждой единице совокупности. Задача второй стадии – упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Это достигается путем сводки и группировки первичного статистического материала.

Сводка – это комплекс операций по обобщению конкретных единичных фактов, образующих совокупность. Служит для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Центральным моментом сводки является группировка.

Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенному существенному для них признаку. В зависимости от цели и задач исследования различают следующие виды группировок: типологические, структурные и аналитические.

Типологические группировки позволяют выделить социально-экономические типы явлений. Выполняются в разнородной совокупности. Например, с помощью этой группировки можно изучить распределение основных фондов по формам собственности; выделить в секторах экономики крупные, средние и мелкие предприятия. Структурные группировки служат для изучения структуры однотипных явлений. Например, группировка населения по возрастным группам, группировка предприятий по размеру основных фондов. Аналитические группировки служат для исследования взаимосвязи между явлениями в однокачественной совокупности. Например, для установления взаимосвязи между энерговооруженностью труда и производительностью труда рабочих.

Группировка показателей производится по определенному признаку. Признаки бывают атрибутивные, альтернативные и количественные. По роли во взаимосвязи явлений признаки подразделяют на факторные (оказывающие влияние) и результативные (изменяющиеся под воздействием факторных).

Методика группировки состоит из следующих этапов:

Ø выбор группировочного признака;

Ø определение числа групп (k);

Ø определение интервала группировки (h);

Ø непосредственно группировка, то есть распределение совокупности по выделенным группам.

Число групп определяется в зависимости от содержания группировочного признака: если признак атрибутивный, число групп определяется по числу разновидностей признака; если признак количественный число групп определяется расчетным путем.

Аналитическая группировка имеет свои особенности:

Ø в качестве группировочного признака выбирается факторный ( Тема 2. Сводка и группировка данных - student2.ru );

Ø после распределения единиц совокупности на группы по (х)в каждой группе рассчитывается среднее значение результативного признака ( Тема 2. Сводка и группировка данных - student2.ru );

Ø по характеру изменения x и у устанавливают наличие или отсутствие зависимости и её направление.

Интервалы группировки могут быть равные и неравные.

Группировку с равными интервалами выполняют, когда вариация признака невелика, а группировку с неравными интервалами, когда размах вариации признака велик и его значения варьируют неравномерно.

1. При группировке с равными интервалами размер интервала равен:

если количество групп известно: Тема 2. Сводка и группировка данных - student2.ru ,

где k - количество групп.

б) если количество групп не известно;

при малом объёме выборки (до 30 единиц), то есть n Тема 2. Сводка и группировка данных - student2.ru 30

Тема 2. Сводка и группировка данных - student2.ru ,

где n – объем совокупности.

когда объем совокупности более 30 единиц, то есть n > 30

Тема 2. Сводка и группировка данных - student2.ru .

2. При группировке с неравными интервалами порядок проведения группировки следующий:

- при равнонаполненных интервалах:

Ø количество групп (k) задается или рассчитывается по формуле, как и при группировке с равными интервалами;

Ø определяется количество единиц, Тема 2. Сводка и группировка данных - student2.ru которое должно быть в каждой группе: Тема 2. Сводка и группировка данных - student2.ru ;

Ø ранжируются единицы совокупности по возрастанию группировочного признака;

Ø проводится непосредственно группировка;

б) при прогрессивно возрастающих или убывающих в арифметической прогрессии интервалах величина i-того интервала: Тема 2. Сводка и группировка данных - student2.ru

где h - величина первого интервала: Тема 2. Сводка и группировка данных - student2.ru ; i - порядковый номер интервала.

в) если изменение размеров количественного признака приводит к переходу от одного качества к другому, граница интервала устанавливается в том месте, где осуществляется этот переход. Рамки границ зависят от условий места и времени. Например, при группировке предприятий по численности работников на малые, средние и большие устанавливаются более короткие интервалы для малых предприятий, и более длинные – для крупных.

г) специализированные интервалы применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, распределение предприятий различных видов деятельности по уровню рентабельности.

Если в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности или нужно привести к сопоставимому виду группировки с различными интервалами, выполняют перегруппировку данных (вторичную группировку). Методика проведения вторичной группировки включает последовательное решение двух задач: изменение величины интервалов группировок и пересчет частот или удельных весов групп. В процессе наблюдения и сводки данных получают статистические ряды, которые по содержанию подразделяют на: ранжированные, ряды распределения и ряды динамики.

Расположение признака в порядке возрастания или убывания образует ранжированный ряд. Статистическим рядом распределения называют упорядоченное расположение единиц совокупности по какому-либо группировочному признаку с указанием частоты его появления. Ряды распределения бывают: вариационные (построенные по количественному признаку), атрибутивные.

Вариационные ряды распределения могут быть дискретные (признак представлен в виде отдельных чисел, чаще целых) и интервальные (признак представлен в виде интервала “от … до …”).

Любой ряд распределения состоит из двух элементов: вариантов (признаков) – x и частот – f. Частоты, выраженные в долях единицы или в процентах к итогу, называют частостями, сумма которых равна 1 или 100%. Для рядов с неравными интервалами частоты могут быть представлены в форме плотности распределения Тема 2. Сводка и группировка данных - student2.ru .

Анализ рядов распределения можно проводить наглядно на основе их графического изображения. Для этого строят полигон, гистограмму, кумуляту и огиву распределения (см. тему 4 “Графический метод”).

Результаты статистической сводки и группировки удобнее всего располагать в виде таблиц. Таблица, имеющая название, наименование строк и граф, которые ещё не заполнены цифрами, называется макетом таблицы.

Каждая статистическая таблица имеет подлежащее и сказуемое. Подлежащее таблицы - это объект изучения, располагается обычно слева, в виде наименования горизонтальных строк. Сказуемое – это система показателей, которыми характеризуется объект изучения, располагается справа в виде наименования вертикальных граф. В зависимости от построения подлежащего различают следующие виды таблиц: простые, групповые и комбинационные. Простые – таблицы, в подлежащем которых нет группировок, а дается лишь перечень единиц совокупности (перечневые таблицы), административных единиц (территориальные таблицы) или периодов времени (хронологические таблицы). Подлежащее может быть представлено сочетанием этих признаков. Пример макета простой перечневой таблицы:

Таблица 2.1

Цены на основные виды горючего в Украине на 1.01.2003 г.

Виды горючего Средняя цена, грн./т. Объём партии, т.
А 1 2
Бензин A-76    
Бензин A-92    
Дизельное топливо    

Примером макета территориальной таблицы может служить таблица 2.2:

Таблица 2.2

Территория земного шара, млн. км2.

Части света Численность населения, млн. чел. Площадь, км2
Европа    
Азия    
Америка    
Африка    
Австралия    
Антарктида    

Простым хронологическим является макет таблицы 2.3:

Таблица 2.3

Численность населения Украины за период 2000-2003гг.

Годы Всё население, млн. чел. В том числе
городское сельское
А 1 2 3
     
     
     
     

Групповые таблицы в подлежащем содержат группировку единиц совокупности по одному признаку (таблица 2.4).

Таблица 2.4

Распределение работников фирмы по уровню образования

на 1.01.2003г., чел.

Уровень образования Всего работников в том числе
мужчин женщин
А 1 2 3
Высшее      
Средне специальное      
Среднее      
Итого      

Комбинационные – таблицы, в которых подлежащее содержит группировку единиц совокупности по двум и более признакам, взятым в сочетании (таблица 2.5):

Таблица 2.5

Среднегодовая численность работников предприятия за 2002г., чел.

Группы работников предприятия по уровню образования Численность работников, чел.
Всего в том числе
мужчины женщины
1. Рабочие – всего,      
в том числе с образованием:      
- средним      
- средним специальным      
- высшим      
2. Служащие – всего,      
в том числе с образованием:      
- средним      
- средним специальным      
- высшим      

Показатели сказуемого таблицы могут иметь простую разработку и сложную. В первом случае показатели располагаются последовательно друг за другом, (таблицы 2.1, 2.2), а во втором – показатели даются в комбинации (делятся на группы и подгруппы). Например, таблицы 2.3, 2.4, 2.5. Если в сказуемом показатели даны за один период времени, таблица называется статической. Все приведенные выше макеты таблиц являются по построению сказуемого статическими. Если в сказуемом явление изменяется во времени, таблица называется динамической, например, таблица 2.6.

Таблица 2.6

Состав населения г. Донецка за 1990 и 2000 гг., чел.

Пол Годы
А 1 2
Мужчины    
Женщины    
Итого    

Для анализа взаимосвязей между факторным и результативным признаками строятся таблицы взаимной сопряженности, в подлежащем которых представлена группировка по факторному признаку, а в сказуемом – по результативному. Такие таблицы содержат числовую характеристику изучаемой совокупности по двум и более атрибутивным признакам или комбинации количественных и атрибутивных признаков (таблица 2.7).

Таблица 2.7

Распределение семей по среднедушевому доходу и

уровню потребления фруктов

Группы семей по среднедушевому доходу, грн. Группы семей по уровню потребления фруктов за год на душу населения, кг.
До 30 30 - 40 40 - 50 50 - 60 Свыше 60
До 80          
80 - 100          
110 - 140          
140 - 200          
Свыше 200          

Основные правила составления таблиц:

Ø Каждая таблица должна иметь номер и название, в котором указывается содержание таблицы, объект наблюдения и период времени.

Ø Необходимо указывать единицы измерения показателей.

Ø Названия строк и граф должны быть сформулированы ясно и кратко.

Ø Следует нумеровать графы.

Ø Округление чисел нужно производить с одинаковой точностью, если признак меньше принятой точности, то ставится 0,00 или 0,000.

Ø Таблица должна быть замкнутой, то есть иметь итоговые показатели.

Ø Необходимо соблюдать принятые в таблицах условные обозначения:

“-”, если явление отсутствует,

“нет сведений” или “…”, если явление присутствует, но сведения о нем отсутствуют,

Тема 2. Сводка и группировка данных - student2.ru Тема 2. Сводка и группировка данных - student2.ru “ ”, если пересечение строки и графы не имеет смысла.

Тесты

1. Как называется упорядоченное расположение единиц совокупности по какому либо группировочному признаку:

1) рядом распределения; 2) рядом динамики;

3) ранжированным рядом

2. Какими бывают признаки по роли во взаимосвязи между явлениями:

1) альтернативными; 2) атрибутивными и количественными;

3) факторными и результативными.

Наши рекомендации