Тема 3. Группировка данных и ее роль в анализе информации
Статистическое наблюдение в основном совпадает с первой ступенью человеческого познания действительности — эмпирическим познанием. Такой переход осуществляется посредством процесса теоретического обобщения статистических данных, сведения фактов воедино, который в статистике носит название сводки статистических данных. Сводка и группировка являются вторым этапом статистического исследования.
Сводка — это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.
В результате сводки осуществляется переход от данных, характеризующих отдельные явления (люди, учреждения, события социальной жизни), к данным, характеризующим совокупность явлений в целом (население страны, деятельность предприятий, учреждений культуры, науки т.д.)
Простая сводка — это операция по подсчету общих итогов по совокупности единиц наблюдения.
Группировка — расчленение единиц изучаемой совокупности на группы, однородные в каком-либо существенном отношении и характеристика таких групп с целью:
- выделения типов социально-экономических явлений;
- изучения структуры явления и структурных сдвигов, происходящих в нем;
- выявления связи и зависимости между явлениями.
Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках — посредством группировки по отдельным признакам и комбинации самих признаков имеется возможность выявить закономерности изучаемых явлений, проследить взаимоотношение различных факторов и определить силу их влияния на результативные показатели.
Группировки могут быть представлены в виде рядов распределения. Правила построения рядов и группировок аналогичны.
Ряд распределения — это упорядоченное распределение единиц совокупности на группы по какому-либо признаку.
В зависимости от признака, положенного в основу ряда распределения различают атрибутивные (строятся по качественным признакам) и вариационные (строятся по количественным признакам) ряды распределения. Атрибутивный ряд характеризует состав совокупности по тем или иным существенным признакам; анализ таких рядов за несколько временных периодов позволяют исследовать изменение структуры во времени.
Пример 1. Построение атрибутивного ряда.
Таблица 3. Распределение студентов группы по полу.
Группы студентов по полу, x i | Численность, чел. fi | Удельный вес, % к итогу wi |
Всего студентов, в т.ч. | ||
мужчин | ||
женщин |
Вариационный ряд строится по количественным признакам и имеет следующие элементы:
вариант x i— конкретное значение варьирующего признака;
частота fi — численность отдельных вариантов;
частность, относительная численность wi— частота, выраженная в долях единиц или процентах к итогу, т.е.:
wi = fi / å fi
например, wi = fi / å fi =5/25=0,2
В зависимости от характера вариации признака различают дискретные ряды, строящиеся по такому признаку, который может принимать только определенные, выражаемые, как правило, целым числом, значения или интервальные ряды распределения, характеризующие распределение единиц по непрерывному признаку, т.е. такому признаку, который может принимать любые промежуточные значения.
Пример 2. Построение дискретного ряда
Имеются следующие данные об успеваемости 20 студентов группы по статистике: 5,4,4,4,З,2,5,3,4,4,4,3,2,5,2,5,5,2,3,З.
Вариантами ряда являются баллы оценок, а частотами — количество студентов, их получившим. Численность студентов по группам может быть представлена в долях единиц. Кроме обычных частот могут быть рассчитаны накопленные (кумулятивные) частоты, по которым строится суждение о том, какое число единиц совокупности обладать значением, не большим или не меньшим определенного значения.
Таблица 4. Распределение студентов группы по успеваемости.
Группы студентов по полученным оценкам x i | Количество студентов, чел. fi | Удельный вес, доли wi | Накопленные (кумулятивные) частоты |
0, 25 | 0, 25 | ||
0,30 | 0,55 | ||
0,25 | 0,80 | ||
0,20 | 1,00 | ||
всего | 1,00 |
wi = fi / å fi =5/20=0,25
wi = fi / å fi =6/20=0,3
В данном случае возможно построение атрибутивного ряда по группам успевающих и неуспевающих студентов.
Пример 3. Построение атрибутивного ряда
Группы студентов по уровню успеваемости x i | Количество студентов, чел. fi | Удельный вес, доля wi |
успевающие | 0,64 | |
неуспевающие | 0,36 | |
всего |
wi = fi / å fi =16/20=0,64
wi = fi / å fi =4/20=0,36