Тема 2. Сводка и группировка статистических данных
Сводка – это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Она выполняется с целью привидения результатов в форму, удобную для последующего анализа и осуществляется при помощи метода группировок.
Статистическая группировка – это процесс образования однородных групп на основе расчленения статистической совокупности на группы по какому-либо одному или нескольким определенным, существенным для них признакам, носящим название группировочных признаков.
Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям.
Различают следующие виды группировок: типологическая (расчленение разнородной совокупности на отдельные качественно однородные группы), структурная (разделение однородной совокупности на группы, характеризующие ее структуру по определенному варьирующему признаку), аналитическая (предназначена для установления тесноты связи между взаимодействующими признаками – факторным и результативным).
Простейшей группировкой является ряд распределения, представляющий собой упорядоченное расположение единиц статистической совокупности по значению какого-либо признака. Ряды распределения подразделяются на атрибутивные (по качественному признаку) и вариационные (по количественному признаку). Различают дискретные и интервальные вариационные ряды. Интервальные вариационные ряды бывают с равными, неравными, закрытыми и открытыми интервалами. При построении вариационного ряда с равными интервалами определяют число групп и величину интервала. Число групп может быть задано или определено по формуле Стерджесса , где N – число единиц совокупности. Величина равного интервала рассчитывается по формуле , где хmax и хmin – максимальное и минимальное значение признака.
Существует 3 основных формы представления статистических данных:
- текстовая – включение данных в текст;
- табличная – представление данных в таблицах;
- графическая – выражение данных в виде графиков.
Текстовая форма применяется при малом количестве цифровых данных.
Табличная форма применяется чаще всего, так как является более эффективной формой представления статистических данных. В отличие от математических таблиц, которые по начальным условиям позволяют получить тот или иной результат, статистические таблицы рассказывают языком цифр об изучаемых объектах.
Статистическая таблица – это система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.
Различают подлежащее и сказуемое статистической таблицы. В подлежащем указывается характеризуемый объект – либо единицы совокупности, либо группы единиц, либо совокупность в целом. В сказуемом дается характеристика подлежащего, обычно в числовой форме. Обязателен заголовок таблицы, в котором указывается к какой категории и к какому времени относятся данные таблицы.
По характеру подлежащего статистические таблицы подразделяются на простые, групповые и комбинационные. В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку, а в сказуемом указываются число единиц в группах (абсолютное или в процентах) и сводные показатели по группам. В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким.
При построении таблиц необходимо руководствоваться следующими общими правилами.
1. Подлежащее таблицы располагается в левой (реже – верхней) части, а сказуемое – в правой (реже – нижней).
2. Заголовки столбцов содержат названия показателей и их единицы измерения.
3. Итоговая строка завершает таблицу и располагается в ее конце, но иногда бывает первой: в этом случае во второй строке делается запись «в том числе», и последующие строки содержат составляющие итоговой строки.
4. Цифровые данные записываются с одной и той же степенью точности в пределах каждого столбца, при этом разряды чисел располагаются под разрядами, а целая часть отделяется от дробной запятой.
5. В таблице не должно быть пустых клеток: если данные равны нулю, то ставится знак «–» (прочерк); если данные не известны, то делается запись «сведений нет» или ставится знак «…» (троеточие). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1).
Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графическая форма является самой эффективной формой представления данных с точки зрения их восприятия. С помощью графиков достигается наглядность характеристики структуры, динамики, взаимосвязи явлений, их сравнения.
Статистические графики – это условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем. Графическая форма облегчает рассмотрение статистических данных, делает их наглядными, выразительными, обозримыми. Однако графики имеют определенные ограничения: прежде всего, график не может включить столько данных, сколько может войти в таблицу; кроме того, на графике показываются всегда округленные данные – не точные, а приблизительные. Таким образом, график используется только для изображения общей ситуации, а не деталей. Последний недостаток – трудоемкость построения графиков. Он может быть преодолен использованием персонального компьютера (например, «Мастером диаграмм» из пакета Microsoft Office Excel).
По способу построения графики делятся на диаграммы, картограммы и картодиаграммы.
Наиболее распространенным способом графического изображения данных являются диаграммы, которые бывают следующих видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграмм зависит от вида представляемых данных и задачи построения. В любом случае график обязательно сопровождается заголовком – над или под полем графика. В заголовке указывается, какой показатель изображен, по какой территории и за какое время.