Методы обработки статистической информации
Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.
Группировка –расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристика таких групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.
Признаки, положенные в основание группировки, называются группировочнымиили основанием группировки. Группировочные признаки бывают атрибутивными и количественными.
Атрибутивным называется признак, характеризующий свойство, качество данного явления без количественного выражения.
Количественным называется признак, характеризующий размеры, величину изучаемой совокупности и дающий возможность разделить ее на группы по величине индивидуальных значений группировочного признака.
Если же признак изменяется в широких пределах и имеет много различных значений, решается вопрос об определении интервала группировки.
Величиной интервала называется разность между максимальным и минимальным значениями признака в каждой группе. Равные интервалы – это интервалы, размеры которых имеют во всех группах одну и туже величину. Неравные интервалы – это интервалы, размеры которых изменяются по величине от группы к группе.
Различают открытые и закрытые интервалы. Открытые интервалы имеют одну какую-либо обозначенную границу, верхнюю или нижнюю.
Результаты группировки могут быть представлены в виде рядов распределения, статистических таблиц и графически.
Ряд распределения – это первичная характеристика массовой статистической совокупности, в которой находят количественное отражение закономерности массовых явлений и процессов общественной жизни. Ряд распределения состоит из варианты и частоты (частости). Варианта – отдельные значения варьирующего признака. Частота – величина, показывающая сколько раз повторяется данная варианта. Частость – это частота, выраженная в процентах.
Статистическая таблица – это таблица, дающая сводную количественную характеристику статистической совокупности. Статистическая таблица состоит из подлежащего и сказуемого. Подлежащим таблицы являются единицы статистической совокупности или их группы. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных. Составными элементами таблицы являются общий, боковые и верхние заголовки. В общем заголовке должен быть выражен главный смысл помещенных в таблице данных. Боковой заголовок раскрывает смысл подлежащего, верхние заголовки – названия сказуемых (ого). Остов таблицы, в котором заполнены общий, боковые и верхние заголовки называется макетом таблицы.
Для графического представления статистической информации могут использоваться линейные, столбиковые, секторные и полосные диаграммы. Для графического изображения рядов распределения применяются- полигон распределения , гистограмма распределения , кумулята и огива.
Полигон распределения применяется для изображения дискретного ряда распределения. На оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, на оси ординат – значения частот. Для замыкания полигона крайние вершины соединяют с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе от Хмин и Х макс.
Гистограмма применяется для изображения интервального вариационного ряда. На оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах (частота, приходящаяся на единицу ширины интервала).
При построении кумулятивной кривой на оси абсцисс откладываются варианты ряда, а по оси ординат – накопленные частоты (определяются путем последовательного суммирования частот по группам).Накопленные частоты наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов, затем их соединяют и получают ломанную линию, т. е. кумуляту.
Если на оси ординат отложить не накопленные частоты, а накопленные частости, то получается огива распределения.