Сводка и группировка материалов статистического наблюдения

Сводка статистических данных. Статистическая сводка – это научно-организованная обработка материалов статистического наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет средних и относительных показателей. Статистическая сводка осуществляется по специально составленной программе, в которой указываются методы сбора и обработки информации. Содержание сводки чаще всего отражаются в виде макета таблиц, результаты сводки позволяют достаточно полно охарактеризовать весь изучаемый объект и отдельные его части с помощью многочисленных показателей. Выполнение статистической сводки состоит из следующих этапов:

1) Определение задачи сводки в соответствии с целью статистического исследования

2) Построение необходимых группировок

3) Проверка достоверности и полноты собранной информации, расчет показателей, необходимых для характеристики изучаемого явления и формулирования выводов.

Если по изучаемой совокупности производится только подсчет общих итогов, то сводка называется простой.

Виды группировок.

Статистическая группировка – это процесс образования однородных групп на основе расчленения статистической совокупности на части по существенным для единиц этой совокупности признакам. В экономико-статистических исследованиях применяются группировки трех видов:

1) типологические группировки

2) структурные группировки

3) аналитические группировки

Типологическая группировка используется для выявления и характеристики социально-экономических типов явления. Примером такой группировки служит деление предприятий на части в соответствии с их формой собственности или экономически-активного населения на занятых и безработных.

Структурная группировка позволяет охарактеризовать состав явления, процесса или совокупности. Например, группировка населения по полу, возрасту или душевому доходу. Анализ результатов таких группировок, выполненных за несколько периодов позволяет оценить изменение структуры явлений по времени, что отражает важнейшие закономерности их развития.

Аналитическая группировка используется для установления взаимосвязи между отдельными явлениями и их признаками. В основе аналитической группировки лежит факторный признак и каждая выделенная группа характеризуется средними значениями результативного признака. Например, с помощью группировки предприятий по фондовооруженности труда (факторный признак) можно установить наличие зависимости от него производительности труда (результативного признака).

Признак, на основе которого производится деление единиц совокупности на группы называется группировочным признаком или основанием группировки. Если группы образуются по одному признаку то группировка называется простой (например, деление населения на возрастные группы). Группировка по двум и более признакам называется сложной или комбинационной. Например, возрастные группы населения делятся на подгруппы по полу и т.д. Как правило больше четырех группировочных признаков не применяется. Выбор группировочного признака сравнительно прост если группировка производится по атрибутивному признаку. Если атрибутивный признак имеет мало разновидностей то количество групп определяется числом этих разновидностей. Например, группировки населения по полу или социальному положению. В случае, если эти атрибутивные признаки имеют большое количество разновидностей, то разрабатываются классификации разновидностей. Классификации – это особый вид группировок представляющих собой устойчивую номенклатуру групп, образованных на основе сходства и различия единиц изучаемой совокупности. Классификации выступают в качестве статистического стандарта, устанавливаемого на определенный период. Например, ОКВЭД – общероссийский классификатор видов экономической деятельности продукции и услуг, классификатор основных фондов (ОКОФ).

Когда группировка производится по количественному, дискретному признаку, то число групп соответствуют числу вариант если оно не очень велико. Например, распределение рабочих по тарифному разряду, студентов по оценкам и т.д. При большом числе вариант их объединяют в группы. Когда группировка производится по количественному непрерывному признаку весь диапазон его изменения разбивается на интервалы «от – до» (Например, при группировке предприятий по объему производства первый интервал «100-200» тыс. р., второй интервал 200-300 тыс. р. и т.д., последний интервал 1млн р.) Интервал, в котором указана лишь должна граница называется открытым. Интервал, имеющий верхнюю и нижнюю границу называется закрытым. Длина интервала – это разница между верхней и нижней границей. Интервалы бывают равные, неравные и специализированные. Неравные интервалы применяются в аналитических группировках для того, чтобы число единиц совокупности в группе было достаточно велико и чтобы они были приблизительно одинаково заполнены. Специализированные интервалы используются в типологических группировках. Границы устанавливаются там, где намечается переход от одного качества к другому. Величина интервала и число групп при группировке по непрерывному количественному признаку определяется исходя из целей исследования особенностей изучаемого признака, объема и количества имеющейся информации. Количество групп и длина интервала группировки взаимосвязаны. Ориентировочно число групп с равными интервалами можно определить по формуле Стерджесса: n=1+3,322lgN, где N-объем совокупности. Формула (3.1) устанавливает следующее соотношение между числом групп n и объемом статистической совокупности N. Это соотношение произведено в таблице 3.1 (в распечатке). Соответственно формула Стерджесса для определения длины интервала группировки выглядит следующим образом – формула (3.2).

Все сказанное позволяет выделить следующие основные стадии в последовательности выполнения статистических группировок:

1. Обоснование группировочного признака и показателей, с помощью которых предполагается характеризовать выделенные группы;

2. Определение числа групп и длины интервалов;

3. Составление макета групповой вспомогательной таблицы и выполнение необходимых расчетов;

4. Составление макета итоговой таблицы и расчет необходимых показателей;

5. Анализ полученных результатов и формулировка выводов.

Статистические таблицы.

Результаты сводки и группировки материалов наблюдения как правило представляются в виде статистической таблицы. В таких таблицах выделяют два элемента: подлежащее – перечень единиц совокупности или групп, на которые разделена статистическая совокупность; сказуемое – показатели, характеризующие выделяемые в подлежащем таблицы единицы или группы статистической совокупности. Над таблицей помещается заголовок, отражающий ее основное содержание, время, место и объект, к которым относится представленные в таблице данные. В зависимости от строения подлежащего различают три вида таблиц:

1. Простые

2. Групповые

3. Комбинационные

В простых таблицах в подлежащем приводится перечень единиц совокупности, хронологических дат и территорий. В групповых подлежащее образовано группировкой по одному признаку. В комбинационных в подлежащем представлены группы, выделенные в результате сложной группировки. Групповые статистические таблицы по сравнению с простыми более информативны. В их подлежащем представлены группы, сформированные по существенному признаку, что позволяет выявить связь между изучаемыми показателями. В комбинационных таблицах каждая группа подлежащего, сформированная по одному признаку делится на подгруппы по второму признаку, а полученные подгруппы по третьему признаку и т.д. (пример – таблица 3.1. такая таблица позволяет помимо зависимости результативного характера выявить зависимость между самими факторами. Так, в данном примере прослеживается увеличение заработной платы водителей с повышением квалификации и степени выполнения нормы выработки).

Статистические ряды распределения.

Несистематизированные данные, собранные в процессе статистического наблюдения, образуют первичный ряд данных. При большом объеме совокупности первичный ряд данных становится трудно обозримым и его непосредственное рассмотрение не может дать представление о распределении единиц совокупности по величине признака. Первым шагом в упорядочивании первичного шага является его ранжирование, т.е. расположение всех вариант ряда в возрастающем или убывающем порядке. Ранжирование данных позволяет :

1. Сразу увидеть максимальное и минимальное значение признака в совокупности и оценить разницу между ними

2. Определить число повторений отдельных вариант ряда.

В результате первичный неупорядоченный ряд преобразовывается в упорядоченный ряд, в котором будет отражено число повторений каждой варианты. Этот ряд называется статистическим рядом распределения.

Он характеризует структуру изучаемого явления, позволяет судить о степени однородности изучаемой совокупности закономерностей и границах варьирования изучаемого признака. Элементами статистического ряда распределения являются варианты хi и частоты fi. Для характеристики структуры совокупности используется показатель, который называется частостью и определяется по формуле (3.3). из определения частоты и частости следует равенство (3.3). ряды распределения могут быть атрибутивными и вариационными. Атрибутивным называется рад, построенный по атрибутивному признаку (например, распределение рабочего цеха по профессиям, таблица 3.2). вариационным называется статистический ряд, построенный по количественному признаку. Вариационный ряд является дискретным, если признак, по которому он построен дискретный и интервальным если признак по которому он построен непрерывен (пример дискретного ряда – распределение рабочих предприятия по квалификации, таблица 3.3). информация таблицы 3.3. позволяет судить о динамике структуры рабочих и позволяет оценить изменение качества рабочей силы (если данные приведены за несколько месяцев). Примером интервального ряда является распределение предприятий по объему произведенной продукции (таблица 3.4). Статистический ряд распределения является обязательным итого любой группировки. Статистические ряды распределения могут быть изображены графически. Чаще всего графики используют для изображения вариационных статистических рядов. Дискретный ряд изображают с помощью линейной диаграммы, которая называется полигоном распределения. При его построении в прямоугольной системе координат по оси абсцисс откладываются варианты, а по оси ординат – частота или частость. Полученная на пересечении абсцисс и ординат точки соединяют прямыми линиями, в результате чего получают ломаную линию, называемую полигоном распределения. На рисунке 3.1 построен полигон распределения по данным таблицы 3.3.

Интервальный ряд распределения изображается в форме столбиковой диаграммы, которая в этом случае называется гистограммой. На рисунке 3.2 построена гистограмма по данным таблицы 3.4. Для решения ряда задач (определение структурных средних, наблюдение за процессом концентрации изучаемого явления) ряды распределения преобразовывают в кумулятивные ряды, строящиеся по накопленным частотам или частостям.

Среднее арифметическое взвешенное используется при расчете среднего уровня относительных величин: средней производительности труда, себестоимости единица продукции, рентабельности производства. Простая средняя арифметическая при этом как правило не используется. При решении таких задач особое значение имеет обоснование того показателя, который используется в качестве веса признака, средний уровень которого определяется. Рассмотрим схемы выбора веса и самого расчета среднего уровня относительных показателей.

Пример 1. По данным таблицы 4.2 определим удельный вес собственных средств в объеме инвестиций в среднем по акционерному обществу. Запишем аналитическую формулу расчета показателя средний уровень которого требуется определить (под этой таблицей 4.2. он уже написан). При расчете удельного веса собственных средств в объеме инвестиций в целом в знаменателе должна быть показана сумма инвестиций в целом по акционерному обществу (15,5 + 40 +32), а в числителе величина собственных средств акционерного общества используемых в качестве инвестиций. Величина этих средств может быть определена по данным таблицы следующим образом (под таблицей). В результате имеем следующий расчет. В данном случае вариантами являются удельные веса собственных средств в инвестициях по каждому предприятию, а весами объемы инвестиций по каждому предприятию.

Пример 2. По данным таблицы 4.3 определить рентабельность реализованной продукции в целом по предприятию. Средняя рентабельность. В данной задаче вариантами являются показатели рентабельности каждого вида продукции, а весами - объем затрат на ее производство.

Среднее гармоническое.

Может быть простой и взвешенной и рассчитывается по формуле 4.4. Среднее гармоническое взвешенное применяется вместо средней арифметической взвешенной когда нет данных о частотах отдельных вариант совокупности но есть данные о величине произведения (4.5). Средняя гармоническая является преобразованной формой средней арифметической и тождественно ей.

Пример. Имеются данные по работе трех обменных пунктов валюты (таблица 4.4). 1 вариант – по каждому обменному пункту известен курс доллара и объем продаж доллара, 2 вариант – по каждому обменному пункту известен курс доллара и выручка от продажи валюты. Если воспользоваться данными 1 варианта то среднее арифметическое взвешенное курса доллара будет выглядеть следующим образом (под формулой записано). При использовании данных 2 варианта для нахождения общего объема продаж сначала необходимо рассчитать его по пункту каждому обменному.

Среднее геометрическое и среднее квадратическое.

Средняя геометрическая простая определяется по формуле 4.6. Среднее геометрическое взвешенное определяется по формуле 4.7. В экономической статистике среднее геометрическое применяется при определении средних коэффициентов и темпов роста в рядах динамики. Средняя квадратическая простая определяется по формуле 4.8, Среднее квадратическое взвешенное – 4.9. Среднее квадратическое используется при оценке уровней вариации анализируемых показателей.

Структурное среднее. Для расчета степенных средних необходимо располагать информацией не только о значениях признака но и о величине его веса. Такая информация не всегда доступна. В этом случае предпочтение отдается структурным средним. Структурное среднее характеризуют структуру рядов распределения. К таким показателям относятся мода и медиана. Модой называется варианта, которая наиболее часто встречается в анализируемой совокупности, наличием двух и более модальных значений означает неоднородность статистической совокупности. В дискретном ряду распределения мода – это варианта с максимальное частотой. Например, в таблице 4.5 наибольшей частотой является 88, этой частоте соответствует модальное значение признака 37, т.е. наибольшим способом у покупателей пользуется обувь 37 размера. В интервальном ряду распределения с разными интервалами мода исчисляется по формуле 4.10. определим моду интервального ряда по данным таблицы 4.6. максимальная частота 7, модальным является интервал 8.2, в соответствии с формулой 4.10. медианой называется значение варьирующего признака, которая делит ранжированный ряд данных на две равные части. Одна половина единиц анализируемой совокупности будет иметь значение меньше медианы, другая – больше. При определении медианы по несгруппированным данным сначала их необходимо ранжировать, затем определить номер единиц совокупность, значение признака которой будет медианой. При небольшом объеме совокупности этот номер определяется визуально, а при большом по формуле 4.11.

Например, данные о стаже работы 7 продавцом представлены в виде ранжированного ряда. В этом случае номер медианы по формуле 4.11 будет равен 3. Если число вариант будет четным, то медиана равна средней арифметической от двух цифр в середине ряда.

В дискретном ряду распределения (таблица 4.5) ne= 37. Медиана по данным интервального ряда распределения с равными интервалами определяется следующим образом:

1. Для каждого интервала рассчитывается накопленная частота (графа 3 таблица 4.6)

2. Определяется медианный интервал. Таким интервалом является тот, накопленная частота которого больше или равна 1\2 численности единиц совокупности (в таблице 4.6 это будет 8.9). Накопленная частота этого интервала 14, что больше чем 12.5 (половина от объема совокупности)

3. Медиана определяется по формуле 4.12. Расчет моды и медианы для вариационных рядов с неравными интервалами определяется аналогично, но показатели частоты заменяются на показатели плотности распределения, что обеспечивает сопоставимость неравных интервалов.

Средняя арифметическая мода и медиана являются показателями центра статистического распределения. В каждой конкретной задаче предпочтение может быть отдано любому из этих показателей. В симметричных рядах распределения величины всех трех показателей совпадают и предпочтение отдается средней арифметической. Симметричным является распределение, в котором частоты любых двух вариант равноотстоящих от центра распределения равны между собой. Для ассиметричных рядом предпочтительной характеристикой центра распределения является медиана поскольку она занимает промежуточное положение между модой с средним арифметическом. В статистическом контроле качества продукции чаще пользуются медианой поскольку для определения ее в ранжированном ряду не требуется дополнительных расчетов и кроме того она не чувствительна к крайним значениям контрольной пробы. Мода применяется при изучении спроса населения на потребительские товары с целью выявления продукции, пользующейся наибольшим спросом.

Наши рекомендации