Сводка и группировка статистических данных

Статистические данные, собранные в ходе наблюдения, в своем первоначальном виде труднообозримы и без предварительной их подготовки не пригодны для проведения углубленного анализа.

Сводка– процедура сжатия, уплотнения и систематизации (упорядочения) информации является обязательным этапом исследования любого уровня.

Большую роль в разработке статистических данных играют современные классификаторы технико-экономической и социальной информации. С 2003 года по постановлению Правительства РФ ГОСКОМСТАТ, (с 2004 года -РОССТАТ) ведет большую работу по разработке классификаторов и их гармонизации с международными аналогами.

Классификаторы – это инструментальное средство структурирования информации на основе международных стандартов. Классификаторы представляют собой систематизированный перечень объектов (видов деятельности, организаций, продукции, основных фондов и т.д.), каждому из которых присваивается определенный код, который служит средством идентификации объектов. Классификаторы являютсяобязательными для применения при создании государственных информационных систем и ресурсов на любом уровне. В настоящее время для использования в статистических целях разработано более 30 общероссийских классификаторов, среди которых: ОКВЭД – Общероссийский классификатор видов экономической деятельности вместо ОКОНХ, Общероссийский классификатор продукции – ОКП, ОКПО – ОК предприятий и организаций, ОКУН – услуг населению, ОКАТО – объектов административно-территориального деления и т.д. Использование классификаторов позволяет получить стандартные группировки в статистических отчетах, в средствах электронной обработки, в выходных статистических материалах и публикациях.

Основным приемом сводки данных любого исследования является группировка. Группировка – объединение единиц статистической совокупности в однородные группы по одному или нескольким признакам. Признак, положенный в основу группировки, называется группировочным.Если группировка проводится по одному признаку, то она называется простой, если по двум или нескольким признакам - комбинационной.

Исходя из сложности социально-экономических явлений, предпочтение следовало бы отдать комбинационным группировкам, однако, чем больше группировочных признаков используется, тем менее обозрима и информативна группировка. Чрезмерная детализация информации может привести к пустым и мало наполненным группам, т.е. группам, содержащим одну либо две единицы.

Использование группировок решает следующие основные задачи:

1. Выделение и описание объективно существующих типов и групп.

2. Изучение структуры совокупности и оценка структурных сдвигов.

3. Изучение связей и зависимостей между признаками.

Этим задачам соответствуют три вида группировок: типологическая, структурная, аналитическая. Рассмотрим примеры.

Типологическая группировка:выделение и описание объективно существующих типов и групп. В таблице 1.1 представлена группировка по атрибутивному признаку.

Таблица 1.1. - Среднегодовая численность занятых в экономике СПб по формам собственности организаций

Форма собственности 2005 год 2012 год
тыс. чел. % тыс. чел. %
А
Всего 2427,0 2530,4
государственная и муниципальная 780,9 32,2 713,1 28,2
частная 1365,8 56,3 1412,6   55,8
общественных организаций 24,5 14,7 0,6
смешанная российская 123,2 5,1 151,4 6,0
иностранная, совместная российская и иностранная 132,6 5,4 238,6 9,4

Типологическая группировка отражена в графах А, 1, 3. Группировочный признак – форма собственности. По каждой выделенной группе определен объем признака - число занятых в организациях разной формы собственности. Результат типологической группировки - абсолютные показатели, характеризующие объем выделенных групп (число единиц в группе) или объем признака в каждой группе, в данной таблице – численность занятых.

Таблица 1.2 содержит типологическую группировку по количественному признаку (графы А и 1).

Таблица 1.2. - Группировка регионов РФ по объему оборота розничной торговли в расчете на одного предпринимателя (по данным выборочного обследования 2004 г.)

Оборот розничной торговли на одного предпринимателя (тыс. руб.) Число регионов Доля регионов, %
А
До 100 5,7
101-150 14,8
151-200 21,8
201-250 16,4
251-300 13,7
Свыше 300 27,6


По величине оборота розничной торговли на одного предпринимателя выделено 6 групп и определено число регионов в каждой группе, что представляет типологическую группировку.

Структурная группировка: изучение структуры совокупности.

Структурная группировка, как правило, строится на базе типологической с использованием относительных показателей, т.е. рассчитывается доля каждой группы в общем объеме совокупности (либо в общем объеме признака). В таблице 1.1 структурная группировка представлена графами А, 2 и 4, в таблице 1.2. - графами А и 2

При наличии структурной группировки за ряд лет можно изучить динамику структуры, т.е. структурные сдвиги.

Задачааналитической группировки:отражение связей и зависимостей между признаками. Аналитическая группировка строится на основе признака-фактора, т.е. фактора, под влиянием которого изменяется другой признак, называемый результатом. Для каждой группы, сформированной на основе признака-фактора, рассчитывается средняя величина признака-результата. Наличие или отсутствие синхронности в изменении значений этих признаков позволяет выдвигать гипотезу о наличии или отсутствии связи между ними.

Таблица 1.3. - Зависимость сопротивления резины разрыву от времени вулканизации

Время вулканизации, мин., (X) Средняя величина сопротивления разрыву, кг/ сводка и группировка статистических данных - student2.ru , ( сводка и группировка статистических данных - student2.ru )  
30 – 34* 156,0  
34 - 38 165,4  
38 - 42 169,3  
42 - 46 173,7  

*Единицы совокупности со значениями признака, совпадающими с верхними границами интервала, относятся в следующую группу

Наблюдаемое закономерное увеличение значений средней величины показателя сопротивления разрыву (признак - результат), соответствующее увеличению времени вулканизации (признак - фактор), позволяет выдвинуть гипотезу о наличии прямой корреляционной зависимости между этими характеристиками.

Практическое построение группировок предполагает:

1. Выбор группировочного признака, что зависит от целей и задач исследования.

2. Определение числа выделяемых групп, которое зависит от объема совокупности и от вида группировочного признака.

Если группировка проводится по атрибутивному признаку, то число групп соответствует числу градаций признака в данной совокупности. Например, в таблице 1.1. число выделенных групп соответствует числу реально существующих форм собственности в данный момент время на конкретной территории.

Если группировка строится по количественному дискретному признаку, то число групп соответствует числу значений этого признака. Например, группировка студентов по курсам обучения.

Основная проблема связана с группировкой по количественному непрерывному признаку. В этом случае число групп можно определить по формуле Стерджеса:

сводка и группировка статистических данных - student2.ru , (1)

где k – число групп, N – объем совокупности.

Однако эта формула дает хорошие результаты только при изучении больших совокупностей, по край мере при N>100. В ином случае число групп определяется интуитивно, либо на основе профессионального опыта, либо опираясь на результаты предыдущих аналогичных исследований, либо на основе выбора из нескольких группировок, с использованием компьютерных программ и учетом конкретных требований к результатам группировки.

3. После определения числа групп, необходимо рассчитать величину группировочного интервала (при использовании компьютерных программ данная процедура, чаще всего, выполняется автоматически): сводка и группировка статистических данных - student2.ru , (2)

где h – величина группировочного интервала, Xmin и Xmax– минимальное и максимальное значения признака совокупности.

Например: Xmax= 1200; Xmin = 200; k = 5:

сводка и группировка статистических данных - student2.ru .

Нижней границей первого интервала будет минимальное значение признака (200), верхняя граница: 200 + 200(величина группировочного интервала) = 400. Нижняя граница второго интервала 400, верхняя - 600 (400=200) и т.д.

Интервалы группировок могут быть равными, прогрессивно возрастающими, прогрессивно убывающими или специализированными. Это зависит от характера группировочного признака, от степени его вариации, а также от цели исследования.

СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ

Сложность социально-экономических явлений порождает необходимость применения целой системы взаимосвязанных и взаимодополняющих показателей. При этом все показатели можно объединить в три группы: абсолютные, относительные и средние.

Абсолютные показатели – показатели, характеризующие объем совокупности в целом, отдельных ее типов или групп, или характеризующие объем признаков как в целом по совокупности, так и в разрезе отдельных типов (групп). Абсолютные показатели – это всегда именованные величины. Например, объем годовой выручки организации; площадь торговых помещений; фонд оплаты труда, численность населения в трудоспособном возрасте и т.п.

Относительные показатели рассчитываются как отношение тех или иных абсолютных показателей или ранее рассчитанных относительных или средних величин. В результате сопоставления одноименных абсолютных величин получают следующие относительные показатели:

· относительные показатели динамики – результат сопоставления одноименных характеристик во времени, например: объем ВВП в текущем году по сравнению с предыдущим годом, уровень среднедушевых денежных доходов населения в текущем году по сравнению с уровнем 2000 года и т.п.;

· относительные показатели структуры – отношение части к целому, например: доля населения в трудоспособном возрасте в общей численности населения; доля материальных затрат в общих затратах на производство и т.п.;

· относительные показатели планового задания и выполнения плана: отношение абсолютной величины планируемого уровня показателя к фактическому уровню за аналогичный предыдущий период и фактически достигнутого уровня к запланированному;

· относительные показатели координации – соотношение двух частей одного целого, например, соотношение численности мужского и женского населения, соотношение студентов первого и пятого курсов и т.п.;

· относительные показатели наглядности (сравнения) – соотношение одноименных характеристик по разным совокупностям (пространственное сравнение), например: сравнение показателей уровня жизни по регионам России или с показателями других стран.

В результате перечисленных сопоставлений получают либо коэффициент, либо показатель, выраженный в процентах.

· При сопоставлении разноименных абсолютных величин, получают относительные показатели интенсивности, характеризующие интенсивность распространения того или иного явления в определенной среде. К ним, например, относится показатели обеспеченности населения товарами длительного пользования, уровень потребления тех или иных продовольственных товаров и т.п. Показатели интенсивности – именованные величины, например: уровень потребления мяса на душу населения будет измеряться в кг./чел.; обеспеченность жильем - число кв. метров на душу населения.

Средние величины. Необходимость расчета средних величин обусловлена сложным характером социально-экономических явлений, которые, с одной стороны, устойчивы в массе, а с другой стороны, сугубо индивидуальны. Это связано с тем, что характеристики социально-экономических явлений формируются под влиянием значительного числа факторов. Одни из них выступают в качестве основных и формируют типический уровень признаков в совокупности. Другие факторы – случайные (в контексте конкретного исследования), они формируют отклонение индивидуальных значений признаков от типического (среднего) уровня по совокупности.

При расчете средних величин происходит взаимопогашение влияния случайных факторов, поэтому средние величины являются оценкой типического уровня признака, то есть уровня признака, характерного для данной изучаемой совокупности, для данного типа явлений в определенных условиях и в конкретное время. Объективной основой этой функции средних величин является качественная и количественная однородность изучаемой совокупности.

Как отмечал А. Кетле (бельгийский математик, астроном, социолог, родоначальник научной статистики (1796-1874), статистическое среднее представляет собойкатегорию объективной действительности. Типическое среднее – это истинная величина, отклонения от которой могут быть только случайными.

Наряду с типическими средними в практических расчетах используются и системные средние - это средние, рассчитанные по количественно не однородным совокупностям. Например, средняя заработная плата по Санкт-Петербургу. Эта средняя рассчитывается по всем видам деятельности, хотя уровень заработной платы по отдельным видам деятельности весьма различен, например, в банковской сфере и в сфере образования.

Наши рекомендации