Совокупности на группы, характеризующие ее структуру какому-либо варьирующему признаку.
Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой
Сводка и группировка – это важные звенья в статистическом исследовании. Можно располагать прекрасным статистическим материалом, но испортить его неумелой сводкой.
ПРИМЕР
Имеются следующие данные о работе 14 заводов одной из отраслей промышленности:
Таблица 1.1.
Номер | Среднегодовая стоимость основных производственных фондов, млрд.руб. | Среднесписочное число работающих за отчётный период, чел. | Производство продукции за отчётный период, млрд.руб. |
3,0 | 3,2 | ||
7,0 | 9,6 | ||
2,0 | 1,5 | ||
3,9 | 4,2 | ||
3,3 | 6,4 | ||
2,8 | 2,8 | ||
6,5 | 9,4 | ||
6,6 | 11,9 | ||
2,0 | 2,5 | ||
4,7 | 3,5 | ||
2,7 | 2,3 | ||
5,3 | 7,3 | ||
5,0 | 6,4 | ||
3,1 | 3,0 | ||
ИТОГО | 57,9 |
1.Провести простую сводку.
2. Построить ряд распределения с равными закрытыми интервалами. Изучаемый признак - стоимость основных фондов .
3.Произвести группировку,образовав пять групп предприятий. Группировочный признак - стоимость основных фондов .
Величина интервала в этом случае определяется по формуле:
h=R/ n
где R = Xmax - Xmin т. е. размах вариации;
Xmax, Xmin - максимальное и минимальное значения признака в совокупности.
Тогда величина интервала будет равна:
( 7,0-2,0 ) /5 = 1
Теперь образуем группы предприятий, отличающиеся друг от друга по среднегодовой стоимости основных производственных фондов на эту величину. Первая группа заводов будет иметь размер основных производственных фондов в пределах от 2 до 3 млн. руб., вторая группа определится в пределах границ от 3 до 4 и т. д. Распределив заводы по группам, подсчитаем число заводов в каждой из них.
Техника подсчета проста. Можно сделать выборку нужных значений из табл. 1.1 и занести их
предварительно в рабочую таблицу
Таблица 1.2
Группы предприятий по стоимости основных производственных фондов, млрд.руб. | Номер предприятия (число предприятий) |
2,0-3,0 | 3,6,9 ,11 (4) |
3,0-4,0 | 1,4,5,14 (4) |
4,0-5,0 | 10 (1) |
5,0-6,0 | 12,13 (2) |
6,0-7,0 | 2,7,8 (3) |
На основании рабочей таблицы составляется ряд распределения заводов по размеру основных фондов:
Таблица 1.3
Группы предприятий по стоимости основных производственных фондов, млрд.руб. | Число заводов | Удельный вес предприятий группы в процентах к итогу |
2,0-3,0 | 3,6,9 ,11 (4) | 28,5 |
3,0-4,0 | 1,4,5,14 (4) | 28,5 |
4,0-5,0 | 10 (1) | 7,2 |
5,0-6,0 | 12,13 (2) | 14,3 |
6,0-7,0 | 2,7,8 (3) | 21,5 |
ИТОГО: |
После того как определён группировочный признак, задано число групп, и образованы сами группы необходимо отобрать показатели, которые характеризуют группы и определить их объёмные показатели по каждой группе
Таблица 1.4
Группы | Номер предприятия | Среднегодовая стоимость основных производственных фондов, млрд.руб | Среднесписочное число работающих за отчётный период, чел. | Производство продукции за отчётный период, млрд.руб. |
2,0-3,0 | 2,0 2,8 2,0 2,7 | 1,5 2,8 2,5 2,3 | ||
Итого | 9,5 | 9,1 | ||
3,0-4,0 | 3,0 3,9 3,3 3,1 | 3,2 4,2 6,4 3,0 | ||
Итого | 13,3 | 16,8 | ||
4,0-5,0 | 4,7 | 3,5 | ||
Итого | 4,7 | 3,5 | ||
5,0-6,0 | 5,3 5,0 | 7,3 6,4 | ||
Итого | 10,3 | 13,7 | ||
6,0-7,0 | 7,0 6,5 6,6 | 9,6 9,4 11,9 | ||
Итого | 20,1 | 30,9 | ||
Всего | 57,9 |
Окончательная сводная таблица с результатами группировки
Таблица 1.5
Группы | Номер предприятия | Среднегодовая стоимость основных производственных фондов, млрд.руб | Среднесписочное число работающих за отчётный период, чел. | Производство продукции за отчётный период, млрд.руб. | ||||
Число предприятий | В % к итогу | Млрд.руб. | В % к итогу | человек | В % к итогу | Млрд.руб | В % к итогу | |
2,0-3,0 | 28,5 | 9,5 | 16,4 | 20,4 | 9,1 | 12,3 | ||
3,0-4,0 | 28,5 | 13,3 | 34,2 | 16,8 | 22,7 | |||
4,0-5,0 | 7,2 | 4,7 | 8,1 | 7,2 | 3,5 | 4,8 | ||
5,0-6,0 | 14,3 | 10,3 | 17,8 | 13,8 | 13,7 | 18,5 | ||
6,0-7,0 | 21,5 | 20,1 | 34,7 | 24,4 | 30,9 | 41,7 | ||
Итого | 57,9 |
Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
Результаты статистической сводки материалов даются в виде статистических таблиц. Табличный метод изложения цифровых данных — это большое достижение статистики. Ит
Статистическая таблица — это форма рационального изложения цифрового материала.
Составные части и элементы статистической таблицы показаны на следующей схеме:
Название таблицы
(общее заглавие)
Содержание строк | Наименование граф (верхние заголовки) | |||||
А | ||||||
Наименование строк (боковые заголовки) | ||||||
Итоговая строка |
Статистическая таблица— это ряд взаимопересекающихся горизонтальных и вертикальных линий, образующих по горизонтали строки, а по вертикали —графы (столбцы, колонки). Таким образом, строки и графы образуют как бы скелет таблицы.
Подлежащимстатистической таблицы называется объект изучения. Это могут быть единицы статистической совокупности, их группы, которые характеризуются числовыми показателями.
Сказуемымстатистической таблицы называется перечень числовых показателей, которыми характеризуется объект изучения, т. е. подлежащее таблицы.
Простыми называются такие статистические таблицы, в подлежащем которых нет группировок. Простые таблицы бывают перечневыми, территориальными и хронологическими.
В перечневых простыхтаблицахв подлежащем дается перечень единиц, составляющих объект изучения.
Групповыми называются такие статистические таблицы, в которых изучаемый объект разделен в подлежащем на группы по тому или иному признаку.
Комбинационной таблицей называется такая, где в подлежащем дана группировка единиц совокупности по двум и более признакам, взятым в комбинации.
III. Методические указания, задачи и упражнения к темам «Абсолютные, относительные и средние величины»
Показатели, которыми статистика характеризует совокупности единиц в целом или по группам, называются обобщающимипоказателями.
Первоначальным видом обобщающих показателей являются абсолютные величины.Их получают непосредственно в результате сводки (суммирования)первичного статистического материала. На основе таких абсолютных величин исчисляют относительныеи средние величины,которые их дополняют.
Абсолютные статистические величины выражают либо уровни, характеризующие состояние явления на определенный момент, либо результаты процессов за определенный период.
Статистические абсолютные показатели являются всегда именованными числами. Они выражают размеры качественно определенных общественных явлений в присущих им единицах измерения. Эти единицы измерения могут быть натуральными (численность, вес, меры длины, объема) или денежными.
Относительная величина в статистике — это обобщающий показатель, который дает числовую меру соотношения двух сопоставляемых статистических величин.
Относительные величины получают в результате сравнения двух показателей. Знаменатель отношения, т. е. та величина, с которой сравнивают другую, называется основанием, или базой сравнения. Если основание принять за единицу, то относительная величина выразится в форме коэффициента , она покажет, во сколько раз сравниваемая величина больше или меньше основания. Относительная величина может быть выражена в процентах, если основание принято за 100. Она может быть выражена и в промилле, если основание принято за 1000.
В статистике применяются разнообразные относительные величины. В зависимости от их познавательной сущности различают относительные показатели выполнения плана, структуры, сравнения, динамики и интенсивности развития.
Показатели выполнения плана применяют для характеристики степени выполнения плана и исчисляют путем деления величины фактического выполнения на величину планового задания.
Показатель структуры — это относительная доля (или удельный вес) части в целом, выраженная в процентах.
Показатели сравнения. За базу сравнения берут какую-то одну часть совокупности, а все остальные выражают отношением к ней.
Показатели динамики (темпы). Их вычисляют путем отношения величины текущего периода к величине одного из прошлых периодов.
Показатели интенсивности развития. Их получают путем сравнения объемов разных совокупностей, находящихся в определенной связи друг с другом.
Средняяявляется наиболее распространенным обобщающим показателем в статистике
Средней величиной в статистике называется обобщающая характеристика совокупности однотипных явлений по какому-либо количественно варьирующему признаку, которая показывает уровень признака, отнесенный к единице совокупности.
Средние, которые применяются в статистике, относятся к классу степенных средних.
Вычисляют среднюю арифметическую (простую и взвешенную), среднюю гармоническую и среднюю хронологическую.
Средняя арифметическая —наиболее распространенный вид средних, так как она соответствует природе общественных явлений, где объем варьирующих признаков в совокупности чаще всего образуется именно как сумма значений признака у отдельных единиц совокупности.
Среднюю арифметическую получают делением суммы значений варьирующего признака на число этих значений.
где
x- варьирущее значение признака;
f-число значений признака.
ПРИМЕР
Имеются данные о тарифном разряде рабочих на предприятии:
Тарифный разряд | ||||||
Число рабочих |
Определить средний тарифный разряд рабочих.
В данном примере средний тарифный разряд будет равен:
= (1×3 + 2×5 + 3×10 + 4×12 + 5×20 +6×26) / (3 + 5 + 10 + 12 + 20 + 26) =
= 347 / 76 = 4,57 ≈ 5 (разр.)
Соответственно средний тарифный разряд рабочих на предприятии – 5.
Средняя гармоническая —это величина, обратная средней арифметической из обратных значений признаков.
где
W - значение варьирующего признака на число этого признака, т.е. x × f
x- варьирущее значение признака.
ПРИМЕР
Определить среднюю цену картофеля , если известно, что картофель куплен по разным ценам :
№ партии | Цена за кг ( руб.) | Стоимость партии (руб.) |
В качестве весов применяется стоимость партий. Тогда средняя цена картофеля равна:
=( 10000 + 7000 + 5000 ) / ( 10000 / 10 ) + ( 7000 / 13 ) + ( 5000 / 16 ) = 22000 / 1851 = 11,9 (руб.)
Средние величины и показатели вариации широко применяются для характеристики статистических совокупностей по варьирующим признакам.
Для определения средней величины заработка значение первого (открытого) интервального варианта (если нет индивидуальных данных) принимается величина интервала, следующего за ним.
При вычислении среднего квадратического отклонения при достаточно большом объёме изучаемой совокупности (n>30) применяются формулы:
(невзвешенная);
(взвешенная).
Но в так называемых малых выборах (n 20) расчёт производится по формуле:
.
IV. Методические указания, задачи и упражнения к теме «Выборочный метод в статистике».
Выборочный метод имеет важное значение. Это связано с сокращением отчётности при переходе к рыночной экономике.
Для вычисления средней ошибки выборки в том случае, когда генеральная совокупность представляется достаточно большой или отношение выборки к численности генеральной совокупности (n:N) менее 5%, то поправкой (I - ) можно пренебречь и находить ошибку выборки по способу повторного отбора, даже если сама выборка была бесповторной.
Наиболее частой ошибкой является отождествление средней ошибки, выборочной средней и средней ошибки выборочной доли. Изучая эту тему, надо хорошо усвоить, что средняя ошибка выборочной средней определяется по вариации количественного признака
(x1, x2, …,xn).
(для бесповторного собственно случайного отбора)
Средняя ошибка выборочной доли:
(для бесповторного случайного отбора)
определяются по показателям дисперсии альтернативного признака [ ], где .
В решении этих задач часто неверно представляется значение так называемого коэффициента доверия (t) при заданной степени вероятности. Значение (t) определяется по специальным таблицам, которые приводятся в курсах статистики. Наиболее часто встречающиеся значения (t) приведены в учебниках.
V. Методические указания, задачи и упражнения к теме «Статистическое изучение динамики».
В теме излагается методология изучения развития социально-экономического явления во времени.
Для успешного выполнения задач данной темы необходимо уяснить познавательное значение и условия применения показателей, характеризующих изменения уровней ряда динамики (y): абсолютный прирост ( ), темп роста (Tp) и прироста (Tn) и др.
Важное значение в условиях интенсификации социально-экономических явлений имеет показатель, отображающий наращивание экономического потенциала. Для сравнительного анализа наращивания социально-экономических явлений используется показатель темпа наращивания (Тн):
Тн = П цi : y0i
Часто допускаются ошибки при определении среднего уровня ряда динамики. Надо уяснить, что в интервальных рядах динамики (с равными интервалами) средний уровень определяется по формуле:
В моментных рядах динамики (с равноотстающими датами времени) средний уровень определяется по формуле:
.
В задачах на изучение сезонных колебаний показатели средних уровней исчисляются для определения в рядах динамики общей тенденции роста (тренда). Это важно для обоснования методов измерения сезонных колебаний.
В стабильных рядах динамики, в которых нет ярко выраженной общей тенденции роста, сезонные колебания измеряются на основе постоянного среднего уровня. Для определения по одноимённым внутригодовым периодам обобщающих показателей по формуле:
,
где - усреднённый уровень одноимённых внутригодовых периодов (за ряд лет); - общий (постоянный) средний уровень.
В рядах динамики с ярко выраженной общей тенденцией роста сезонные колебания изучаются на основе переменного уровня, выражающего тренд (yt).
Тренд в рядах внутригодовой динамики обычно определяется способом аналитического выравнивания.
При применении этого способа расчёт индексов сезонности производится по формуле:
,
где yi – исходный (эмпирический) уровень изучаемого внутригодового периода; yti – выровненный (теоретический) уровень изучаемого периода; n – число годовых периодов.
При определении среднего (среднегодового) темпа роста ( ) по абсолютным уровням ряда используется формула:
,
где yn – конечный уровень ряда; y0 – базисный уровень ряда; m – число субпериодов в изучаемом ряду динамики.
Например, если продажа товара А составляла в 1995г. – 353 тыс. т, а в 2000г. – 480 тыс. т, то расчёт среднегодового темпа роста производится так:
(в периоде 1995г. – 2000г. – 6 лет).
Извлечение корня высокой степени при определении среднего темпа роста производится по специальным таблицам.
Для определения среднего (среднегодового) абсолютного прироста ( ) по цепным (погодовым) приростам ( цi) используется формула:
, где n – число цепных (погодовых) абсолютных приростов.
Средний (среднегодовой) абсолютный прирост можно определить и по абсолютным уровням ряда динамики:
, где yn – конечный уровень ряда динамики; y0 - базисный уровень ряда динамики; m – число субпериодов в изучаемом интервале времени.
Так, для приведённых выше данных о продаже продукта А среднегодовой абсолютный прирост определяется так:
тыс. т.
показатели среднего темпа роста и среднего абсолютного прироста применяются при краткосрочном статистическом прогнозировании (КСП) путём экстраполяции уровня развития изучаемого явления на ближайшее будущее. При КСП предполагается, что выявленная внутри динамического ряда основная закономерность роста (тренда) сохраняется и в дальнейшем развитии. Поэтому, если в статистическом ряду нет резких колебаний цепных показателей динамики, то для определения экстраполируемого уровня (yn+1) применяются формулы:
а) по среднему абсолютному приросту ( )
yn+1 = yn + l;
б) по среднему темпу роста ( )
yn+1 = yn( )l.
При этом: yn – конечный уровень ряда динамики с вычисленными или ; l – срок прогноза (упреждения).
Для КСП может быть использован метод экстраполяции тренда на основе аналитического выравнивания уровней ряда динамики, отображающего динамику развития явления за отдельные этапы экономического развития.
Расчёт экстраполируемого уровня (ytn+lt) производится по формуле:
ytn+lt = а0 + а1lt.
При этом: а0 и а1 – параметры модели тренда; lt – показания времени прогнозируемого периода.
VI. Методологические указания, задачи и упражнения к теме «Индексный метод в статистике».
При решении задач этой темы надо прежде всего уяснить особенности применения индексного метода в статистике, его сущность и сферу применения, после чего необходимо изучить конкретные виды и формы индексов.
Часто в задачах о продаже (реализации) товаров в денежном выражении данные о товарообороте отчётного периода в фактических ценах (q1p1) ошибочно принимаются за продажу товаров в натуральных (физических) измерителях (q1).
При вычислении общего индекса цен по формуле средней гармонической важно определить индивидуальные индексы .
Например, если цена на товар А повышена в отчётном периоде (p1) по сравнению с базисным (p0) на 13%, то индивидуальный индекс вычисляется так:
.
При определении индексов полезно использовать систему взаимосвязанных индексов товарооборота:
индекс цен (ip)
товарооборот индекс цен (ip)
в фактических индекс физического объёма
ценах (iqp) товарооборота (iq)
На основе этой системы по двум известным индексам определяется значение третьего неизвестного индекса.
Например, по данным о росте в отчётном периоде (по сравнению с базисным) товарооборота в фактических ценах на 9% и снижении цен на 3% можно вычислить индекс физического объёма товарооборота:
iq = iqp : ip = 1,09 : 0,97 = 1,1236 или 112,4%
VII. Методологические указания, задания и упражнения к теме «Статистическое изучение связи».
В этой теме рассматривается методология статистического изучения связи социально-экономического явления. Для выполнения задач по данной теме надо прежде всего уяснить виды взаимосвязей, изучаемых в статистике, знать конкретные задачи, которые решаются статистическими методами.
Важно понять, что для установления формы связи необходимо исходить из характера изменения результативного признака (y) под влиянием признака – фактора (x). Математическая обработка исходных данных важна при выборе адекватной формы связи.
Для определения по данным парной корреляции параметров прямолинейной регрессии
yx = a0+a1x решается система нормальных уравнений:
na0 + a1 x = y
a0 x + a1 x2 = xy
Для нахождения параметров a0 и a1 целесообразно использовать способ определителей:
,
Важно также уяснить, если форма связей отвечает уравнению yx = a0+a1x, то для изучения связи применяется линейный коэффициент корреляции (r). Исчисление этого показателя основано на сопоставлении стандартизированных отклонений (t) признаков y и x от их среднего значения:
, где , (n – число сопоставимых пар).
Путём математических преобразований получают ряд производных формул, по которым в зависимости от характера исходных данных и используемых средств вычислительной техники определяется r. Так, линейный коэффициент корреляции можно определить по формуле:
.
Использовать эту формулу удобно по данным, на основе которых определялись параметры уравнений связи.
При непрямолинейной форме для измерения тесноты связи определяется индекс корреляции (R).
Для качественной оценки тесноты связи можно воспользоваться таблицей (по шкале Чеддока):
Значение коэффициента корреляции | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
Характеристика тесноты связи | слабая | умеренная | заметная | высокая | весьма высокая |
В задачах этой темы допускаются ошибки при определении показателей тесноты связи. Не всегда используется метод логического контроля исчисленных характеристик. Из сущности показателей тесноты следует, что их числовые значения могут стремиться к пределу .