Методические указания к выполнению задания 1
Методические указания по выполнению задач
Тема. Сводка и группировка статистических данных
Задание 1
Таблица 1. Исходные данные | ||||||
Номер предприятия | Объем выпускаемой продукции, млрд.руб. | Средняя заработная плата, руб. | Уставный капитал, млрд.руб. | Число работающих, чел. | Объем реализованной продукции, млрд.руб. | |
3,21 | 2,11 | |||||
9,64 | 8,54 | |||||
1,53 | 2,43 | |||||
4,27 | 3,17 | |||||
6,48 | 5,38 | |||||
2,83 | 1,73 | |||||
9,45 | 8,35 | |||||
11,96 | 10,96 | |||||
2,58 | 1,58 | |||||
3,59 | 2,49 | |||||
2,39 | 1,39 | |||||
1,33 | 2,33 | |||||
1,44 | 1,47 | |||||
3,07 | 2,97 | |||||
2,56 | 2,46 | |||||
7,95 | 6,95 | |||||
3,68 | 2,68 | |||||
8,09 | 7,79 | |||||
2,52 | 1,52 | |||||
2,84 | 1,74 | |||||
1,67 | 1,47 | |||||
12,99 | 11,8 | |||||
5,61 | 4,51 | |||||
4,43 | 3,43 | |||||
4,73 | 3,63 | |||||
3,82 | 2,87 | |||||
2,35 | 1,35 | |||||
2,98 | 1,88 | |||||
5,77 | 4,67 | |||||
2,29 | 1,39 | |||||
Итого | 138,05 | 115,04 | ||||
Сгруппировать предприятия по показателю, указанному в задании, выделив четыре группы. Определить среднюю величину, моду и медиану, показатели вариации. Изобразить графически результаты группировки. Сформулировать выводы. | ||||||
Таблица 2. Распределение данных по вариантам для задания 1 | ||
№ варианта | Номера предприятий | Группировочный признак |
1-17 | Уставный капитал | |
2-19 | Уставный капитал | |
3-26 | Уставный капитал | |
4-25 | Объем выпускаемой продукции | |
5-24 | Объем выпускаемой продукции | |
6-23 | Объем выпускаемой продукции | |
7-26 | Объем реализованной продукции | |
8-25 | Объем реализованной продукции | |
9-30 | Объем реализованной продукции | |
10-29 | Объем реализованной продукции | |
11-30 | Число работающих | |
1-17 | Число работающих |
Методические указания к выполнению задания 1
Сводка - комплекс последовательных действий по обобщению конкретных единичных данных, образующих совокупность, с целью обнаружения типичных черт и закономерностей, присущих изучаемому явлению в целом. Сводка проводится на основе всестороннего теоретического анализа изучаемого явления.
По глубине обработкисводка бывает:
Простая сводка - операция по подсчету общих, итоговых (суммарных) данных по совокупности единиц наблюдения (например, количество студентов, имеющих «5», «4» и т.д.).
Сложная сводка включает в себя группировку данных наблюдения, подсчет общих и групповых итогов, получение системы взаимосвязанных показателей, представление результатов группировки и сводки в виде статистических таблиц (например, расчет средних оценок по группам на факультете).
По форме обработки материала сводки бывают децентрализованными (обработка материала происходит последовательными этапами: сверху вниз – указания, снизу вверх – отчетные данные) и централизованными (весь статистический материал поступает в одну организацию, которая обрабатывает его от начала и до конца, делая соответствующие выводы, например, централизованное тестирование).
По содержанию сводки бывают первичными и вторичными (основываются на данных первичной сводки и представляют собой отчеты, таблицы, сводные балансы по отраслям народного хозяйства или по территориальному признаку).
По технике и способу выполнения сводки подразделяются на ручные и механизированные (с помощью ЭВМ).
Задача сводки - характеристика объекта исследования с помощью запроектированных систем статистических показателей, выявление и измерение существенных черт и особенностей явлений и процессов общественной жизни.
Этапы сводки:
1)определение групп и подгрупп. Осуществляется систематизация, группировка материалов, собранных при наблюдении
2)определение системы показателей. Уточняется предусмотренная планом система показателей, с помощью которых количественно характеризуются свойства и особенности изучаемого предмета;
3)определение видов таблиц. Исчисляются сами показатели, и обобщенные данные для наглядности и удобства представляются в таблицах, статистических рядах, графиках, диаграммах.
Сводка статистической информации, как правило, не ограничивается получением общих итогов по изучаемой совокупности. Чаще всего исходная информация на этой стадии статистической работы систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.
Метод группировки —метод в статистической методологии, позволяющий обобщить статистические данные, раскрыть наиболее существенные особенности, формы развития массового явления в целом и отдельных его составляющих.
Требования к научно обоснованной группировке:
1) глубокий анализ сущности и природы изучаемого явления, позволяющий определить его типические свойства и внутренние различия;
2) правильное, четкое определение существенных признаков, по которым должна проводиться группировка;
3) объективное, обоснованное установление границ групп при условии, что образованные группы должны объединять однородные элементы совокупности, а сами группы (одна по отношению к другой) должны существенно различаться.
Принцип метода группировок -определение групп по принципу подобия и различия единиц совокупности. Подобие - однородность единиц в определенных пределах (группах), различие - это их существенное расхождение по группам.
Группировка- расчленение общей совокупности единиц по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в качественном и количественном отношении.
Задачи группировок:
1) выделение в совокупности изучаемых явлений их социально-экономических типов;
2) изучение структуры общественных явлений;
3) выявление связей и зависимостей между общественными явлениями;
Важнейшими проблемами при построении группировки являются выбор группировочного признака или основание группировки.
Группировочный признак- варьирующий признак, по которому производится объединение единиц совокупности в группы.
Виды группировок определяются в зависимости от задач, решаемых с их помощью.
Типологическая группировка- это разделение качественно разнородной исследуемой совокупности на однородные группы единиц в соответствии с социально-экономическими типами. Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов. Они позволяют проследить зарождение, развитие и отмирание различных типов явлений. При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений. Она производится на базе глубокого теоретического анализа исследуемого явления.
Структурная группировка- группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. В основу структурных группировок могут быть положены атрибутивные или количественные признаки. Их выбор определяется задачами конкретного исследования и сущностью изучаемой совокупности. В изменении структуры общественных явлений отражаются важнейшие закономерности их развития.
Аналитическая группировка- распространенный прием статистического изучения связей, которые обнаруживаются при параллельном сопоставлении обобщенных значений признаков по группам. Различают зависимые признаки - результативные, значения которых изменяются под влиянием других признаков, и факторные признаки, оказывающие влияние на другие. В основе аналитической группировки лежит признак-фактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками.
Первичная группировка- непосредственная группировка данных статистического; наблюдения.
Вторичная группировка- это перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:
1) если ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;
2) для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группировочным признакам или по разным интервалам.
Способы вторичной группировки:а) объединение мелких групп в более крупные; б) выделение определенной доли единиц совокупности.
Простаягруппировка - группировка, в которой группы образованы по одному признаку, в сложнойразделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Сложная группировка может выполняться как комбинационная и как многомерная. При комбинационной группировкегруппы, выделенные по одному из признаков, затем подразделяются на подгруппы по другому признаку, которые, в свою очередь, могут быть разделены по следующему признаку. В случае если группировка осуществляется одновременно по группе признаков, ее называют многомерной.
В основе качественнойгруппировки лежит качественный (атрибутивный) признак. Количество групп качественной группировки определяется числом вариантов группировочного признака. Количественнаягруппировка - группировка, в основе которой лежит количественный признак.
При выборе в качестве группировочных некоторых атрибутивных признаков может быть выделено только строго определенное количество групп, равное количеству вариантов группировочного признака.
При группировке по количественному признакувопрос о количестве и границах групп следует решать исходя из сущности изучаемого социально-экономического явления. Чем больше размах варьирования, тем больше образуется групп, и наоборот.
Необходимо также принимать во внимание численность единиц совокупности, по которой строится группировка. При небольшом объеме совокупности нецелесообразно образовывать большое число групп, так как в этом случае в группах не будет достаточного числа единиц для выявления статистических закономерностей.
При группировке по количественному признаку определяется число групп и ширина интервалов в каждой группе.
Число групппри группировке по количественному признаку определяется по формуле Стерджесса:
n = 1 + 3,22 lgN,
где n - число групп;
N - численность совокупности.
Для определения числа групп можно воспользоваться номограммой Стерджесса:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | … |
n | … |
Интервал- промежуток между двумя значениями количественного группировочного признака, в пределах которого все значения признака относятся к одной группе, т.е. значение варьирующего признака, лежащее в определенных границах. Нижняя граница - наименьшее значение признака в интервале. Верхняя граница - наибольшее значение признака в интервале.
Величина (шаг) интервала- разность между его верхней и нижней границей. По величине группировочного признака интервалы подразделяются на равные и неравные.
Равные интервалыприменяются в тех случаях, когда изменение группировочного признака внутри совокупности происходит равномерно. Расчет величины равного интервала производится по формуле:
где n - число групп;
xmax, xmin - наибольшее и наименьшее значение признака в совокупности.
Если распределение группировочного признака внутри совокупности неравномерное, то используются неравные интервалы.Неравные интервалы могут быть прогрессивно возрастающими и прогрессивно убывающими в арифметической и геометрической прогрессии. Они могут быть также произвольными в зависимости от экономического или социального значения группировочного признака у единиц совокупности.
Закрытыеинтервалы - интервалы, в которых обозначены обе границы (например, 5-10, 10-15, 15-20, 20-25).
В открытыхинтервалах обозначена только одна граница. Открытыми интервалы бывают обычно в первой и последней группах (например, до 10, 10-15, 15-20, 20 и более).
Правила записи числа шага интервала:
- если величина интервала представляет собой величину, которая имеет 1 знак до запятой (например, 0,88; 1,585; 4,71), то полученные значения округляются до десятых (0,9; 1,6; 4,7);
- если 2 знака до запятой и несколько после (например, 15,985), то округляют до целых);
- если 3 знака и более до запятой, то округляют до ближайшего числа, кратного 50 или 100 (например, 557 следует округлить до 600; 112,53 до 100; 148,2 до 150).
Результаты группировокпредставляются в виде таблиц.
Статистическая таблица- форма наглядного и наиболее рационального изложения полученных в результате, статистической сводки и группировки числовых (цифровых) данных.
Подлежащеетаблицы - статистическая совокупность, о которой идет речь в таблице, т.е. перечень отдельных, или всех единиц совокупности или их групп.
Сказуемоетаблицы - показатели, с помощью которых дается характеристика явления, отображаемого в таблице.
В простой таблицев подлежащем дается простой перечень каких-либо объектов или территориальных единиц, т.е. в подлежащем нет группировки единиц совокупности. Простые таблицы бывают монографическими и перечневыми. Монографическиетаблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо группу из него, выделенную по определенному, заранее сформированному признаку. Простымиперечневыми таблицами называются табл
ицы, подлежащее которых содержит перечень единиц изучаемого объекта.
Групповыминазываются статистические таблицы, подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку. Сказуемое в групповых таблицах состоит из
числа показателей, необходимых для характеристики подлежащего.
Комбинационныминазываются статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и болев признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы по какому-либо другому признаку и т.д.
Основные правиласоставления статистических таблиц:
1) таблица по возможности должна быть небольшой и легкообозримой. В случае необходимости обработки большого количества материала вместо одной таблицы иногда могут быть построены несколько взаимосвязанных и последовательно расположенных друг за другом таблиц;
2) таблица должна содержать следующие компоненты:
- заголовок (в нем обычно указывается объект или территория, которым посвящена таблица);
- время, к которому относятся данные;
- единицы измерения, они могут указываться в заголовке таблицы, если все показатели таблицы выражены в одних и тех же единицах измерения и счета, или в заголовке соответствующих граф в случае присутствия в таблице различных единиц измерения;
3) при заполнении таблиц используются следующие условные обозначения:
- отсутствие данных в случае, если данная позиция не подлежит заполнению, обозначается знаком умножения (х);
- при отсутствии явления ставится знак тире (—);
- при отсутствии данных ставится многоточие (...) или пишется «н. св.» (нет сведений);
- для отображения очень малых чисел используют обозначение 0.0 или 0.00;
4) цифровые данные записываются в таблицу с одной и той же степенью точности;
5) сопоставляемую в ходе анализа информацию располагают в соседних графах (либо одну под другой);
6) если таблица печатается на нескольких страницах, то на первой странице сразу под сказуемым печатается строка, в которой графы сказуемого нумеруются, а на последующих страницах заголовки граф не повторяются, а указываются только их цифровые обозначения.
Средними величинами в статистике называют обобщающие показатели, выражающие типичные, характерные для определенных условий места и времени размеры и количественные соотношения явлений общественной жизни. В средних величинах погашаются индивидуальные различия в величине признака, которые возникают по тем или иным причинам у отдельных единиц изучаемой совокупности, и, наоборот, определяется уровень варьирующего признака, типичный для большинства единиц данной совокупности.
Статистическая совокупность – совокупность социально-экономических объектов или явлений общественной жизни, объединенных качественной основой, общей связью, но отличающихся друг от друга отдельными признаками.
Вариация — количественные изменения значений признака при переходе от одной единицы совокупности к другой. Вариация возникает под воздействием случайных, прежде всего внешних, причин. Вариация у единиц совокупности означает, что их признаки могут принимать различные значения или видоизменения. Такие признаки называются варьирующими, а отдельные значения или видоизменения называются вариантами.
В статистике различают несколько видов средних величин: арифметическую, гармоническую, геометрическую, хронологическую.
Конкретное решение о том, какой вид средней величины надо использовать в каждом отдельном случае, принимается в зависимости от экономического содержания изучаемого явления.
В зависимости от частоты повторения вариант средние исчисляются как простые невзвешенные, так и взвешенные.
Среднюю арифметическую рассчитывают по формуле:
- невзвешенную - взвешенную
где xi – значение усредняемого признака,
fi – частота появления признака,
n – единиц совокупности.
Разновидностью средней является мода и медиана. Это так называемые структурные средние, которые применяются для изучения внутреннего строения рядов распределения значений признака. Мода и медиана рассчитываются в дискретных и в интервальных рядах.
Дискретные вариационные ряды основаны на прерывных, или дискретных, признаках, интервальные – чаще всего на непрерывных. Прерывными называются признаки, имеющие определенные значения, между которыми нет промежуточных значений. Непрерывный признак характеризуется тем, что его варианты принимают любое значение. В дискретных рядах варианты выражаются целыми или определенными числами, а в интервальных варианты даются в виде интервалов.
Мода– это значение варьирующего признака (варианта), которое чаще всего встречается в статистическом ряду, т.е. это варианта, которой соответствует наибольшая частота.
В дискретных рядах модой является значение варианты с наибольшей частотой.
В интервальных рядах мода определяется по формуле:
где xMo - нижняя граница модального ряда,
i – величина модального интервала,
fMo – частота модального ряда,
fMo-1 – частота ряда, предшествующего модальному,
fMo+1 – частота ряда, следующего за модальным.
Модальный интервал – интервал, имеющий наибольшую частоту.
Медиана– это варианта, которая находится в середине непрерывно возрастающего (убывающего) вариационного ряда. Медиана делит ряд пополам, и по обе стороны от нее находится одинаковое количество единиц совокупности.
В дискретных рядах распределения при нечетном числе членов медианой является варианта, находящаяся в середине упорядоченного ряда. При четном числе членов медианой является средняя арифметическая из двух вариант, стоящих в центре ранжированного ряда.
В интервальном вариационном ряду медиана находится следующим образом. Сначала определяется медианный интервал - интервал, в котором находится медиана. Это интервал, кумулятивная (накопленная) частота которого равна или превышает половину суммы частот.
Затем определяется медиана по формуле:
где xMе - нижняя граница медианного ряда,
i – величина медианного интервала,
fMе – частота медианного интервала,
fн – сумма накопленных частот в интервалах, предшествующих медианному,
∑fi – сумма частот.
Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность или нетипичность этих средних путем измерения колеблемости (вариации) изучаемого признака.
Самыми простыми признаками вариации являются минимум и максимум - это самое наименьшее и наибольшее значение признака в совокупности.
Размах вариации (R) - разность между максимальным (xmax) и минимальным (xmin ) значениями признака в изучаемой совокупности:
R = x max – x min
Размах вариации не характеризует распределение отклонения внутри совокупности, он позволяет судить лишь о разбросе крайних значений признака в совокупности, т.е. делать выводы о том, в каких пределах варьируются значения изучаемого признака.
Среднее линейное отклонение:
- невзвешенное - взвешенное
где │x-xср│- абсолютное значение (модуль) отклонения варианты от средней арифметической.
Среднее линейное отклонение характеризует отклонение всех вариант от средней арифметической. Однако это значение не учитывает характера отклонений, которые могут быть или положительные, или отрицательные.
Для более точного определения колебаний численного значения изучаемого признака используются среднее квадратическое отклонение (σ) и дисперсия (σ2).
Дисперсия(σ2) - средняя арифметическая квадратов отклонений вариантов значений признака от их средней величины. Дисперсия обычно называется средним квадратом отклонений:
- невзвешенная - взвешенная
Среднее квадратическое отклонение – это обобщающая характеристика абсолютных размеров вариации признака в совокупности. Среднее квадратическое отклонение всегда выражаются в тех единицах измерения, в которых выражены сами варианты и их средняя.
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:
Если значение среднего квадратического отклонения составляет половину и более значения средней, то данные можно считать неоднородными.
Коэффициент вариации - наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Этот показатель позволяет сопоставить вариацию признака совокупностей, варианты которых имеют различные единицы измерения.
Совокупность считается качественно однородной, а средняя – типичной, если коэффициент вариации не превышает 33%. Коэффициент вариации применяется для сравнения колеблемости разнородных признаков.
Тема. Ряды динамики
Задание 2
Таблица 3. Динамика производства основных продуктов питания
в России на душу населения
Год | Производство, кг | |||
сахара и кондитерских изделий | овощей | зерна | картофеля | |
25,4 | ||||
27,5 | ||||
27,4 | ||||
26,8 | ||||
28,5 | ||||
24,3 | ||||
20,9 | ||||
26,3 | ||||
26,5 | ||||
26,2 | ||||
27,0 | ||||
26,0 | ||||
39,0 | ||||
44,0 | ||||
57,0 | ||||
53,4 | ||||
58,4 | ||||
57,0 |
Таблица 4. Распределение данных по вариантам для задания 2
Номер варианта | Производство продукции и годы | Схема расчета |
1985-1990 сахар и кондитерские изделия | Базисная и цепная схема | |
1991-1996 сахар и кондитерские изделия | Базисная и цепная схема | |
1997-2002 сахар и кондитерские изделия | Базисная и цепная схема | |
1985-1990 овощи | Базисная и цепная схема | |
1991-1996 овощи | Базисная и цепная схема | |
1997-2002 овощи | Базисная и цепная схема | |
1985-1990 зерно | Базисная и цепная схема | |
1991-1996 зерно | Базисная и цепная схема | |
1997-2002 картофель | Базисная и цепная схема | |
1985-1990 картофель | Базисная и цепная схема | |
1997-2002 зерно | Базисная и цепная схема | |
1991-1997 картофель | Базисная и цепная схема |
Согласно своего варианта произвести:
1) расчет показателей анализа рядов динамики;
2) аналитическое выравнивание по прямой;
3) рассчитать прогнозное значение анализируемого показателя на год, следующий за последним.
Изобразить графически эмпирические данные и линию тренда. Сформулировать выводы.