Тема 3. сводка и группировка статистических данных.
1. Задачи сводки и ее основное содержание
2. Метод группировок
3. Виды группировок
4. Вторичные группировки
5. Комбинированные группировки
6. Ряды распределения
7. Многомерные группировки и их классификация
1. Задачи сводки и ее основное содержание
Статистическая сводка - второй этап статистического исследования. Она приводит нас к цели статистического исследования - цифровому освещению фактов и явлений.
Статистическая сводка - сложная операция по научной обработке данных статистического наблюдения.
Ее задача - превратить массовые данные в систему статистических таблиц и итогов, которая позволит выявить наиболее типичные черты и закономерности изучаемых явлений.
Статистическая сводка состоит из:
Öсистематизация и группировка наблюдений
Öподсчет группировочных и общих итогов
Öсоставление системы первичных показателей для характеристики типичных групп и подгрупп изучаемого явления
Öоформление в виде статистических таблиц
Основа статистической сводки -всесторонний теоретический анализ изучаемых процессов и явлений.
Статистическая сводка проводится по программе, которая представляет собой систему разрабатываемых таблиц. Она определяет подлежащее и сказуемое сводки.
Подлежащее - группы и части исследуемой совокупности (о чем).
Сказуемое - показатели, характеризующие каждую группу или совокупность в целом (численный показатель).
Статистическая сводка производится по заранее составленному плану. Там фиксируются вопросы организации сводки, оформления результатов сводки и статистических публикаций.
Метод группировок
Группировка - эффективный метод исследования массовых общественных явлений.
Ее цель - выявить характерные черты и особенности состояния и развития изучаемой статистической совокупности.
Под ней понимают расчленение единиц совокупности на однородные группы по определенному существенному для них признаку.
Ее следует проводить на основе глубокого анализа сущности изучаемых явлений. Для ее осуществления устанавливается признак, по которому единицы совокупности определяются в группы. Этот признак называется группировочным (или основанием группировки). Выбор последнего должен согласовываться с задачей, которую эта группировка решает. От правильного выбора группировочного признака зависит ее результат.
Основанием группировки может являться как количественный, так и атрибутивный признак. При проведении сложной группировки в качестве основания выдвигаются несколько группировочных признаков и предыдущий признак является внешним.
Осуществление группировки по количественному признаку начинается с определения числа групп, на которые необходимо разбить совокупность. Оно зависит от:
ü цели исследования
ü объема совокупности
ü размаха вариации признаков совокупности
Проведение группировки по количественному признаку предполагает определение величины интервала признака.
Интервал - числовое значение, с помощью которого определяются границы изменения признака в группе. Интервалы могут быть равными и неравными. При равном интервале группировки величина интервала вычисляется по формуле:
d=(xmax-xmin)/n, где
d - величина интервала,
xmax - максимальное значение признака в группе,
xmin - минимальное значение признака в группе,
xmax-xmin=R - размах вариации
Иногда для определения интервала может быть использована формула Стерджеса (обычно при незначительных вариациях признаков):
d=(xmax-xmin)/(1+lnN), где
N - объем совокупности.
Величину неравных интервалов обычно задает сам исследователь, сообразуя с задачами группировки. Они могут быть прогрессивно возрастающими и убывающими. В большинстве случаев неравные интервалы возрастают и переходят к большим значениям признаков.
Интервалы могут быть открытыми и закрытыми. Открытые имеют одну границу. Они либо открывают либо закрывают группировку. Закрытый интервал имеет две границы: нижнюю и верхнюю. Нижняя указывает на min возможное значение признаков в данной группе, а верхняя - на max.
Метод группировок обычно предшествует всем прочим методам статистического анализа.
Виды группировок
С помощью метода группировок решаются следующие задачи:
þ выделение типов социально-экономических явлений
þ изучение структуры социально-экономических явлений
þ выявление взаимосвязи между явлениями
В связи с этим различают 3 вида группировок:
1) типологические
Распределение численности занятого населения на предприятиях и организациях различных форм собственности (по типам занятости):
Показатели | млн. | чел. |
90г. | 94г. | |
Всего занято в экономике | 75,3 | 68,5 |
в том числе: | ||
На государственных и муниципальных предприятиях и организациях | 62,2 | 30,6 |
В частном секторе | 9,4 | 22,6 |
В общественных организациях и фондах | 0,6 | 0,5 |
На совместных предприятиях | 0,1 | 0,3 |
На предприятиях и организациях смешанной формы собственности | 3,0 | 14,5 |
Пример группировки: группировка семей по социально-экономическим типам.
2) структурные
решают задачи по изучению строения (структуры) однородной в качественном отношении статистической совокупности.
Пример: структура денежных доходов/расходов населения.
Денежные расходы всего в том числе: | на покупку | продуктов питания |
непродовольственных товаров | ||
на оплату услуг: |
Сопоставление данных о структуре совокупности в динамике позволяет проанализировать структурные сдвиги, происшедшие в строении совокупности под воздействием социально-экономических факторов.
3) аналитические
позволяет выявить влияние одних признаков на другие, то есть установить взаимосвязь между ними. Взаимосвязанные признаки делятся на факторные и результативные. В статистике зависимые признаки называются результативными, а признаки, оказывающие влияние, - факторными. При проведении аналитической группировки совокупность разбивается на группы как правило по факторному признаку, а для каждой группы рассчитывается либо среднее значение результативного признака, либо относительная величина, если он качественный. Взаимосвязь при этом проявляется в систематическом изменении результативного признака в связи с изменением признака факторного.
Пример: Потребление фруктов и ягод в домохозяйствах в зависимости от уровня среднедушевого денежного дохода в 1994 г. (децильное распределение(10%)) кг на душу в месяц:
Децильная группа домохозяйств по уровню денежного дохода | Потребление фруктов и ягод в кг |
1. с наименьшим денежным доходом | 1,4 |
2. | 1,7 |
3. | 2,0 |
4. | 2,1 |
5. | 2,3 |
6. | 2,5 |
7. | 2,7 |
8. | 2,9 |
9. | 3,1 |
10. с наивысшим денежным доходом | 3,3 |
Вторичные группировки
Метод вторичной группировки - прием, используемый в статистическом исследовании для образования новых групп на основе ранее произведенной (первичной) группировки.
К вторичной группировке прибегают:
ÿ если результаты первичной группировки не удовлетворили исслед-ля
ÿ при появлении новых задач исследования
Она производится путем сведения статистических данных в новые группы по тому же признаку, что и первичная. При этом исходная статистическая информация не используется.
При проведении вторичной группировки производится либо дробление интервалов на более мелкие, либо их укрупнение. Осуществляя вторичную группировку, исходят из предположения о равном распределении признака внутри интервала.
Пример: Распределение населения РФ по размерам среднедушевого денежного дохода в 1996 г.
Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) | Население (в % к итогу) |
Все население | |
в том числе со среднедушевым денежным доходом открытый интервал: до 120,0 | 39,2 |
120,1 - 240,0 | 34,1 |
240,1 - 360,0 | 14,2 |
360,1 - 480,0 | 6,2 |
480,1 и выше | 6,3 |
Итого: |
Для проведения группировки нам необходимо определить новые группы и построить таблицу.
Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) | Население (в % к итогу) |
Все население | |
в том числе со среднедушевым денежным доходом открытый интервал: до 200,0 | 39,2+34,1/120*80=61,9 |
200,1 - 400 | (34,1-22,7)+14,2+6,2*40/120=27,7 |
400,1 и выше | (6,2-2,1)+6,3=10,4 |
Итого: |
Комбинированные группировки
Комбинированная группировка предполагает расчленение статистической совокупности по 2 и более признакам, взятым в сочетании. При этом сперва образуются группы по первому признаку, затем внутри выделяются подгруппы.
Комбинированная группировка обладает большими аналитическими возможностями, однако следует учитывать, что проведение группировки по большому числу признаков может привести к недостаточной численности единиц в группах. Поэтому к комбинированной группировке прибегают при достаточно большом объеме совокупности. Выбор группировочных признаков диктуется целью группировки.
Ряды распределения
В результате распределения единиц совокупности по величине какого-либо варьирующегося признака получают ряды распределения, которые дают возможность судить о закономерности распределения, однородности статистической совокупности и о границах вариации признаков совокупности. На основе рядов распределения исчисляются различные обобщающие показатели. Ряды распределения могут быть образованы как по атрибутивному, так и по количественным признакам. В зависимости от этогоразличают атрибутивные и вариационные ряды распределения. Они состоят из вариантов признаков и частот.
Пример атрибутивного ряда:
Национальность студента | Количество студентов |
русские | |
украинцы | |
белорусы | |
молдаване | |
казахи |
Пример: дискретный вариационный ряд распределения:
Оценка | Количество студентов |
Дискретные ряды основаны на прерывных или дискретных признаках. Графиком является полигон (ОХ - варианты признака, ОУ - частости). График - ломаная кривая, соединяющая все пары чисел, имеющие координатами вариант и частоту.
Интервальные ряды распределения получаются в результате интервальной группировки. Признак в этих рядах распределения варьируется непрерывно внутри интервала. График - гистограмма (ОХ - отрезки, соответствующие границам изменения признака в интервале, ОУ - частоты).