Виды статистических группировок. Вторичные группировки
Содержание и пределы группировок многообразны. Различны и задачи, выполняемые ими. Однако принято выделять след. основные задачи, решаемые с помощью метода стат. группировок: образование типов исследуемых явлений: изучение строения изучаемых явлений и структурных изменений, происходящих в них; выявление связи м/ изучаемыми признаками.
Для решения этих задач соответственно применяют типологические, структурные, вариационные и аналитические группировки. Следует отметить, что приведенная классификация стат. группировок по выполняемым задачам имеет некоторую условность, поскольку они на практике применяются в комплексе.
Типологические группировки - это группировки, направленные на выявление наиболее крупных типов явлений (в т.ч. социально-экономических) и осуществляемые посредством расчленения разнотипной массы явлений на однородные, качественно не сводимые друг к другу совокупности.
В основу типологической группировки могут быть положены как атрибутивные (описательные), так и количественные признаки. Главная задача любой типологической группировки состоит в том, чтобы она адекватно отражала реально существующие типы изучаемых явлений.
При использовании метода типологических группировок важное значение имеет правильный выбор группировочного признака. При атрибутивном признаке с незначительным разнообразием его значений число групп определяется свойством изучаемого явления: группировка населения по половозрастному признаку, предприятий и хозяйств - по формам собственности, стран - по типу государственного устройства и т.п.
Выделение типов на основе количестденного признака состоит в определении групп с учетом значений (величины) изучаемых признаков. При этом очень важно правильно установить интервал группировки на основе которого количественно различаются одни группы от других, намечаются гранит выделения их нового качества.
Типологические группировки необходимо отличать от классификаций Классификация представляет собой расчленение совокупности явлений на однородные в качественном отношении группы, классы, разряды на основании и сходства и различия бел характеристики каждой из них числовыми показателя ми. Классификация, таким образом, это простой перечень - однотипных групп простое разбиение явлений на классы, в то время как типологическая группировка немыслима без количественных характеристик каждого из выделяемых типов явления.
Типологические группировки широко применяются в правовой статистике. Например, распределение преступлений по главам уголовного кодекса, распределение осужденных по видам примененных к ним наказаний, расчленение осужденных по полу, по социальному положению и т.п. Главное во всех случаях - качественная несводимость одной группы к другой.
Структурные группировки - расчленение на отдельные группы в целом однородных по своей сущности совокупностей. Например, при изучении отдельных видов преступлений - хищений, убийств, хулиганства и т.д. В качестве структурных группировок будут выступать группировки хищений по способам, размерам хищений; группировки убийств по мотивам, по формам вины, группировки хулиганств по квалифицирующим обстоятельствам и т.д.
Вариационные группировки - это по существу разновидность структурных группировок. Если учесть, что структурные строятся на основе качественных (атрибутных) признаков, то вариационные создаются на основе количественного варьирующего, т.е. изменяющегося признака, общего для данной совокупности. Например, группировка осужденных к лишению свободы по сроку наказания, группировка исков о возмещении вреда по размерам и т.п.
Аналитические группировки - это группировки, направленные на выявление взаимосвязи между двумя или несколькими признаками изучаемого явления или самими явлениями. Эти признаки делятся на факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие, зависящие от них признаки, называемые результативными.
Суть взаимосвязи проявляется в том, что с изменением значения факторного признака соответственно возрастает или убывает значение признака результативного.
Наглядным примером такой зависимости является взаимосвязь между себестоимостью продукции и производительностью труда: чем выше производительность труда, тем ниже в среднем себестоимость продукции. Аналитические группировки позволяют выявить также взаимосвязи и в сфере социально-правовых отношений. Например, чем больше преступлений, тем ниже в среднем сроки наказания. Объясняется это тем, что «массовые преступления имеют свойство быстро перерастать в норму жизни».'
Статистические группировки производят, как правило, на основе мате риалов первичного учета: карточек на обвиняемого, на уг. дело и т.п. Но помимо таких группировок, которые можно назвать первичными в статистике встречаются и так называемые вторичные группировки, т.е. перегруппировки уже сгруппированного материала. К вторичной группировке прибегают тогда когда ранее производимые группировки (первичные) не дают возможности глубоко исследовать изучаемые явления, установить закономерности их развития, их типические особенности. Например, есть необходимость сравнить уровень преступности по ряду областей за несколько лет, причем по первой области имеется материал сгруппированный по отдельным месяцам, по второй — по кварталам, а по третьей - по годам. Очевидно, что для сравнения мы вынуждены будем перегруппировать материалы по первой и второй областям, т.е. укрупнить интервалы до одного года. Только после такой вторичной группировки можно сопоставить данные по всем трем областям.
Ряды распределения.
Результаты сводки и группировки материалов стат. наблюдения оформляются в виде стат. рядов распределения и таблиц.
Рядами распределения называются ряды числовых показателей, характеризующие распределение единиц изучаемой совокупности в зависимости с группировочного признака. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта.
В завис-ти от группировочного признака ряды распределения могут быть: 1) атрибутивными, если они образованы по кач-ному признаку (специальность, национальность, пол и т.п.); 2) вариационными, если они образованы по колич-ному признаку (срок лишения свободы, размер штраф сумма иска и т.п.).
Вариационный ряд обычно изображается в виде 2х срок, первая строка хар-ризует значение или варианты изучаемого варьирующего признака, вторая строка указывает, сколько раз (как часто) данное значение встречается. Первая строка называется строкой значений или вариантов, а вторая - строка частот. В нашем примере сроки лишения свободы будут вариантами, а число осужденных — частотой.
Вариационные ряды подразделяются на 2 вида: дискретные и интервальные. В дискретных рядах распределение признака дается только в виде целых чисел. Например, количество обвиняемых, приходящихся на одно уголовное дело. В интервальных рядах вариация исследуемого признака дается в виде непрерывно изменяющейся величины, т.е. значение признака может быть выражено любым дробным числом. Например, сроки лишения свободы, варьирующие в пределах года (6 месяцев, 9 месяцев и пр.). Для интервальных вариационных рядов характерно, что они строятся на основе количественного признака, выражающегося в виде интервала «от ... до».
Результаты сводки и группировки материалов оформляются в виде статистических рядов распределения.
Ряд распределения – это ряд числовых показателей, хар-ризующих распределение единиц изучаемого явления в завис-ти от группировочного признака. Они хар-ризуют состав или структуру изучаемого явления, позволяют судить о её однородности.
Виды рядов распределения:
В завис-ти от группировочного признака выделяют:
1. атрибутивные (качественные) ряды – составляют по нац-ности, по спец-ности, по полу, по семейному положению;
2. вариационные ряды – составляются по колич-ному признаку (напр.: по сроку лишения свободы, размеру штрафа, размеру причинённого ущерба).
Вариационный ряд распределения всегда состоит из 2х строк: 1 строка хар-ризует значение или варианты изучаемого варьирующего признака – это строка значений или вариаций; 2 строка показывает сколько раз, как часто данное значение встречается – это строка частот.
Вариационные ряды распределения бывают 2х видов:
1) дискретные ряды – распределение признака даётся в виде целых чисел (кол-во обвиняемых),
2) интервальные ряды – значение изучаемого признака даётся в виде непрерывно изменяющейся величины, т.е. это может быть любое дробное число (сроки лишения свободы: от и до).
Средняя прогрессивная.
Средняя прогрессивная — это средняя арифметическая, рассчитанная из показателей, которые выше средней арифметической по всей совокупности.
Например, 5 спортсменов пробежали 100-метровку со следующими результатами:
1-й за 15 сек., 2-ой за 12 сек., 3-й за 10 сек., 4-й за 14 сек., 5-й за 19 сек. Средняя арифметическая по всей совокупности будет равна 14 сек.
Значит, средняя прогрессивная должна рассчитываться только из тех показателей, которые по своему значению превосходят среднюю арифметическую всей совокупности (14 сек.). А это есть показатели 2-го (12 сек.) и 3-го (10 с спортсменов.
Т.о., средняя прогрессивная будет равна 11 сек.,
т.е. на 3 сек. отличается от средней арифметической всей совокупности. И оборот, средняя арифметическая, рассчитанная из показателей, которые по ему значению уступают средней арифметической всей совокупности может быть названа средней регрессивной, т.е. средней по худшим показателям, какими показателями в нашем примере есть показатели 1-го (15 сек.) и 5-го сек.) спортсменов.
Т.о., средняя регрессивная будет равна 17 сек.
Показатели вариации
В начале данной главы говорилось о том, что средние величины не должны применяться огульно, что они используются для характеристики качественно однородных групп изучаемой совокупности, в которых колеблемо (варьирование) индивидуальных знаний признака не столь велико. Для характеристики степени однородности изучаемой совокупности, степени колеб. индивидуальных знаний признака от средней по всей совокупности и меняются, так называемые показатели вариации: размах вариации, средне линейное отклонение, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации - это разность между максимальным и минимальным значением признака по данной совокупности. Возьмем для примера две группы по 5 человек, осужденных к различным срокам наказания в виде лишения свободы: 1) I год, 4 года, 6 лет, 9 лет и 15 лет; 2) 4 года, 6 лет, 7 лет, 8 лет и 10 лет.
Средний срок лишения свободы для 1-ой и 2-ой группы будет одинаков-7 лет:
Однако степень однородности этих двух групп, степень колеблемости (варьирования) индивидуальных значений признака в этих группах резко отличаются (вторая группа более однородна по сравнению с первой). Подтвердим этот вывод путем применения различных показателей вариации. Итак, размах вариации как разность между максимальным и минимальным значением признака для первой группы будет равен 14 лет (15-1), а для второй — всего 6 лет (10-4). Однако размах вариации показывает лишь разницу между максимальным и минимальным значением изучаемого признака, не касаясь степени колеблемости (варьирования) признаков остальных единиц совокупности.
Поэтому для более полной, более точной характеристики степени колеблемости индивидуальных значений признака изучаемой совокупности дает показатель среднего линейного отклонения (Л).
Среднее линейное отклонение - это средняя арифметическая, полученная из абсолютных отклонений индивидуальных значений признака от средней арифметической по всей совокупности.
Т.о., среднее линейное отклонение для первой группы будет равно:
Среднее линейное отклонение, по сравнению с размахом вариации, фиксирует, таким образом, отклонения индивидуальных значений признака каждой единицы совокупности от общей средней по всей совокупности.
Среднее квадратичное отклонение определяется путем извлечения корня квадратного, из суммы квадратов линейных отклонений, поделенных число индивидуальных значений признаков изучаемой совокупности.
Таким образом, в нашем примере среднеквадратичное отклонение для первой группы будет равно:
Среднее квадратичное отклонение для второй группы будет равно:
Как показатель вариации среднее квадратичное отклонение применяет
Среднее линейное отклонение для второй группы будет равно:
Применительно к нашему примеру коэффициент вариации (Кв.) для правой группы можно рассчитать по формуле