Сущность группировки. Виды группировок, задачи и значение
Изучаемые статистикой массовые явления и процессы протекают во множествах элементов (единиц) некоторого вида, или совокупностях. В изучении массового явления необходимо, прежде всего, определить действующие в нем различные качественно однородные совокупности. Отдельные единицы статистической совокупности объединяются в группы. Группировки являются важнейшим статистическим методом обобщения данных, основой для правильного исчисления аналитических показателей.
Группировка – разбиение совокупности на группы, однородные по какому либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким либо признакам.
С помощью метода группировок решаются следующие задачи:
ü Выявление социально-экономических типов явлений;
ü Изучение структуры явления и структурных сдвигов, происходящих в нем;
ü Выявление связи и зависимости между явлениями;
Метод группировки основывается на двух категориях – группировочном признаке и интервале.
Группировочным признакомназывается признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В качестве основания группировки следует использовать существенные признаки. При этом в основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (урожайность, основные фонды и т.д.), а вторые отражают состояние единицы совокупности (отраслевая принадлежность предприятия, его форма собственности организационно-правовая форма, виды сельскохозяйственных угодий и т.д.).
После определения основания группировки следует решить вопрос о количестве групп, на которое надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, население в трудоспособном возрасте и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные и годовые группы.
При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка сельскохозяйственного производства по экономическим районам, то вся исследуемая совокупность делится на 12 групп: именно на столько экономических районов поделена территория страны.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями в группе. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в нем.
Величина интервалапредставляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или мене равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:
Xi= ;
где Xi - величина равного интервала;
Xmax и Xmin; - максимальные и минимальные значения группировочного признака;
n – предполагаемое число групп.
Полученную таким образом величину округляют. Она является шагом интервала.
Первые и последние интервалы количественной группировки могут быть открытыми и закрытыми.
Открытые – это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя – у последнего. Закрытыми называются интервалы, у которых обозначены обе границы.
Величина открытого интервала принимается равной величине смежного с ним интервала (то есть первый интервал приравнивается ко второму, а последний к предпоследнему).
При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и тоже значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Таким образом, верхняя граница i-го интервала равна нижней границе i+1-го интервала.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Для того чтобы правильно отнести к той или иной группе единицу объекта, у которой значение признака совпадает с границами интервалов, можно использовать открытые интервалы
Если в основании группировки лежит дискретный признак, то нижняя граница последующего интервала равна верхней границе предыдущего интервала, увеличенной на 1, если значение признака целое число; 0,1, если значение признака выражено с точностью до десятых; 0,01, если значение признака выражено до сотого знака.
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.
Неравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:
hi+1 =hi+a
Где a – постоянное число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным – при прогрессивно убывающих интервалах.
В геометрической прогрессии:
hi+1 =hi *q,
где q – постоянное положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.
При определении границ интервалов статистических группировок исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому. Рамки границ зависят от условий места и времени.
Поэтому следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства и разных типов хозяйств. Это достигается путем использования группировок со специализированными интервалами.
Специализированными называют интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально- экономических явлений на макроуровне часто применяют группировки, интервалы которых являются произвольными. Особенность данной группировки в том, что выбор числа групп и границ интервалов зависит от исследователя.
Статистические группировки делятся на типологические, структурные и аналитические.
Типологическая группировка – это разделение исследуемой совокупности на классы, социально–экономические типы, однородные группы единиц в соответствии с изучаемыми признаками. Примером типологической группировки является группировка сельскохозяйственных предприятий по формам собственности. Типологические группировки широко применяются в исследовании социально-экономических явлений и процессов. Они позволяют проследить зарождение, развитие и отмирание различных типов явлений. При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений. Она производится на базе глубокого теоретического анализа исследуемого явления.
Другой вид группировки – структурная.
Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому либо варьирующему признаку.
Структурные группировки строятся либо на основе ранее проведенной типологической группировки, либо на основе первичных данных. Проведение структурной группировки по первичной статистической информации предполагает решение таких методологических вопросов, как:
o Выбор группировочного признака; В качестве такого может выступать как существенный, так и несущественный признак;
o Определение числа групп и величин интервала. Здесь необходимо учитывать несколько условий :
1) Число групп детерминируется уровнем колеблемости группировочного признака: чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;
2) Число групп должно отражать реальную структуру изучаемой совокупности;
3) Не допускается выделение пустых групп. Если проблема пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы.
Для нахождения числа групп используется формула Стерджесса
n=1+3,322lgN
N – количество элементов совокупности.
В случае равных интервалов величина интервала может быть определена как
n=1+3,322lgN
или
i= ;
o Определение системы показателей для характеристики групп. Обязательным показателем является численность групп. Он может быть представлен либо частотой ( количеством единиц в каждой группе), либо удельным весом каждой группы.
Одним из видов структурной группировки является ряд распределения.
Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. Ряды распределения принято оформлять в идее статистической таблицы. В зависимости от признака, положенного основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам. Элементами этого ряда распределения являются значения атрибутивного признака и число случаев, относящихся к каждому значению. Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры явления.
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами считают отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, то есть это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.
называют частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.
Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.
В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку.
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационных рядов целесообразно, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, то есть число вариантов дискретного признака достаточно велико.
Наглядно ряды распределения можно представить при помощи их графического изображения, позволяющего судить о форме распределения. Наиболее часто для этой цели используют полигон и гистограмму.
Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяются прямыми линиями, в результате этого получают ломаную линию, называемую полигоном частот. Иногда для замыкания полигона предполагается крайние точки (слева и справа на ломаной линии) соединить с точками на оси абсцисс. В этом случае получается многоугольник.
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. В результате получается гистограмма – график, на котором ряд распределения изображен в виде смежных друг с другом столбиков.
Особенности аналитической группировки следующие: во-первых, в основу группировки кладется факторный признак; во-вторых, каждая выделенная группа характеризуется средними значениями результативного признака. Аналитические группировки позволяют изучить многообразие связей и зависимости между варьирующими признаками. Преимущество метода аналитических группировок перед другими методами анализа состоит в том, что он не требует соблюдения каких-либо условий для его применения, кроме одного – качественной однородности исследуемой совокупности.
Группировка, в которой группы образованы по одному признаку, называется простой. Для характеристики явления бывает недостаточно разбить совокупность на группы по какому-либо одному признаку. В этом случае строят сложные группировки. Сложной называется группировка, в которой разделение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации)./5 с.51/