Значение и сущность группировки
Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка.
Группировка – это расчленение единиц совокупности на группы, однородные в каком-либо существенном отношении и, характеристика таких групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.
Группировка лежит в основе всей дальнейшей работы с собранной информацией. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не сможем уловить ее структуры, роли отдельных групп, их специфики.
Группировки в статистическом анализе выполняют следующие функции:
§ выделение социально-экономических типов явлений;
§ изучение структуры и структурных сдвигов, происходящие в социально-экономических явлениях;
§ анализ взаимосвязей между явлениями.
Для решения задачи группировки нужно установить правила отнесения каждой единицы к той или иной группе.
В эти правила входят определения тех характеристик (признаков), по которым будет проводиться группировка (группировочных признаков), и их значений, отделяющих одну группу от другой (интервалов группировки).
Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. В основание группировки могут быть положены как количественные, имеющие числовое выражение (возраст, доход, численность работников), так и атрибутивные, которые отражают состояние единицы совокупности (пол, национальность и т.д.) признаки.
После того как определено основание группировки, необходимо определить количество групп, на которые необходимо разбить исследуемую совокупность.
Если совокупность строится по атрибутивному признаку, то число групп приравнивается, как правило, к количеству градаций, виду состояний у этого признака.
Если группировка строится по количественному признаку, то число групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака, в каждом отдельном случае его необходимо обосновать.
Определение числа групп можно осуществить с помощью формулы Стерджесса:
(3.1)
где n – число групп; N – число единиц совокупности.
Недостаток данного метода – дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
Второй способ определения числа групп основан на применении среднего квадратического отклонения. Если величина интервала равна 5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ на 9 групп и σ на 6 групп.
Рассмотрим определение интервалов группировочных признаков. Используют интервалы открытые и закрытые. В первом случае указывается верхняя и нижняя граница интервала. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Закрытые интервалы подразделяются на равные и неравные. Величина равного интервала определяется по формуле (3.2).
(3.2)
где xmax – максимальное значение признака в совокупности; xmin – минимальное значение признака; n – число групп.
Неравные интервалы могут определяться как равнонаполненные. При этом совокупность исследуемых факторов разбивается на группы равного объема с числом единиц в каждой j-й группе: nj = n / m, где n – общее число единиц, m – число групп. Данные ранжируются, отсчитывается число единиц, составляющих первую группу n1, затем – вторую n2 и т.д. Границы интервалов будут соответствовать фактическим значениям признака в каждой группе.
Неравные интервалы могут быть также прогрессивно-возрастающими или прогрессивно-убывающими в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:
(3.3)
а в геометрической прогрессии:
(3.4)
где а – константа, имеющая для прогрессивно-возрастающих интервалов знак «+», а для прогрессивно-убывающих интервалов знак «-»; q – константа (для прогрессивно-убывающих интервалов q > 1; в другом случае – q < 1).
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна.
Виды группировок
Различают три вида группировок:
1) типологические;
2) структурные;
3) аналитические.
Типологические группировки служат для выделения социально-экономических типов. Этот вид группировок в значительной степени определяется представлениями экспертов о том, какие типы могут встретиться в изучаемой совокупности. Для ее проведения необходимо осуществить следующую последовательность действий:
1) назвать те типы явлений, которые могут быть выделены;
2) выбираются группировочные признаки, формирующие описание типов;
3) устанавливаются границы интервалов;
4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы, и определяется численность каждого из них.
Пример. Поставлена задача выделить типы акционерных компаний с высокими, средними и низкими дивидендами и установить распространенность каждого типа в данном регионе.
Показатель выплаты дивидендов характеризует долю прибыли на акцию или долю чистого дохода, выплачиваемого как дивиденды.
Этот коэффициент зависит от структуры акционерного капитала фирмы, длительности существования фирмы и перспектив ее роста. Обычно молодые, быстрорастущие компании выплачивают низкие дивиденды, если вообще их выплачивают; тогда как зрелые компании стремятся дать более высокие дивиденды. Структура капитала и выплата дивидендов зависят от отраслевой принадлежности фирмы. Поэтому при классификации фирм по уровню выплаты дивидендов мы должны использовать в качестве группировочных признаков, во-первых, отрасль (подотрасль), во-вторых, показатель выплаты дивидендов.
Первый группировочный признак выполняет роль характеристики условий, второй непосредственно характеризует тип фирмы. Границы интервалов для второго группировочного признака могут изменяться при переходе от одной отрасли к другой, так как то, что для одной отрасли может рассматриваться как высокий уровень выплаты, для другой может оцениваться иначе.
Изменение границ интервалов группировочного признака при выделении одних и тех же типов в разных условиях называется специализацией интервалов группировочного признака.
Иногда условия формирования типов приводят к различиям в их описании, в самом круге признаков. Например, выделение крупных, средних, мелких предприятий в разных отраслях должно производиться по разным характеристикам: в энергоемких отраслях – по потреблению электроэнергии; в сырьеемких отраслях – по величине товарно-материальных запасов; в трудоемких – по численности рабочих; в капиталоемких – по стоимости оборудования.
Изменение круга группировочных признаков при выделении одних и тех же типов в разных условиях называется специализацией группировочных признаков.
Вернемся к нашему примеру. Предположим, что мы располагаем данными 15 фирм, представляющих три подотрасли промышленности. Проведем их группировку с учетом двух выше названных признаков (табл. 3.1).
Таблица 3.1
Группировка акционерных компаний n-го района
по уровню выплаты дивидендов за 200__ г.
Подотрасль промышленности | Показатель выплаты дивидендов, % | Тип компании | Число компаний |
1 Производство кондитерских изделий 2. Производство трикотажных изделий 3. Производство обуви | до 30 30-50 50 и выше до 20 20-40 40 и выше до 10 10-30 30 и выше | н с в н с в н с в | – – |
В табл. 3.1 (гр. 3) для краткости использованы условные обозначения типов компаний: н – компании с низким показателем оплаты дивидендов, с – средним, в – высоким показателем выплаты.
Использование специализации интервалов как бы уравнивает наши оценки компаний в разных отраслях, что позволяет объединить выделенные группы в три типа независимо от отрасли (табл. 3.2). Это последний шаг типологической группировки.
Таблица 3.2
Распределение акционерный компаний n-го района
по уровню выплаты дивидендов в 200_ г.
Тип компаний | Число компаний | |
абсолютное | в процентах к итогу | |
н с в | 20,0 46,7 33,3 | |
Итого | 100,0 |
Достоинство типологической группировки – позволяет избавиться от чрезмерного дробления совокупности.
Недостаток – данный метод группировки слишком субъективен: эксперт определяет, какие типы должны быть выделены, по каким признакам, какими должны быть границы интервалов. Так же число группировочных признаков ограничено двумя-тремя.
Однако, если объект исследования хорошо изучен, если имеется развитая теория, то этот метод может дать хорошо интерпретируемые результаты.
В любом случае правильность проведения типологической группировки требует проверки. С этой целью рассчитываются сводные показатели по группам (средние, относительные величины); если различие между группами статистически незначимо (по t-критерию Стьюдента или F-критерию, или критерию χ2 и т.д.), то схема группировки должна быть пересмотрена – схожие группы могут быть объединены, изменены границы интервалов и т.д.
Структурная группировка определяет структуру однородных совокупностей.
Если для типологической группировки чаще используются открытые и неравные интервалы, то для структурной группировки более характерны закрытые равные интервалы. Структурная группировка позволяет изучать интенсивность вариации группировочного признака. На основе структурной группировки можно изучать динамику структуры совокупности.
Если известны структурные характеристики совокупности в одном и другом периодах: и – доли i-й группы в период «0» и в период «1», то можно рассчитать показатель среднего абсолютного изменения структуры:
(3.5)
где k – число групп.
Другой сводный показатель абсолютных структурных сдвигов строится на основе формулы среднего квадратического отклонения:
. (3.6)
Если показатели структуры выразить не в долях, а в процентах, то, так как и первый показатель, квадратичный коэффициент абсолютных структурных сдвигов оценивает на сколько процентных пунктов в среднем различаются удельные веса отдельных групп сравниваемых структур. При отсутствии структурных сдвигов оба эти показателя равны нулю; их величина тем больше, чем значительнее абсолютные изменения удельных весов групп. Квадратичный коэффициент более чутко реагирует на структурные изменения.
Пример.Необходимо провести анализ 30 торговых предприятий по области, применяя метод группировок и используя структурную группировку (табл. 3.3).
Таблица 3.3. Исходные данные для группировки предприятий
Номер магазина | Торговая площадь, м2 | Численность, чел. | РТО, млн. руб. |
1 | 2 | 3 | 4 |
Продолжение табл. 3.3
В качестве группировочного признака возьмем площадь магазинов. Образуем четыре группы предприятий с равными интервалами. Величину интервала определим по формуле (3.2)
Произведем расчет верхних и нижних границ интервалов (табл. 3.4)
Таблица 3.4. Расчет верхних и нижних границ интервалов
Группа | Расчет границ интервала | Граница |
1-я 2-я 3-я 4-я | 150 + 65 = 215 215 + 65 = 280 280 + 65 = 345 345 + 65 = 410 | 150 – 215 215 – 280 280 – 345 345 – 410 |
Распределив торговые предприятия по группам, подсчитаем число организаций в каждой из них.
Техника подсчета следующая: необходимо сделать выборку хозяйств из табл. 3.3 по величине торговой площади магазинов и распределить их по полученным выше группам.
После того как определен группировочный признак – торговая площадь, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их объемные показатели по каждой группе.
Показатели, характеризующие магазины, разносятся по указанным группам, и подсчитываются итоги по группам в разработанной таблице (табл. 3.5)
Результаты группировки заносятся в сводную таблицу, и определяются общие итоги по совокупности единиц наблюдения по каждому показателю (табл. 3.6).
Таблица 3.5. Разработочная таблица группировки торговых организаций по торговой площади
Номер группы | Группы магазинов по величине торговой площади | Номер магазина | Торговая площадь, м2 | Численность, чел. | РТО, млн. руб. |
150 – 215 | |||||
Итого | |||||
215 – 280 | |||||
Итого | |||||
280 – 345 | |||||
Итого | |||||
345 – 410 | |||||
Итого | |||||
Всего |
Таблица 3.6. Группировки торговых организаций района по величине торговой площади
Номер группы | Группы магазинов по величине торговой площади | Количество магазинов | Торговая площадь, м2 | Численность, чел. | РТО, млн. руб. |
150 – 215 215 – 280 280 – 345 345 – 410 | |||||
Итого |
Для того чтобы выявить закономерности распределения торговых организаций по величине торговой площади, заменим абсолютные показатели, характеризующие выделенные группы, относительными показателями структуры (табл. 3.7)
Таблица 3.7. Группировки торговых организаций по величине торговой площади
Номер группы | Группы магазинов по величине торговой площади | Количество магазинов, % к итогу | Торговая площадь, м2 | Численность, чел. | РТО, млн. руб. |
150 – 215 215 – 280 280 – 345 345 – 410 | 20,0 40,0 23,3 16,7 | 13,3 37,5 25,9 23,3 | 13,9 37,6 26,8 21,7 | 12,7 37,5 26,9 22,9 | |
Итого | 100,0 | 100,0 | 100,0 | 100,0 |
Из табл. 3.7 видно, что в основном преобладают торговые организации с торговой площадью 215 – 280 м2 (40%), на долю которых приходится 37,5% всего товарооборота.