Проведение первичной и вторичной группировки
Если в основу группировки положен количественный признак, необходимо определить
1) количество групп,
2) интервалы группировки.
1)При определении количества групп необходимо учитывать особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.
Существует зависимость между числом групп и единиц совокупности (формула Стэрджесса):
n = 1+3,322·lgN,
где n – число групп, N – число единиц совокупности.
2)Интервал – значение варьирующего признака лежащего в определённых границах.
Величина интервала – разность между верхней и нижней границей.
Интервалы группировки могут быть равными и неравными.
Если мы применяем равные интервалы, то можно рассчитать его величину:
,
где d –величина интервала, n – число выделяемых групп, Xmax и Xmin – соответственно максимальное и минимальное значение единиц совокупности.
Первый и последний интервал могут быть открытыми. Открытый интервал не имеет одну из границ.
Когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), единица обладающая этим значением, обычно относится к той группе, где эта величина выступает в роли верхней границы.
Пример 3.3. Известны следующие данные по основным показателям деятельности банков одной из областей России.
№ п/п | Сумма активов, млн. руб. | Собственный капитал, млн. руб. |
645,6 | 12 - min | |
636,9 | 70,4 | |
629,0 | ||
619,6 | 120,8 - max | |
616,4 | 49,4 | |
614,4 | 50,3 | |
608,6 | ||
601,1 | 52,4 | |
600,2 | ||
600,0 | 27,3 | |
592,9 | ||
591,7 | 22,4 | |
585,5 | 39,3 | |
578,6 | ||
577,5 | 22,9 | |
553,7 | 119,3 | |
543,6 | 49,6 | |
542,0 | 88,6 | |
517,0 | 43,7 | |
516,7 | 90,5 | |
Итого | 1153,9 |
В качестве группировочного признака возьмем собственный капитал. Количество групп определяется по формуле Стэрджесса: n = 1+3,322·lg20=5,32. Таким образом, выделяется пять групп банков с равными интервалами
млн. руб.
Результаты группировки заносятся в таблицу, и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Вторичная группировка
Иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. В этом случае используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка – образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Пример 3.4. Распределение акционеров двух районов области по размеру дивидендов на одну акцию в 2006 г.
Первый район | Второй район | ||||
№ группы | Группы акционеров по размеру дивидендов, тыс. руб. | Удельный вес акционеров группы, % (к итогу) | № группы | Группы акционеров по размеру дивидендов, тыс. руб. | Удельный вес акционеров группы, % (к итогу) |
10 - 40 | 10-60 | ||||
40 - 80 | 60 - 120 | ||||
80 - 120 | 120 - 200 | ||||
120 - 160 | 200 - 300 | ||||
160 - 200 | - | - | - | ||
Итого | - | - | - |
Приведенные данные не позволяют сравнить распределение акционеров двух районов по размеру дивидендов на одну акцию, так как в районах имеется различное число групп акционеров, и различны величины интервалов.
Необходимо ряды распределения привести к сопоставимому виду. За основу сравнения возьмем структуру распределения акционеров второго района (как наиболее крупную). Следовательно, по первому району нужно произвести вторичную группировку или перегруппировку акционеров, образовав такое же число групп и с теми же интервалами, как во втором районе.
В результате перегруппировки получаем следующие сопоставимые данные.
№ группы | Группы акционеров по размеру дивидендов на акцию, тыс. руб. | Удельный вес акционеров группы, % к итогу | Расчет | |
Второй район | Первый район | |||
10 - 60 | 18 + 0,5 • 12 = 24 | |||
60 - 120 | 0,5 • 12 + 40 = 46 | |||
120 - 200 | 25 + 5 = 30 | |||
200 - 300 | - | - | ||
Итого | - |
Анализ данных вторичной группировки позволяет сделать вывод о том, что акционеры второго района имеют более высокие размеры дивидендов (120 тыс. руб. и более на одну акцию выплачивают 70% акционеров этого района, а в первом районе — только 30% акционеров).