Способы построения группировок
Процесс построения группировок состоит из следующих этапов.
1) Определение группировочного признака.
Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, возраст человека и т.д.), а вторые отражают состояние единицы совокупности (пол человека, национальность, и т.д.)
Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки и образуют группу результативных признаков.
2) Определение количества групп.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности. Степени вариации признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (пол – 2, регионов России – 89 и т.д.).
Если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
Чем больше колеблемость группировочного признака, тем больше следует образовать групп.
Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:
Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
3) Определение интервала группировки.
Интервал – значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала – разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения (крайние точки).
Полученная величина является шагом интервала.
Открытые интервалы – те, у которых указана только одна граница.
Закрытые интервалы – те, у которых обозначены обе границы.
Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.
Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.
Вторичная группировка
Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа для образования новых групп:
1) способ укрупнения интервалов – объединение первоначальных интервалов – используется в случае перехода от более мелких интервалов к более крупным, а также в случаях, когда границы новых и старых интервалов совпадают.
2) способ долевой перегруппировки – создание новых интервалов на основе закрепления за каждой группой определенной доли единиц совокупности.