Принципы построения статистических группировок
Весь процесс построения группировки можно разбить на ряд этапов:
1 этап: Определяют состава группировочного признака. При этом в основание группировки могут быть положены как количественные, так и качественный (атрибутивные) признаки.
ОСНОВАНИЕ ГРУППИРОВКИ |
качественный (атрибутивный) признак |
количественныйпризнак |
2 этап: Определяют количество групп, на которые, надо разбить совокупность.
КОЛИЧЕСТВО ГРУПП |
в основание группировки положен количественный признак |
в основание группировки положен качественный признак |
групп столько, сколько имеется градаций признака |
число групп вычисляется математическим путем с помощью формулы Стерджесса: n=1+3,322LgN n- число групп N-число единиц совокупности |
Если группировка строится по качественному (атрибутивному) признаку то групп столько, сколько имеется градаций (пол человека – 2 группы, образование – 5)
Если группировка строится по количественному признаку, то следует обратить внимание на число единиц объекта. При небольшом объеме не следует образовывать слишком большое число групп.
Определение числа групп можно осуществить математическим путем с помощью формулы Стерджесса:
n=1+3,322LgN
n- число групп
N-число единиц совокупности
3 этап: Определяют интервал группировки.
Интервал - это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, нижнюю (наименьшее значение признака в интервале) и верхнюю (наибольшее) границы или хотя бы одну из них.
ВЕЛИЧИНА ИНТЕРВАЛА |
Если вариация признака проявляется в узких границах и распределение носит равномерный характер |
Если размах вариации велик и значения варьируют неравномерно |
строятся группировка с равными интервалами, при этом используется следующая формула: h=R/n=(Xmax – Xmin )/n R-размах совокупности Xmax и Xmin - максимальное и минимальное значения признака в совокупности n - число групп |
строятся группировка с неравными интервалами |
Если вариация признака проявляется в узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по формуле:
h=R/n=(Xmax – Xmin )/n
R-размах совокупности
Xmax и Xmin - максимальное и минимальное значения признака в совокупности
n - число групп
Если размах вариации велик и значения варьируют неравномерно, то используют группировку с неравными интервалами.
Интервалы группировки могут быть открытыми (указана только одна граница - верхняя или нижняя) и закрытыми (у которых имеются верхняя и нижняя границы).
Правила определения интервала группировки:
1. Если величина интервала имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (т.е. 0,7; 0,6; 2,4)
2. Если величина интервала имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (т.е. 11; 23)
3. Если величина интервала представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего числа, кратного 10 (т.е. 120; 760)
4. Если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя - по принципу «исключительная» (например, если нижняя граница i-группы равна 50, а верхняя - 100, то единица совокупности со значением признака, равным 100, попадет в группу i +1)
5. Если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более»
6. Если в основании группировки лежит дискретный признак, то верхняя граница i -го интервала равна нижней границе (i + 1)-го интервала, увеличенной на 1
4 этап:Проведение группировки.
Группы | Интервал | Число единиц в группе | Сумма/средняя |
1 группа | Xmin - Xmin+h | n1 | S1 |
2 группа | Xmin+h - Xmin+h+h | n2 | S2 |
3 группа | Xmin+h+h - Xmax | n3 | S3 |
Ряды распределения
После определения группировочного признака и Гранин групп строится статистический ряд распределения.
Статистический ряд динамики – это упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку
ВИДЫ РЯДОВ РАСПРЕДЕЛЕНИЯ |
Атрибутивные (группы строятся по качественному признаку) |
Вариационные (группы строятся по количественному признаку) |
Дискретные (группы строятся по признаку, изменяющему дискретно) |
Интервальные (группы строятся по признаку, принимающему в определенном интервале любые значения) |
ЭЛЕМЕНТЫ РЯДА РАСПРЕДЕЛЕНИЯ |
ВАРИАНТЫ Отдельные возможные значения признаков |
ЧАСТОТЫ Числа, которые показывают, насколько часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями; соответственно сумма частостей равна 1, или 100% |