Выполнение группировки по количественному признаку

При построении группировки с равными интервалами по количественному признаку целесообразно придерживаться следующего алгоритма.

1. Определение оптимального количества групп n.

Число групп n зависит от:

1) задач исследования;

2) группировочного признака;

3) от объема совокупности N;

4) степени вариации группировочного признака.

Оптимальное число групп n определяется подбором или по формуле Стерджесса:

n=1+3,322·lgN,

где N - число единиц совокупности.

Каждая группа должна характеризовать типы явлений, а число единиц в группах должно быть достаточно большим, чтобы можно было делать достаточно обоснованные вы­воды об исследуемой совокупности.

Когда определено число групп, то следует определить интер­валы группировки. Количество групп n и величина интервала h связаны между собой обратной зависимостью.

2. Определение величины интервала группировки: Выполнение группировки по количественному признаку - student2.ru где xmax , xmin – соответственно максимальное и минимальное значения признака в совокупности.

Интервал – это: 1) промежуток между максимальным и минимальным значениями признака в группе; 2) значение варьирующего признака, лежащее в определенных границах;

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Величина интервала - разность между его верхней и нижней границей. Нижняя граница -наименьшее значение признака в интервале. Верхняя граница - наибольшее значение признака в интервале. Интервал группировок с двумя границами называется закрытым, а с одной верхней или нижней – открытым.

Интервалы группировки в зависимости от их величины быва­ют равные инеравные.

Равные интервалы применяются при равномерном изменении значений группировочного признака в сравнительно узких границах, а неравные интервалы – при неравномерном изменении в достаточно широких границах.

3. Определение границ каждого интервала Выполнение группировки по количественному признаку - student2.ru

За нижнюю границу первого интервала Выполнение группировки по количественному признаку - student2.ru принимают минимальное значение признака Выполнение группировки по количественному признаку - student2.ru , т.е. Выполнение группировки по количественному признаку - student2.ru = Выполнение группировки по количественному признаку - student2.ru Тогда верхняя граница первого интервала Выполнение группировки по количественному признаку - student2.ru . Очевидно, что Выполнение группировки по количественному признаку - student2.ru . В этом случае нижняя граница второго интервала Выполнение группировки по количественному признаку - student2.ru , верхняя граница второго интервала Выполнение группировки по количественному признаку - student2.ru , Выполнение группировки по количественному признаку - student2.ru и т.д. Замечание. Также за нижнюю границу можно принимать величину Выполнение группировки по количественному признаку - student2.ru , так как Выполнение группировки по количественному признаку - student2.ru и Выполнение группировки по количественному признаку - student2.ru являются случайными величинами и, поэтому, рекомендуется отступить влево от нижней границы Выполнение группировки по количественному признаку - student2.ru .

4. Подсчет числа единиц Выполнение группировки по количественному признаку - student2.ru , попавших в интервал

Для избегания повторного счета единиц, совпадающих с границами интервалов, условимся в каждый интервал включать варианты, равные или большие левой границы и варианты, меньшие правой границы ( Выполнение группировки по количественному признаку - student2.ru ).

Для упрощения расчетов целесообразно построить ранжированный ряд возрастающих значений признака и произвести подсчеты числа единиц в каждой группе. Для автоматического подсчета частот можно использовать редактор MS Excel с помощью статистической функции «Частота» («Вставка - Выполнение группировки по количественному признаку - student2.ru Функция – Статистические - Частота»), выделив массивы данных и границ интервалов в соответствующих окнах этой функции.

Замечание. Обычно строят от 7 до 11 групп достаточно заполненных частотами. Если группы не содержат частот, то нужно уменьшить число групп n, тем самым увеличив ширину интервала h.

Наши рекомендации