Расчет интервала группировок
В результате статистического наблюдения мы получаем неупорядоченный ряд отдельных значений, работать с которым затруднительно.
Во-первых, результаты наблюдений необходимо упорядочить, или проранжировать, то есть расположить все значения в порядке возрастания или убывания.
Ряд, где значения признака располагаются в порядке возрастания или убывания, называется ранжированным (упорядоченным) рядом распределения.
Теперь можно определить величину интервала.
Правильное установление величины интервала имеет первостепенное значение для образования качественно однородных групп. Например, показатель: "темпы роста" -- 93%, 98%, 101%. Нецелесообразно делать интервал 95%-105%, то есть объединять увеличивших и снизивших производство в одну группу. Необходимо сделать интервалы 95%-100%, 100%-105%.
Если совокупность однородна по своему составу, то в основу построения интервального ряда следует положить принцип равенства интервалов.
Однородная совокупность -- такая совокупность, когда самые существенные признаки для каждой ее единицы являются в основном одинаковыми.
Величина интервала определяется по формуле:
Xmax - Xmin R
i = ------------------- = ----------- ,
N n (3.3.1)
где i -- величина интервала,
Xmax -- максимальное значение признака в ряду распределения;
Xmin -- минимальное значение признака в ряду распределения;
R -- размах вариации (разница между Xmax и Xmin);
n -- число групп.
Возникает вопрос о числе групп, которое зависит от изменчивости признака и числа наблюдений. Здесь нет строго научных приемов, всякий раз эта задача решается с учетом конкретных обстоятельств.
Чем интенсивнее меняется признак и чем больше единиц совокупности, тем больше образуется групп.
При равенстве интервалов для ориентировки существует формула, предложенная американским ученым Стерджессом:
n = 1 + 3,322 lg N. (3.3.2)
При 200 единицах (N = 200) n = 1 + 3,322 * lg 200 = 9.
В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие.
Арифметическая и геометрическая прогрессия:
h i+1 = h i + a ("+" возрастающая, "-" убывающая);
h i+1 = h i * q (">1" возрастающая, "<1" убывающая).
Такая необходимость возникает, когда колеблемость признака осуществляется неравномерно и в больших пределах. Например, группировка торговых предприятий по объему товарооборота. Разница в товарообороте для мелких магазинов, ларьков, палаток в несколько миллионов рублей имеет решающее значение, а для крупных (например, универсам) – несущественное.
При определении величины интервала важное значение имеет точное установление границ, которые обозначаются указанием значений "от" и "до". Например, "от 1 до 3" : 1 - 3, 4 - 7, 8 - 10 (дискретные значения).
Однако на практике нередко (для варьирующих признаков) одно и то же число служит верхней и нижней границами двух смежных групп : до 90, 90-100, 100-110, 110-120. Здесь вопрос решается двояко: по принципу "включительно" и "исключительно". "Включительно" 90 должно войти в первую группу, а "исключительно" 90 -- во вторую группу. В этом случае лучше делать открытый интервальный ряд и по последнему интервалу определять принцип. Например, "свыше 150" (150 входит в предыдущую группу, то есть принцип "включительно") и "150 и более" (150 входит в эту группу, то есть действует принцип "исключительно").
Открытый интервал: «до 90». Закрытый интервал: «90-100».
Середина интервала определяется как полусумма верхней и нижней границ интервала:
Интервал | Решение | Середина интервала |
до 90 | (70 + 90) : 2 | |
90-110 | (90 + 110) : 2 | |
110-150 | (110 + 150) : 2 | |
150-200 | (150 + 200) : 2 | |
свыше 200 | (200 + 250) : 2 |
Если величина интервала, рассчитанная по формуле
Xmax - Xmin
i = ------------------- , имеет один знак до запятой (например: i =0,88, i = 1,585,
n
i = 4,8), то значения округляются до десятых: 0,9; 1,6; 4,8.
Если два знака до запятой (15,985), то округляется до целых (16). Если 3-, 4- значные значения, то округляют до ближайшего числа, кратного 100 или 50. Например, 557 ® 550.
При статистическом исследовании иногда приходится производить вторичную группировку. Основными методами вторичной группировки являются:
n метод изменения интервала;
n долевая перегруппировка.