Расчет интервала группировок

В результате статистического наблюдения мы получаем неупорядоченный ряд отдельных значений, работать с которым затруднительно.

Во-первых, результаты наблюдений необходимо упорядочить, или проранжировать, то есть расположить все значения в порядке возрастания или убывания.

Ряд, где значения признака располагаются в порядке возрастания или убывания, называется ранжированным (упорядоченным) рядом распределения.

Теперь можно определить величину интервала.

Правильное установление величины интервала имеет первостепенное значение для образования качественно однородных групп. Например, показатель: "темпы роста" -- 93%, 98%, 101%. Нецелесообразно делать интервал 95%-105%, то есть объединять увеличивших и снизивших производство в одну группу. Необходимо сделать интервалы 95%-100%, 100%-105%.

Если совокупность однородна по своему составу, то в основу построения интервального ряда следует положить принцип равенства интервалов.

Однородная совокупность -- такая совокупность, когда самые существенные признаки для каждой ее единицы являются в основном одинаковыми.

Величина интервала определяется по формуле:

Xmax - Xmin R

i = ------------------- = ----------- ,

N n (3.3.1)

где i -- величина интервала,

Xmax -- максимальное значение признака в ряду распределения;

Xmin -- минимальное значение признака в ряду распределения;

R -- размах вариации (разница между Xmax и Xmin);

n -- число групп.

Возникает вопрос о числе групп, которое зависит от изменчивости признака и числа наблюдений. Здесь нет строго научных приемов, всякий раз эта задача решается с учетом конкретных обстоятельств.

Чем интенсивнее меняется признак и чем больше единиц совокупности, тем больше образуется групп.

При равенстве интервалов для ориентировки существует формула, предложенная американским ученым Стерджессом:

n = 1 + 3,322 lg N. (3.3.2)

При 200 единицах (N = 200) n = 1 + 3,322 * lg 200 = 9.

В экономической практике в большинстве своем применяются неравные интервалы, прогрессивно возрастающие или убывающие.

Арифметическая и геометрическая прогрессия:

h i+1 = h i + a ("+" возрастающая, "-" убывающая);

h i+1 = h i * q (">1" возрастающая, "<1" убывающая).

Такая необходимость возникает, когда колеблемость признака осуществляется неравномерно и в больших пределах. Например, группировка торговых предприятий по объему товарооборота. Разница в товарообороте для мелких магазинов, ларьков, палаток в несколько миллионов рублей имеет решающее значение, а для крупных (например, универсам) – несущественное.

При определении величины интервала важное значение имеет точное установление границ, которые обозначаются указанием значений "от" и "до". Например, "от 1 до 3" : 1 - 3, 4 - 7, 8 - 10 (дискретные значения).

Однако на практике нередко (для варьирующих признаков) одно и то же число служит верхней и нижней границами двух смежных групп : до 90, 90-100, 100-110, 110-120. Здесь вопрос решается двояко: по принципу "включительно" и "исключительно". "Включительно" 90 должно войти в первую группу, а "исключительно" 90 -- во вторую группу. В этом случае лучше делать открытый интервальный ряд и по последнему интервалу определять принцип. Например, "свыше 150" (150 входит в предыдущую группу, то есть принцип "включительно") и "150 и более" (150 входит в эту группу, то есть действует принцип "исключительно").

Открытый интервал: «до 90». Закрытый интервал: «90-100».

Середина интервала определяется как полусумма верхней и нижней границ интервала:

Интервал Решение Середина интервала
до 90 (70 + 90) : 2
90-110 (90 + 110) : 2
110-150 (110 + 150) : 2
150-200 (150 + 200) : 2
свыше 200 (200 + 250) : 2

Если величина интервала, рассчитанная по формуле

Xmax - Xmin

i = ------------------- , имеет один знак до запятой (например: i =0,88, i = 1,585,

n

i = 4,8), то значения округляются до десятых: 0,9; 1,6; 4,8.

Если два знака до запятой (15,985), то округляется до целых (16). Если 3-, 4- значные значения, то округляют до ближайшего числа, кратного 100 или 50. Например, 557 ® 550.

При статистическом исследовании иногда приходится производить вторичную группировку. Основными методами вторичной группировки являются:

n метод изменения интервала;

n долевая перегруппировка.

Наши рекомендации