Теоретические основы группировки

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде таблиц и статистических рядов распределения.

Группировка – объединение единиц статистической совокупности в количественные однородные группы в соответствии со значениями одного или нескольких признаков.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по определенному варьирующему признаку. Он характеризует состояние (структуру) исследуемого явления, позволяет судить об однородности совокупности, единицах ее изменения, закономерностях развития наблюдаемого объекта. Построение рядов распределения является составной частью сводной обработки статистической информации.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения. Последние, в свою очередь, в зависимости от характера вариации признака делятся на дискретные (прерывные)и интервальные (непрерывные) ряды распределения.

Пример дискретного ряда: Распределение медицинских халатов, реализованных магазином за месяц, по размерам.  
Размер халата Число проданных халатов, шт.
Итого
Пример интервального ряда: Распределение покупок в аптеке по сумме.    
Сумма покупки, руб. Число покупок
До 50
50,1-100
100,1-150
150,1-200
200,1-250
Свыше 250
Итого

Группировка осуществляется поэтапно. Вначале определяется примерное число групп, затем величина интервала. Строится первый вариант группировки, который при необходимости уточняется. Для определения числа групп может применяться формула Стерджесса:

Теоретические основы группировки - student2.ru ,

где N – численность совокупности, r – число групп.

Величина интервала определяется по формуле: Теоретические основы группировки - student2.ru ,

где xmax, xmin – соответствующие максимальное и минимальное значения признаков совокупности, r – величина интервала. Полученный результат округляется.

Равные интервалы группировки применяются для однородных совокупностей, а для социально-экономических явлений чаще применяются неравноинтервальные группировки. Если крайнее значение единиц совокупности значительно отличается по величине от остальных, применяются группировки с открытыми границами интервалов.

Первый интервал с открытой нижней границей, последний интервал с открытой верхней границей. Величина первого интервала принимается равной величине следующего за ним интервала (не более чем). Величина последнего интервала с открытой верхней границей принимается равной величине предпоследнего интервала.

Различают абсолютные и относительные частотные характеристики.

Абсолютная характеристика – частота, показывает, сколько раз встречается в совокупности данный вариант ряда. Достоинство частоты – простота, недостаток – невозможность сравнительного анализа рядов распределения разной численности.

Для подобных сравнений применяют относительные частоты или частости, которые рассчитываются по формуле:

Теоретические основы группировки - student2.ru , Теоретические основы группировки - student2.ru ,

где N – численность совокупности.

Это относительная величина структуры (по форме).

Сумма частостей равна 1.

Теоретические основы группировки - student2.ru

Теоретические основы группировки - student2.ru Если частости выражены в процентах или в промилях их суммы равны соответственно 100 или 1000.

В неравных интервальных рядах распределения частотные характеристики зависят не только от распределения вариантов ряда, но и от величины интервала при прочих равных условиях расширение границ интервала приводит к увеличению наполненности групп.

Для анализа рядов распределения с неравными интервалами используют показатели плотности:

Абсолютная плотность: Теоретические основы группировки - student2.ru

где fi – частота, ci - величина интервала – показывает, сколько единиц в совокупности приходится на единицу величины соответствующего интервала. Абсолютная плотность позволяет сопоставлять между собой насыщенность различных по величине интервалов ряда. Абсолютные плотности не позволяют, однако, сравнивать ряды распределения разной численности.

Для подобных сравнений применяются относительные плотности: Теоретические основы группировки - student2.ru , где di – частости (доли), ci - величины соответствующих интервалов – показывает, какая часть (доля) совокупности приходится на единицу величины соответствующего интервала. Удобнее всего ряды распределения анализировать с помощью их графического изображения, позволяющего судить о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигони гистограмма.

Полигон используется для изображения дискретных вариационных рядов. При построении полигона в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала частот, т. е. число случаев, в которых встретилось то или иное значение признака. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот. Например, на рис. 6. приведено распределение числа студентов по успеваемости и полигон частот для данного распределения. Для построения полигона воспользуемся мастером диаграмм Microsoft Excel (режим «График»).

Теоретические основы группировки - student2.ru

Рис. 6

Для изображения интервальных вариационных рядов распределений применяются гистограммы. При этом на оси абсцисс откладываются значения интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. В результате получается гистограмма – график, на котором ряд распределения представлен в виде смежных друг с другом областей. Для характеристики рядов распределения применяют так же графики накопленных частот или кумуляты.

Кумулята позволяет определить, какая часть совокупности обладает значениями изучаемого признака не превышающими заданного предела, а какая часть – наоборот – превышает этот предел.

Наши рекомендации