Статистические ряды распределения
Описание изменений варьирующего признака осуществляется с помощью рядов распределения.
Статистический ряд распределения — это упорядоченное распределение единиц статистической совокупности на отдельные группы по определенному варьирующему признаку.
Статистические ряды, построенные по качественному признаку называют атрибутивными. Если в основе ряда распределения лежит количественный признак, то ряд является вариационным.
В свою очередь вариационные ряды делят на дискретные и интервальные. В основе дискретного ряда распределения лежит дискретный (прерывный) признак, принимающий конкретные числовые значения (число правонарушений, число обращений граждан за юридической помощью). Интервальный ряд распределения строится на основе непрерывного признака, который может принимать любые значения из заданного диапазона (возраст осужденного, срок лишения свободы и т.д.)
Любой статистический ряд распределения содержит два обязательных элемента – варианты ряда и частоты. Варианты (xi) – отдельные значения признака, которые он принимает в ряду распределения. Частоты (fi) – это числовые значения, показывающие сколько раз встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности.
Частоты, выраженные в относительных единицах (долях или процентах) называются частостями (wi). Сумма частостей равна единице, если Частости выражены в долях единицы, или 100, если они выражаются в процентах. Использование частостей позволяет производить сравнение вариационных рядов с разным объемом совокупности. Частости определяются по следующей формуле:
Для построения дискретного ряда ранжируются все встречающиеся в ряду индивидуальные значения признака, а затем подсчитываются частоты повторений каждого значения. Оформляется ряд распределения в идее таблицы, состоящей из двух строк и столбцов, в одной из которых приводятся значения вариантов ряда xi, во второй – значения частот fi.
Рассмотрим пример построения дискретного вариационного ряда.
Пример 3.1. По данным УМВД зарегистрировано преступлений, совершенных в городе N несовершеннолетними в возрасте.
17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.
.Построить дискретный ряд распределения.
Решение.
Сначала необходимо проранжировать данные о возрасте несовершеннолетних, т.е. записать их в порядке возрастания.
13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17
Далее подсчитываем частоты повторений каждого значения возраста. Заносим данные вариантов и частот в таблицу 3.1.
Таблица 3.1
№ группы | Варианты xi, лет | Частоты fi |
Итого: |
Таким образом, частоты отображают количество человек данного возраста, например, 5 человек имеют возраст 13 лет, 8 человек – 14 лет, и т.д.
Построение интервальных рядов распределения осуществляют аналогично выполнению равноинтервальной группировки по количественному признаку, то есть вначале определяют оптимальное число групп, на которые будет разбита совокупность, устанавливаются границы интервалов по группам и подсчитываются частоты.
Проиллюстрируем построение интервального ряда распределения на следующем примере.
Пример 3.2.
Построить интервальный ряд по следующей статистической совокупности – заработной плате юриста в конторе.
№ п/п 1 2 3 4 5 6 7 8 9 10 11 12 13
Р-р з/п, тыс. руб. 16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0
№ п/п 14 15 16
Р-р з/п, тыс. руб. 21,5 26,0 27,4
Решение.
Примем оптимальное количество групп равноинтервальной группировки для данной статистической совокупности, равное 4 (у нас 16 вариантов). Следовательно, численность каждой группы равна:
а величина каждого интервала будет равна:
Границы интервалов определяем по формулам:
,
где - соответственно нижняя и верхняя границы i-го интервала.
Опуская промежуточные вычисления границ интервалов, заносим их значения (варианты) и количество юристов (частоты), имеющих з/п в пределах каждого интервала, в таблицу 3.2, которая и иллюстрирует полученный интервальный ряд.
Таблица 3.2
№ группы | З/п юриста, тыс. руб. | Количество юристов |
16,0-20,0 | ||
20,0-24,0 | ||
24,0-28,0 | ||
28,0-32,0 | ||
Итого: |
Анализ статистических рядов распределения может производиться с использованием графического метода. Графическое представление рядов распределения позволяет наглядно проиллюстрировать закономерности распределения исследуемой совокупности путем ее изображения в виде полигона, гистограммы и кумуляты. Остановимся на каждом из перечисленных графиков.
Полигон – ломаная, отрезки которой соединяют точки с координатами (xi ;fi ). Обычно полигон используют для изображения дискретных рядов распределения. Для его построения на оси абсцисс откладывают ранжированные индивидуальные значения признака xi, на оси ординат – соответствующие этим значениям частоты. В результате, соединив отрезками точки, соответствующие данным, отмеченным по осям абсцисс и ординат, получают ломаную, называемую полигоном. Приведем пример построения полигона частот.
Для иллюстрации построения полигона возьмем результат решения примера 3.1 на построение дискретного ряда – рисунок 1. По оси абсцисс отложен возраст осужденных, по оси ординат – количество несовершеннолетних осужденных, имеющих данный возраст. Анализируя данный полигон, можно сказать, что наибольшее количество осужденных – 14 человек, имеют возраст 15 лет.
Рисунок 3.1 – Полигон частот дискретного ряда.
Полигон можно построить и для интервального ряда, в этом случае по оси абсцисс откладывают середины интервалов, а по оси ординат – соответствующие им частоты.
Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы значения признака, а высоты равны соответствующим частотам. Гистограмма применяется только для изображения интервальных рядов распределения. Если интервалы являются неравными, то для построения гистограммы на оси ординат откладывают не частоты, а отношение частоты к ширине соответствующего интервала. Гистограмму можно преобразовать в полигон распределения, если середины ее столбиков соединить между собой отрезками.
Для иллюстрации построения гистограммы возьмем результаты построения интервального ряда из примера 3.2– рисунок 3.2.
Рисунок 3.2 – Гистограмма распределения заработной платы юристов.
Для графического изображения вариационных рядов также используют кумуляту. Кумулята – кривая, изображающая ряд накопленных частот и соединяющая точки с координатами (xi ;fiнак ). Накопленные частоты вычисляются последовательным суммированием всех частот ряда распределения и показывают число единиц совокупности, имеющих значение признака не больше, чем указанное. Проиллюстрируем вычисление накопленных частот для вариационного интервального ряда, представленного в примере 3.2 – таблица 3.3.
Таблица 3.3
№ группы | З/п юриста, тыс. руб. | Количество юристов, чел | Накопленная частота fiнак |
16,0-20,0 | |||
20,0-24,0 | |||
24,0-28,0 | |||
28,0-32,0 | |||
Итого: |
Для построения кумуляты дискретного ряда распределения по оси абсцисс откладывают ранжированные индивидуальные значения признака, а по оси ординат – соответствующие им накопленные частоты. При построении кумулятивной кривой интервального ряда первая точка будет иметь абсциссу, равную нижней границе первого интервала, а ординату, равную 0. Все последующие точки должны соответствовать верхним граница интервалов. Построим кумуляту, используя данные таблицы 3.3 – рисунок 3.3.
Рисунок 3.3 – Кумулятивная кривая распределения заработной платы юристов.
Контрольные вопросы
1. Понятие статистического ряда распределения, его основные элементы.
2. Виды статистических рядов распределения. Их краткая характеристика.
3. Дискретные и интервальные ряды распределения.
4. Методика построения дискретных рядов распределения.
5. Методика построения интервальных рядов распределения.
6. Графическое изображение дискретных рядов распределения.
7. Графическое изображение интервальных рядов распределения.
Задачи
Задача 1. Имеются следующие данные об успеваемости 25 студентов группы по ТГП в сессию: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3, 5, 4, 2, 3, 3. Постройте дискретный вариационный ряд распределения студентов по баллам оценок, полученных в сессию. Для полученного ряда рассчитайте Частости, накопленные Частости, накопленные частоты. Сделайте выводы.
Задача 2. В колонии содержатся 1000 осужденных, их распределение по возрасту представлено в таблице:
Возраст, | ||||||
Кол-во осужденных, fi |
Изобразите данный ряд графически. Сделайте выводы.
Задача 3. Имеются следующие данные о сроках лишения свободы заключенных:
5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.
Постройте интервальный ряд распределения заключенных по срокам лишения свободы. Сделайте выводы.
Задача 4. Имеются следующие данные о распределении осужденных в области за изучаемый период по возрастным группам:
Возраст, лет | Число осужденных |
До 20 | |
20-25 | |
25-30 | |
30-35 | |
35-40 | |
40-45 | |
45-50 | |
50 и старше |
Изобразите данный ряд графически, сделайте выводы.
: