Статистический интервальный ряд распределения
Представление результатов наблюдений в виде статистического дискретного ряда распределения на практике удобно лишь в случае ограниченного количества (не более 10-20) различающихся между собой вариант в выборочной совокупности. Если же количество таких вариант существенно больше, то результаты представляют в виде интервального статистического ряда распределения.
Для построения такого ряда всю область наблюдаемых значений изучаемого признака Х разбивают на некоторое небольшое количество равных по величине интервалов (проводят их группировку) и фиксируют количество значений признака, принадлежащих каждому интервалу (частоту интервала).
Число интервалов k следует брать не очень большим, чтобы после группировки ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака.
Согласно формуле Стерджеса рекомендуемое число интервалов , а величина (ширина) интервала , где – разность между наибольшим и наименьшим значениями признака. За начало первого интервала рекомендуется брать величину .
Пусть, например, все наблюдавшиеся значения признака Х принадлежат интервалу (a; b). Разделим его на k равных частей (частичных интервалов) длиной и обозначим точки деления через x0=a, x1, x2, …, xk-1, xk=b (рис. 6.4).
Рис. 6.4
Если частоты интервалов равны соответственно п1, п2, ..., пk, то целесообразно составить таблицу, в первой строке которой перечислить все частичные интервалы, а во второй – соответствующие им частоты. Предполагается, что каждому интервалу принадлежит один из его концов – либо во всех случаях левые, либо во всех случаях правые.
X | (х0; х1) | (х1; х2) | (х2; х3) | … | (хk-2; хk-1) | (хk-1; хk) |
ni | п1 | п2 | n3 | … | пk-1 | пk |
Такая таблица называется интервальным статистическим рядом распределения.
Графическим изображением такого ряда распределения является фигура, называемая гистограммой частот.
Определение 6.1.6.Гистограммой частот называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной , а высотами – частоты интервалов (рис. 6.5).
Рис. 6.5
Примечание 1. Аналогично строится гистограмма относительных частот.
Примечание 2. Для статистического интервального ряда распределения кумулята определяется также как для дискретного, при этом ломаная строится, начиная с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю; другие точки этой ломаной соответствуют концам интервалов.
Пример 6.1.2. Измерения роста Х 800 студентов дали следующие результаты (в см.): 173, 169, 189, 181, 178, 158, 185, 166, 177, 161, 179, 194, 182, 174, 170, …, 174, 166, 177, 169, 185. Построить статистический ряд распределения величины Х, а также гистограмму относительных частот и кумуляту.
○ Среди перечисленных значений роста наименьшим является значение хmin=158, а наибольшим – хmax=198. Используя формулу Стерджеса, найдем число частичных интервалов k=1+3,322lg800= =10,6≈11, оптимальную величину интервала вычислим по формуле , а начало первого интервала:
.
Поэтому для построения статистического дискретного ряда распределения рассмотрим интервал (156, 200), который разделим на 11 частичных интервалов с шириной , и подсчитаем количество значений признака Х, попадающих в каждый из интервалов. Полученные результаты представим в виде таблицы:
Х | 156–160 | 160–164 | 164–168 | 168–172 | 172–176 | 176–180 | 180–184 | 184–188 | 188–192 | 192–196 | 196–200 |
ni | |||||||||||
0,02 | 0,06 | 0,08 | 0,1 | 0,16 | 0,2 | 0,14 | 0,12 | 0,06 | 0,04 | 0,02 | |
0,02 | 0,08 | 0,16 | 0,26 | 0,42 | 0,62 | 0,76 | 0,88 | 0,94 | 0,98 |
где , – соответствующие значения относительной и накопленной частости, которые и будем использовать для построения гистограммы относительных частот (рис. 6.6) и кумуляты (рис. 6.7) соответственно.
Рис. 6.6
|
Рис. 6.7
●