Определяем размах выборки как разность между ее максимальным и
минимальным элементами:
.
2. Определяем длину b и количество интервалов группировки k; при этом .
к=1+3.322*lgN
Имеем:
.
Итак, выборочная совокупность может быть разбита на восемь
Интервалов группировки длины 1.
3. Для каждого интервала группировки (α;β) находим:
а) середину интервала
;
б) частоту интервалов
подсчитывается как число элементов из полуинтервала [α;β)
(правый конец интервала не учитывается), а в последнем интервале частота
Определяется как количество элементов выборки, принадлежащих
отрезку [α;β];
в) накопленную частоту интервала, равную сумме частот
Интервалов с первого по данный включительно,
;
г) относительную частоту
;
д) относительную накопленную частоту
.
Дополнительно вводим колонку
.
Строим группированный статистический ряд.
(α;β) | х | ||||||
(18;19) | 18,5 | 0,03 | 0,03 | ||||
(19;20) | 19,5 | 0,11 | 0,14 | ||||
(20;21) | 20,5 | 0,27 | 0,41 | ||||
(21;22) | 21,5 | 0,28 | 0,69 | ||||
(22;23) | 22,5 | 0,19 | 0,88 | ||||
(23;24) | 23,5 | 0,05 | 0,93 | ||||
(24;25) | 24,5 | 0,03 | 0,96 | ||||
(25;26) | 25,5 | 0,04 | 1,00 |
Задача 2.По данным задачи 1 необходимо:
а) построить полигон частот;
б) построить гистограмму частот;
в) построить кумулятивную кривую;
г) по кумулятивной кривой определить вероятность p(19,7<X<23,55)
попадания случайной величины в интервал (19,7;23,55) (то есть долю и
процентное отношение числа элементов, находящихся в указанном
интервале, к объему выборки).
1. Полигон частот есть ломаная с вершинами в точках с координатами .
Гистограммой частот называется ступенчатая фигура,
Состоящая из прямоугольников, основания которых лежат на
Интервалах группировки, а площадь прямоугольников равна частоте
соответствующего интервала. Исходя из определения заключаем:
основание каждого из прямоугольников гистограммы равно b, а высота
- .
Кумулятивная кривая (или полигон относительных
накопленных частот или кумулята) определяется как ломаная с
вершинами в точках с координатами .
4. Вероятность попадания случайной величины в
интервал (α;β) находится следующим образом:
,
где и - ординаты точек кумулятивной кривой, абсциссы которых раны β и α соответственно.
Строим полигон частот по колонкам 3 и 4 группированного статистического ряда (рисунок 4).
Рис.4
Строим гистограмму частот по колонкам 3 и 8 группированного статистического ряда из задачи 1 (рисунок 5).
Строим кумулятивную кривую по колонкам 3 и 7 группированного статистического ряда из задачи 1 (рисунок 6).
Используя определение и рисунок 6, получаем:
или 81%.
Итак, интервал (19,7;23,55) содержит около 81% элементов выборочной совокупности.
Задача 3. По данным задачи 1 найти а) моду, б) медиану, в) нижние и
верхние квартили, децили, перцентили, г) сделать соответствующие выводы.
Модой называется значение признака, имеющее максимальную
частоту. Интервал с нижней границей , длиной и
частотой есть модальный (содержащий моду), если его
частота – максимальна. Величина моды для
группированного статистического ряда равна:
,
где и - частоты интервала, предшествующего и следующего за модальным соответственно.
Рис.5