Часть 2. обработка опытных данных
Основным объектом исследования в математической статистике является выборка. Выборкой объема nназываются числа x1 , x2 ,…, xn, получаемые на практике при n – кратном повторении эксперимента в неизменных условиях.
На практике выборку чаще всего представляют статистическим рядом. Для этого вся числовая ось, на которой лежат значения выборки, разбивается на k интервалов (это число выбирается произвольно от 5 до 10), которые обычно равны, вычисляются середины интервалов zi, и считается число элементов выборки, попадающих в каждый интервал ni.
Статистическим рядом называется последовательность пар (zi , ni).
Полигон служит для отображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков имеют координаты (zi , ni).
Гистограмма представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака ki=xi+1-xi и высотами равными частотам ni..Гистограмма служит только для интервальных вариационных рядов.
Кумулятивная кривая (кумулята) – кривая накопленных частот.
Рассмотрим решение задачи в программе EXCEL на следующем примере.
ПРИМЕР. Дана выборка числа посетителей некоторого специалиста поликлиники за 25 дней.
14, 18, 16, 21, 12, 19, 27, 19, 15, 20, 27, 29, 22, 28, 19, 17, 18, 24,
23, 22, 19, 20, 23, 21, 19.
Построим статистический ряд, полигон, гистограмму и кумулятивную кривую.
Решение.
Откроем книгу программы EXCEL. Ввдем в первый
столбец (ячейки А1-А25) исходные данные. Определим область чисел,
на какой лежат данные. Для этого найдем максимальный и минимальный элементы выборки. Введем в В1 подпись «Максимум», а в В2 -
подпись «Минимум». В соседних ячейках С1 и С2 определим функции
«МАХ» и «MIN». Для этого ставим курсор в С1 и вызываем мастер
функций, нажав на кнопку fx , в открывшемся окне в поле «Категория»
выбираем «Статистические», и ниже ищем функцию МАКС(MAX) и
вызываем ее двойным щелчком мыши по названию. В качестве аргумента
функции (в графе «Число 1») обведем область данных (ячейки А1-А25).
Поле «Число 2» оставляем пустым. Нажимаем «ОК». Результатом будет число 29. Ставим курсор в ячейку С2 и аналогично вводим функцию МИН(MIN). Результат – число 12. Видно, что все данные укладываются на отрезке [12;30]. Разделим его на девять (выбирается произвольно от 5 до 10) интервалов по 2 единицы каждый:
12-14, 14-16, 16-18, 18-20, 20-22, 22-24, 24-26, 26-28, 28-30.
В ячейки D1-D9 вводим верхние границы интервалов группировки – числа 14, 16, 18, 20, 22, 24, 26, 28, 30. Для вычисления частот ni используют
функцию ЧАСТОТА(FREQUENCY), находящуюся в категории «Статистические (Массив)».
Введем ее в ячейку Е1. В строке «Массив данных» введем диапазон
выборки (ячейки А1-А25). В строке «Массив интервалов» введем диа-
пазон верхних границ интервалов группировки (ячейки D1-D9). Результат функции является массивом и выводится в ячейках Е1-Е9. В Excel для полного вывода (не только первого числа в Е1) нужно выделить ячейки
Е1-Е9, обведя их мышью, и нажать F2, а далее одновременно
CTRL+SHIFT+ENTER. Результат – частоты интервалов 2,2,3,7,4,3,0,3,1.
Для построения гистограммы нужно выбрать
ВСТАВКА/ДИАГРАММА или нажать на соответствующий значок на
основной панели (при этом курсор должен стоять в свободной ячейке).
Далее выбрать тип: ГИСТОГРАММА, вид по выбору, нажать
«ДАЛЕЕ», в строке «ДИАПАЗОН» обвести частоты Е1-Е9, перейти на
вкладку «РЯД», в строке « ПОДПИСИ ОСИ Х» ввести интервалы в
ячейках D1-D9, нажать «ДАЛЕЕ» ввести название «ГИСТОГРАММА», подписи осей: ось Х - «ИНТЕРВАЛЫ» и ось Y -«ЧАСТОТА», нажать «ГОТОВО».
Для создания полигона перейти на пустую ячейку и сделать то же самое, только вместо типа диаграммы «ГИСТОГРАММА», выбрать «ГРАФИК». Для построения кумулятивной кривой нужно посчитать накопленные частоты. Для этого в ячейку F1 вводим «=Е1», в F2 – вводим «=F1+Е2»
и автозаполнением перетаскиваем эту ячейку до F9. Далее строим график как и в случае полигона, но в строке «ДИАПАЗОН» вводим накопленные частоты, ссылаясь на F1-F9, а на вкладке «РЯД», в строке « ПОДПИСИ ОСИ Х» вводим интервалы в ячейках D1-D9.
Задание 4.По данным выборки построить статистический ряд, полигон, гистограмму и кумулятивную кривую.
Выборка | |||||||||||||||
1. | |||||||||||||||
2. | 13,4 | 14,7 | 15,2 | 15,1 | 13,0 | 8,8 | 14.0 | 17.9 | 15.1 | 16.5 | 16.6 | 14.2 | 16.3 | 14.6 | 11.7 |
16.4 | 15.1 | 17.6 | 14.1 | 18.8 | 11.6 | 13.9 | 18.0 | 12.4 | 17.2 | 14.5 | 16.3 | 13.7 | 15.5 | 16.2 | |
3. | 1.9 | 3.1 | 1.3 | 0.7 | 3.2 | 1.1 | 2.9 | 2.7 | 2.7 | 4.0 | 1.7 | 3.2 | 0.9 | 0.8 | 3.1 |
1.2 | 2.6 | 1.9 | 2.3 | 3.2 | 4.1 | 1.3 | 2.4 | 4.5 | 2.5 | 0.9 | 1.4 | 1.6 | 2.2 | 3.1 | |
4. | |||||||||||||||
5. | |||||||||||||||
6. | |||||||||||||||
7. | |||||||||||||||
8. | |||||||||||||||
9. | 11.3 | 10.7 | 16.9 | 15.8 | 16.1 | 12.3 | 14.0 | 17.7 | 14.7 | 16.2 | 17.1 | 10.1 | 15.8 | 18.3 | 17.5 |
12.7 | 20.7 | 13.5 | 14.0 | 15.7 | 14.3 | 17.7 | 15.4 | 10.9 | 15.2 | 16.7 | 17.3 | 15.4 | 19.2 | 14.0 | |
10. | 1.7 | 4.1 | 4.3 | 2.6 | 0.9 | 0.8 | 1.2 | 2.1 | 3.2 | 2.9 | 1.1 | 3.2 | 4.5 | 2.1 | 3.1 |
5.1 | 1.1 | 1.9 | 0.9 | 3.1 | 0.9 | 3.1 | 3.3 | 2.8 | 2.8 | 2.5 | 4.0 | 4.3 | 1.1 | 2.1 | |
11. | 45.8 | 50.2 | 49.5 | 47.6 | 50.5 | 49.2 | 27.3 | 49.1 | 47.1 | 47.2 | 52.1 | 46.4 | 51.4 | 52.4 | 49.9 |
48.6 | 55.6 | 52.8 | 54.7 | 47.6 | 49.4 | 49.5 | 49.5 | 52.5 | 51.8 | 45.2 | 48.8 | 50.8 | 50.3 | ||
12. | |||||||||||||||
Лабораторная работа№ 2
ТОЧЕЧНОЕ И ИНТЕРВАЛЬНОЕ ОЦЕНИВАНИЕ
ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ
Цель: Овладеть навыками расчета с помощью программы Excel(Calc) основных числовых характеристик выборки. Научиться строить доверительные интервалы для математического ожидания и дисперсии.
Для исследования основных свойств явления или объекта, представленного выборкой вычисляют точечные и интервальные оценки.