Лр5. вычисление статистических показателей эмпирического массива данных и их графическая интерпретация
Цель работы: обработка выборки одномерных случайных величин (эмпирического массива данных), вычисление статистических показателей массива и их графическая интерпретация, определение теоретического закона распределения выборки случайных величин.
Теоретические сведения
Порядок обработки одномерных случайных величин следующий:
• построение вариационного ряда выборки одномерной случайной величины (упорядочение выборки объемом n от Хmin к Xmax);
• определение ориентировочного значения с округлением в меньшую сторону количества интервалов группирования r по формуле:
г=1,15(0,42(n-1)2)0,27; (3.1)
• вычисление ширины интервалов группирования DX :
(3.2)
• построение табл. 3.1 подсчета частот, частостей и формирование внешнего вида эмпирического распределения в интервалах группирования 1,2,...,j,..., r.
Руководствуясь данными табл. 3.1, выполняется построение графических характеристик эмпирического распределения (гистограммирование):
1) Гистограмма относительных частот (эмпирическая вероятность) - колонки 1,5.
2) Полигон относительных частот (кривая, описывающая гистограмму) - колонки 3,5.
3) Эмпирическая функция (график ступенчатой накопленной частости) - колонки 1,6.
4) Кумулятивная кривая, кумулята (линия, описывающая функцию распределения и проходящая через середины интервалов группирования) - колонки 2,6.
5) Диаграмма Парето (гистограмма, ранжированная в порядке убывания частостей совместно с кумулятой).
Таблица 3.1
Определение основных статистических характеристик выборки
1. Математическое ожидание (математи́ческое ожида́ние — среднее значение случайной величины)
2. Дисперсия (математическое ожидание квадрата отклонения случайной величины Xj в интервале группирования от ее математического ожидания)
3. Среднее квадратическое отклонение - стандарт (квадратный корень из дисперсии)
4. Коэффициент вариации (относительное рассеивание)
5. Асимметрия (асимметричность распределения относительно моды)
, если распределение вытянуто вправо от моды, , если влево.
6. Эксцесс (островершинность распределения)
, если вершина распределения более высокая и «острая», , если вершина более низкая и "плоская".
7. Мода (значение в распределении, соответствующее максимальной частоте)
8. Медиана
- начальная граница, частота и номер медианного интервала.
Практические задания
Порядок выполнения работы:
1. Настроить табличный процессор Excel для работы с данными. Для этого убедиться в наличии вкладки Анализ данных в списке падающего меню кнопки строки меню Сервис. B противном случае произвести подключение Пакета анализа. Для этого установить соответствующий флажок в окне Надстройки, открывающемся после выбора вкладки Надстройки кнопки строки меню Сервис.
Создать таблицу 3.1 для проведения расчетов.
2. Ввести в столбец “Выборка случайных величин” числовые данные заданного варианта (табл. 3.2).
3. C целью получения вариационного ряда произвести сортировку введенных случайных величин по возрастанию. Для этого необходимо выделить левой кнопкой мыши область сортируемых данных. Далее воспользоваться кнопкой строки меню Данные, вкладка Сортировка (возможен быстрый доступ к данному инструменту при нажатии на кнопку панели инструментов Стандартная).
ТаблицаЗ.2
Исходные данные для гистограммирования одномерных случайных величин | |||||||||
Номера задания | |||||||||
9,2 | 207,4 | 8,9 | 254,3 | 201,5 | 8,71 | 8,7 | |||
55,3 | 238,9 | 212,5 | 2,23 | 236,4 | 141,3 | 5,81 | 108,1 | 199,3 | |
229,1 | 251,8 | 286,8 | 5,93 | 223,7 | 249,2 | 165,6 | 6,74 | 60,2 | 190,8 |
8,5 | 169,1 | 245,5 | 4,27 | 8,3 | 167,4 | 158,1 | 9,35 | 35,9 | 69,3 |
113,4 | 205,7 | 145,4 | 6,01 | 110,8 | 203,6 | 174,9 | 6,37 | 119,8 | 196,8 |
140,7 | 260,7 | 215,4 | 5,4 | 137,4 | 212,7 | 11,99 | 40,9 | 132,1 | |
22,7 | 261,6 | 3,7 | 22,2 | 258,9 | 135,3 | 6,22 | 26,4 | ||
95,5 | 168,5 | 7,46 | 93,3 | 166,8 | 171,1 | 3,04 | 49,6 | 257,8 | |
63,1 | 196,2 | 170,5 | 6,97 | 61,7 | 194,9 | 1,86 | 171,4 | ||
44,5 | 232,1 | 8,26 | 43,4 | 229,7 | 137,9 | 6,61 | 53,7 | 220,8 | |
200,2 | 167,1 | 140,7 | 6,01 | 195,5 | 165,4 | 206,4 | 2,15 | 52,7 | 231,5 |
14,4 | 222,9 | 182,5 | 6,99 | 220,6 | 209,3 | 5,23 | 134,1 | 252,6 | |
37,7 | 71,5 | 162,8 | 9,67 | 36,8 | 70,8 | 152,5 | 7,99 | 42,4 | 224,9 |
19,9 | 147,3 | 187,1 | 7,96 | 19,4 | 145,8 | 181,7 | 7,7 | 18,9 | 142,7 |
79,1 | 196,2 | 223,5 | 1,2 | 77,3 | 194,2 | 158,1 | 5,45 | 1,7 | |
32,1 | 236,7 | 197,1 | 5,47 | 31,3 | 234,3 | 214,5 | 7,36 | 141,9 | 165,8 |
125,6 | 203,1 | 180,1 | 6,58 | 122,7 | 157,6 | 2,72 | 14,9 | ||
1,7 | 243,6 | 162,8 | 5,64 | 1,7 | 160,3 | 1,45 | 7,2 | 214,8 | |
55,6 | 209,6 | 214,9 | 7,47 | 54,3 | 207,4 | 248,4 | 5,05 | 25,7 | |
10,7 | 148,7 | 135,1 | 2,05 | 10,4 | 147,2 | 192,6 | 3,39 | 62,2 | 197,1 |
42,9 | 136,3 | 218,9 | 12,39 | 41,9 | 134,9 | 278,6 | 5,74 | 218,4 | |
148,9 | 171,1 | 220,9 | 7,6 | 145,4 | 169,3 | 153,5 | 3,58 | 21,6 | 253,5 |
37,2 | 336,8 | 104,8 | 7,08 | 36,3 | 333,4 | 136,7 | 5,81 | 190,9 | 161,9 |
187,3 | 270,6 | 193,4 | 2,17 | 182,9 | 267,8 | 217,1 | 1,16 | 75,4 | 190,2 |
27,6 | 195,1 | 139,3 | 6,43 | 193,1 | 208,8 | 7,22 | 53,1 | 203,1 | |
15,7 | 162,2 | 2,82 | 15,3 | 253,4 | 101,8 | 6,85 | 35,4 | 326,4 | |
2,9 | 289,7 | 164,3 | 10,26 | 2,9 | 286,8 | 159,6 | 9,93 | 2,8 | 280,8 |
96,5 | 201,8 | 121,8 | 9,55 | 94,2 | 199,7 | 8,36 | 5,9 | 175,9 | |
266,1 | 176,8 | 3,14 | 50,8 | 263,9 | 145,2 | 3,22 | 1,6 | 207,4 | |
7,6 | 221,7 | 1,5 | 7,4 | 219,4 | 182,9 | 8,76 | 23,9 | 230,6 | |
6,2 | 181,5 | 163,6 | 8,64 | 6,7 | 179,6 | 238,5 | 4,13 | 8,1 | 163,9 |
302,7 | 251,2 | 182,5 | 2,2 | 295,7 | 248,6 | 197,2 | 7,22 | 91,1 | 163,3 |
67,2 | 176,8 | 253,2 | 1,92 | 65,6 | 177,3 | 6,77 | 13,7 | ||
26,9 | 104,2 | 261,8 | 5,21 | 26,3 | 103,2 | 191,4 | 5,29 | 30,6 | 229,4 |
1,7 | 149,5 | 3,33 | 1,6 | 211,8 | 131,2 | 1,99 | 10,2 | 144,1 | |
49,3 | 142,8 | 219,1 | 4,19 | 48,1 | 141,4 | 187,9 | 2,1 | 178,6 | 262,2 |
56,3 | 227,8 | 141,9 | 6,83 | 225,5 | 118,3 | 9,24 | 195,6 | ||
65,4 | 203,4 | 198,3 | 3,5 | 63,8 | 201,3 | 177,3 | 2,13 | 288,6 | 243,4 |
25,1 | 237,9 | 188,3 | 9,08 | 24,5 | 235,5 | 212,8 | 4,06 | 138,4 | |
48,9 | 194,3 | 172,7 | 2,11 | 47,8 | 192,3 | 167,8 | 2,05 | 46,6 | 188,3 |
4. Для определения основных статистических характеристик необходимо:
4.1.Выбрать пункт Описательная статистика в списке окна Инструменты анализа (кнопка строки меню Сервис, вкладка Анализ данных).
4.2.B окне Описательная статистика в поле с названием Входной интервал ввести ВХОДНЫЕ ДАННЫЕ. Далее, установить переключатель Группирование в положение - по столбцам.
4.3.Указать ПАРАМЕТРЫ ВЫВОДА, для чего установить соответствующий переключатель в положение Выходной интервал. Заполнить поле выходного интервала - область, в которой будет располагаться итоговая таблица. Для этого указывается номер ячейки, в которой будет располагаться левый верхний угол таблицы (вне зоны расчетной табл. 3.1). Далее, установить флажок в окне Итоговая статистика.
4.4.Нажатием кнопки OK вывести таблицу основных статистических характеристик.
5. Произвести предварительную обработку данных для заполнения табл. 3.1, используемую в дальнейшем для построения требуемых гистограмм:
5.1. Выбрать пункт Гистограмма в списке окна Инструменты анализа (кнопка строки меню Сервис, вкладка Анализ данных).
5.2. B окне Гистограмма в поле с названием Входной интервал ввести ВХОДНЫЕ ДАННЫЕ.
5.3. Указать ПАРАМЕТРЫ ВЫВОДА, для чего установить соответствующий переключатель в положение Выходной интервал. Заполнить поле выходного интервала (вне зоны расчетной табл. 3.1). Далее, установить флажок в окне Парето и Интегральный процент.
5.4. Нажатием кнопки OK вывести таблицу частот и частостей эмпирического распределения.
5.5. Полученная таблица состоит из шести столбцов. B трех первых из них представлены данные, необходимые для построения гистограмм эмпирической вероятности и эмпирической функции. Три последних столбца содержат данные для построения диаграммы Парето.
5.6. Ha основании полученных данных, путем копирования, заполнить табл. 3.1 файла отчета. При этом данные из первого столбца (Карман) копируются в столбец 3 (Начало - конец интервала группирования) табл. 3.1; данные из второго столбца (Чacmoma) - в столбец 5 (Встречаемость частот); данные из третьего столбца (Интегральный %) - в столбец 7 (Накопленная частость). Оставшиеся столбцы (2, 4) табл. 3.1 необходимо заполнить самостоятельно, манипулируя уже имеющимися данными. В столбце 2 нумерация интервала группирования от 1 до 7. в столбце 4 середина интервала группирования рассчитывается по формуле xj=(xj+xj-1)/2.
5.7. Для построения диаграммы Парето рассчитать накопленную частоту по данным столбца М. Значения расположить после графы Интегральный % в столбце О.
5.8. Произвести проверку правильности вычислений, просуммировав содержимое столбца 5 (Встречаемость частот). Для этого воспользуетесь кнопкой суммирования, предварительно выделив область данных, подлежащую суммированию. Результат, выводимый в нижней ячейке, должен быть равен объему введенной выборки. Аналогичным образом выполняется суммирование содержимого столбца 6 (Частость в интервале) результат должен быть равен единице. B противном случае необходимо определить и устранить причину несоответствия.
5.8. Для построения гистограмм Плотности распределения вероятности (столбец Частость в интервале), Эмпирической функции(столбец Частость в накопленная), Диаграммы Парето(столбцы Частота и Накоплена частота) используйте вкладку Диаграмма кнопка строки меню Вставка или кнопку Мастер диаграмм панели инструментов Стандартная.
5.9. Разместить полученные гистограммы на листе отчета. При необходимости, отформатировать гистограммы с целью придания им наиболее оптимального внешнего вида и экономичности расположения на листе.
5.10.По внешнему виду гистограммы эмпирической вероятности, используя графики теоретических плотностей распределения вероятностей, определить, какому теоретическому закону соответствует указанная гистограмма.
Пример итогового отчета с полученными результатами и построенными гистограммами представлен на рис. 3.1.
Рис. 3.1. Итоговый отчет по практическому занятию №3
Контрольные вопросы
1.Укажите порядок обработки одномерных случайных величин.
2.Что такое математическое ожидание ?
3.Что такое дисперсия ?
4.Что такое среднее квадратическое отклонение ?
5.Что такое коэффициент вариации ?
6.Что такое ассиметрия ?
7.Что такое эксцесс ?
8.Что такое мода ?
9.Что такое медиана ?
10.Как настроить табличный процессор Excel для работы с данными ?