Первичная обработка данных
Лабораторная работа № 1
При проведении экспериментов фиксировались значения случайной величины X, характеризующей время простоя оборудования в ожидании ремонта (в тоннах).
Задание: произвести первичную обработку полученных опытных данных с целью изучения свойств случайной величины Х.
1) Составим расчетную таблицу, в которой запишем вариационный ряд (элементы выборки в порядке возрастания признака) и произведем расчеты, необходимые для вычисления числовых характеристик.
|
2) Найдем размах выборки = 6115,63- 3543,68 = 2571,95.
3) Длина интервала = = = 406,835.
4)Границы интервалов: =3543,68, =3543,68+406,835=3950,515, =3950,515+406,835=4357,35,
=4357,35+406,835=4764,185, =4764,185+406,835=5171,02, =5171,02+406,835=5577,855, =5577,855+406,835=5984,69, =5984,69+406,835=6391,525 .
5) Построим интервальный статистический ряд:
Таблица 2 – Интервальный статистический ряд
Границы интервалов , т. | Частоты | Частости | Накопленные частости |
[3543,68; 3950,515) | 1/40 | 1/40 | |
[3950,515; 4357,35) | 5/40 | 6/40 | |
[4357,35; 4764,185) | 6/40 | 12/40 | |
[4764,185; 5171,02) | 13/40 | 25/40 | |
[5171,02; 5577,855) | 10/40 | 35/40 | |
[5577,855; 5984,69) | 4/40 | 39/40 | |
[5984,69; 6391,525) | 1/40 | ||
Итого |
6) Вычислим числовые характеристики.
В качестве оценки математического ожидания используется среднее арифметическое наблюденных значений. Эта статистика называется выборочным средним.
.
Для оценивания по выборочным данным моды распределения, используется то значение сгруппированного статистического ряда , которому соответствует наибольшее значение частоты. По интервальному статистическому ряду определяется модальный интервал, в который попало наибольшее число элементов выборки, и в качестве точечной оценки моды может использоваться среднее значение этого интервала.
.
Для определения выборочного значения медианы используется вариационный ряд. В качестве оценки медианы принимают средний (т. е. -й) член этого ряда, если значение n – нечётно и среднее арифметическое между двумя средними (т. е. между -м и -м) членами этого ряда, если n – чётно. В нашем случае объем выборки = 40 - четное, т.е. в качестве оценки медианы примем
= .
В качестве оценки дисперсии используется статистика = .
Оценка среднего квадратического отклонения = .
Оценка коэффициента вариации .
Оценка коэффициента асимметрии
.
Оценка коэффициента эксцесса
.
7) Для приближённого построения эмпирической функции распределения воспользуемся соотношением:
8) Построим гистограмму частот и эмпирическую функцию распределения.
Рисунок 1 – Гистограмма частот
Рисунок 2 – Функция распределения
Вывод. В результате исследования выборки значений непрерывной случайной величины, характеризующей время простоя оборудования в ожидании ремонта, получили следующие результаты, тонн: минимальная масса простоя – 3543,68, максимальная – 6115,63, среднее значение массы простоя оборудования – 4960,403, наиболее вероятная масса простоя оборудования – 4967,6, средневероятна – 4973,53, среднеквадратическое отклонение массы простоя оборудования от среднего значения составило 540,988. Оценка коэффициента вариации составила 10,9%, что указывает на большую колеблемость признака относительно среднего значения, оценка коэффициента асимметрии составила – 0,379, оценка коэффициента эксцесса составила 0,094.