Методики расчета основных статистических характеристик
На практике, для удобства представления и обработки, данные, полученные в результате наблюдений, группируют по интервалам. Группированные данные представляют в виде границ интервалов и количества наблюдений, попавших в каждый интервал. В этом случае значением, представляющим каждый интервал с количеством попаданий mj, служит середина интервала Xj, которую вычисляют по формуле:
, (2.5)
где – наименьшее значение интервала из данных наблюдений;
∆x – величина интервала;
j – номер интервала (j = 0, 1, 2, … k-1);
При выборе величины интервала группирования учитывают следующие принципиальные положения:
– величина ∆x выбирается постоянной для всех интервалов;
– выбор величины ∆x зависит от количества наблюдений и разброса их значений, рекомендуется задавать величину интервала такой, чтобы получилось не менее 6 и не более 20 интервалов [8];
– рекомендуется определять количество интервалов k при заданном количестве наблюдений n по формуле Стенжерса:
(2.6)
Величина интервала группирования может быть определена:
Очевидно, что когда данные расположены по интервалам, то некоторая часть информации теряется. Так, среднее статистическое значение X и дисперсия S2, вычисленные по группированным данным, будут отличаться от значений, вычисленных по негруппированным данным. Данное отличие при расчете среднего значения и дисперсии, зависящее главным образом от величины интервала, очень незначительно и в большинстве случаев несущественно. Кроме того, группировка имеет свои преимущества, если необходимо обрабатывать большое количество данных. На практике группировку нужно применять, когда велико и число наблюдений, и число различных значений среди них.
В случае группированных данных, формулы (2.1) и (2.2) приобретают вид:
(2.7)
(2.8)
где Xj - середина j-го интервала; mj -число наблюдений в j-м интервале.
Задача 2
Разжимные кулаки ножных тормозов автомобилей ЗиЛ-431410 заменялись в эксплуатации при превышении допустимого износа рабочих поверхностей и мест сопряжений с втулками кронштейнов. В процессе наблюдений было зафиксировано 45 первых замен разжимных кулаков.
Значения наработок на отказ в тыс. км:
251,7 201,4 177,9 70,0 198,9 133,5 125,0 290,6 173,2 218,5 234,0 287,3 220,3 144,3 243,5 167,6 250,8 217,1 102,1 199,2 246,6 163,6 175,2 205,2 329,9 308,0 177,7 209,6 221,4 165,6 165,1 218,3 221,0 145,6 300,0 197,6 246,0 139,9 174,3 219,5 236,1 223,8 244,8 160,0 118,7
Необходимо найти характеристики случайной величины наработок на отказ разжимных кулаков ножных тормозов автомобилей:
– среднее статистическое значение времени отказа (X);
– среднее квадратическое отклонение от статического значения (S);
–коэффициент вариации (Н)
Исходные данные принять по табл. 2 исходя из соотношения
где а – поправочный коэффициент
Исходные данные
Таблица 2
Параметр | вариант | |||||||||||||||||||
а | 0,77 | 0,78 | 0,79 | 0,80 | 0,81 | 0,82 | 0,83 | 0,84 | 0,85 | 0,86 | 0,87 | 0,88 | 0,89 | 0,90 | 0,91 | 0,92 | 0,93 | 0,94 | 0,95 | 0,96 |
Пример решения
Сгруппировать данные наблюдений. Вычислить приближенное количество интервалов группирования по формуле (2.6):
Полученное значение округлить в меньшую сторону k = 6. Упорядочить значения наработок на отказ в порядке возрастания:
70,0 102,1 118,7 125,0 133,5 139,9 144,3 145,6 160,0 163,6 165,1 165,6 167,6 173,2 174,3 175,2 177,7 177,9 197,6 198,9 199,2 201,4 205,2 209,6 217,1 218,3 218,5 219,5 220,3 221,0 221,4 223,8 234,0 236,1 243,5 244,8 246,0 246,6 250,8 251,7 287,3 290,6 300,0 308,0 329,9
Рассчитать величину интервала группирования:
Определить границы интервалов
,
например: для первого интервала, ; для второго интервала, и т.д.
Рассчитать по формуле 2,5 середину интервалов и определить число попаданий mj результатов наблюдений попадающих в середину интервала группирования. Полученные параметры свести в таблицу 3.
Подсчет Xj и mj
Таблица 3
Номер интервала | Границы интервалов | Середина интервала, Xj | Число попаданий, mj |
70 - 113,3 | 91,7 | ||
113,3 - 156,6 | |||
156,6 - 200 | 178,3 | ||
200 - 243,3 | 221,7 | ||
243,3 - 286,6 | |||
286,6 - 329,9 | 308,3 |
Найти оценку математического ожидания с помощью формулы (2.7):
Найти оценку дисперсии по формуле (2.8):
Среднее квадратическое отклонение и коэффициент вариации определить аналогично примеру 1:
Данные числовые характеристики называют точечными, так как они характеризуют изучаемую случайную величину одним числом. При небольшом числе испытаний указанные характеристики, как правило, отличаются от их истинных значений. В связи с этим, наряду с точечными характеристиками применяются так называемые интервальные оценки.
Методики расчета