Основные законы распределения случайных величин
Коэффициент вариации V – является характеристикой закона распределения случайных величин: V ‹ 0,35 –близок к нормальному закону; V › 0,35 –закон Вейбулла или логарифмически нормальный; V = 1,0 -экспоненциальный закон распределения случайных величин.
Нормальный закон распределения (законГаусса)(рис. 3.1и др.).Если распредёление случайной величины подчиняется определенному закону и может быть хотя бы приближенно описано кривой у = ае – bх,то такое распределение называют нормальным. Так как к коэффициентам аи bпредъявляется только одно требование, а именно: а, b > 0, то можно говорить о семействе кривых нормального распределения. С увеличением коэффициента «а» кривая «вытягивается» в высоту; при увеличении коэффициента «b» кривая «сплющивается». Наиболеечасто нормальное распределение используют для оценки распределения внешней нагрузки (или напряжения) на детали и агрегаты автомобиля в различных условиях эксплуатации, при определении суммарной наработки восстанавливаемых изделий до капитального ремонта, наработки до отказа невосстанавливаемых изделий.
Логарифмически-нормальный законраспределения (рис. 3.6) описывает распределение случайной величины, логарифм которой распределен по нормальному закону. Применяют, когда значение случайной величины составляет случайную долю ранее наблюдавшегося явления. Это распределение часто используют при расчете долговечности деталей автомобилей, эксплуатируемых в однородных условиях; при исследовании наработки до отказа многих невосстанавливаемых изделий; при исследовании циклических нагрузок, действующих на детали; для описания явлений усталости при циклической нагрузке, если предположить, что усталостное разрушение наступает в результате накопления единичных повреждений, причем число циклов, вызывающих каждое единичное повреждение, зависит от того, сколько повреждений уже накоплено.
Закон распределения Вейбулла (рис. 3.6).Практика исследования нагруженности агрегатов и деталей автомобилей показывает, что наиболее приемлемым законом распределения для описания их прочности и долговечности является закон распределения, предложенный шведским ученым Вейбуллом. Этому закону хорошо следуют распределения предела упругости ряда металлов, характеристики прочности материалов, усталостная долговечность деталей, наработка до отказа многих невосстанавливаемых деталей (например, подшипников качения); наработка до отказа некоторых изделий, у которых отказ наступает вследствие усталостного разрушения. Результаты обработки эксплуатационных наблюдений по грузовым автомобилям показывают, что ресурсы деталей, лимитирующих надежность, в 60-70 % случаев подчиняются распределению Вейбулла.
Рис. 3.6. Кривые логнормального распределения и распределения Вейбулла
Экспоненциальный законраспределения (рис. 3.7)широко применяется в теории надежности, в теории массового обслуживания и других областях. Экспоненциальному закону распределения подчиняется наработка на отказ многих невосстанавливаемых элементов, этот закон часто используется при рассмотрении внезапных отказов в тех случаях, когда явления изнашивания и старения настолько слабо выражены, что ими можно пренебречь. Экспоненциальное распределение применяют также для описания наработки сложных систем, прошедших период приработки, и для описания времени безотказной работы системы с большим числом последовательно соединенных элементов, если каждый из элементов в отдельности не оказывает большого влияния на отказ системы. Математическое ожидание и среднее квадратическое отклонение такого распределения равны между собой, что является существенным при проверке соответствия экспоненциального распределения теоретическому распределению. Экспоненциальное распределение является частным случаем распределения Вейбулла и гамма - распределения.
Гамма-распределение (рис. 3.7)служит для описания: износовых отказов, отказов вследствие накопления повреждений, наработки системы с резервными элементами, распределения времени восстановления. При различных параметрах гамма-распределение принимает самые разнообразные формы, что и объясняет его широкое применение. Если параметр формы a = 0,то гамма-распределение совпадает с экспоненциальным распределением, при a > 10 –практически совпадает с нормальным распределением. Если a -произвольное целое число, то гамма-распределение называют распределением Эрланга. Если параметр масштаба b = 0,5;а значение параметра формы кратно 0,5; то гамма-распределение совпадает с распределениемХИ - квадрат,которое применяется для проверки согласия эмпирических данных с гипотетической функцией распределения.
Рис. 3.7. Кривые экспоненциального и гамма-распределений
При обработке экспериментальных данных нередко исследуемую выборку представляют как смесь (суперпозицию)нескольких распределений. По внешнему виду распределения, например, наличию двух или более максимумов, можно судить о целесообразности использования суперпозиции распределения. К таким распределениям могут привести различные причины изготовления и эксплуатации – изготовление одних и тех же деталей на различном оборудовании или по различной технологии, изменение конструкции детали или кузова, различия в условиях эксплуатации.
ПРИМЕР СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
Статобработка состоит в упорядочении выборочных наблюдений и при необходимости в группировке этих наблюдений по достаточно малым интервалам, в вычислении частостей(относительных частот) для каждого интервала, в определении числовых характеристикстатистического распределения и графическом представлениирезультатов в виде гистограмм, полигонов и функций распределения.
После статобработки можно получить различные статистические характеристики (статистики). Среди них важнейшими являются: среднее арифметическое (выборочное среднее, статистическое среднее, средневзвешенное); выборочная дисперсия (статистическая дисперсия); выборочное среднее квадратическое отклонение (выборочное стандартное отклонение, выборочный стандарт).
Используют также такие характеристики: мода –значение случайной величины, имеющее наибольшую вероятность (значение признака, встречающееся с наибольшей частотой); медиана –значение случайной величины, при котором вероятность появления величины Xi ,меньших Xср., равна вероятности появления величин, больших X(значение признака, относительно которого эмпирическая совокупность делится на две равные по числу членов части).
Кроме среднего арифметического (статистического начального момента первого порядка) и выборочной дисперсии (статистического центрального момента второго порядка) для оценки асимметриииспользуют центральный момент третьегопорядка, а для характеристики эксцесса(островершинности) – центральный момент четвертогопорядка.
Более полными характеристиками выборки, по сравнению с ранее рассмотренными, являются эмпирическая функция распределения, гистограмма и полигон.
Гистограммаявляется графическим представлением статистического ряда, она показывает количество измерений, попавших в каждый, одинаковый по величине интервал.
Эмпирическая функция распределения(статистическая функция распределения, кумулятивная кривая, функция накопленных частот) является статистическим аналогом распределения генеральной совокупности (теоретической функции распределения).
Если объем выборки увеличивается, то от статистических закономерностей можно перейти к вероятностным, так как при этом эмпирическая функция распределения приближается к теоретической функции распределения генеральной совокупности; среднее арифметическое (выборочное среднее) приближается к математическому ожиданию (которое является генеральной средней), а выборочная дисперсия – к дисперсии генеральной совокупности.
Одной из основных и часто выполняемых задачстатистической обработки результатов испытаний (наблюдений) является построение(выбор) такого теоретического(вероятностного) распределения,которое наилучшим образом воспроизводило бы характерные признаки (особенности) экспериментального ряда. Такой переход от статистической модели к вероятностному распределениюпозволяет использовать информацию об аналогах при расчете надежностипроектируемых новых устройств и систем.
Вероятностные законы распределения представляют или в виде функции распределения илив виде плотности распределения.
Функциюраспределения иногда называют интегральнойфункцией, а плотностьраспределения вероятностей – дифференциальнойфункцией распределения.
Гистограммапри интегрировании принимает вид плавной кривой, которую называют графиком плотности распределения вероятностей(плотности распределения), а уравнение, описывающее его, закономраспределения случайной величины.
Упорядочиваниевыборочных наблюдений состоит в расположении наблюдавшихся значений в порядке возрастания. Полученный ряд называют вариационным,или ранжированным.
Если число членов вариационного ряда велико, то для удобства его изучения наблюдавшиеся значения группируют по интервалам (классам), образуя интервальный ряд. Длину интервалов обычно берут одинаковой. Интервальный ряд может быть построен как для дискретных, так и непрерывных случайных величин.
Классическим примером, на основе которого были впервые получены многие положения математической статистики, является вычисление выборочных значений характеристик распределения признаков случайно составленной группы сверстников (например, группы новобранцев).
Наглядный пример вычисления Хср, S, S несмещ., моментов и коэффициента вариации можно получить, если использовать данные наблюдения роста группы двадцатилетних юношей-студентов третьекурсников.
Обычно все вычисления в математической статистике производят в табличной форме, которая наиболее удобна, так как обладает наглядностью, обозримостью и позволяет проверять вычисления на каждом этапе (табл. 4.1).
В настоящее время, при наличии настольных компьютеров и карманных калькуляторов, заполнение таких таблиц не вызывает принципиальных трудностей.
В табл. 4.1 приведены цифры, соответствующие росту двадцатилетних юношей. При комплектовании лекционных потоков меньше всего учитывается рост студентов, поэтому выборку можно считать случайной.
Примером грубой ошибки в подобной ситуации было бы вычисление выборочных характеристик с использованием наблюдений роста солдат Преображенского полка царской гвардии.
Порядок выполнения работы
Необходимо выполнить статистическую обработку выборки размером n = 50.
Исходные данные для расчетов лабораторной работы выбираем из табл. 4.1выборки размером n = 56,для которой дан пример расчета.
1. Аналогично табл. 4.1 чертим таблицу для исходных данных и результатов расчетов с учетом выборки n = 50.Заполняемтолько два первых столбца (№ и Х),остальные столбцы надо будет заполнить результатами своих расчетов.
Начало выборки соответствует номеру фамилии студента в журнале группы.
Например, № 13. Записываем для 1-го номера Х1 = 189; для 2-го номера Х2 = 172 и т.д. до конца таблицы, Х44 = 177; затем переходим к началу таблицы Х45 = 183 и далее до Х50 = 180. В выборку не попадут 6 значений от № 7 до № 12.
2. Для построения гистограммы, полигона распределения и кумулятивной линии заполняем таблицу аналогичную табл. 4.2.
Если данные табл. 4.1 разделить на классы, то можно построить гистограмму и полигон частот.
Разбиение на классы можно выполнить по правилу Штюргеса(Старджеса).
Число классов
.
В нашем случае для n = 56число классов k = 1 + 3,32*1,75 = 6,81.
Дляn = 50число классов k = 1 + 3,32*1,70= 6,64.
Длина интервала составит l = (Xmax – Xmin)/ k.
С другой стороны размах варьирования составляет R = Xmax – Xmin= 189 – 166 = 23 см.
где Xmax и Xmin- соответственно максимальная и минимальная величины.
Исходя из этого, примем число классов равным 6 со ступенями, равными 4 см: 4х6 = 24 см. k = 6; l = 4 см.В дальнейшем, для упрощения записей, размерность «см» не указывается. Варианты(перечень интервалов для интервального ряда) и соответствующие им частоты (частости) образуют статистический ряд выборки.
Таблица 4.1
Варианты заданий:Исходные данные и результаты расчетов
№ | x | ||||
+ 7,34 | 53,88 | 395,45 | 2902,58 | ||
- 5,66 | 32,04 | - 181,32 | 1026,28 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+ 4,34 | 18,84 | 81,75 | 354,78 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+ 9,34 | 87,23 | 814,78 | 7610,05 | ||
+ 8,34 | 69,56 | 580,09 | 4837,98 | ||
- 1,66 | 2,76 | - 4,57 | 7,59 | ||
- 7,66 | 58,68 | - 449,46 | 3442,83 | ||
- 1,66 | 2,76 | - 4,57 | 7,59 | ||
+13,34 | 177,96 | 2373,93 | 31668,20 | ||
- 3,66 | 13,40 | - 49,03 | 179,44 | ||
- 0,66 | 0,44 | - 0,287 | 0,19 | ||
- 8,66 | 75,00 | - 649,46 | 5624,34 | ||
+ 3,34 | 11,16 | 37,26 | 124,45 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
- 6,66 | 44,35 | - 295,41 | 1967,42 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
- 6,66 | 44,36 | - 295,41 | 1967,42 | ||
- 4,66 | 21,72 | - 101,19 | 471,57 | ||
- 5,66 | 32,04 | - 181,32 | 1026,28 | ||
+ 1,34 | 1,80 | 2,41 | 3,22 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+ 3,34 | 11,16 | 37,26 | 124,45 | ||
- 1,66 | 2,76 | - 4,57 | 7,59 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+12,34 | 152,28 | 1879,08 | 23187,86 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
- 3,66 | 13,40 | - 49,03 | 179,44 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
- 8,66 | 75,00 | - 649,46 | 5624,34 | ||
- 9,66 | 93,32 | - 901,43 | 8707,80 | ||
+ 4,34 | 18,84 | 81,75 | 354,78 | ||
+ 7,34 | 53,88 | 395,45 | 2902,58 | ||
+ 0,34 | 0,12 | 0,039 | 0,0134 | ||
+ 6,34 | 40,19 | 254,84 | 1615,69 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
- 3,66 | 13,39 | - 49,03 | 179,44 | ||
+ 9,34 | 87,23 | 814,78 | 7610,05 | ||
+ 7,34 | 53,88 | 395,45 | 2902,58 | ||
- 0,66 | 0,44 | - 0,287 | 0,19 | ||
- 1,66 | 2,76 | - 4,57 | 7,59 | ||
+ 4,34 | 18,84 | 81,75 | 354,78 | ||
- 9,66 | 93,32 | - 901,43 | 8707,80 | ||
- 6,66 | 44,36 | - 295,41 | 1967,42 | ||
- 4,66 | 21,72 | - 101,19 | 471,57 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
- 6,66 | 44,36 | - 295,41 | 1967,42 | ||
- 5,66 | 32,04 | - 181,32 | 1026,28 | ||
+ 3,34 | 11,16 | 37,26 | 124,45 | ||
- 4,66 | 21,72 | - 101,19 | 471,57 | ||
+ 2,34 | 5,48 | 12,81 | 29,98 | ||
- 2,66 | 7,07 | - 18,82 | 50,06 | ||
+ 1,34 | 1,80 | 2,41 | 3,22 | ||
∑ | + 0,04 | 1695,90 | 2577,70 | 131951,25 |
Таблица 4.2
Разбивка массива исходных данных на классы, вычисление частот
Число наблюдений с одинаковым значением варианты называют частотой. Сумма частот равна объему выборки – n.
å h i = n .
Отношение частоты к объему выборки называют частостью(относительной частотой).
D h i = h i /n .