Краткие сведения из теории вероятностей и математической статистики
2.1. Случайные величины и параметры их распределений
Поскольку из-за влияния неконтролируемых факторов отклик - это всегда случайная величина, при обработке результатов эксперимента широко используется аппарат теории вероятностей и математической статистики, поэтому напомним некоторые основные понятия и определения этого раздела математики.
Случайное событие - событие, реализацию которого при определенном комплексе условий невозможно заранее предсказать.
Например, реализацию такого события, как пять остановок доменной печи в течение месяца, невозможно предсказать заранее, поскольку остановок может быть и три, и семь, и четыре, и т.д.
Случайная величина - величина, которая может принимать какое-либо значение из установленного множества и с которой связано вероятностное распределение.
Случайная величина может быть дискретной или непрерывной.
Дискретная случайная величина - случайная величина, которая может принимать значения только из конечного или счетного множества действительных чисел.
Непрерывная случайная величина - случайная величина, которая может принимать любые значения из конечного или бесконечного интервала.
Если при фиксированном наборе уровней всех контролируемых факторов провести п измерений отклика X, то в результате будет получен ряд хотя и близких, но отличающихся друг от друга значений:
X; (i =1,2, ...,п), (2.1)
где х - i -е измерение величины X,
x-i, х2,..., хп - реализация случайной величины X.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Пример 2.1.В результате изучения работы доменной печи на протяжении полутора лет было зарегистрировано следующее количество ее остановок в течение каждого месяца (табл. 2.1).
Таблица 2.1
Число остановок доменной печи по месяцам (общее число наблюдений п = 18)
Месяц | ||||||||||||||||||
Число остановок |
В данном примере число остановок доменной печи в течение месяца -это дискретная случайная величина. В первом из п = 18 измерений этой величины было получено значение x1 = 3, во втором - х2 = 4 и т.д., до х18 = 7. Приведенные в табл. 2.1 значения - это реализация такой случайной величины, как число остановок доменной печи в течение месяца.
Каждому значению дискретной случайной величины X (любому из событий А, когда случайная величина X принимает какое-либо строго определенное значение х), можно поставить в соответствие следующее отношение:
W =, (2.2)
n
где m - число наблюдений, в которых дискретная случайная величина X оказалась равна х; п - общее количество наблюдений. Величину W называют частотой реализации события А.
В примере 2.1, в шести наблюдениях: / = 4, 5, 6, 10, 11 и 16, количество остановок доменной печи в течение месяца X оказалось равным пяти (X = 5), следовательно, частота реализации такого события, как пять остановок, равна 6/18 = 0,33. Частоты реализаций для других событий (две, три, четыре и т.д. остановки) приведены в табл. 2.2.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Таблица 2.2 Частота остановок печи отжига
Число остановок х | 2 | |||||
Количество наблюдений т, в которых реализовалось событие X = х | ||||||
Частота реализации, W = т/п | 0,06 | 0,11 | 0,17 | 0,33 | 0,22 | 0,11 |
Если продолжить наблюдения за работой доменной печи в течение еще полутора лет, то, конечно же, совершенно не обязательно, что на протяжении следующих восемнадцати месяцев пять остановок будет снова зарегистрировано ровно в 6 случаях из 18 наблюдений, а частота реализации этого события опять окажется равной 0,33. Однако при возрастании числа повторений одного и того же комплекса условий частота реализации такого события, как, например, пять остановок печи в течение месяца, будет принимать все более и более устойчивое значение. Так, если подсчитать частоту реализации данного события за 36 месяцев, то она уже практически не будет отличаться от того значения, которое затем можно будет получить за четыре с половиной года (при условии, что за все это время наблюдений в работе доменной печи не произойдет никаких существенных изменений).
Предел, к которому стремится отношение т/n при неограниченном возрастании числа опытов п, называется вероятностью случайного события.
Вероятность Р(А) события А - число от нуля до единицы, которое представляет собой предел частоты реализации события А при неограниченном числе повторений одного и того же комплекса условий.
Для дискретной случайной величины можно указать вероятность, с которой она принимает каждое из своих возможных значений конечного или счетного множества действительных чисел. Для непрерывной случайной величины задают вероятность ее попадания в один из заданных интервалов области ее определения (поскольку вероятность того, что она примет какое-либо конкретное свое значение, стремится к нулю).
Полностью свойства случайной величины описываются законом ее распределения, под которым понимают связь между возможными значениями случайной величины и соответствующими им вероятностями.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Распределение случайной величины - функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.
В математике используют два способа описания распределений случайных величин: интегральный (функция распределения) и дифференциальный (плотность распределения).
Функция распределения F(x)- функция, определяющая для всех действительных х вероятность того, что случайная величина X принимает значение не больше, чем х
F(x) = P(X < x). (2.3)
Функция распределения F(x) имеет следующие свойства (рис.2.1, а):
1. Ее ордината, соответствующая произвольной точке х^, представляет собой вероятность того, что случайная величина X будет меньше, чем xi, т.е. Г(х\) = Р(Х< xi).
2. Функция распределения принимает значение, заключенное между нулем и единицей:
О < F\x)< 1. (2.4)
3. Функция распределения стремится к нулю при неограниченном
уменьшении х и стремится к единице при неограниченном возраста
нии х, то есть
lim F(x) =0, lim F(x) =1. (2 5)
4. Функция распределения представляет собой монотонно возрастаю
щую кривую, то есть
Г(хг)>Г(х\), если x2>xi. (2.5а)
5. Ее приращение на произвольном отрезке (x-ь х2) равно вероятности
того, что случайная величинах попадет в данный интервал:
Fyxzj-Fyxy) =P(X<x2)-P(X<x[) =P(xу <X<x^)ш (2.6)
F(x)
а 20 б
F(x)
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Рассмотрим, какие особенности имеют функции распределения дискретных случайных величин. Пусть X - дискретная случайная величина, принимающая возможные значения x1t х2,..., хп с вероятностями p1t р2, ..., рп ■ Функция распределения вероятностей этой случайной величины X равна
F(x) = Р(Х < х) = / \рк,
хк
где производится суммирование вероятностей всех возможных значений случайной величины X, меньших чем х. Такая функция всегда разрывная, ступенчатая (рис.2.1, б): от -оо до xi включительно функция равна нулю, в точке х1 происходит скачок на величину рь и функция остается постоянной до х2 включительно и т.д., то есть возможным значениям случайной величины соответствуют скачки функции, равные вероятностям этих значений. Последний скачок на рп происходит в точке хп, и функция равна единице от хп до +оо. Таким образом, сумма всех скачков равна единице.
Плотность распределения f(x) - первая производная (если она существует) функции распределения.
. / \dF (х )
J\x)=;• (2.7)
ах
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Плотность функции распределения f(x) имеет следующие свойства (рис.2.2):
x1 dx Mx M0 Me
Х2
X
Рис.2.2. Дифференциальный закон распределения плотность распределения f(x)
1. Плотность распределения вероятностей является неотрицательной
функцией, т.е.
Л*№ (2.8)
Это свойство справедливо, так как F(x) есть неубывающая функция.
2. Функция распределения случайной величины X равна определенному
интегралу от плотности распределения вероятностей в пределах (-оо,
х):
а
F(х^ = \f (х) dx
(2.9)
3. Вероятность события, состоящая в том, что случайная величина X примет значение, заключенное в полуинтервале [xi ,х2 ], равна определенному интегралу от плотности распределения вероятностей на этом полуинтервале:
X
P(xj < X < х2)= F(x2)-F(x1)= [f(x)dx
(2.10)
X
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
4. Интеграл плотности распределения в бесконечно большом интервале (-оо, + оо) равен единице:
1-ии
\f(x)dx = Р(- оо < X < +оо ) = 1,
(2.11)
так как попадание случайной величины в интервал -оо < Х< + оо есть достоверное событие.
В большинстве случаев при обработке экспериментальных данных, основываясь на тех или иных предположениях (гипотезах) относительно свойств исследуемой случайной величины, удается записать функцию ее распределения (а следовательно, и плотность распределения как первую производную от функции распределения) с точностью до некоторых неизвестных параметров.
Например, для случайной величины, которая удовлетворяет так называемому нормальному закону распределения (закону распределения Гаусса), функцию распределения можно записать в виде
(х - М х )
F (х) = —. \е 1 а х dx, (2 12)
^2тгст2х _i
а для случайной величины, имеющей, например, распределение Вейбу-ла-Гнеденко (используемое для описания результатов экспериментов в случае хрупкого разрушения металла, а также в испытаниях на многоцикловую усталость), функция распределения определяется следующим выражением:
К-х
н
b
F(x) = l-e v с , приХ>хн,
F(x) = 0, при X < хн. (2.13)
В функциях (2.12) и (2.13) константы Мх, ох2 и с, Ь, хн являются параметрами распределений, причем первое из этих двух выражений относится к двух-параметрическому виду закона распределения, а второе, соответственно, - к трехпараметрическому.
Параметр распределения - постоянная, от которой зависит функция распределения.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Следовательно, если известен вид функции распределения (каким-либо образом установлено, что случайная величина не противоречит тому или иному закону распределения), то для того, чтобы однозначно охарактеризовать случайную величину, достаточно задать только лишь параметры ее распределения.
Важнейшими параметрами распределения, задающими случайную величину X, являются ее математическое ожидание Мх (характеризует центр рассеивания) и дисперсия о-х2 (характеризует степень рассеивания).
Математическое ожидание Мх - среднее взвешенное по вероятностям значение случайной величины.
Для дискретной случайной величины математическое ожидание определяется выражением
Mx=T,xipi, (2.14)
i
где Xj- значения дискретной случайной величины, а р,- = Р(Х= х,).
Если в условиях примера 2.1 предположить, что р, ~ W-, (см. табл. 2.2), то для математического ожидания такой дискретной случайной величины, как число остановок доменной печи в течение месяца, можно получить следующее значение:
Мх = 20,06 + 30,11 + 40,17 + 50,33 + 60,22 + 70,11 = 4,87.
Для непрерывной случайной величины математическое ожидание определяется интегралом
+00
M x =\xf(x)dx, (2.15)
-ос
где f(x) - плотность распределения непрерывной случайной величины.
Можно отметить, что геометрический смысл математического ожидания непрерывной случайной величины - это абсцисса центра тяжести фигуры под кривой плотности распределения f(x). Сказанное проиллюстрируем на рис. 2.2, где видно, что произведение f(x)dx есть площадь элементарного участка под кривой f(x), а х - абсцисса этого участка, т.е. расстояние от начала координат.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
Следовательно, интеграл (2.15) дает абсциссу центра тяжести всей площади фигуры под кривой f(x).
Кроме математического ожидания центр рассеивания случайной величины можно еще охарактеризовать такими параметрами ее распределения, как мода и медиана.
Мода Мо - значение случайной величины, соответствующее локальному максимуму плотности вероятностей для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины.
Для примера 2.1 (см. табл. 2.2), при условии, что р, ~ W-,, мода Мо числа остановок доменной печи равна 5, поскольку именно этому значению данной дискретной случайной величины соответствует локальный максимум вероятности, равный 0,33.
Медиана Me - значение случайной величины, для которого функция распределения принимает значение 14 , или имеет место «скачок» со значения, меньшего чем 14, до значения, большего чем 14.
Таким образом, для дифференциального закона распределения медиана есть такое значение непрерывной случайной величины X, которое делит пополам площадь под кривой плотности распределения f(x).
В примере 2.1, если предположить, что функция распределения от четырех остановок F(4) (вероятность того, что число остановок доменной печи в течение месяца будет не более четырех) равна 0,06 + 0,11 + 0,17 = 0,34 , а функция распределения F(5) = 0,34 + 0,33 = 0,67, то медианой Me такой дискретной случайной величины, как число остановок доменной печи в течение месяца, будет значение Me = 5.
Дисперсия случайной величины ах2 - математическое ожидание случайной величины (X - Мх)2.
Для дискретной случайной величины дисперсия определяется следующим математическим выражением:
а2x = ]Г(xi -Mx f ■ p(xi). (2.16)
i-Х
В примере 2.1 (опять же, если предположить, что р, ~ W;) значение дисперсии числа остановок доменной печи равно:
ах2 = (2 - 4,87)20,06 + (3 - 4,87)20,11 + (4 - 4,87)20,17 +
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...
+ (5 - 4,87)20,33 + (6 - 4,87)20,22 + (7 - 4,87)20,11 = 1,7931.
Для непрерывной случайной величины дисперсия определяется выражением
+QO
а\ = \[x — Mx) ■ f(x)dx, (2.17)
-ос
где х - значения непрерывной случайной величины X; f(x) - плотность распределения; Мх- математическое ожидание.
Дисперсия имеет размерность квадрата единицы измерения случайной величины, а положительное значение квадратного корня из дисперсии называется средним квадратичным отклонением.
Среднее квадратичное отклонение ох- неотрицательный квадратный корень из дисперсии.
аx =+>/сгx-(2.18)
Для примера 2.1 среднее квадратичное отклонение числа остановок доменной печи в течение месяца равно аx = +^1,7931 =1,34.
В заключение этого раздела дадим определение еще одного параметра распределения случайной величины, который носит название квантиль.
Квантиль порядка Р, хй- значение случайной величины, для которого функция распределения принимает значение Р или имеет место «скачок» со значения, меньшего чем Р, до значения, большего чем Р:
F(xp) = Р. (2.19)
Из этого определения квантиля следует, что медиана Me - это квантиль порядка 14, т.е. Me = x0i5-
Вероятность попадания случайной величины Хв интервал [ хР^, хР2 ] равна
Р(хр1 <Х < хр2) = Р(Х < хр2)-Р(Х < хр1) =F(xp2)-F(xp1)= Р2 -Pj. (2.20)
В примере 2.1 квантиль порядка 0,95 числа остановок доменной печи скорее всего равен семи х 0,95 = 7, поскольку F(6) « 0,06 + 0,11 + 0,17 + 0,33 + 0,22 = 0,89, a F(7) ~ 0,89 + 0,11 = 1,00.
2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...