Краткие сведения из теории вероятностей и математической статистики

2.1. Случайные величины и параметры их распределений

Поскольку из-за влияния неконтролируемых факторов отклик - это все­гда случайная величина, при обработке результатов эксперимента широко ис­пользуется аппарат теории вероятностей и математической статистики, поэто­му напомним некоторые основные понятия и определения этого раздела мате­матики.

Случайное событие - событие, реализацию которого при определенном комплексе условий невозможно заранее предсказать.

Например, реализацию такого события, как пять остановок доменной пе­чи в течение месяца, невозможно предсказать заранее, поскольку остановок может быть и три, и семь, и четыре, и т.д.

Случайная величина - величина, которая может принимать какое-либо значение из установленного множества и с которой связано вероятностное рас­пределение.

Случайная величина может быть дискретной или непрерывной.

Дискретная случайная величина - случайная величина, которая может принимать значения только из конечного или счетного множества действитель­ных чисел.

Непрерывная случайная величина - случайная величина, которая может принимать любые значения из конечного или бесконечного интервала.

Если при фиксированном наборе уровней всех контролируемых факторов провести п измерений отклика X, то в результате будет получен ряд хотя и близких, но отличающихся друг от друга значений:

X; (i =1,2, ...,п), (2.1)

где х - i -е измерение величины X,

x-i, х2,..., хп - реализация случайной величины X.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Пример 2.1.В результате изучения работы доменной печи на протяже­нии полутора лет было зарегистрировано следующее количество ее остановок в течение каждого месяца (табл. 2.1).

Таблица 2.1

Число остановок доменной печи по месяцам (общее число наблюдений п = 18)

Месяц
Число остано­вок

В данном примере число остановок доменной печи в течение месяца -это дискретная случайная величина. В первом из п = 18 измерений этой вели­чины было получено значение x1 = 3, во втором - х2 = 4 и т.д., до х18 = 7. При­веденные в табл. 2.1 значения - это реализация такой случайной величины, как число остановок доменной печи в течение месяца.

Каждому значению дискретной случайной величины X (любому из собы­тий А, когда случайная величина X принимает какое-либо строго определенное значение х), можно поставить в соответствие следующее отношение:

W =, (2.2)

n

где m - число наблюдений, в которых дискретная случайная величина X оказа­лась равна х; п - общее количество наблюдений. Величину W называют часто­той реализации события А.

В примере 2.1, в шести наблюдениях: / = 4, 5, 6, 10, 11 и 16, количество остановок доменной печи в течение месяца X оказалось равным пяти (X = 5), следовательно, частота реализации такого события, как пять остановок, равна 6/18 = 0,33. Частоты реализаций для других событий (две, три, четыре и т.д. остановки) приведены в табл. 2.2.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Таблица 2.2 Частота остановок печи отжига

Число остановок х 2
Количество наблюдений т, в кото­рых реализовалось событие X = х
Частота реализации, W = т/п 0,06 0,11 0,17 0,33 0,22 0,11

Если продолжить наблюдения за работой доменной печи в течение еще полутора лет, то, конечно же, совершенно не обязательно, что на протяжении следующих восемнадцати месяцев пять остановок будет снова зарегистриро­вано ровно в 6 случаях из 18 наблюдений, а частота реализации этого события опять окажется равной 0,33. Однако при возрастании числа повторений одного и того же комплекса условий частота реализации такого события, как, напри­мер, пять остановок печи в течение месяца, будет принимать все более и бо­лее устойчивое значение. Так, если подсчитать частоту реализации данного события за 36 месяцев, то она уже практически не будет отличаться от того значения, которое затем можно будет получить за четыре с половиной года (при условии, что за все это время наблюдений в работе доменной печи не произойдет никаких существенных изменений).

Предел, к которому стремится отношение т/n при неограниченном воз­растании числа опытов п, называется вероятностью случайного события.

Вероятность Р(А) события А - число от нуля до единицы, которое пред­ставляет собой предел частоты реализации события А при неограниченном числе повторений одного и того же комплекса условий.

Для дискретной случайной величины можно указать вероятность, с кото­рой она принимает каждое из своих возможных значений конечного или счетно­го множества действительных чисел. Для непрерывной случайной величины задают вероятность ее попадания в один из заданных интервалов области ее определения (поскольку вероятность того, что она примет какое-либо конкрет­ное свое значение, стремится к нулю).

Полностью свойства случайной величины описываются законом ее рас­пределения, под которым понимают связь между возможными значениями слу­чайной величины и соответствующими им вероятностями.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Распределение случайной величины - функция, которая однозначно оп­ределяет вероятность того, что случайная величина принимает заданное зна­чение или принадлежит к некоторому заданному интервалу.

В математике используют два способа описания распределений случай­ных величин: интегральный (функция распределения) и дифференциальный (плотность распределения).

Функция распределения F(x)- функция, определяющая для всех действи­тельных х вероятность того, что случайная величина X принимает значение не больше, чем х

F(x) = P(X < x). (2.3)

Функция распределения F(x) имеет следующие свойства (рис.2.1, а):

1. Ее ордината, соответствующая произвольной точке х^, представляет собой вероятность того, что случайная величина X будет меньше, чем xi, т.е. Г(х\) = Р(Х< xi).

2. Функция распределения принимает значение, заключенное между ну­лем и единицей:

О < F\x)< 1. (2.4)

3. Функция распределения стремится к нулю при неограниченном
уменьшении х и стремится к единице при неограниченном возраста­
нии х, то есть

lim F(x) =0, lim F(x) =1. (2 5)

4. Функция распределения представляет собой монотонно возрастаю­
щую кривую, то есть

Г(хг)>Г(х\), если x2>xi. (2.5а)

5. Ее приращение на произвольном отрезке (x-ь х2) равно вероятности
того, что случайная величинах попадет в данный интервал:

Fyxzj-Fyxy) =P(X<x2)-P(X<x[) =P(xу <X<x^)ш (2.6)

F(x)

а 20 б

F(x)

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Рассмотрим, какие особенности имеют функции распределения дис­кретных случайных величин. Пусть X - дискретная случайная величина, прини­мающая возможные значения x1t х2,..., хп с вероятностями p1t р2, ..., рп ■ Функ­ция распределения вероятностей этой случайной величины X равна

F(x) = Р(Х < х) = / \рк,

хк

где производится суммирование вероятностей всех возможных значений случайной величины X, меньших чем х. Такая функция всегда разрывная, сту­пенчатая (рис.2.1, б): от -оо до xi включительно функция равна нулю, в точке х1 происходит скачок на величину рь и функция остается постоянной до х2 вклю­чительно и т.д., то есть возможным значениям случайной величины соответст­вуют скачки функции, равные вероятностям этих значений. Последний скачок на рп происходит в точке хп, и функция равна единице от хп до +оо. Таким обра­зом, сумма всех скачков равна единице.

Плотность распределения f(x) - первая производная (если она существу­ет) функции распределения.

. / \dF (х )

J\x)=;• (2.7)

ах

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Плотность функции распределения f(x) имеет следующие свойства (рис.2.2):


краткие сведения из теории вероятностей и математической статистики - student2.ru

x1 dx Mx M0 Me

Х2

X

Рис.2.2. Дифференциальный закон распределения плотность распределения f(x)

1. Плотность распределения вероятностей является неотрицательной
функцией, т.е.

Л*№ (2.8)

Это свойство справедливо, так как F(x) есть неубывающая функция.

2. Функция распределения случайной величины X равна определенному
интегралу от плотности распределения вероятностей в пределах (-оо,
х):

а

F(х^ = \f (х) dx

(2.9)

3. Вероятность события, состоящая в том, что случайная величина X примет значение, заключенное в полуинтервале [xi ,х2 ], равна опре­деленному интегралу от плотности распределения вероятностей на этом полуинтервале:

X

P(xj < X < х2)= F(x2)-F(x1)= [f(x)dx

(2.10)




X

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

4. Интеграл плотности распределения в бесконечно большом интервале (-оо, + оо) равен единице:

1-ии

\f(x)dx = Р(- оо < X < +оо ) = 1,

(2.11)

так как попадание случайной величины в интервал -оо < Х< + оо есть достовер­ное событие.

В большинстве случаев при обработке экспериментальных данных, осно­вываясь на тех или иных предположениях (гипотезах) относительно свойств ис­следуемой случайной величины, удается записать функцию ее распределения (а следовательно, и плотность распределения как первую производную от функции распределения) с точностью до некоторых неизвестных параметров.

Например, для случайной величины, которая удовлетворяет так назы­ваемому нормальному закону распределения (закону распределения Гаусса), функцию распределения можно записать в виде

(х - М х )

F (х) = —.1 а х dx, (2 12)

^2тгст2х _i

а для случайной величины, имеющей, например, распределение Вейбу-ла-Гнеденко (используемое для описания результатов экспериментов в случае хрупкого разрушения металла, а также в испытаниях на многоцикловую уста­лость), функция распределения определяется следующим выражением:

К-х

н

b

F(x) = l-e v с , приХ>хн,

F(x) = 0, при X < хн. (2.13)

В функциях (2.12) и (2.13) константы Мх, ох2 и с, Ь, хн являются парамет­рами распределений, причем первое из этих двух выражений относится к двух-параметрическому виду закона распределения, а второе, соответственно, - к трехпараметрическому.

Параметр распределения - постоянная, от которой зависит функция рас­пределения.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Следовательно, если известен вид функции распределения (каким-либо образом установлено, что случайная величина не противоречит тому или иному закону распределения), то для того, чтобы однозначно охарактеризовать слу­чайную величину, достаточно задать только лишь параметры ее распределе­ния.

Важнейшими параметрами распределения, задающими случайную вели­чину X, являются ее математическое ожидание Мх (характеризует центр рас­сеивания) и дисперсия о-х2 (характеризует степень рассеивания).

Математическое ожидание Мх - среднее взвешенное по вероятностям значение случайной величины.

Для дискретной случайной величины математическое ожидание опреде­ляется выражением

Mx=T,xipi, (2.14)

i

где Xj- значения дискретной случайной величины, а р,- = Р(Х= х,).

Если в условиях примера 2.1 предположить, что р, ~ W-, (см. табл. 2.2), то для математического ожидания такой дискретной случайной величины, как число остановок доменной печи в течение месяца, можно получить следующее значение:

Мх = 20,06 + 30,11 + 40,17 + 50,33 + 60,22 + 70,11 = 4,87.

Для непрерывной случайной величины математическое ожидание опре­деляется интегралом

+00

M x =\xf(x)dx, (2.15)

-ос

где f(x) - плотность распределения непрерывной случайной величины.

Можно отметить, что геометрический смысл математического ожидания непрерывной случайной величины - это абсцисса центра тяжести фигуры под кривой плотности распределения f(x). Сказанное проиллюстрируем на рис. 2.2, где видно, что произведение f(x)dx есть площадь элементарного участка под кривой f(x), а х - абсцисса этого участка, т.е. расстояние от начала координат.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Следовательно, интеграл (2.15) дает абсциссу центра тяжести всей площади фигуры под кривой f(x).

Кроме математического ожидания центр рассеивания случайной величи­ны можно еще охарактеризовать такими параметрами ее распределения, как мода и медиана.

Мода Мо - значение случайной величины, соответствующее локальному максимуму плотности вероятностей для непрерывной случайной величины или локальному максимуму вероятности для дискретной случайной величины.

Для примера 2.1 (см. табл. 2.2), при условии, что р, ~ W-,, мода Мо числа остановок доменной печи равна 5, поскольку именно этому значению данной дискретной случайной величины соответствует локальный максимум вероятно­сти, равный 0,33.

Медиана Me - значение случайной величины, для которого функция рас­пределения принимает значение 14 , или имеет место «скачок» со значения, меньшего чем 14, до значения, большего чем 14.

Таким образом, для дифференциального закона распределения медиана есть такое значение непрерывной случайной величины X, которое делит попо­лам площадь под кривой плотности распределения f(x).

В примере 2.1, если предположить, что функция распределения от четы­рех остановок F(4) (вероятность того, что число остановок доменной печи в те­чение месяца будет не более четырех) равна 0,06 + 0,11 + 0,17 = 0,34 , а функ­ция распределения F(5) = 0,34 + 0,33 = 0,67, то медианой Me такой дискретной случайной величины, как число остановок доменной печи в течение месяца, будет значение Me = 5.

Дисперсия случайной величины ах2 - математическое ожидание случай­ной величины (X - Мх)2.

Для дискретной случайной величины дисперсия определяется следую­щим математическим выражением:

а2x = ]Г(xi -Mx f ■ p(xi). (2.16)

i-Х

В примере 2.1 (опять же, если предположить, что р, ~ W;) значение дис­персии числа остановок доменной печи равно:

ах2 = (2 - 4,87)20,06 + (3 - 4,87)20,11 + (4 - 4,87)20,17 +

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

+ (5 - 4,87)20,33 + (6 - 4,87)20,22 + (7 - 4,87)20,11 = 1,7931.

Для непрерывной случайной величины дисперсия определяется выраже­нием

+QO

а\ = \[x — Mx) ■ f(x)dx, (2.17)

-ос

где х - значения непрерывной случайной величины X; f(x) - плотность распре­деления; Мх- математическое ожидание.

Дисперсия имеет размерность квадрата единицы измерения случайной величины, а положительное значение квадратного корня из дисперсии называ­ется средним квадратичным отклонением.

Среднее квадратичное отклонение ох- неотрицательный квадратный ко­рень из дисперсии.

аx =+>/сгx-(2.18)

Для примера 2.1 среднее квадратичное отклонение числа остановок до­менной печи в течение месяца равно аx = +^1,7931 =1,34.

В заключение этого раздела дадим определение еще одного параметра распределения случайной величины, который носит название квантиль.

Квантиль порядка Р, хй- значение случайной величины, для которого функция распределения принимает значение Р или имеет место «скачок» со значения, меньшего чем Р, до значения, большего чем Р:

F(xp) = Р. (2.19)

Из этого определения квантиля следует, что медиана Me - это квантиль порядка 14, т.е. Me = x0i5-

Вероятность попадания случайной величины Хв интервал [ хР^, хР2 ] рав­на

Р(хр1 <Х < хр2) = Р(Х < хр2)-Р(Х < хр1) =F(xp2)-F(xp1)= Р2 -Pj. (2.20)

В примере 2.1 квантиль порядка 0,95 числа остановок доменной печи скорее всего равен семи х 0,95 = 7, поскольку F(6) « 0,06 + 0,11 + 0,17 + 0,33 + 0,22 = 0,89, a F(7) ~ 0,89 + 0,11 = 1,00.

2. КРАТКИЕ СВЕДЕНИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ ...

Наши рекомендации