Случайные величины и их характеристики
Понятие случайной величины является одним из центральных понятий теории вероятностей. Под случайной величиной понимается величина, принимающая в результате испытания то или иное (но при этом только одно) возможное значение, заранее не известное, меняющееся от испытания к испытанию и зависящее от случайных обстоятельств. Случайная величина характеризует все возможные результаты случайного эксперимента с количественной стороны, однако, нельзя достоверно предсказать, какое именно значение при этом она примет.
Случайные величины обозначают обычно большими латинскими буквами, например X, Y, Z, или малыми греческими буквами, например x, z, h, а их возможные значения – малыми латинскими буквами, например x, y, z.
Случайные величины могут быть дискретными и непрерывными. Дискретной случайной величиной (ДСВ) называют такую величину, которая принимает отдельные, изолированные значения с определенными вероятностями. Непрерывной случайной величиной (НСВ) называют такую величину, которая может принимать любое значение из некоторого конечного или бесконечного числового промежутка.
Например, можно считать, что число покупателей в магазине, побывавших там в течение дня, число автомобилей, ремонтируемых еженедельно в данной мастерской, число пассажиров, находящихся в аэропорту, являются ДСВ. Курс валют, доход, объем ВНП и т.п. обычно рассматриваются как НСВ.
Для описания случайной величины используется функция распределения – функция F(x), которая определяет вероятность того, что случайная величина X примет значение меньше, чем x, т.е.
. (2.10)
На рис. 2.1 изображены характерные графики функций распределения ДСВ (рис. 2.1а) и НСВ (рис. 2б).
Из определения функции распределения вытекают следующие ее свойства:
10. Функция распределения F(x) есть неотрицательная функция, заключенная между нулем и единицей: .
20. Функция распределения F(x) есть неубывающая функция, т.е. .
30. Функция распределения F(x) изменяется от 0 до 1 при изменении x от–¥ до +¥:
, .
Для описания ДСВ на практике обычно используется закон распределения (или ряд распределения) вероятностей случайной величины – это когда каждому возможному значению случайной величины ставится в соответствие некоторая вероятность.
Закон распределения обычно записывают в виде таблицы:
X | x1 | x2 | … | xk |
P | p1 | p2 | … | pk |
Обычно . Обязательно .
Пример 2.8. Доход от некоторого рискованного бизнеса составляет сумму около 1000 у.е. с заданным законом распределения (знак минус означает убыток):
X | –2000 | –1000 | ||||
P | 0,1 | 0,1 | 0,2 | 0,2 | 0,3 | 0,1 |
Какой наиболее вероятностный денежный доход рискованного бизнеса? Является ли этот риск вероятностно-успешным?
Решение. Поскольку сумма всех вероятностей
0,1+0,1+0,2+0,2+0,3+0,1=1,
то представленный ряд действительно является законом распределения вероятностей случайной величины X. Наиболее вероятностный денежный доход этого бизнеса равен 2000, т.к. вероятность этого события P(X=2000)=0,3 наибольшая. Вероятность получить прибыль в этом бизнесе равна P(X>0)=0,2+0,3+0,1=0,6, а вероятность оказаться в убытке равна P(X<0)=0,1+0,1=0,2. Таким образом, этот рискованной бизнес является вероятностно-успешным. â
Для описания НСВ на практике обычно используется плотность распределения вероятностей случайной величины:
. (2.11)
Из определения плотности распределения вытекают следующие ее свойства:
10. . | 30. . |
20. . | 40. . |
Можно отметить, что для НСВ справедливы равенства
.
Пример 2.9. Пусть плотность распределения случайной величины X имеет вид
.
Найти значение постоянной C. Чему равна вероятность того, что данная случайная величина примет значение, лежащее на интервале (0;1)?
Решение. Чтобы функция f(x) была плотностью распределения, должны выполняться два условия: 10 и 20. Из первого условия имеем C³0. По второму условию интеграл
должен быть равен 1. Отсюда C=1.
Искомая вероятность может быть найдена при помощи свойства 30. В нашем случае
. â
Функция распределения содержит достаточно полную информацию о случайной величине. Действительно, функция распределения одновременно указывает на то, какие значения может принимать случайная величина и с какими вероятностями. Однако судить об основных особенностях случайной величины только по виду функции распределения довольно трудно. Еще труднее сравнивать случайные величины. В связи с этим вводят более простые характеристики случайной величины, определяемые только одним числом. Хотя числовые характеристики не дают полного представления о случайной величине, однако они в сжатой форме выражают наиболее важные черты распределения.
Условно числовые характеристики разделяют на два класса: характеристики положения (математическое ожидание, мода, медиана, начальные моменты) и характеристики рассеивания (дисперсия, среднее квадратичное отклонение, центральные моменты). Важнейшими из них являются математическое ожидание, дисперсия, среднее квадратичное отклонение.
Математическое ожидание характеризует среднее ожидаемое значение случайной величины, т.е. приближенно равно ее среднему значению. Для решения многих задач достаточно знать эту величину. Например, при оценивании покупательской способности населения вполне может хватить знания среднего дохода. При анализе выгодности двух видов деятельности можно ограничиться сравнением их средних прибыльностей.
Математическое ожидание ДСВ определяется следующим образом
. (2.12)
Математическое ожидание НСВ находится по формуле
. (2.13)
Из определения математического ожидания вытекают следующие ее свойства:
10. , где С – постоянная величина.
20. .
30. .
40. , если X и Y – независимые случайные величины.
Для дальнейшего анализа случайных величин знания одного лишь математического ожидания недостаточно. Существуют отличные друг от друга случайные величины, имеющие одинаковые математические ожидания. Например, средний уровень жизни в Швеции и США приблизительно одинаков, однако разброс в доходах в этих странах существенно отличается. Акции двух компаний могут приносить в среднем одинаковые дивиденды, однако вложение денег в одну из них может быть гораздо более рискованной операцией, чем в другую. Следовательно, нужна числовая характеристика, которая оценивает разброс возможных значений случайной величины относительно ее математического ожидания. Такой наиболее распространенной характеристикой является дисперсия.
Дисперсией называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
, (2.14)
где . Раскрыв скобки и используя свойства математического ожидания, получим формулу, которая довольно часто используется для вычисления дисперсии:
, (2.15)
Из определения дисперсии вытекают следующие ее свойства:
10. , где С – постоянная величина.
20. .
30. , если X и Y – независимые случайные величины.
Дисперсия имеет размерность, равную квадрату размерности случайной величины, что не всегда удобно при исследовании случайной величины. Для того чтобы представить разброс значений случайной величины в тех же единицах, что и сама случайная величина, вводится числовая характеристика – среднее квадратичное отклонение.
Средним квадратичным отклонением (СКО) называется квадратный корень из дисперсии:
. (2.16)
Чтобы оценить разброс значений случайной величины в процентах относительно ее среднего значения, вводится коэффициент вариации, рассчитываемый по формуле:
. (2.17)
Пример 2.10. По данным примера 2.8 определить, чему равен на длительный период средний доход от рассмотренного бизнеса? Какова мера риска вложений в такое предприятие?
Решение. Средний доход от рассмотренного бизнеса за длительный период равен математическому ожиданию:
у.е.
Мерой риска вложений в рискованное предприятие может служить среднее квадратичное отклонение. Вычислим дисперсию по формуле (2.15), предварительно найдем
.
Тогда
.
Следовательно, СКО будет равна
у.е.
Коэффициент вариации в данном случае равен
.
Таким образом, разброс значений случайной величины достаточно большой, следовательно, рассматриваемый бизнес имеет очень высокий уровень риска. â
Пример 2.11. По данным примера 2.9 вычислить математическое ожидание и дисперсию?
Решение. По определению
.
Однако этот интеграл равен нулю, т.к. подынтегральная функция является нечетной. Таким образом
.
Вычислим теперь
.
Применяя интегрирование по частям, получим
.
Таким образом, дисперсия будет равна
. â