Определение 21.2.Математическое ожидание абсолютно непрерывной случайной величины
Как мы уже отмечали, вероятность события, состоящего в том, что абсолютно непрерывная случайная величина примет некоторое конкретное значение, равна нулю. Поэтому и формула для математического ожидания принимает иной вид.
Вспомним, что функция распределения абсолютно непрерывной случайной величины
Соответственно, математическое ожидание случайной величины Х будет таким:
Замечание 21.7. Вернемся к нашей аналогии плотности вероятности и физической плотности при обсуждении абсолютно непрерывного закона распределения. Точка, в которой нужно установить упор (подвес), для тог, чтобы уравновесить этот гипотетический стержень и будет точкой математического ожидания в данном случае. Так что, как и в дискретном случае, мы можем говорить о математическом ожидании как о «средневзвешенном» значении.
Пример 21.3.
Найти математическое ожидание равномерно распределенной на [a,b] случайной величины X. Поскольку при x<a, x>b плотность p(x)=0 и ЕХ =
То есть математическое ожидание – это середина отрезка [a,b]
Свойства математического ожидания.
1. Если случайная величина Х принимает одно и то же значение при всех исходах случайного эксперимента, то есть Х º С, то её математическое ожидание равно С.
2. Если ЕХ = а, и k – константа, то Е(kХ) = kЕХ (математическое ожидание случайной величины, умноженной на число, равно математическому ожиданию случайной величины, умноженному на это число).
3. Если ЕХ = а, и k – константа, то Е(k + Х) = k + ЕХ математическое ожидание суммы случайной величины и числа равно сумме этого числа и математического ожидания случайной величины).
4. E(X+Y) =EX + EY
5. Если X и Y – независимые случайные величины, то E(X∙Y) = EX∙ EY
Определение 21.3.Дисперсия случайной величины.
Дисперсия DXслучайной величины X определяется формулой
DX = E(X – EX)2
Дисперсия случайной величины — это математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
Рассмотрим случайную величину X с законом распределения
X | |||
Р |
Вычислим её математическое ожидание.
EX = 1× + 2× + 3× =
Составим закон распределения случайной величины X – EX
X– EX | |||
Р |
а затем закон распределения случайной величины (X - EX)2
(X– EX)2 | |||
Р |
Теперь можно рассчитать величину DX :
DX = × + × + × =
Замечание 21.8. Более удобной для вычисления может оказаться следующая формула, которую можно рассматривать как одно из свойств дисперсии:
DX = EX2 – (EX)2
Таким образом, дисперсия случайной величины равна разности математического ожидания квадрата случайной величины и квадрата её математического ожидания. Для использования этой формулы нужно составить таблицу:
X2 | |||
Р |
и провести вычисления EX2 и (EX)2 по описанной схеме.
Пример 21.4.
Найти дисперсию случайной величины, заданной законом распределения
X | ||
Р | p | q |
Выше было показано, что EX = р. Легко видеть, что EX2 = р. Таким образом, получается, что DX = р – р2 = pq.
Дисперсия характеризует степень рассеяния значений случайной величины относительно её математического ожидания. Если все значения случайной величины тесно сконцентрированы около её математического ожидания и большие отклонения от математического ожидания маловероятны, то такая случайная величина имеет малую дисперсию. Если значения случайной величины рассеяны и велика вероятность больших отклонений от математического ожидания, то такая случайная величина имеет большую дисперсию.
Пример 21.5.
Найти дисперсию случайной величины Х, равномерно распределенной на [a,b]
Свойства дисперсии.
1. Если k – число, то D(kX) = k2 DX.
2. Для попарно независимых случайных величин X1, X2,¼, Xn справедливо равенство
3. Если Х и Y независимы, D(X+Y) = DX + DY.
Предлагаем в качестве упражнения рассмотреть, чему равняется D(X– Y) в тех же условиях
Определения 2.6.Неравенства Маркова и Чебышева
Неравенства Маркова дают оценку для значений случайной величины в тех случаях, когда наши знания о случайной величине ограничиваются ее математическим ожиданием и дисперсией, и, хотя эти оценки достаточно грубы, они требуют минимальной информации о рассматриваемой случайной величине.
Если возможные значения дискретной случайной величины Х неотрицательны и существует ее математическое ожидание ЕХ = а , то для любого числа с > 0 справедливо неравенство
Р (Х <с ) >1 – а / с
Соответственно, выполняется и неравенство
Р (Х ≥ с ) ≤ а / с
Эти неравенства называются (первым и вторым) неравенствами Маркова
Пример 21.6. Пусть X — время опоздания студента на
лекцию, причем известно, что ЕХ = 1 мин. Воспользовавшись
первым неравенством Чебышева, оценим вероятность Р{Х >5}
того, что студент опоздает не менее, чем на 5 мин.
Имеем P(X≥5) ≤EX/5
Таким образом, искомая вероятность не более 0,2, т.е. в среднем,
из каждых пяти студентов опаздывает по крайней мере на 5 мин не более чем один студент.
Если Х – случайная величина, математическое ожидание которой ЕХ = а , дисперсия DХ конечна, то для любого числа с > 0 выполняются неравенства
P ( | X – a | ≥ c ) ≤DX / c2
P ( | X – a | < c ) >1 – DX / c2
Данные неравенства называются (первым и вторым) неравенствами Чебышева
Замечание 21.9. Иногда и неравенства Маркова и неравенства Чебышева называются первым и вторым неравенствами Чебышева.
Пример 21.7. Пусть в условиях предыдущего примера известно дополнительно, что а = y/DX = 1. Оценим минимальное значение хо, при котором вероятность опоздания студента на время не менее хо не превышает заданного значения Р3 = 0,1.
Для решения поставленной задачи воспользуемся неравенством Чебышева. Тогда
Р3 ≤ Р{Х ≥х0} = Р{Х - ЕX ≥ хо - ЕX} ≤ Р{|Х – EХ| >х0- EX}≤
Значит,
и
И, подставляя конкретные значения, имеем
Таким образом, вероятность опоздания студента на время более 4,16 мин не более 0,1.
Сравнивая полученный результат с результатом предыдущего примера можно заметить, что дополнительная информация о дисперсии времени опоздания позволяет дать более точную оценку искомой вероятности.
Замечание 21.10. Элементарным следствием из неравенства Чебышева является Закон больших чисел (в форме Чебышева):
Определение 21.8. (Начальным)Моментом порядка k случайной величины Х называется число mk = Е(Хk )
Определение 21.9. (Центральным) моментом порядка k случайной величины Х называется число μk = Е(Х–ЕХ)k
Замечание 21.11. Нетрудно видеть, что математическое ожидание – начальный момент первого порядка, а дисперсия – центральный момент второго порядка.
Замечание 21.12. Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = EX, то все ее центральные моменты нечетного порядка равны нулю.
В тех случаях, когда какие-нибудь причины благоприятствуют более частому
появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения.
Определение 21.10. Асимметрией А случайной величины Х называют отношение третьего центрального момента к кубу среднеквадратичного отклонения. А=μ3 / σ3
(по Е.В.Сидоренко)
Асимметрия - величина, характеризующая степень асимметрии распределения относительно математического ожидания.:
Если коэффициент асимметрии отрицателен, то либо большая часть значений случайной величины, либо мода находятся левее математического ожидания, и наоборот, если больше нуля , то правее.
В тех случаях, когда какие-нибудь причины благоприятствуют более частому
появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней,
или отрицательной - более высокие
Очевидно, что для случайной величины, распределенной симметрично относительно математического ожидания, асимметрия равна нулю.
В тех случаях, когда какие-либо причины способствуют преимущественному
появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см следующий рисунок эксцесса).
Определение 21.11. Эксцессом γ случайной величины Х называют отношение
g = (μ4 / σ4 ) –3
Эксцесс: а) положительный; 6) отрицательный. В распределениях с нормальной выпуклостьюγ =0.
Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины Х от нормального распределения, как раз и является эксцесс. Для нормального распределения γ=0, если γ >0 , то это значит, что график плотности «заострен» сильнее, чем у нормального, а если γ<0, то, соответственно, меньше.
Определение 21.12. Квантилью (квантилем)уровня α или α-квантилью (0<α<1) называют число Qα, удовлетворяющее неравенствам Р{X < Qα }≤α и P{X> Qα } ≤ 1 – α
½ -квантиль называют также Медианой М случайной величины Х.
Для непрерывной случайной величины Х α-квантиль Qα – это такое число, меньше которого Х принимает значение с вероятностью α.
Если известна плотность распределения ρ(х) случайной величины Х, то, учитывая связь между функцией распределения и плотностью, уравнение для определения квантили можно записать как
Иначе говоря, квантиль Qα – решение уравнения F(Qα )=α ,
Пример 21.8.
Найдем α-квантиль и медиану экспоненциального распределения
(Непрерывная случайная величина Х имеет показательное распределение с параметром l > 0, если она принимает только неотрицательные значения, а ее плотность распределенияимеет вид: r(х) = lе-lх , x≥0 и 0, если х <0
, поэтому , а медиана равна
Определение 21.13. Модой непрерывной случайной величины называют точку максимума (локального) плотности распределения р(х). Различают унимодальные (имеющие одну моду), бимодальные (имеющие две моды) и мулътимодальные (имеющие несколько мод) распределения.
Для определения моды дискретной случайной величины предположим сначала, что ее значения x1, … xn расположены в порядке возрастания.
Модой дискретной случайной величины называют такое значение хi, при котором для вероятностей выполняются неравенства
pi-1 < pi и pi+1 < рi
В случае дискретных случайных величин распределения также могут быть унимодальными, бимодальными и мультимодальными.
Определение 21.14.Наивероятнейшим значением называют моду, при которой достигается глобальный максимум вероятности (дискретной случайной величины) или плотности распределения (непрерывной случайной величины).
Если распределение унимодальное, то мода также будет наивероятнейшим значением.