Лекция 21. Числовые характеристики случайных величин

Модуль 3

Лекция 21. Числовые характеристики случайных величин

Понятие параметров распределения

Математическое ожидание и его свойства

Дисперсия и ее свойства

Неравенства Маркова и Чебышева

Моменты

Квантиль, асимметрия, эксцесс, мода, медиана

Ковариация

Коэффициент корреляции

Программные положения

Числовые характеристики случайных величин играют важную роль для их описания. Они важны для характеристики случайных величин в том числе в математической статистике, где они используются, например, при параметрическом оценивании. Понятие квантиль необходимо при статистической проверке гипотез

Методические рекомендации

Перед чтением текста лекции повторите определения понятия случайной величины и закона ее распределения. Рассмотрите различные числовые характеристики, уделяя особое внимание математическому ожиданию и дисперсии. Разберите вывод значений этих характеристик для основных табличных законов распределения

Вопросы для самоконтроля

  1. Что такое параметры распределения. Дайте 2 варианта определения
  2. Что такое математическое ожидание, каковы его свойства?
  3. Определите математическое ожидание для дискретной и абсолютно непрерывной случайных величин
  4. Что такое дисперсия, каковы ее свойства?
  5. Что такое ковариация, каковы ее свойства?
  6. Что такое коэффициент корреляции, каковы его свойства?
  7. В чем удобство использования коэффициента корреляции по сравнению с ковариацией?
  8. Сформулируйте неравенства Маркова и Чебышева
  9. Определите начальный и центральный моменты k-го порядка
  10. Определите квантиль, асимметрию, эксцесс, моду, медиану
  11. Найдите математическое ожидание, дисперсию и среднее квадратичное отклонение дискретной случайной величины X, закон распределения которой представлен в таблице

Лекция 21. Числовые характеристики случайных величин - student2.ru

12. Вероятность того, что при трех выстрелах стрелок попадет в цель хотя бы один раз, равна 0,992. Найдите математическое ожидание и дисперсию числа X попаданий при

двадцати выстрелах.

13. Время X безотказной работы станка имеет экспоненциальное распределение. Известно, что вероятность отказа станка за 5 ч равна 0,39347. Найдите математическое ожидание, дисперсию и среднее квадратичное отклонение времени

безотказной работы станка.

14. Пусть Х – время опоздания студента на лекцию, причем известно, что ЕХ=2 мин.

А) Воспользовавшись неравенством Маркова (первым неравенством Чебышева), оценить вероятность того, что студент опоздает не менее, чем на 6 минут

Б) Если, дополнительно, DX=1, оценить минимальное значение t0 , при котором вероятность опоздания студента на время, не менее t0 не превышает заданного значения вероятности Рзаданная= 0,1. Воспользоваться вторым неравенством Чебышева.

Литература

К. А.Н. Кричивец, Е.В. Шикин, А.Г.Дьячков «Математика для психологов» Глава 8

А.Н.Бородин «Элементарный курс теории вероятностей» Часть 1 §12

Математическое ожидание и его свойства

Пример 21.3.

Найти математическое ожидание равномерно распределенной на [a,b] случайной величины X. Поскольку при x<a, x>b плотность p(x)=0 и ЕХ =

Лекция 21. Числовые характеристики случайных величин - student2.ru

То есть математическое ожидание – это середина отрезка [a,b]

Свойства математического ожидания.

1. Если случайная величина Х принимает одно и то же значение при всех исходах случайного эксперимента, то есть Х º С, то её математическое ожидание равно С.

2. Если ЕХ = а, и k – константа, то Е(kХ) = kЕХ (математическое ожидание случайной величины, умноженной на число, равно математическому ожиданию случайной величины, умноженному на это число).

3. Если ЕХ = а, и k – константа, то Е(k + Х) = k + ЕХ математическое ожидание суммы случайной величины и числа равно сумме этого числа и математического ожидания случайной величины).

4. E(X+Y) =EX + EY

5. Если X и Y – независимые случайные величины, то E(X∙Y) = EX∙ EY

Пример 21.4.

Найти дисперсию случайной величины, заданной законом распределения

X
Р p q

Выше было показано, что EX = р. Легко видеть, что EX2 = р. Таким образом, получается, что DX = р – р2 = pq.

Дисперсия характеризует степень рассеяния значений случайной величины относительно её математического ожидания. Если все значения случайной величины тесно сконцентрированы около её математического ожидания и большие отклонения от математического ожидания маловероятны, то такая случайная величина имеет малую дисперсию. Если значения случайной величины рассеяны и велика вероятность больших отклонений от математического ожидания, то такая случайная величина имеет большую дисперсию.

Пример 21.5.

Найти дисперсию случайной величины Х, равномерно распределенной на [a,b]

Лекция 21. Числовые характеристики случайных величин - student2.ru

Свойства дисперсии.

1. Если k – число, то D(kX) = k2 DX.

2. Для попарно независимых случайных величин X1, X2,¼, Xn справедливо равенство

Лекция 21. Числовые характеристики случайных величин - student2.ru

3. Если Х и Y независимы, D(X+Y) = DX + DY.

Предлагаем в качестве упражнения рассмотреть, чему равняется D(X– Y) в тех же условиях

Определения 2.6.Неравенства Маркова и Чебышева

Неравенства Маркова дают оценку для значений случайной величины в тех случаях, когда наши знания о случайной величине ограничиваются ее математическим ожиданием и дисперсией, и, хотя эти оценки достаточно грубы, они требуют минимальной информации о рассматриваемой случайной величине.

Если возможные значения дискретной случайной величины Х неотрицательны и существует ее математическое ожидание ЕХ = а , то для любого числа с > 0 справедливо неравенство

Р (Х <с ) >1 – а / с

Соответственно, выполняется и неравенство

Р (Х ≥ с ) ≤ а / с

Эти неравенства называются (первым и вторым) неравенствами Маркова

Пример 21.6. Пусть X — время опоздания студента на

лекцию, причем известно, что ЕХ = 1 мин. Воспользовавшись

первым неравенством Чебышева, оценим вероятность Р{Х >5}

того, что студент опоздает не менее, чем на 5 мин.

Имеем P(X≥5) ≤EX/5

Таким образом, искомая вероятность не более 0,2, т.е. в среднем,

из каждых пяти студентов опаздывает по крайней мере на 5 мин не более чем один студент.

Если Х – случайная величина, математическое ожидание которой ЕХ = а , дисперсия DХ конечна, то для любого числа с > 0 выполняются неравенства

P ( | X – a | ≥ c ) ≤DX / c2

P ( | X – a | < c ) >1 – DX / c2

Данные неравенства называются (первым и вторым) неравенствами Чебышева

Замечание 21.9. Иногда и неравенства Маркова и неравенства Чебышева называются первым и вторым неравенствами Чебышева.

Пример 21.7. Пусть в условиях предыдущего примера известно дополнительно, что а = y/DX = 1. Оценим минимальное значение хо, при котором вероятность опоздания студента на время не менее хо не превышает заданного значения Р3 = 0,1.

Для решения поставленной задачи воспользуемся неравенством Чебышева. Тогда

Р3 ≤ Р{Х ≥х0} = Р{Х - ЕX ≥ хо - ЕX} ≤ Р{|Х – EХ| >х0- EX}≤ Лекция 21. Числовые характеристики случайных величин - student2.ru

Значит,

Лекция 21. Числовые характеристики случайных величин - student2.ru и Лекция 21. Числовые характеристики случайных величин - student2.ru

И, подставляя конкретные значения, имеем Лекция 21. Числовые характеристики случайных величин - student2.ru

Таким образом, вероятность опоздания студента на время более 4,16 мин не более 0,1.

Сравнивая полученный результат с результатом предыдущего примера можно заметить, что дополнительная информация о дисперсии времени опоздания позволяет дать более точную оценку искомой вероятности.

Замечание 21.10. Элементарным следствием из неравенства Чебышева является Закон больших чисел (в форме Чебышева):

Определение 21.8. (Начальным)Моментом порядка k случайной величины Х называется число mk = Е(Хk )

Определение 21.9. (Центральным) моментом порядка k случайной величины Х называется число μk = Е(Х–ЕХ)k

Замечание 21.11. Нетрудно видеть, что математическое ожидание – начальный момент первого порядка, а дисперсия – центральный момент второго порядка.

Замечание 21.12. Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = EX, то все ее центральные моменты нечетного порядка равны нулю.

В тех случаях, когда какие-нибудь причины благоприятствуют более частому

появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения.

Определение 21.10. Асимметрией А случайной величины Х называют отношение третьего центрального момента к кубу среднеквадратичного отклонения. А=μ3 / σ3

Лекция 21. Числовые характеристики случайных величин - student2.ru

(по Е.В.Сидоренко)

Асимметрия - величина, характеризующая степень асимметрии распределения относительно математического ожидания.:
Если коэффициент асимметрии отрицателен, то либо большая часть значений случайной величины, либо мода находятся левее математического ожидания, и наоборот, если больше нуля , то правее.

В тех случаях, когда какие-нибудь причины благоприятствуют более частому

появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней,

или отрицательной - более высокие

Очевидно, что для случайной величины, распределенной симметрично относительно математического ожидания, асимметрия равна нулю.

В тех случаях, когда какие-либо причины способствуют преимущественному

появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см следующий рисунок эксцесса).

Определение 21.11. Эксцессом γ случайной величины Х называют отношение

g = (μ4 / σ4 ) –3

Лекция 21. Числовые характеристики случайных величин - student2.ru

Лекция 21. Числовые характеристики случайных величин - student2.ru

Эксцесс: а) положительный; 6) отрицательный. В распределениях с нормальной выпуклостьюγ =0.

Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины Х от нормального распределения, как раз и является эксцесс. Для нормального распределения γ=0, если γ >0 , то это значит, что график плотности «заострен» сильнее, чем у нормального, а если γ<0, то, соответственно, меньше.

Определение 21.12. Квантилью (квантилем)уровня α или α-квантилью (0<α<1) называют число Qα, удовлетворяющее неравенствам Р{X < Qα }≤α и P{X> Qα } ≤ 1 – α

½ -квантиль называют также Медианой М случайной величины Х.

Для непрерывной случайной величины Х α-квантиль Qα – это такое число, меньше которого Х принимает значение с вероятностью α.

Если известна плотность распределения ρ(х) случайной величины Х, то, учитывая связь между функцией распределения и плотностью, уравнение для определения квантили можно записать как

Лекция 21. Числовые характеристики случайных величин - student2.ru

Иначе говоря, квантиль Qα – решение уравнения F(Qα )=α ,

Пример 21.8.

Найдем α-квантиль и медиану экспоненциального распределения

(Непрерывная случайная величина Х имеет показательное распределение с параметром l > 0, если она принимает только неотрицательные значения, а ее плотность распределенияимеет вид: r(х) = lе-lх , x≥0 и 0, если х <0

Лекция 21. Числовые характеристики случайных величин - student2.ru , поэтому Лекция 21. Числовые характеристики случайных величин - student2.ru , а медиана равна Лекция 21. Числовые характеристики случайных величин - student2.ru

Определение 21.13. Модой непрерывной случайной величины называют точку максимума (локального) плотности распределения р(х). Различают унимодальные (имеющие одну моду), бимодальные (имеющие две моды) и мулътимодальные (имеющие несколько мод) распределения.

Для определения моды дискретной случайной величины предположим сначала, что ее значения x1, … xn расположены в порядке возрастания.

Модой дискретной случайной величины называют такое значение хi, при котором для вероятностей выполняются неравенства

pi-1 < pi и pi+1 < рi

В случае дискретных случайных величин распределения также могут быть унимодальными, бимодальными и мультимодальными.

Определение 21.14.Наивероятнейшим значением называют моду, при которой достигается глобальный максимум вероятности (дискретной случайной величины) или плотности распределения (непрерывной случайной величины).

Если распределение унимодальное, то мода также будет наивероятнейшим значением.

Модуль 3

Лекция 21. Числовые характеристики случайных величин

Наши рекомендации