Двумерные случайные величины.

1. Дискретные двумерные случайные величины.

Закон распределения дискретной двумерной случайной величины (Х, Y)имеет вид таблицы с двойным входом, задающей перечень возможных значений каждой компоненты и вероятности p(xi, yj), с которыми величина принимает значение (xi, yj):

Y Х
x1 x2 xi xn
y1 p(x1, y1) p(x2, y1) p(xi, y1) p(xn, y1)
yj p(x1, yj) p(x2, yj) p(xi, yj) p(xn, yj)
ym p(x1, ym) p(x2, ym) p(xi, ym) p(xn, ym)

При этом сумма вероятностей, стоящих во всех клетках таблицы, равна 1.

Зная закон распределения двумерной случайной величины, можно найти законы распреде-ления ее составляющих. Действительно, событие Х = х1 представляется собой сумму несовместных событий (X = x1, Y = y1), (X = x1, Y = y2),…, (X = x1, Y = ym), поэтому

р(Х = х1) = p(x1, y1) + p(x1, y2) +…+ p(x1, ym) (в правой части находится сумма вероятностей, стоящих в столбце, соответствующем Х = х1). Так же можно найти вероятности остальных возможных значений Х. Для определения вероятностей возможных значений Y нужно сложить вероятности, стоящие в строке таблицы, соответствующей Y = yj.

Пример 1. Дан закон распределения двумерной случайной величины:

Y X
-2
-0,8 0,1 0,3 0,1
-0,5 0,15 0,25 0,1

Найти законы распределения составляющих.

Решение. Складывая стоящие в таблице вероятности «по столбцам», получим ряд распре-деления для Х:

Х -2
р 0,25 0,55 0,2

Складывая те же вероятности «по строкам», найдем ряд распределения для Y:

Y -0,8 -0,5
p 0,5 0,5

2. Непрерывные двумерные случайные величины.

Определение 7.1. Функцией распределения F(x, y)двумерной случайной величины (X, Y) называется вероятность того, что X < x, a Y < y:

F( х, у ) = p ( X < x, Y < y ). (7.1)

y

Двумерные случайные величины. - student2.ru

Рис.1.

Это означает, что точка (X, Y) попадет в область, заштрихованную на рис. 1, если вершина прямого угла располагается в точке (х, у).

Замечание. Определение функции распределения справедливо как для непрерывной, так и для дискретной двумерной случайной величины.

Свойства функции распределения.

0 ≤ F(x, y) ≤ 1 (так как F(x, y) является вероятностью).

1) F(x, y) есть неубывающая функция по каждому аргументу:

F(x2, y) ≥ F(x1, y), если x2 > x1;

F(x, y2) ≥ F(x, y1), если y2 > y1.

Доказательство. F(x2, y) = p(X < x2, Y < y) = p(X < x1, Y < y) + p(x1 ≤ X < x2, Y < y) ≥

≥ p(X < x1, Y < y) = F(x1, y). Аналогично доказывается и второе утверждение.

2) Имеют место предельные соотношения:

а) F(-∞, y) = 0; b) F(x, - ∞) = 0; c) F(- ∞, -∞) = 0; d) F( ∞, ∞) = 1.

Доказательство. События а), b) и с) невозможны ( так как невозможно событие Х<- ∞ или Y <- ∞), а событие d) достоверно, откуда следует справедливость приведенных равенств.

При у = ∞ функция распределения двумерной случайной величины становится функцией распределения составляющей Х: F(x, ∞) = F1(x).

При х = ∞ функция распределения двумерной случайной величины становится функцией распределения составляющей Y : F( ∞, y) = F2(y).

Доказательство. Так как событие Y < ∞ достоверно, то F(x, ∞) = р(Х < x) = F1(x). Аналогично доказывается второе утверждение.

Определение 7.2. Плотностью совместного распределения вероятностей (двумер-ной плотностью вероятности)непрерывной двумерной случайной величины называ-ется смешанная частная производная 2-го порядка от функции распределения:

Двумерные случайные величины. - student2.ru . (7.2)

Замечание. Двумерная плотность вероятности представляет собой предел отношения вероятности попадания случайной точки в прямоугольник со сторонами Δх и Δу к площади этого прямоугольника при Двумерные случайные величины. - student2.ru

Свойства двумерной плотности вероятности.

1) f(x, y) ≥ 0 (см. предыдущее замечание: вероятность попадания точки в прямоуголь-ник неотрицательна, площадь этого прямоугольника положительна, следовательно, предел их отношения неотрицателен).

2) Двумерные случайные величины. - student2.ru (cледует из определения двумерной плотности вероятно-сти).

3) Двумерные случайные величины. - student2.ru (поскольку это вероятность того, что точка попадет на плос-кость Оху, то есть достоверного события).

Вероятность попадания случайной точки в произвольную область.

Пусть в плоскости Оху задана произвольная область D. Найдем вероятность того, что точка, координаты которой представляют собой систему двух случайных величин (двумерную случайную величину) с плотностью распределения f(x, y), попадет в область D. Разобьем эту область прямыми, параллельными осям координат, на прямоугольники со сторонами Δх и Δу. Вероятность попадания в каждый такой прямоугольник равна Двумерные случайные величины. - student2.ru , где Двумерные случайные величины. - student2.ru - координаты точки, принадлежащей прямоугольнику. Тогда вероятность попадания точки в область D есть предел интегральной суммы Двумерные случайные величины. - student2.ru Двумерные случайные величины. - student2.ru , то есть

Двумерные случайные величины. - student2.ru (7.3)

Отыскание плотностей вероятности составляющих

двумерной случайной величины.

Выше было сказано, как найти функцию распределения каждой составляющей, зная двумерную функцию распределения. Тогда по определению плотности распределения

Двумерные случайные величины. - student2.ru (7.4)

Аналогично находится Двумерные случайные величины. - student2.ru

Лекция 8.

Основные понятия математической статистики. Генеральная совокупность и выборка. Дискретный вариационный ряд, статистическое распределение выборки. Интервальный вариационный ряд. Полигоны частот и гистограммы. Выборочная функция распределения и её свойства. Числовые характеристики статистического распределения: выборочное среднее, выборочная дисперсия, выборочное среднее квадратическое отклонение, мода и медиана.

Математическая статистика занимается установлением закономерностей, которым подчинены массовые случайные явления, на основе обработки статистических данных, полученных в результате наблюдений. Двумя основными задачами математической статистики являются:

- определение способов сбора и группировки этих статистических данных;

- разработка методов анализа полученных данных в зависимости от целей исследования, к которым относятся:

а) оценка неизвестной вероятности события; оценка неизвестной функции распределения; оценка параметров распределения, вид которого известен; оценка зависимости от других случайных величин и т.д.;

б) проверка статистических гипотез о виде неизвестного распределения или о значениях параметров известного распределения.

Для решения этих задач необходимо выбрать из большой совокупности однородных объектов ограниченное количество объектов, по результатам изучения которых можно сделать прогноз относительно исследуемого признака этих объектов.

Определим основные понятия математической статистики.

Генеральная совокупность– все множество имеющихся объектов.

Выборка – набор объектов, случайно отобранных из генеральной совокупности.

Объем генеральной совокупности N и объем выборки n – число объектов в рассматривае-мой совокупности.

Виды выборки:

Повторная – каждый отобранный объект перед выбором следующего возвращается в генеральную совокупность;

Бесповторная – отобранный объект в генеральную совокупность не возвращается.

Замечание. Для того, чтобы по исследованию выборки можно было сделать выводы о поведе-нии интересующего нас признака генеральной совокупности, нужно, чтобы выборка правиль-но представляла пропорции генеральной совокупности, то есть была репрезентативной(представительной). Учитывая закон больших чисел, можно утверждать, что это условие выполняется, если каждый объект выбран случайно, причем для любого объекта вероятность попасть в выборку одинакова.

Первичная обработка результатов.

Пусть интересующая нас случайная величина Х принимает в выборке значение х1 п1 раз, х2 – п2 раз, …, хк – пк раз, причем Двумерные случайные величины. - student2.ru где п – объем выборки. Тогда наблюдаемые значения случайной величины х1, х2,…, хк называют вариантами, а п1, п2,…, пк – частотами. Если разделить каждую частоту на объем выборки, то получим относительные частоты Двумерные случайные величины. - student2.ruПоследовательность вариант, записанных в порядке возрастания, называют дискретным вариационным рядом, а перечень вариант и соответствующих им частот или относительных частот – статистическим рядом или статистическим распределением выборки:

xi x1 x2 xk
ni n1 n2 nk
wi w1 w2 wk

Пример.

При проведении 20 серий из 10 бросков игральной кости число выпадений шести очков оказалось равным 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2,3,4,1.Составим вариационный ряд: 0,1,2,3,4,5. Статистический ряд для абсолютных и относительных частот имеет вид:

xi
ni
wi 0,15 0,3 0,25 0,15 0,1 0,05

Если исследуется некоторый непрерывный признак, то вариационный ряд может состоять из очень большого количества чисел. В этом случае удобнее использовать группированную выборку. Для ее получения интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько равных частичных интервалов длиной h, а затем находят для каждого частичного интервала ni – сумму частот вариант, попавших в i-й интервал. Составленная по этим результатам таблица называется группированным статистическим рядом или интервальным вариационным рядом:

Номера интервалов k
Границы интервалов (a, a + h) (a + h, a + 2h) (b – h, b)
Сумма частот вариант, попав- ших в интервал   n1   n2   …   nk

Наши рекомендации