Двумерная случайная величина

До сих пор мы рассматривали дискретные случайные ве­личины, которые называют одномерными: их возможные зна­чения определялись одним числом. Кроме одномерных вели­чин рассматривают также величины, возможные значения ко­торых определяются несколькими числами. Двумерную слу­чайную величину обозначают через (X, Y); каждая из величин X и Y называется компонентой (составляющей). Обе величи­ны Х и Y, рассматриваемые одновременно, образуют систему двух случайных величин. Например, при штамповке стальных пластинок их длина и ширина представляют собой двумерную случайную величину.

Определение 1. Законом распределения двумерной случай­ной величины (X, Y) называют множество возможных пар чи­сел (xi, yj) и их вероятностей p(xi, yj). Двумерную случайную величину можно трактовать как случайную точку А(Х, Y) на координатной плоскости.

Закон распределения двумерной случайной величины обыч­но задается в виде таблицы, в строках которой указаны воз­можные значения xi случайной величины X, а в столбцах — возможные значения yj случайной величины Y, на пересече­ниях строк и столбцов указаны соответствующие вероятности pij. Пусть случайная величина Х может принимать п значе­ний, а случайная величина Y - т значений. Тогда закон рас­пределения двумерной случайной величины (X, Y) имеет вид

Двумерная случайная величина - student2.ru

Из этой таблицы можно найти законы распределения каждой из случайных компонент. Например, вероятность того, что слу­чайная величина Х примет значение хk, равна, согласно тео­реме сложения вероятностей независимых событий,

Двумерная случайная величина - student2.ru

Иными словами, для нахождения вероятности Р(хk) нужно просуммировать все т вероятностей по k-му столб­цу таблицы (18.21). Аналогично получается вероятность то­го, что случайная величина Y примет возможное значение уr: Р(уr) получается суммированием всех n вероятностей r-й стро­ки таблицы (18.21) (r = 1, 2, ... ,m). Отсюда следует, что сумма всех вероятностей в законе распределения (18.21) равна единице:

Двумерная случайная величина - student2.ru

Пример 1. Задано распределение двумерной случайной вели­чины:

Двумерная случайная величина - student2.ru

Найти распределения Х, Y и Х + Y.

Решение. В нашем случае возможные значения случайной величины X: х1 = 1, х2 = 2, x3 = 3. Тогда, согласно формуле (18.22), имеем P(x1) = 0,1 + 0,2 = 0,3, P(x2) = 0,15 + 0,22 = 0,37, Р(x3) = 0,12 + 0,21 = 0,33. Отсюда получаем закон распреде­ления X:

Двумерная случайная величина - student2.ru

Аналогично получаем и для распределения Y: у1 = 1, y2 = 2; P(y1) = 0,1 + 0,15 + 0,12 = 0,37, P(y2) = 0,2 + 0,22 + 0,21 = 0,63;

Двумерная случайная величина - student2.ru

Теперь найдем распределение X+Y. Возможные значения этой случайной величины: 2, 3, 4 и 5. Соответствующие вероятнос­ти Р(2) = 0,1, Р(3) = 0,15 + 0,2 = 0,35, Р(4) = 0,12 + 0,22 = 0,34, Р(5) = 0,21. Отсюда находим искомое распределение:

Двумерная случайная величина - student2.ru

В случае системы двух случайных величин используются кроме математических ожиданий и дисперсий еще и другие числовые характеристики, описывающие их взаимосвязь.

Корреляционный момент

Определение 2. Корреляционным моментом случайных ве­личин Х и Y (или ковариацией) называется математическое ожидание произведений их отклонений:

Двумерная случайная величина - student2.ru

Корреляционный момент служит для описания связи между случайными величинами Х и Y. Из свойств математического ожидания легко убедиться в том, что μxy можно записать в следующем виде:

Двумерная случайная величина - student2.ru

Для непосредственного вычисления корреляционного момен­та (ковариации) используется формула (см. распределение (18.21))

Двумерная случайная величина - student2.ru

ТЕОРЕМА 3. Корреляционный момент двух независимых слу­чайных величин Х и Y равен нулю.

Если корреляционный момент μxу не равен нулю, то, стало быть, величины Х и Y являются зависимыми.

Коэффициент корреляции

Из определения корреляционного момента следует, что его размерность равна произведению размерностей величин Х и Y; например, если Х и Y измерены в сантиметрах, то μxy имеет размерность см2.

Это обстоятельство затрудняет сравнение корреляционных моментов различных систем случайных величин. Для устране­ния этого недостатка вводят безразмерную числовую характе­ристику — коэффициент корреляции, величина которого не зависит от выбора системы измерения случайных величин.

Определение 3. Коэффициентом корреляции случайных ве­личин Х и Y называется отношение их корреляционного мо­мента к произведению средних квадратических отклонений этих величин:

Двумерная случайная величина - student2.ru

Из определения и свойств математического ожидания и дис­персии следует важный вывод, что абсолютная величина коэф­фициента корреляции не превосходит единицы:

Двумерная случайная величина - student2.ru

Определение 4. Две случайные величины Х и Y называются коррелированными, если их корреляционный момент (коэффи­циент корреляции) отличен от нуля; если же их корреляцион­ный момент равен нулю, то Х и Y называются некоррелированными.

Таким образом, две коррелированные случайные величины (т.е. при rxy ≠ 0) являются также и зависимыми. Обратное утверждение неверно, т.е. две зависимые величины могут быть как коррелированными, так и некоррелированными.

Пример 2. Найти корреляционный момент и коэффициент корреляции двух случайных величин Х и Y, распределения которых заданы в предыдущем примере 1.

Решение. Воспользуемся формулами (18.24), (18.26), а также формулой вычисления центрального момента второго порядка (18.19); последовательно вычисляем: М(Х) = 2,03, М(Y) = 1,63, D(X) = 0,629, D(Y) = 0,233,

Двумерная случайная величина - student2.ru

В данном случае коэффициент корреляции близок к нулю; это означает, что случайные величины Х и Y слабокоррелированы.

Линейная регрессия

Пусть (X, Y) — двумерная случайная величина, где Х и Y — зависимые случайные величины. Оказывается возмож­ным приближенное представление величины Y в виде линей­ной функции величины X:

Двумерная случайная величина - student2.ru

где а и b — параметры, подлежащие определению. Обычно эти величины определяются с помощью метода наименьших квад­ратов (см. п. 8.5).

Определение 5. Функция (18.27) называется наилучшим при­ближением в смысле метода наименьших квадратов, если ма­тематическое ожидание M[Y — g(Х)]2 принимает наименьшее возможное значение. Функцию g(х) называют среднеквадратической регрессией Y на X.

ТЕОРЕМА 4. Линейная средняя квадратическая регрессия Y на Х имеет вид

Двумерная случайная величина - student2.ru

где rxy определяется формулой (18.25), ту = M(Y) и mx = М(Х) — математические ожидания соответственно случайных величин Y и X.

Коэффициент b = rxуσу / σx называют коэффициентом ре­грессии Y на Х, а прямую

Двумерная случайная величина - student2.ru

реализующую линейную зависимость (18.28) случайной вели­чины Y от случайной величины X, называют прямой среднеквадратической регрессии Х на Y. Поскольку зависимость (18.28) является приближенной, то существует погрешность этого приближения, называемая остаточной дисперсией:

Двумерная случайная величина - student2.ru

Аналогичную форму записи имеет прямая среднеквадратическая регрессия Х на Y:

Двумерная случайная величина - student2.ru

Пример 3. Найти линейную среднюю квадратическую регрес­сию и остаточную дисперсию случайной величины Y на слу­чайную величину Х по данным примеров 1 и 2.

Решение. Для двумерной случайной величины (X, Y), приведенной в примере 1, все необходимые числовые характе­ристики указаны в решении примера 2: mx = 2,03, ту = 1,63, rху = -0,023, σx = Двумерная случайная величина - student2.ru = 0,793, σy = Двумерная случайная величина - student2.ru = 0,483. Из уравнения (18.28) получаем искомое соотношение:

Двумерная случайная величина - student2.ru

Остаточная дисперсия рассчитывается по формуле (18.29):

Двумерная случайная величина - student2.ru

Для оценки среднеквадратичной погрешности линейной ре­грессии обычно используют величину ε, в нашем случае она составляет

Двумерная случайная величина - student2.ru

Наши рекомендации