Зависимые и независимые случайные величины
Условные законы распределения. Регрессия.
Определение. Условным законом распределения одной из одномерных составляющих двумерной случайной величины (X, Y) называется ее закон распределения, вычисленный при условии, что другая составляющая приняла определенное значение (или попала в какой-то интервал). В предыдущей лекции было рассмотрено нахождение условных распределений для дискретных случайных величин. Там же приведены формулы условных вероятностей:
В случае непрерывных случайных величин необходимо определить плотности вероятности условных распределений jу(х) и jХ(y). С этой целью в приведенных формулах заменим вероятности событий их «элементами вероятности»,!
после сокращения на dx и dy получим:
т.е. условная плотность вероятности одной из одномерных составляющих двумерной случайной величины равна отношению ее совместной плотности к плотности вероятности другой составляющей. Эти соотношения записанные в виде
называются теоремой (правилом) умножения плотностей распределений.
Условные плотности jу(х) и jХ(y). обладают всеми свойствами «безусловной» плотности.
При изучении двумерных случайных величин рассматриваются числовые характеристики одномерных составляющих X и Y — математические ожидания и дисперсии. Для непрерывной случайной величины (X, Y) они определяются по формулам:
Наряду с ними рассматриваются также числовые характеристики условных распределений: условные математические ожидания Mх(Y) и Му(Х) и условные дисперсии Dх(Y) и DY(X). Эти характеристики находятся по обычным формулам математически ожидания и дисперсии, в которых вместо вероятностей событий или плотностей вероятности используются условные вероятности или условные плотности вероятности.
Условное математическое ожидание случайной величины Y при X = х, т.е. Mx(Y), есть функция от х, называемая функцией регрессии или просто регрессией Y по Х. Аналогично МY(Х) называется функцией регрессии или просто регрессией X по Y. Графики этих функций называются соответственно линиями регрессии (или кривыми регрессии) Y по X или X по У.
Зависимые и независимые случайные величины.
Определение. Случайные величины X и Y называются независимыми, если их совместная функция распределения F(x,y) представляется в виде произведения функций распределений F1(x) и F2(y) этих случайных величин, т.е.
В противном случае, случайные величины Х и Y называются зависимыми.
Дифференцируя дважды равенство по аргументам х и у, получим
т.е. для независимых непрерывных случайных величин X и Y их совместная плотность j(х,у) равна произведению плотностей вероятности j1(х) и j2(у) этих случайных величин.
До сих пор мы сталкивались с понятием функциональной зависимости между переменными X и Y, когда каждому значению х одной переменной соответствовало строго определенное значение у другой. Например, зависимость между двумя случайными величинами — числом вышедших из строя единиц оборудования за определенный период времени и их стоимостью — функциональная.
В общем случае, сталкиваются с зависимостью другого типа, менее жесткой, чем функциональная.
Определение. Зависимость между двумя случайными величинами называется вероятностной (стохастической или статистической), если каждому значению одной из них соответствует определенное (условное) распределение другой.
В случае вероятностной (стохастической) зависимости нельзя, зная значение одной из них, точно определить значение другой, а можно указать лишь распределение другой величины. Например, зависимости между числом отказов оборудования и затрат на его профилактический ремонт, весом и ростом человека, затратами времени школьника на просмотр телевизионных передач и чтение книг и т.п. являются вероятностными (стохастическими).
На рис. 5.10 приведены примеры зависимых и независимых случайных величин X и Y.
На рис. 5.10а зависимость между X и Y проявляется в том, что с изменением х меняется как распределение Y, так и условное математическое ожидание МХ(Y) (с увеличением х МХ(Y) увеличивается). Там же показана зависимость МХ(Y) от х, т.е. линия регрессии Y пo X.
На рис. 5.10б зависимость между случайными величинами проявляется в изменении условных дисперсий (с ростом х DХ(Y) увеличивается), при этом MХ(Y) = const, т.е. линия регрессии Y по X параллельна оси Ох. На рис. 5.10в случайные величины Y и X независимы, так как с изменением х распределение случайной величины Y, а значит, условное математическое ожидание и условная дисперсия не меняются.
Таким образом, обобщая, можно утверждать, что если случайные величины Y и X независимы, то линии регрессии Y по X и X по Y параллельны координатным осям Ох и Оу.