Математическое ожидание и дисперсия случайной величины
Математическим ожиданием дискретной случайной величины называется сумма произведений всех ее возможных значений на соответствующие вероятности. Математическое ожидание случайной величины обозначается через М(Х), или или а. Если дискретная случайная величина принимает конечное число значений х1, х2,…хn соответственно с вероятностями р1, р2,…рn, то по определению М(Х) = х1р1+х2р2+... + хnpn,
Выясним вероятностный смысл математического ожидания дискретной случайной величины. Пусть в результате n испытаний случайная величина X значение Х1 приняла m1раз, значение х2 – m2 раз, значение хк - mк раз, причем m1 + m2 +... + mk =n. Так как сумма принятых значений равна x1m1 + х2m2 +... + хкmк то среднее арифметическое х всех ее значений определяется формулой
X=х1m1+ х2m2 +... + хкmк /n или x=x1*m1/n+x2*m2/n+….+xkmk/n, x=x1W1+x2W2+….+xkWk, где Wj =mi/n относительная частота значений xi (i = 1, 2, ..,, к). Если n достаточно велико, то относительная частота события приближенно равна его вероятности, т.е. Wk = рк, поэтому получаем приближенную формулу x=x1p1+x2p2+…+xkpk,
Итак, математическое ожидание дискретной случайной величины приближенно равно среднему арифметическому ее возможных значений. Вследствие этого математическое ожидание случайной величины называется ее средним значением.
Замечание.
Математическое ожидание называют также центром распределения. Это название заимствовано из механики и объясняется следующим: если в точках х1,х2,...,хп оси Ох находятся соответственно массы P1Р2,…Рn то координата х центра тяжести системы материальных точек вычисляется по формуле : ( ) . Так как =1, то
Дисперсией, или рассеянием, случайной величины X называется математическое ожидание квадрата ее отклонения. Дисперсия обозначается через D(X), т.е. Из определения и свойств математического ожидания следует, что дисперсия любой случайной величины X неотрицательна, т.е. Для вычисления дисперсии применяется формула
Мода и медиана
Мода– величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле:
где х 0 нижняя граница интервала;h – величина интервала;f m частота интервала; f m-1 частота предшествующего интервала; f m+1 частота следующего интервала.
Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше.
Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.
При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:
где х 0 нижняя граница интервала;h – величина интервала; f m частота интервала; f – число членов ряда; S m-1 – сумма накопленных членов ряда, предшествующих данному.