Дисперсия случайной величины

Дисперсия случайной величины характеризует меру разброса случайной величины около ее математического ожидания.

Если случайная величина x имеет математическое ожидание Mx , то дисперсией случайной величины x называется величина Dx =M(x - Mx )2.

Величина Mx 2 >для дискретных и непрерывных случайных величин соответственно вычисляется по формулам

, .

Для определения меры разброса значений случайной величины часто используется среднеквадратичное отклонение ,связанное с дисперсией соотношением .

Основные свойства дисперсии:

· дисперсия любой случайной величины неотрицательна, Dx 0;

· дисперсия константы равна нулю, Dc=0;

· для произвольной константы D(cx ) = c2D(x );

· дисперсия суммы двух независимых случайных величинравна сумме их дисперсий: D(x ± h ) = D(x ) + D (h ).

Моменты

В теории вероятностей и математической статистике, помимо математического ожидания и дисперсии, используются и другие числовые характеристики случайных величин. В первую очередь это начальные и центральные моменты.

Начальным моментом k-го порядка случайной величины x называется математическое ожидание k-й степени случайной величины x , т.е. a k = Mx k.

Центральным моментом k-го порядка случайной величины x называется величина m k, определяемая формулой m k = M(x - Mx )k.

Заметим, что математическое ожидание случайной величины - начальный момент первого порядка, a1= Mx , а дисперсия - центральный момент второго порядка,

a 2 = Mx 2 = M(x - Mx )2 =Dx .

Существуют формулы, позволяющие выразить центральные моменты случайной величины через ее начальные моменты, например:

m 2=a 2-a 12, m 3 = a 3 - 3a 2a 1 + 2a 13.

Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = Mx , то все ее центральные моменты нечетного порядка равны нулю.

19. Числовые характеристики случайных величин. Математическое ожидание непрерывной случайной величины. Математическое ожидание смешанной случайной величины. Демонстрационный вариант.

Числовые характеристики случайных величин

1. Математическое ожидание.

Математическим ожиданием случайной величины X, называется величина

В случае ряда (n=) и несобственного интеграла предполагается, что они абсолютно сходятся, в противном случае математическое ожидание не существует.

Смысл математического ожидания: если проведено большое количество опытов и в каждом из них определено значение случайной величины, то среднее арифметическое полученных значений приближенно равно математическому ожиданию, чем больше число опытов, тем «ближе» среднее наблюдаемых значений к математическому ожиданию.

Так как математическое ожидание теоретическая величина, которую можно найти без проведения опытов, то тем самым можно указать среднее значение случайной величины в большом числе опытов без проведения самих опытов.

Поэтому математическое ожидание называют также средним значением, средним ожидаемым, центром рассеивания, центром распределения.

Обозначение: M, M(x), M(X). Размерность математического ожидания совпадает с размерностью самой случайной величины.

Свойства математического ожидания:

M(C)=C, где С - некоторая постоянная величина.

M(C∙X)=C∙M(X).

M(X+Y)= M(X)+M(Y).

M(X∙Y)=M(X)∙M(Y), если Х и Y независимые случайные величины.

Если Y=φ(X) функция от случайной величины Х, то

2. Дисперсия.

Центрированной случайной величиной или отклонением, называется случайная величина

На основании свойств математического ожидания:

Дисперсия есть математическое ожидание квадрата отклонения.

Используя определение математического ожидания, можно получить:

Размерность дисперсии равна квадрату размерности самой случайной величины.

Среднее квадратическое отклонение случайной величины это величина:

Размерность среднего квадратического отклонения совпадает с размерностью самой случайной величины.

Свойства дисперсии:

D(C)=0, где С - некоторая постоянная величина.

D(C∙X) =

(дисперсия равна математическому ожиданию квадрата случайной величины минус квадрат математического ожидания).

Если Х и Y независимые случайные величины, то

D(X =D(X)+D(Y).

Если Х и Y зависимые случайные величины, то

D(X =D(X)+D(Y)+2∙ M (

Число M( называется корреляционным моментом случайных величин X и Y, и обозначается К( , Y). Зависимые случайные величины иногда называют скоррелированными друг с другом.

3. Моменты случайных величин.

Пусть случайная величина k N.

Величина M( называется начальным моментом k-го порядка. Математическое ожидание – начальный момент первого порядка.

Величину M(( называют центральным моментом k-го порядка. Дисперсия – центральный момент второго порядка.

Величина M( ) - абсолютный момент k-го порядка.

4. Мода и медиана случайной величины.

Модой ( ) случайной величины называют её наиболее вероятное значение, для которого вероятность или плотность вероятности f(x) достигают максимума.

Если вероятность или плотность вероятности достигают максимума не в одной, а в нескольких точках, то распределение называют полимодальным.

Медианой непрерывной случайной величиной называют такое её значение, для которого P( =P(

2. Математическое ожидание непрерывной случайной величины Х.

20. Числовые характеристики случайных величин. Мода случайной величины, медиана случайной величины ( особенности применения для дискретных случайных величин)
Демонстрационные примеры. Повышение точности оценок математического ожидания с помощью медианы (одномерный и многомерный случаи)

Модой непрерывной случайной величины называется такое значение х, в котором f(x) достигает своего локального максимума.

Мода есть «центр сгущения» случайной величины в смысле наиболее часто встречающихся значений случайной величины. Распределение с одной модой называется унимодальным, а распределение с несколькими модами - мультимодальным. Для симметричного унимодального распределения мода совпадает с математическим ожиданием, а следовательно, и с медианой. Как в случае с медианой, иногда математическому ожиданию приписывают смысл моды, что, конечно же, неверно, так как математическое ожидание и мода для несимметричных распределений не совпадают.

Медианой случайной величины X называется такое ее значение Me, для которогоP(X<Me)=P(X>Me),

т. е. одинаково вероятно, окажется ли случайная величина меньше или больше Me. Геометрическая медиана — это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.
В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.

21. Числовые характеристики случайных величин. Начальные моменты случайной величины.

Начальным моментом k-го порядка случайной величины называется математическое ожидание случайной величины .


Если - дискретная случайная величина, принимающая конечное число значений, то

Если - дискретная случайная величина, принимающая бесконечное, но счетное число значений, то

Если - непрерывная случайная величина, принимающая значение на конечном промежутке , то

Если - непрерывная случайная величина, принимающая значения на всей числовой оси, то

Начальный момент 1-го порядка - это математическое ожидание случайной величины: .
Начальные моменты высших порядков главным образом используются для вычисления центральных моментов.

22. Числовые характеристики случайных величин. Центральные моменты случайной величины. Свойство второго центрального центрального момента. Использование центрального момента 3-го порядка для характеристики крутости (островершинности) распределения.

23. Связь между центральными и начальными моментами.

24. Некоторые важные для практики распределения дискретных случайных величин.
Биномальное распределение. Геометрическое распределение. Примеры экспериментальных расчетов с помощью EXEL

Возникает в тех случаях, когда ставится вопрос: сколько раз происходит некоторое событие в серии из определенного числа независимых наблюдений (опытов), выполняемых в одинаковых условиях.

Для удобства и наглядности будем полагать, что нам известна величина p – вероятность того, что вошедший в магазин посетитель окажется покупателем и (1– p) = q – вероятность того, что вошедший в магазин посетитель не окажется покупателем.

Если X – число покупателей из общего числа n посетителей, то вероятность того, что среди n посетителей оказалось k покупателей равна

P(X= k) = , где k=0,1,…n

называют формулой Бернулли. При большом числе испытаний биномиальное распределение стремиться к нормальному.

25. Некоторые важные для практики распределения дискретных случайных величин.
Распределение Пуассона.

Распределение Пуассона.Дискретная случайная величина Химеет распределение Пуассона, если она имеет бесконечное счетное множество возможных значений 0, 1, 2, ... m, …, а соответствующие им вероятности определяются формулой:

Примерами случайных явлений, подчиненных закону распределения Пуассона, являются: последовательность радиоактивного распада частиц, последовательность отказов при работе сложной компьютерной системы, поток заявок на телефонной станции и многие другие.
Закон распределения Пуассона (23) зависит от одного параметра а, который одновременно является и математическим ожиданием, и дисперсией случайной величины Х, распределенной по закону Пуассона. Таким образом, для распределения Пуассона имеют место следующие основные числовые характеристики:

26. Некоторые важные для практики распределения непрерывных случайных величин. Равномерное распределение. Показательное распределение.
Демонстрационный пример.

Равномерное распределение. Непрерывная величина Х распределена равномерно на интервале (a, b), если все ее возможные значения находятся на этом интервале и плотность распределения вероятностей постоянна:

\


Для случайной величины Х , равномерно распределенной в интервале (a, b) (рис. 4), вероятность попадания в любой интервал (x1, x2), лежащий внутри интервала (a, b), равна:



График плотности равномерного распределения

Примерами равномерно распределенных величин являются ошибки округления. Так, если все табличные значения некоторой функции округлены до одного и того же разряда , то выбирая наугад табличное значение, мы считаем, что ошибка округления выбранного числа есть случайная величина, равномерно распределенная в интервале

Показательное распределение. Непрерывная случайная величина Х имеет показательное распределение, если плотность распределения ее вероятностей выражается формулой:

График плотности распределения вероятностей, представлен на рис. 5.


График плотности показательного распределения

Время Т безотказной работы компьютерной системы есть случайная величина, имеющая показательное распределение с параметром λ , физический смысл которого – среднее число отказов в единицу времени, не считая простоев системы для ремонта.

27. Некоторые важные для практики распределения непрерывных случайных величин.
Нормальное распределение. Вероятность попадания в заданный интервал (расчет с помощью функции Лапласа). Примеры экспериментальных расчетов с помощью математического пакета EXEL


Непрерывная величина Х распределена равномерно на интервале (a, b), если все ее возможные значения находятся на этом интервале и плотность распределения вероятностей постоянна:


Для случайной величины Х , равномерно распределенной в интервале (a, b) (рис. 4), вероятность попадания в любой интервал (x1, x2), лежащий внутри интервала (a, b), равна:



График плотности равномерного распределения

Примерами равномерно распределенных величин являются ошибки округления. Так, если все табличные значения некоторой функции округлены до одного и того же разряда , то выбирая наугад табличное значение, мы считаем, что ошибка округления выбранного числа есть случайная величина, равномерно распределенная в интервале

28. Некоторые важные для практики распределения непрерывных случайных величин.
Распределение xи-квадрата (закон Пирсона), распределение Стьюдента, распределение Фишера. Примеры использования и экспериментальных расчетов с помощью математического пакета EXEL

29. Проверка гипотезы о математическом ожидании контролируемого параметра большой партии изделий с нормальных законом распределения и известной дисперсией по выборке малого объема. Примеры использования и экспериментальных расчетов с помощью математического пакета EXEL

Пусть мы имеем выборку случайных величин, рас­пределенных по нормальному закону . В этом слу­чае задачи проверки гипотез о математических ожиданиях и дисперсиях формулируются следующим образом.

1. В критерии проверки гипотез вида при известной диспер­сии используется статистика , которая при справедли­вости гипотезы подчиняется нормальному распределению: . Проверяемая гипотеза отклоняется при боль­ших отклонениях от .

2. Для проверки гипотезы при неизвестной дисперсии используется статистика , где , . При справедливости статистика распределена как – распределение Стьюдента.

30. Оперативный статистический контроль качества производственных изделий на основе формирования случайных величин с известным законом распределения.
Проверка гипотезы о средних значениях контролируемого параметра двух больших партий изделий с нормальным законом распределения и известными дисперсиями по двум выборкам малого объема. Примеры экспериментальных расчетов с помощью математического пакета EXEL.


Выборочный контроль, построенный на научной основе, т.е. исходящий из теории вероятностей и математической статистики, называют статистическим контролем.

Наиболее распространенными являются две вероятностные модели—биномиальная и гипергеометрическая. В биномиальной модели предполагается, что результаты контроля n единиц можно рассматривать как совокупность n независимых одинаково распределенных случайных величинХ1, Х2,....,Хn , где Хi = 1, если i‑ое измерение показывает, что есть нарушение, т.е. превышено ПДК (предельная норма концентрации) или i‑ое изделие дефектно, и Хi= 0, если это не так. Тогда число Х превышений ПДК или дефектных единиц продукции в партии равно

Х= Х1+ Х2+...+ Хn .(1)

Из формулы (1) и Центральной Предельной Теоремы теории вероятностей вытекает, что при увеличении объема выборки n распределение Х сближается с нормальным распределением. Известно, что распределение Х имеет вид

Р( Х= k) = Cnk pk (1—p)n-k , (2)

где Cnk - число сочетаний из n элементов по k, а p —уровень дефектности (в другой предметной области - доля превышений ПДК в генеральной совокупности), т.е. p = Р( Хi= 1). Формула (2) задает так называемое биномиальное распределение.

Гипергеометрическое распределение соответствует случайному отбору единиц в выборку. Пусть средиN единиц, составляющих генеральную совокупность, имеется D дефектных. Случайность отбора означает, что каждая единица имеет одинаковые шансы попасть в выборку. Мало того, ни одна пара единиц не должна иметь при отборе в выборку преимущества перед любой другой парой. То же самое —для троек, четверок и т.д. Это условие выполнено тогда и только тогда, когда каждое из сочетаний по n единиц из N имеет одинаковые шансы быть отобранным в качестве выборки. Вероятность того, что будет отобрано заранее заданное сочетание, равна, очевидно, 1/ .

Отбор случайной выборки согласно описанным правилам организуют при проведении различных лотерей. Пусть Y —число дефектных единиц в случайной выборке, организованной таким образом. Известно, что тогда P (Y = k) – гипергеометрическое распределение, т.е.

(3)

Замечательный математический результат состоит в том, что биномиальная и гипергеометрическая модели весьма близки, когда объем генеральной совокупности (партии) по крайней мере в 10 раз превышает объем выборки. Другими словами, можно принять, что

Р( Х = k) = P ( Y = k ), (4)

если объем выборки мал по сравнению с объемом партии. При этом в качестве p в формуле (4) берутD/N. Близость результатов, получаемых с помощью биномиальной и гипергеометрической моделей, весьма важна с философской точки зрения. Дело в том, что эти модели исходят из принципиально различных философских предпосылок. В биномиальной модели случайность присуща каждой единице -она с какой-то вероятностью дефектна, а с какой-то - годна. В то же время в гипергеометрической модели качество определенной единицы детерминировано, задано, а случайность проявляется лишь в отборе, вносится экологом или экономистом при составлении выборки. В науках о человеке противоречие между аналогичными моделями выборки еще более выражено. Биномиальная модель предполагает, что поведение человека, в частности, выбор им определенного варианта при ответе на вопрос, определяется с участием случайных причин. Например, человек может случайно сказать «да», случайно—«нет». Некоторые философы отрицают присущую человеку случайность. Они верят в причинность и считают поведение конкретного человека практически полностью детерминированным. Поэтому они принимают гипергеометрическую модель и считают, что случайность отличия ответов в выборке от ответов во всей генеральной совокупности определяется всецело случайностью, вносимой при отборе единиц наблюдения в выборку.

Соотношение (4) показывают, что во многих случаях нет необходимости принимать чью-либо сторону в этом споре, поскольку обе модели дают близкие численные результаты. Отличия проявляются при обсуждении вопроса о том, какую выборку считать представительной. Является ли таковой выборка, составленная из 20 изделий, лежащих сверху в первом вскрытом ящике? В биномиальной модели - да, в гипергеометрической - нет.

Биномиальная модель легче для теоретического изучения, поэтому будем её рассматривать в дальнейшем. Однако при реальном контроле лучше формировать выборку, исходя из гипергеометрической модели. Это делают, выбирая номера изделий (для включения в выборку) с помощью датчиков псевдослучайных чисел на ЭВМ (см. главу 11) или с помощью таблиц псевдослучайных чисел. Алгоритмы формирования выборки встраивают в современные программные продукты по статистическому контролю.

Оперативная характеристика плана статистического контроля. Каковы свойства плана статистического контроля? Они, как правило, определяются с помощью функции f(p), связывающей вероятность p дефектности единицы контроля с вероятностью f(p) положительной оценки экологической обстановки (приемки партии) по результатам контроля. При этом вероятность p того, что конкретная единица дефектна, называется входным уровнем дефектности, а указанная функция называется оперативной характеристикой плана контроля. Если дефектные единицы отсутствуют, р = 0, то партия всегда принимается, т.е. f(0) = 1. Если все единицы дефектные, р = 1, то партия наверняка бракуется, f(1) = 0. Между этими крайними значениями р функция f(p) монотонно убывает.

Вычислим оперативную характеристику плана (n,0). Поскольку партия принимается тогда и только тогда, когда все единицы являются годными, а вероятность того, что конкретная единица—годная, равна (1‑р), то оперативная характеристика имеет вид

f(p) = Р(Х=0) = (1—р)n. (5)

Для плана (n,1) оперативная характеристика, как легко видеть, такова:

f(p) = Р(Х=0)+Р(Х=1) = (1—р)n + n (1—р)n-1 (6)

Оперативные характеристики для конкретных планов статистического контроля не всегда имеют такой простой вид, как в случае формул (5) и (6). Рассмотрим в качестве примера план (20, 0, 2) + (40, 0). Сначала найдем вероятность того, что партия будет принята по результатам контроля первой партии. Согласно формуле (5) имеем:

f1(p) = Р(Х=0) = (1—р)20.

Вероятность того, что понадобится контроль второй выборки, равна

Р(Х=1) = 20(1—р)19.

При этом вероятность того, что по результатам её контроля партия будет принята, равна

f2(p) = Р(Х=0) = (1—р)40.

Следовательно, вероятность того, что партия будет принята со второй попытки, т.е. что при контроле первой выборки обнаружится ровно одна дефектная единица, а затем при контроле второй—ни одной, равна

f3(p) = Р(Х=1) f2(p) = 20(1—р)19(1—р)40= 20(1—р)59.

Следовательно, вероятность принятия партии с первой или со второй попытки равна

f(p) = f1(p) + f3(p) = (1—р)20+ 20(1—р)59.

При практическом применении методов статистического приемочного контроля для нахождения оперативных характеристик планов контроля вместо формул, имеющих обозримый вид лишь для отдельных видов планов, применяют численные компьютерные алгоритмы или заранее составленные таблицы.

.

31. Оперативный статистический контроль качества производственных изделий на основе формирования случайных величин с известным законом распределения.
Проверка гипотезы о средних значениях контролируемого параметра двух больших партий изделий с нормальным законом распределения и неизвестными дисперсиями по двум выборкам малого объема. Примеры экспериментальных расчетов с помощью математического пакета и лабораторного практикума.

Важнейшим источником роста эффективности производства является постоянное повышение технического уровня и качества выпускаемой продукции. Для технических систем характерна жесткая функциональная интеграция всех элементов, поэтому в них нет второстепенных элементов, которые могут быть некачественно спроектированы и изготовлены. Таким образом, современный уровень развития НТП значительно ужесточил требования к техническому уровню и качеству изделий в целом и их отдельных элементов. Системный подход позволяет объективно выбирать масштабы и направления управления качеством, виды продукции, формы и методы производства, обеспечивающие наибольший эффект усилий и средств, затраченных на повышение качества продукции. Системный подход к улучшению качества выпускаемой продукции позволяет заложить научные основы промышленных предприятий, объединений, планирующих органов.

В отраслях промышленности статистические методы применяются для проведения анализа качества продукции и процесса. Анализом качества является анализ, посредством которого с помощью данных и статистических методов определяется отношение между точными и замененными качественными характеристиками. Анализом процесса является анализ, позволяющий уяснить связь между причинными факторами и такими результатами, как качество, стоимость, производительность и т.д. Контроль процесса предусматривает выявление причинных факторов, влияющих на бесперебойное функционирование производственного процесса. Качество, стоимость и производительность являются результатами процесса контроля.

Проверка гипотезы о дисперсиях контролируемого параметра двух больших партий изделий с нормальным законом распределения и неизвестными дисперсиями по двум малым выборкам малого объема (n1 =10; n2 =10 )

Гипотеза H0:

Гипотеза H1:

Вид выборки: любая – большая, малая.

Закон распределения – нормальное распределение.

Статистика:

1. (основная статистика)

2.

Статистика 2 часто используется при табулировании.

Закон распределения статистики U:

1) F–распределение Фишера с числом степеней свободы числителя K1=(n1-1) и знаменателя K2=(n2-1).

2) F–распределение Фишера с числом степеней свободы числителя (большей дисперсии) Ki=ni-1 и знаменателя Kj=nj-1.

Условие принятия H0:

(рис.2.10.)

K1=(n1-1) для числителя,

K2=(n2-1) для знаменателя.

32. Оперативный статистический контроль качества производственных изделий на основе формирования случайных величин с известным законом распределения.
Проверка гипотезы о средних значениях контролируемого параметра двух больших партий изделий с нормальным законом распределения и известными дисперсиями по двум выборкам малого объема. Примеры экспериментальных расчетов с помощью математического пакета и лабораторного практикума.

Важнейшим источником роста эффективности производства является постоянное повышение технического уровня и качества выпускаемой продукции. Для технических систем характерна жесткая функциональная интеграция всех элементов, поэтому в них нет второстепенных элементов, которые могут быть некачественно спроектированы и изготовлены. Таким образом, современный уровень развития НТП значительно ужесточил требования к техническому уровню и качеству изделий в целом и их отдельных элементов. Системный подход позволяет объективно выбирать масштабы и направления управления качеством, виды продукции, формы и методы производства, обеспечивающие наибольший эффект усилий и средств, затраченных на повышение качества продукции. Системный подход к улучшению качества выпускаемой продукции позволяет заложить научные основы промышленных предприятий, объединений, планирующих органов.

В отраслях промышленности статистические методы применяются для проведения анализа качества продукции и процесса. Анализом качества является анализ, посредством которого с помощью данных и статистических методов определяется отношение между точными и замененными качественными характеристиками. Анализом процесса является анализ, позволяющий уяснить связь между причинными факторами и такими результатами, как качество, стоимость, производительность и т.д. Контроль процесса предусматривает выявление причинных факторов, влияющих на бесперебойное функционирование производственного процесса. Качество, стоимость и производительность являются результатами процесса контроля.

Проверка гипотезы о математическом ожидании контролируемого параметра большой партии изделийс нормальным законом распределения известной дисперсией по выборке малого объема (n1 =10)

Гипотеза H0:

Гипотеза H1:

Наши рекомендации