Примеры непрерывных распределений
1. Равномерное распределение. Плотность Равномерного или Прямоугольного распределения:
,
Т. е. вероятности всех возможных значений
случайной величины
одинаковы и равны
.
Математическое ожидание случайной величины с Равномерным распределением равно
,
Дисперсия .
Функция распределения имеет вид ,
(рис. 3.5).
Рис. 3.5. Графики плотности и функции равномерного распределения
2. Показательное (экспоненциальное) распределение -Закон, функция плотности распределения которого имеет вид: , где параметр распределения
есть действительное число (постоянный параметр) (рис. 3.6).
Функция распределения показательного закона имеет вид:
Математическое ожидание и дисперсия случайной величины, распределенной по показательному закону, равны соответственно ,
.
Рис. 3.6. Графики плотности и функции показательного распределения
3. Нормальное распределение.Нормальный закон распределения вероятностей занимает особое место среди других законов распределения. В теории вероятности доказывается, что плотность вероятности суммы независимых или Слабо зависимых, равномерно малых (т. е. играющих примерно одинаковую роль) слагаемых при неограниченном увеличении их числа как угодно близко приближается к нормальному закону распределению независимо от того, какие законы распределения имеют эти слагаемые (центральная предельная теорема А. М. Ляпунова).
Плотность вероятности нормально распределенной случайной величины имеет вид:
, где
и
– вещественные параметры распределения, имеющие конечные значения, при этом часто используют обозначение
.
Функция распределения записывается в виде
,
Здесь – табулированный интеграл вероятности (значения интеграла можно найти во всех учебниках и задачниках по теории вероятностей). Функция и плотность нормального распределения изображены на рис. 3.7.
Рис. 3.7. Графики плотности и функции нормального распределения
Математическое ожидание нормально распределенной случайной величины равно , дисперсия
. Таким образом, параметры
и
имеют смысл математического ожидания и среднеквадратического значения (отклонения) случайной величины.
Распределение, описываемое функцией , называется Нормальным или Распределением Гаусса.
На рис.3.8 изображены кривые нормального распределения случайных погрешностей для различных значений среднеквадратического отклонения .
Рис. 3.8. Кривые нормального распределения, .
Из рис. 3.8 видно, что по мере увеличения среднеквадратического отклонения распределение все более и более расплывается, вероятность появления больших значений погрешностей возрастает, а вероятность меньших погрешностей сокращается, т. е. увеличивается рассеивание результатов наблюдений.
Широкое распространение нормального распределения погрешностей в практике измерений объясняется Центральной предельной теоремой теории вероятностей, являющейся одной из самых замечательных математических теорем, в разработке которой принимали участие многие крупнейшие математики – Муавр, Лаплас, Гаусс, Чебышев и Ляпунов.
Центральная предельная теорема утверждает, что распределение случайных погрешностей будет близко в нормальному всякий раз, когда результаты наблюдения формируются под влиянием большого числа независимо действующих факторов, каждый из которых оказывает лишь незначительное действие по сравнению с суммарным действием всех остальных.
Свойства нормального распределения.
А. Если случайная величина
.
В. Если случайная величина то
В частности, .
Таким образом, вычисление любых вероятностей для нормально распределённой случайной величины сводится к вычислению функции распределения . Она обладает следующими свойствами:
С. Если , то для любого
D.Правило трех сигм. Если то
Большого смысла в запоминании числа 0.0027 нет, но полезно помнить, что почти вся масса нормального распределения сосредоточена в границах от до
.
Пример 3.7. Дана случайная величина . Найти
.
Решение. По формуле свойства В при
получаем
По таблице для функции Лапласа находим
.
Пример 3.8.Случайная величина X – отклонение размера изделия от нормы – нормально распределенная, причём М (Х)= 0. Найти s (Х), если известно, что Р(– 3 < X < 3) = 0.7.
Решение. Р(– 3 < X < 3) = Р( | X | < 3) = = 0.7. Отсюда следует, что
, и, используя табличные данные (приложение 1), получаем 3/s =1.4, или s = 3/1.4 » 2.14.
Основные задачи математической статистики: 1. Разработка методологии сбора и группировки статистического материала, полученного в результате наблюдений за случайными процессами. 2. Разработка методов анализа полученных статистических данных. Этот анализ включает оценку вероятностей события, функции распределения вероятностей или плотности вероятности, оценку параметров известного распределения, а также оценку связей между случайными величинами. | ||||
ВЫБОРОЧНЫЙ МЕТОД. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРОЧНАЯ | ||||
Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений. Экспериментальные данные - это результаты измерения некоторых признаков объектов, выбранных из большой совокупности объектов. Часть объектов исследования, определенным образом выбранная из более обширной совокупности, называется Выборкой, а Вся исходная совокупность, из которой взята выборка,- Генеральной (основной) совокупностью. Исследования, в которых участвуют все без исключения объекты, составляющие генеральную совокупность, называются Сплошными исследованиями. Может использоваться Выборочный метод, суть которого в том, что для обследования привлекается часть генеральной совокупности (Выборка), но по результатам этого обследования судят о свойствах всей генеральной совокупности. Предметом изучения в статистике являются варьирующиеся признаки (называемые Статистическими). Они делятся на качественные и количественные. Качественными признаками объект обладает либо не обладает. Они не поддаются непосредственному измерению (спортивная специализация, квалификация, национальность, территориальная принадлежность и т. п.). Количественные признаки представляют собой результаты подсчета или измерения. В соответствии с этим они делятся на Дискретные и непрерывные. Например, измеряемая температура воздуха в некотором пункте – непрерывная случайная величина (может меняться на сколь угодно малую величину), и соответствующая генеральная совокупность представляет собой бесконечное множество значений. ПовторнойНазывают выборку, при которой объект перед отбором следующего возвращается в генеральную совокупность. БесповторнойНазывают выборку, при которой отобранный объект в генеральную совокупность не возвращается. Если выборка правильно отражает соотношения в генеральной совокупности, то ее называют Репрезентативной(представительной). Например, результаты социологического опроса населения будут зависеть от того, в каком месте он проводится, среди каких групп. | ||||
ВАРИАЦИОННЫЙ РЯД. ПОЛИГОН ЧАСТОТ И ГИСТОГРАММА ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ | ||||
Пусть Х — некоторый признак изучаемого объекта или явления (срок службы электролампы, вес студента, диаметр шарика для подшипника и т. п.). Генеральной совокупностью является множество всех возможных значений этого признака, а результаты N наблюдений над признаком Х дадут нам выборку объема N — первоначальные статистические данные, значения ![]() ![]() ![]() ![]() ![]() ![]() ![]()
Полигоном частот называют ломаную линию, отрезки которой соединяют точки с координатами (ХI; Ni) (рис. 4.1). Отметим, что сумма частот статистического ряда равна объему выборки. Часто статистический ряд составляют, используя относительные частоты вариант: Полигоном относительных частот называют ломаную линию, отрезки которой соединяют точки с координатами (ХI; Hi).
Рисунок 4.1. Полигон частот а), кумулятивная кривая б) Эмпирическим аналогом графика интегральной функции распределения является Кумулятивная кривая (Кумулята). Для ее построения на оси ОХ откладывают значения вариант, на оси ОY – накопленные частоты или относительные частоты. Полученная плавная кривая называется кумулятой. В том случае, если выборка представлена большим количеством различных значений непрерывной случайной величины, то группировку данных проводят в виде интервального вариационного ряда (ИВР). Для этого диапазон варьирования признака разбивают на несколько (5–10) равных интервалов и указывают количество вариант, попавших в каждый интервал. Алгоритм построения интервального вариационного ряда. 1. Исходя из объема выборки (N), определить количество интервалов (K) (см. табл. 4.2). Таблица 4.2.Рекомендуемое соотношениеОбъем выборки-число интервалов
2. Вычислить размах ряда: R=Xmax – Xmin 3. Определить ширину интервала: H=R/(K–1) 4. Найти начало первого интервала X0 = Xmin – H/2 5. Составить интервальный вариационный ряд. Графическим изображением ИВР является Гистограмма. Для ее построения на оси ОХ откладывают интервалы шириной H, на каждом интервале строят прямоугольник высотой M/H. Величина M/H называется Плотностью частоты. Гистограмма является эмпирическим аналогом графика дифференциальной функции распределения. Пример 4.3. Измерена масса тела 100 женщин 30 лет, получены значения от 60 до 90 кг. Построить интервальный вариационный ряд (табл. 4.3) и гистограмму. Таблица 4.3. Интервальный вариационный ряд
Рисунок 4.2. Гистограмма Эмпирическая функция распределения находится по следующей формуле (отношение накопленных частот к объему выборки):
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ. ОЦЕНКА ПАРАМЕТРОВ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ. ТОЧЕЧНАЯ ОЦЕНКА И ЕЕ СВОЙСТВА | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Числовые характеристики генеральной совокупности называются Параметрами генеральной совокупности. Например, для нормального распределения это математическое ожидание и среднее квадратическое отклонение (СКО), для равномерного распределения – это границы интервала, в котором наблюдаются значения этой случайной величины Оценка параметра – соответствующая числовая характеристика, рассчитанная по выборке. Если оценка определяется одним числом, она называется Точечной оценкой. Например, среднее арифметическое выборочных значений служит оценкой математического ожидания. Выборочные значения случайны, поэтому оценки можно рассматривать как случайные величины. Построим точечную оценку параметра ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() | ||||
ОЦЕНКА С ПОМОЩЬЮ ИНТЕРВАЛОВ | ||||
Оценка параметров с помощью интервалов заключается в нахождении интервалов, называемых Доверительными, между границами которых с определенными вероятностями (доверительными) находятся истинные значения оцениваемых параметров. Интервальная оценка определяется двумя числами - концами интервала. Пусть найденная по данным выборки величина Q* служит оценкой неизвестного параметра Q. Оценка Q* определяется тем точнее, чем меньше |Q - Q*|, т. е. чем меньше d в неравенстве |Q - Q*|< d, d > 0. Доверительной вероятностью (Надежностью) оценки Q* параметра Q называется вероятность ¡, с которой оценивается неравенство |Q - Q*|< D. Число A=1 - ¡ называется Уровнем значимости, определяющим вероятность того, что оцениваемый параметр не попадет в доверительный интервал. Обычно задается надежность ¡ и определяется D. Чаще всего вероятность ¡ задается значениями от 0.95 и выше. Неравенство |Q - Q*|< D Можно записать в виде - D < Q - Q* < D или Q* - D < Q < Q* + D. Доверительным интервалом называется интервал (Q* - D, Q* + D), который покрывает неизвестный параметр Q с заданной надежностью. Определение доверительного интервала для среднего значения нормально распределенной измеряемой случайной величины Х При известной дисперсии ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() | ||||
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ | ||||
Статистическая Гипотеза — это предположение О виде закона распределения («данная генеральная совокупность нормально распределена»); О значениях его параметров («генеральное среднее равно нулю»); Об однородности данных («эти две выборки извлечены из одной генеральной совокупности»). Статистическая проверка гипотезы состоит в выяснении того, согласуются ли результаты наблюдений (выборочные данные) с нашим предположением. Результатом проверки может быть отрицательный ответ: выборочные данные противоречат высказанной гипотезе, поэтому от нее следует отказаться. В случае ответа неотрицательного (выборочные данные не противоречат гипотезе) гипотезу принимают в качестве Одного из допустимых решений (не единственно верного). Различают Основную (нулевую) гипотезу (гипотеза, которая проверяется, ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() | ||||
ПРОВЕРКА ГИПОТЕЗ О ВИДЕ РАСПРЕДЕЛЕНИЯ. КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА | ||||
Одной из важных задач математической статистики является установление теоретического закона распределения случайной величины, характеризующей изучаемый признак по эмпирическому распределению, представляющему вариационный ряд. Предположение о виде закона распределения можно сделать по гистограмме или полигону (Рис. 4.3)
Рис. 4.3. Возможные виды гистограмм: Например, по гистограмме (рис. 4.3, а)) можно сделать предположение о том, что генеральная совокупность распределена по нормальному закону. Для проверки гипотез о виде распределения служат специальные критерии — Критерии согласия. Они отвечают на вопрос: согласуются ли результаты экспериментов с предположением о том, что генеральная совокупность имеет заданное распределение. Проверим это предположение с помощью Критерия согласия Пирсона. В этом критерии мерой расхождения между гипотетическим (предполагаемым) и эмпирическим распределением служит статистика Наши рекомендации
|