Нормальное распределение
Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения
Рис. 2. Ряды распределения с положительным (а) и отрицательным (б) эксцессом
В статистике распространены различные виды теоретических распределений: нормальное. биномиальное, Пуассона и др. Каждое из теоретических распределений имеет свою специфику и область применения.
Биномиальное распределение применяется при изучении распределений по альтернативным признакам, характеризующимся определенной вероятностью появления или отсутствия изучаемого события. Это распределение именуется так из-за его отношения к разложению двучлена (p+q)n . Вероятность того, что событие наступит равна p, вероятность того, что событие не наступит равна (1-р)=q. И, следовательно, p+q=1. Члены p и q относятся к вероятности наступления или ненаступления только одного события. Для двух событий вероятность наступления события по з-ну умножения равна р2 , вероятность наступления в первом случае и ненаступления во втором равна p*q, вероятность ненаступления в первом и наступления во втором равна q*p, ненаступления двух событий q2 . Общая вероятность может быть представлена алгебраически и равна р2 + 2pq+ q2 или (p+q)2 . Для трех событий р3 + 3pq2+3p2q +q3. или (p+q)3
Распределение Пуассона используется при анализе распределения маловероятных и редко встречающихся событий. И имеет следующий вид:
,
где -среднее число появления событий в одинаковых независимых испытаниях ( -вероятность события при одном испытании), m- частота данного события.
Например, в результате проверки 1000 партий одинаковых изделий получено следующее распределение кол-ва бракованных изделий в партии.
Таблица 1
Количество брака | m1 | Итого | |||||
Количество партий, содержащих данное число бракованных изделий | f1 | ||||||
Теоретическая частота |
определим среднее число бракованных изделий в партии:
Находим теоретические частоты закона Пуассона:
,
mi=0 =1000*0,606=606
mi=1 =1000*0,5*0,606=303
mi=2 =(1000*0,25*0,606)/2=76
mi=3 =(1000*0,125*0,606)/6=13
mi=4 =(1000*0,125*0,5*0,606)/24=2
Сопоставление свидетельствует о соответствии эмпирического распределения распределению Пуассона.
Степень расхождения частот оценивается с помощью критериев согласия.
Это распределение необходимо для анализа времени ожидания обслуживания клиентов услугами связи, а также времени безотказной работы технических средств и сетей связи.
Нормальное распределение.
Если непрерывная случайная величина имеет плотность распределения:
то она подчиняется закону нормального распределения. Для построения кривой нормального распределения надо знать два параметра — и
Если средняя арифметическая не меняется, но растет величина среднего квадратического отклонения, распределение имеет более плосковершинный характер (рис. 3).
Укажем особенности кривой нормального распределения.
1. Кривая симметрична относительно максимальной ординаты.
Максимальная ордината соответствует значению = Мо = Меее величина равна
2. Кривая асимптотически приближается к оси абсцисс продолжаясь в обе стороны до бесконечности. Следовательно, чем больше значения отклоняются от , тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку отклонениязначений переменной х от равновероятны.
3. Кривая имеет две точки перегиба, находящиеся на расстоянии ± от
4. При = const с увеличением кривая становится более пологой. При = const сизменением кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс
5. В промежутке ± находится 68,3% всех значений признака. В промежутке ±2 находится 95,4% всех значений признака. В промежутке ±3 находится 99,7% всех значений признака (рис. 5).
Рис. 5. Соотношение площади под кривой нормального распределения в зависимости от расстояния от средней арифметической
Эти свойства кривой нормального распределения весьма полезны. Например, известна средняя величина в ряду распределения, подчиняющемся нормальному распределению, которая равна 150, а среднее квадратическое отклонение равно 5. Тогда нам будет известно, что 68,3% всех значений признака и исследуемой совокупности будут иметь значения между 145 и 155 (150±5), а 99,7% всех значений признака (т.е. почти у всех наблюдаемых единиц) будут находиться между 135 и 165 (150±3*5).
Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин. Действие этих причин независимо, и ни одна из причин не имеет преобладающего влияния на другие.
Для удобства вычислений вероятностей случайные величины нормируются, а затем используются заранее табулированные значения плотности функции распределения нормированной случайной величины. Если обозначим черезt, то величину назовем нормированной функцией; эта функция табулирована. Для нормированной случайной величины математическое ожидание равно нулю, а дисперсия равна единице.
Определенный интеграл вида F(t)= носит название нормированной функции Лапласа и характеризует площадь под кривой в промежутке от 0 до t (см. Приложение 2).
Чтобы оценить вероятность попадания в интервал от -¥ доx, рассчитываем F(х) = 1/2 + F(t). Для определения вероятности попадания нормально распределеннойслучайной величиных в заданный интервал (x1;x2)находим разностьF(х2) — F(х1):
где
Например, текущая цена акций примерно подчиняется нормальному закону со средней153 руб. и средним квадратическим отклонением 1,2 руб. Определим вероятность того, что цена акций будет находиться между 150 руб. и 155 руб.
Значениям цены акций 150 и 155 руб. будут соответствовать нормированные отклонения: и
Значения нормированной функции, соответствующие данным значениям t1 и t2, находятся по Приложению 2:
F(t1=-2,5)=-0,4938 [F(-t)=-F(t)];
F(t2=1,67)=-0,4118
Разность F(t2)-F(t1)=0,4118-(-0,4938)=0,9056
Таким образом, вероятность того, что одна акции будет находиться в пределах от 150 до 155 руб., равна 90,56%.