Нормальное распределение
В социально-экономических исследованиях часто встречаются распределения, зависящие от очень большого числа факторов. Для таких распределений теоретическим является нормальное распределение. Теоретической кривой нормального распределения (нормальной кривой) является график функции
, (1.10.7)
где – нормированное стандартное отклонение;
– его среднее значение;
– среднеквадратическое отклонение;
и – математические постоянные.
Значения функции (1.10.7) приведены в табл. П1 приложения. На рис. 1.10.9 изображена нормальная кривая.
Нормальная кривая обладает следующими свойствами:
1) функция f(t) – четная, т. е. f(t) = f(-t);
2) функция f(t) определена на всей числовой оси и стремится к нулю при ;
3) функция f(t) имеет максимум при t = 0;
4) при t = ± 1 график функции f(t) имеет точки перегиба.
Рис. 1.10.9. Нормальная кривая (показано приближенное
распределение площадей под кривой)
Из свойств функции f(t) следует:
1) нормальная кривая симметрична относительно прямой с уравнением t=0, равносильным уравнению ;
2) нормальная кривая асимптотически приближается к оси абсцисс;
3) мода нормального распределения совпадает со средним значением ;
4) при отклонении х от по абсолютной величине на одно нормированное стандартное отклонение нормальная кривая меняет направление выпуклости.
Эксцесс нормального распределения равен нулю. Поэтому, если эксцесс эмпирического распределения, теоретическим распределением которого является нормальное распределение, положителен (либо отрицателен), то эмпирическая кривая имеет более острую (либо более плоскую) вершину по сравнению с нормальной кривой. Этим объясняется название эксцесс - излишек.
Интегрируя функцию (1.10.7), получим нормированную функцию Лапласа
, (1.10.8)
значения которой приведены в табл. П2.
С помощью функции (1.10.8) вычисляется вероятность того, что признак х, имеющий нормальное распределение, примет значение, принадлежащее интервалу :
. (1.10.9)
Из формулы (2.10.9) следует, что
.
Так как функция Лапласа – нечетная, то . Поэтому вероятность того, что отклонение нормально распределенного признака х от его среднего значения по абсолютной величине меньше заданного положительного числа вычисляется по формуле:
. (1.10.10)
Полагая в формуле (1.10.10) , получим:
,
т.е. вероятность того, что абсолютная величина отклонения значения признака х от его среднего значения превысит утроенное среднеквадратическое отклонение, очень мала (она равна 0,0027). Поэтому для эмпирических распределений, близких к нормальному распределению, применимо правило трех сигм – значения признака, большие по абсолютной величине 3s, считаются аномальными и исключаются из рассмотрения.
Для проверки близости эмпирического распределения к нормальному распределению применяются правила, называемые критериями согласия.
Рассмотрим критерий согласия Пирсона, применяемый к эмпирическому распределению, представленному интервальным рядом с равными по длине интервалами:
1) вычисляются теоретические частоты (т. е. частоты, которые имел бы ряд, если бы его распределение было нормальным) по формуле:
, (1.10.11)
где l - длина интервалов,
- нормированные стандартные отклонения,
f(t) – функция (1.10.7);
2) интервалы с малочисленными теоретическими частотами (до 10) объединяются;
3) вычисляется число («хи-квадрат») по формуле:
; (1.10.12)
4) в таблице П3 по числам (1.10.12) и , где число интервалов ряда с теоретическими частотами, находится вероятность р;
5) если вероятность p > 0,01, то имеющиеся расхождения между данными и теоретическими частотами следует считать несущественными, а эмпирическое распределение - близким к нормальному распределению.
Пример 1.10.2.Дано эмпирическое распределение (табл. 1.10.3).
Таблица 1.10.3