Нормальное распределение

В социально-экономических исследованиях часто встречаются распределения, зависящие от очень большого числа факторов. Для таких распределений теоретическим является нормальное распределение. Теоретической кривой нормального распределения (нормальной кривой) является график функции

Нормальное распределение - student2.ru , (1.10.7)

где Нормальное распределение - student2.ru – нормированное стандартное отклонение;

Нормальное распределение - student2.ru – его среднее значение;

Нормальное распределение - student2.ru – среднеквадратическое отклонение;

Нормальное распределение - student2.ru и Нормальное распределение - student2.ru – математические постоянные.

Значения функции (1.10.7) приведены в табл. П1 приложения. На рис. 1.10.9 изображена нормальная кривая.

Нормальная кривая обладает следующими свойствами:

1) функция f(t) – четная, т. е. f(t) = f(-t);

2) функция f(t) определена на всей числовой оси и стремится к нулю при Нормальное распределение - student2.ru ;

3) функция f(t) имеет максимум Нормальное распределение - student2.ru при t = 0;

4) при t = ± 1 график функции f(t) имеет точки перегиба.

Нормальное распределение - student2.ru

Рис. 1.10.9. Нормальная кривая (показано приближенное

распределение площадей под кривой)

Из свойств функции f(t) следует:

1) нормальная кривая симметрична относительно прямой с уравнением t=0, равносильным уравнению Нормальное распределение - student2.ru ;

2) нормальная кривая асимптотически приближается к оси абсцисс;

3) мода нормального распределения совпадает со средним значением Нормальное распределение - student2.ru ;

4) при отклонении х от Нормальное распределение - student2.ru по абсолютной величине на одно нормированное стандартное отклонение нормальная кривая меняет направление выпуклости.

Эксцесс нормального распределения равен нулю. Поэтому, если эксцесс эмпирического распределения, теоретическим распределением которого является нормальное распределение, положителен (либо отрицателен), то эмпирическая кривая имеет более острую (либо более плоскую) вершину по сравнению с нормальной кривой. Этим объясняется название эксцесс - излишек.

Интегрируя функцию (1.10.7), получим нормированную функцию Лапласа

Нормальное распределение - student2.ru , (1.10.8)

значения которой приведены в табл. П2.

С помощью функции (1.10.8) вычисляется вероятность того, что признак х, имеющий нормальное распределение, примет значение, принадлежащее интервалу Нормальное распределение - student2.ru :

Нормальное распределение - student2.ru . (1.10.9)

Из формулы (2.10.9) следует, что

Нормальное распределение - student2.ru Нормальное распределение - student2.ru .

Так как функция Лапласа – нечетная, то Нормальное распределение - student2.ru . Поэтому вероятность того, что отклонение нормально распределенного признака х от его среднего значения по абсолютной величине меньше заданного положительного числа Нормальное распределение - student2.ru вычисляется по формуле:

Нормальное распределение - student2.ru . (1.10.10)

Полагая в формуле (1.10.10) Нормальное распределение - student2.ru , получим:

Нормальное распределение - student2.ru ,

т.е. вероятность того, что абсолютная величина отклонения значения признака х от его среднего значения превысит утроенное среднеквадратическое отклонение, очень мала (она равна 0,0027). Поэтому для эмпирических распределений, близких к нормальному распределению, применимо правило трех сигм – значения признака, большие по абсолютной величине 3s, считаются аномальными и исключаются из рассмотрения.

Для проверки близости эмпирического распределения к нормальному распределению применяются правила, называемые критериями согласия.

Рассмотрим критерий согласия Пирсона, применяемый к эмпирическому распределению, представленному интервальным рядом с равными по длине интервалами:

1) вычисляются теоретические частоты (т. е. частоты, которые имел бы ряд, если бы его распределение было нормальным) по формуле:

Нормальное распределение - student2.ru , (1.10.11)

где l - длина интервалов,

Нормальное распределение - student2.ru - нормированные стандартные отклонения,

f(t) – функция (1.10.7);

2) интервалы с малочисленными теоретическими частотами (до 10) объединяются;

3) вычисляется число Нормальное распределение - student2.ru («хи-квадрат») по формуле:

Нормальное распределение - student2.ru ; (1.10.12)

4) в таблице П3 по числам (1.10.12) и Нормальное распределение - student2.ru , где Нормальное распределение - student2.ru число интервалов ряда с теоретическими частотами, находится вероятность р;

5) если вероятность p > 0,01, то имеющиеся расхождения между данными и теоретическими частотами следует считать несущественными, а эмпирическое распределение - близким к нормальному распределению.

Пример 1.10.2.Дано эмпирическое распределение (табл. 1.10.3).

Таблица 1.10.3

Наши рекомендации