Которым можно считать, что все возможные значения нормально
распределенного признака укладываются в интервал x ± 3σ .
Пользоваться функцией нормального распределения в её
первоначальном виде сложно, так как для каждой пары значений x и σ
Необходимо создавать свои таблицы значений. Поэтому функцию
Стандартизируют и затем используют для обработки рядов распределения,
для чего вводится понятие стандартного отклонения i t :
σ
T xi x
i
−
= .
тогда:
⎟ ⎟
⎠
⎞
⎜ ⎜
⎝
⎛
= ⋅ ⋅
−
'( ) 1 1
t
X e
σ π
ϕ .
Выражение 2
'( ) 1
t
t e−
= ⋅
π
ϕ состоит из констант, не содержит
Параметров, называется стандартизованной функцией нормального
распределения. Для неё разработаны специальные таблицы, позволяющие
находить конкретные значения ϕ'(t) при различных значениях аргумента i t
(Приложение 1).
Исходная функция нормального распределения связана со
стандартизированной соотношением:
'(x) 1 ϕ '(t)
σ
ϕ = ⋅ .
Стандартизованная функция является четной, т.е. ϕ '(−t) =ϕ '(t) .
Для примера рассмотрим подбор теоретического распределения к
Ряду распределения рабочих участка по стажу.
Данный ряд распределения характеризуется следующими
параметрами:
x = 12 лет, σ =6,3 года.
Для того чтобы оценить близость указанного ряда распределения к
Нормальному, необходимо рассчитать частоты теоретического ряда
Распределения iT n .
Для их расчета определяются стандартные отклонения
σ
t x x −
= , затем
по таблицам значений функции Лапласа (Приложение 1) находятся
значения ϕ'(t) .
Для получения частот теоретического распределения iT n необходимо
иметь в виду, как относительная плотность распределения ϕ '(x) связана с
Одной стороны с частотой i n , а с другой - со стандартизованной функцией
нормального распределения ϕ'(t) . Эти связи выражаются следующими
зависимостями:
i
I i
i
i
i
N a
n
Следовательно x
N
n
q
a
q
X T T
T
T
⋅
ϕ '( ) = , = , , ϕ '( ) = .
С другой стороны, '(x) 1 ϕ '(t)
σ
ϕ = ⋅ , таким образом, имеет место
равенство:
T)
N a
n
i
iT ϕ
σ
= ⋅
⋅
, отсюда n ai N '(t)
IT
ϕ
σ
⋅
⋅
= ;
Где i a - ширина интервала,
N – объем статистической совокупности,
σ - среднее квадратическое отклонение,
ϕ '(t) - стандартизованная функция нормального распределения.
Полученные значения iT n округляются до целых значений в
Соответствии со смыслом характеристики частоты.
Расчеты теоретических частот распределения рабочих по стажу
Приведены в таблице 5.6.
Таблица 5.6.
Вспомогательные расчеты для построения теоретического
Распределения по данным о стаже работы рабочих участка.
Стаж, лет Расчетχ 2 -
Критерия
Расчет
λ -критерия
№
п/п
Интервал
I b
I n
x − x
δ
t x x −
=
ϕ'(t)
I n
i iT n − n
T
T
i
I i
n
(n − n )2
I N
IT N
i iT N − N
1 0 - 4 2
-
-
1,59
0,1127
2 1,00 6 4 2
2 4 - 8 6
-
-
0,95
0,2541
0 0,00 14 12 2
3 8 - 12
-
-
0,32
0,3790
- 1 0,08 25 24 1
4 12 - 16
+2
+0,32
0,3790
+1 0,08 38 36 2
5 16 - 20
+6
+0,95
0,2541
- 2 0,50 44 44 0
6 20 - 24
+10
+1,59
0,1127
0 0,00 48 48 0
7 24 - 28
+14
+2,22
0,0339
0 0,00 50 50 0
Все
Го
0 - 28
- - -
0 1,66 - - -
Для определения близости эмпирического и теоретического
Распределений, можно построить эмпирическую и теоретическую кривые
Распределения. Их сопоставление позволяет оценить степень расхождения
Между ними.
Эмпирическую кривую строим по точкам с координатами { i b ,
i n }, теоретическую – по точкам с координатами { i b , iT n }.
Визуальное сопоставление эмпирической и теоретической
Кривых распределения позволяет получить субъективную оценку их
Близости. Сравнивая графики, можно утверждать, что наблюдается
Довольно большая близость фактических и теоретических частот
Распределения. Следовательно, можно сделать вывод о том, что
Исследуемый ряд подчиняется закону нормального распределения. Для
Получения объективной оценки расхождения между эмпирической и
Теоретической кривыми распределения используются специальные
статистические показатели – критерии согласия.
Оценка близости эмпирического и теоретического
Распределений
Эмпирическое распределение отличается от теоретического тем, что
На значения признака в нем влияют случайные факторы. С увеличением
Объема статистической совокупности влияние случайных факторов
Ослабевает, и эмпирическое распределение все менее отличается от
Теоретического.
Для оценки близости распределений используются особые
показатели – критерии согласия. Они основаны на использовании