Предварительный выбор закона распределения
Большинство применяемых в практике контроля статистических методов основано на предложении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения. Проверка гипотезы о законе распределения значения признака в генеральной совокупности осуществляется с помощью критериев согласия.
Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то имеет распределение, близкое к нормальному.
Функция плотности нормального закона распределения имеет вид , а интегральная функция распределения – .
У нормального распределения два параметра (количество параметров ): математическое ожидание и среднее квадратическое отклонение . Их оцениваем по выборке: .
Кривая нормального распределения симметрична относительно прямой .
1) Для нормального закона средняя арифметическая , мода и медиана равны как характеристики центра распределения:
.
У нас: 9,0548; 9,115; 9,097.
Как видно, значения этих величин практически не отличаются друг от друга.
2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.
У нас: –0,3; –0,25.
Как видно, значение коэффициента асимметрии и значение коэффициента эксцесса отличаются от нуля. (Замечание: считается, что число , если 0,1).
3) В случае нормального распределения справедливо следующее условие:
.
Проверим выполнение этого условия для нашего примера.
;
.
Условия выполняется.
4) На практике для выдвижения гипотезы о нормальном распределении используют правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал: :
Рисунок 5. – Правило 3-х сигм.
В нашем случае все значения величин попадают в интервал , равный , то есть в интервал (6,3848; 11,7248), так как 6,75, 10,97.
Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза):
,
где – опытные частоты, – теоретические частоты, – длина интервала, – объём выборки, – среднее квадратическое отклонение, – табулированная функция, .