Роверка нормальности закона распределения вероятности результата наблюдения
Существует несколько так называемых критериев согласия, по которым проверяются гипотезы о соответствии экспериментальных данных тому или иному закону распределения вероятности результата измерения. Наиболее распространенным из них является критерий К.Пирсона (используется при n > 40…50 ).За меру расхождения экспериментальных данных с теоретическим законом распределения вероятности принимается сумма квадратов отклонения частостей от теоретической вероятности попадания отдельного значения результата измерения в i-й интервал.
(1.3.1)
где =( .
1.Данные наблюдений группируют по интервалам, как при построении гистограммы, и подсчитывают частоты mi. Если в некоторые интервалы попадает меньше пяти наблюдений , то такие интервалы объединяют с соседними. При этом число степеней свободы k, конечно, уменьшается.
2. Вычисляют среднее арифметическое и среднее квадратическое отклонение результата наблюдений sx , которые принимают в качестве параметров теоретического нормального распределения с плотностью px(x).
3.Для каждого интервала находят вероятности попадания в них результатов наблюдений либо с использованием таблицы значений интегральной функции нормированного нормального распределения (таблицы 3 приложения) по общей формуле
(1.3.2)
(где в данном случае х1 и х2 -значения Х в начале и в конце каждого из интервалов), либо приближенно как произведение плотности теоретического распределения в середине интервала на его длину:
(1.3.3)
4.Для каждого интервала вычисляют величины χ2i (i=1,2,….,r) и суммируют их по всем i, в результате чего получают меру расхождения . Определяют число степеней свободы k=r-3,где 3-число независимых связей, наложенных на частости P*i.. Если проверяется гипотеза о нормальности распределения, то числу этих связей относится равенство среднего арифметического математическому ожиданию, а точечной оценки дисперсии - дисперсии предполагаемого нормального распределения. Кроме того ,требуется, чтобы сумма частостей по всем интервалам была равна единице.
5.Задаваясь уровнем значимости q =1- α, находят по таблице 9 приложения значения и . Если то распределение результатов наблюдений считают нормальным.
Примечание. Если вычисленная по опытным данным мера расхождения окажется в указанном интервале, то гипотеза принимается. Это, конечно, не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. не противоречит опытным данным. Если же выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.
Поскольку проверка гипотезы основывается на опытных данных, то при принятии решения всегда возможны ошибки. Отвергая в действительности верную гипотезу, мы совершаем ошибку первого рода. Вероятность ошибки первого рода называется уровнем значимости и составляет q=1- а.
Принимая в действительности неверную гипотезу, мы совершаем ошибку второго рода.
Вычислить её вероятность, вообще говоря, невозможно, поскольку для этого нужно рассмотреть все прочие возможные гипотезы, являющиеся альтернативой обсуждаемой гипотезы. Можно лишь утверждать, что при уменьшении ошибки первого рода ошибка второго рода увеличивается, поэтому не имеет смысла брать слишком высокие значения доверительных вероятностей.
Следует иметь ввиду, что оценка нормальности проводится после внесения поправок на систематическую погрешность и исключения результатов, не проходящих по критерию трёх сигм.
При n 10…15 нормальность не проверяется, а принимается или отвергается по априорным данным.
Если 10…15 n 40…50, то применяется составной критерий, когда последовательно проверяется выполнение критерия 1 и критерия 2(ГОСТ 8.207-76).
Критерий 1 основан на вычислении статистики
(1.3.4)
квантили распределения которой представлены в табл.Т.7 приложения 4.
Гипотеза о нормальности распределения на основании первого критерия принимается, если при данном числе наблюдений и выбранном уровне значимости q1 соблюдается условие d1-q1/2 d dq1/2 , где d1-q ½ и d q1/2 -- квантили, выбираемые из таблице 7 приложения.
На основании критерия 2 гипотеза о нормальности распределения принимается, если не более m разностей │Xi- │превосходят уровень , где Sx – среднее квадратическое отклонение результатов наблюдения, а - квантиль интегральной функции нормированного нормального распределения, определяемый по данным табл.2 приложения при значении .
Величина α находится при заданном уровне значимости второго критерия по данным табл. 8 приложения. Распределение результатов наблюдения считается отличным от нормальности, если оно не соответствует хотя бы одному из этих двух критериев. Уровень значимости составного критерия q q1+q2 .