Кривые распределения. Критерии согласия

Кривая распределения – кривая линия, которая отражает закономерность изменения частот в чистом, исключающем влияние случайных факторов виде.

Теоретическая кривая распределения - кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающем влияние случайных факторов.

Закономерности распределения - закономерности изменения частот в вариационных рядах.

Нормальное распределение выражается следующей стандартизированной кривой нормального распределения: Кривые распределения. Критерии согласия - student2.ru ,

где yt - ордината кривой нормального распределения; Кривые распределения. Критерии согласия - student2.ru - стандартизированная (нормированная) величина; e и π – математические постоянные.

В статистической практике большой интерес представляет решение вопроса о том, в какой мере можно считать полученное в результате статистического наблюдения распределение признака в исследуемой совокупности, соответствующее нормальному распределению.

Для решения этого вопроса следует рассчитать теоретические частоты нормального распределения, т.е. те частоты, которые были бы, если бы данное распределение в точности следовало закону нормального распределения. Для расчета теоретических частот применяется следующая формула:

Кривые распределения. Критерии согласия - student2.ru ,

величина Кривые распределения. Критерии согласия - student2.ru определяется по специальной таблице (Приложение 1).

Следовательно, в зависимости от величины t для каждого интервала эмпирического ряда определяются теоретические час­тоты.

Степень расхождения теоретических и эмпирических частот оценивается с помощью особых показателей – критериев согласия, с помощью которых проверяется гипотеза о законе распределения.

Наиболее распространенным является критерий согласияК. Пирсона χ2 ("хи- квадрат"), исчисляемый по формуле:

Кривые распределения. Критерии согласия - student2.ru ,

где f - эмпирические частоты (частости) в интервале;

f´- теоретические частоты (частости) в интервале.

Полученное значение критерия (χ²расч) сравнивается с таблич­ным значением (χ²табл). Последнее определяется по специальной таблице (Приложение 2) в зависимости от принятой вероят­ности (Р) и числа степеней свободы k (для нормального распре­деления k равно числу групп в ряду распределения минус 3).

Если χ²расч £ χ²табл , то гипотеза о близости эмпирического распределения к нормальному не отвергается.

При расчете критерия Пирсона необходимо соблюдать усло­вия: число наблюдений должно быть достаточно велико (п ³ 50); если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.

Используя величину χ²,В.И. Романовский предложил оце­нивать близость эмпирического распределения кривой нормаль­ного распределения по отношению:

Кривые распределения. Критерии согласия - student2.ru ,

где k - число групп; (k – 3) - число степеней свободы при исчислении частот нормального распре­деления.

Если Кривые распределения. Критерии согласия - student2.ru < 3, то можно принять гипотезу о нормальном характере эмпирического распределения.

Распространенным критерием согласия является критерий А.И. Колмогорова (l):

Кривые распределения. Критерии согласия - student2.ru ,

где D - максимальное значение разности между накопленными эмпирически­ми и теоретическими частотами; Кривые распределения. Критерии согласия - student2.ru - сумма эмпирических частот.

По таблице значений вероятностей l-критерия находят соот­ветствующую вероятность (Р). Приведем краткую выдержку из таблицы значений функции k(l) А.Н. Колмогорова:

l 1,23 1,36 1,63 1,80 2,00
Р или k(l) 0,9030 0,9505 0,9902 0,9970 0,9993

Если найденной величине l соот­ветствует значительная по величине вероятность (Р), то расхож­дения между эмпирическим и теоретическим распределениями несущественны и рассматриваемое распределение следует закону нормального распределения.

Практическое и научное значение имеет распределениеПу­ассона. Оно характерно для редко встречающихся явлений, поэтому его называют "законом редких явлений" (или "законом малых чисел").

Закон Пуассона применяется для совокупностей, достаточно больших по объему (n ³ 50) и имеющих достаточно малую долю единиц, обладающих данным признаком (р £ 0,1), например, для распределения партий готовой продукции по числу забракован­ных изделий, печатных страниц по числу опечаток, станков по числу отказов, ткацких станков по числу обрывов нити и т. д.

Теоретические частоты распределения Пуассона определяют­ся формулой:

Кривые распределения. Критерии согласия - student2.ru ,

где n - общее число независимых испытаний;

l - среднее число появления редкого события в п одинаковых независи­мых испытаниях;

т - частота данного события (т = 0, 1, 2 ...);

е - основание натуральных логарифмов, е = 1,271828.

Величина е-l определяется по специальной таблице (Приложение 3); m! – произведение 1×2×3×…×m; 0! – считается равным единице.

Например. Рассмотрим построение кривой нормального распределения на примере, характеризующем распределение партий деталей по длительности производственного цикла:

Таблица 5.2

Границы интервала, час Наблюдаемая частота, fi Нормированное отклонение для нижней границы интервала, Кривые распределения. Критерии согласия - student2.ru = Кривые распределения. Критерии согласия - student2.ru Нормированное отклонение для верхней границы интервала, Кривые распределения. Критерии согласия - student2.ru = Кривые распределения. Критерии согласия - student2.ru Значение интегральной функции Лапласа для Кривые распределения. Критерии согласия - student2.ru F( Кривые распределения. Критерии согласия - student2.ru ) Значение интегральной функции Лапласа для Кривые распределения. Критерии согласия - student2.ru F( Кривые распределения. Критерии согласия - student2.ru ) Оценка вероятности попадания в интервал Pi Частота теоретического распределения Кривые распределения. Критерии согласия - student2.ru
1 2 3 4 5 6 7=6-5 8=7*71
-∞ - 28 -∞ -1,927 -0,5000 -0,4732 0,0268 1,9
28-113 -1,927 -1,393 -0,4732 -0,4177 0,0555 3,94
113-198 -1,393 -0,852 -0,4177 -0,3023 0,1154 8,19
198-283 -0,852 -0,312 -0,3023 -0,1217 0,1806 12,82
283-368 -0,312 +0,229 -0,1217 +0,0910 0,2127 15,11
368-453 +0,229 +0,769 +0,0910 +0,2791 0,1884 13,40
453-538 +0,769 +1,31 +0,2791 +0,4049 0,1258 8,93
538-623 +1,31 +1,86 +0,4049 +0,4686 0,0637 4,52
623-708 +1,86 +2,39 +0,4686 +0,4915 0,0229 1,63
708- +∞ +2,39 +∞ +0,4915 +0,5000 0,0085 0,59
Итого          

Нормальное распределение определяется двумя параметрами – это средняя арифметическая и среднее квадратическое отклонение. По нашим данным Кривые распределения. Критерии согласия - student2.ru =331 ч., σ = 157,25 ч. Все последующие расчеты для определения теоретических частот представлены в графах 3-8 табл.5.2. Значения граф 5 и 6 определяются по таблицам интегральной функции Лапласа (Приложение 4). 7 графа определяется разностью гр.6 – гр.5. Теоретическая частота гр.8 Кривые распределения. Критерии согласия - student2.ru = Кривые распределения. Критерии согласия - student2.ru . Например, для первого интервала Кривые распределения. Критерии согласия - student2.ru = 0,0268·71 = 1,9 и т.д.

Расчет критерия Пирсона: при расчете нужно соблюдать следующие условия:

1) число наблюдений должно быть достаточно велико (п ³ 50);

2) если теоретические частоты в некоторых интервалах меньше 5, то интервалы объединяют так, чтобы частоты были больше 5.

Воспользуемся данными примера, приведенного в табл.5.2, для расчета критерия "хи-квадрат", предварительно округлив теоретические частоты в гр.8, а также объединив частоты двух и трех последних интервалов, выполняя требование Кривые распределения. Критерии согласия - student2.ru ³5. Получим частоты эмпирического и теоретического распределений, приведенные в табл.5.3.

Таблица 5.3

Номер интервала Эмпирические частоты Теоретические частоты Кривые распределения. Критерии согласия - student2.ru Кривые распределения. Критерии согласия - student2.ru
0,17
2,00
0,08
0,00
1,23
0,00
0,57
Итого   4,05

χ²расч = 4,05.

Для проверки гипотезы о нормальности распределения число степеней свободы равно (k-3), где k – число групп. Следовательно, число степеней свободы равно: 7-3=4.

Уровень значимости выбирается таким образом, что Р(χ²расч > χ²табл)=a (величина a принимается равной 0,05 или 0,01).

При уровне значимости 0,05 и числе степеней свободы 4: χ²табл=9,5.

Таким образом, расчетное значение критерия Пирсона не превышает табличное значение (4,05<9,5) при a =0,05, т.е. проведенный расчет дает право не отвергать гипотезу о нормальном характере эмпирического распределения.

Например, по критерию Романовского:

Кривые распределения. Критерии согласия - student2.ru = Кривые распределения. Критерии согласия - student2.ru

Так как рассчитанное отношение значительно меньше 3, следует принять гипотезу о нормальности эмпирического распределения.

Наши рекомендации