Тема 5: Выравнивание вариационных рядов (построение теоретических распределений).
Наиболее часто используются законы распределения нормальный и Пуассона.
График нормального распределения имеет форму колоколообразной кривой, симметричной относительно , концы которой асимптотически приближаются к оси абсцисс. Она имеет точки перегиба, абсциссы которых находятся на расстоянии s от центра симметрии. Эта кривая выражается уравнением:
где у – ордината кривой нормального распределения;
- нормированные отклонения.
При выравнивании вариационного ряда по кривой нормального распределения теоретические частоты ряда определяются по формуле
где N= åf – сумма всех частот вариационного ряда;
h – величина интервала в группах (классах);
s - среднее квадратическое отклонение;
- нормированное отклонение вариантов от средней арифметической.
Значение ординат кривой нормального распределения будет соответствовать величине , которая табулирована и определяется по таблицам значений данной функции j (t) (приложение 1).
Распределение Пуассона.В целом ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где по мере увеличения значений признака х частоты резко уменьшаются и где средняя арифметическая ряда равна или близка по значению к дисперсии, т.е. =s2, то такой ряд можно выровнять по кривой Пуассона, аналитическое выражение которой
где Рх – вероятность наступления отдельных значений х;
а = – средняя арифметическая ряда.
Теоретические частоты при выравнивании эмпирических данных определяются по формуле:
f’ =N Px ,
где f ’- теоретические частоты;
N – общее число единиц ряда.
После выравнивания ряда, т.е. нахождения теоретических частот, возникает необходимость проверить, случайны или существенны расхождения между эмпирическими и теоретическими частотами, и тем самым проверить правильность выдвинутой при выравнивании ряда гипотезы о наличии того или иного характера распределения в эмпирическом ряду.
Для оценки близости эмпирических (f) и теоретических (f ’ ) частот можно применить один из критериев согласия: критерий Пирсона (c2 – «хи-квадрат»), критерий Романовского, критерий Колмогорова (l - «лямбда»).
Критерий Пирсона (c2) представляет собой сумму отношений квадратов расхождений между f и f ‘ к теоретическим частотам:
.
Фактическое значение c2 сравнивают с критическим, определяемым по специальным таблицам (приложение 2) в зависимости от принимаемого уровня значимости и числа степеней свободы.
Уровень значимости (a) – вероятность допуска ошибки в утверждении гипотетического закона (характера) распределения – обычно принимается равным 5% (a=0,05 ).
Число степеней свободы (k) рассчитывается как число групп (m) в ряду распределения минус единица и минус число параметров эмпирического распределения, использованных для нахождения теоретических частот. Так, при выравнивании по кривой нормального распределения число степеней свободы k = m-1-2, поскольку при расчете теоретических частот используется два параметра эмпирического распределения: и s, т.е. k = m –3. При выравнивании по кривой Пуассона k = m – 1 – 1 = m – 2.
Если фактическое c2 оказывается меньше табличного (критического), то расхождения между эмпирическими и теоретическими частотами можно считать случайными.
Критерием Романовского:
Если указанное отношение меньше 3, то расхождения считают случайными, если больше 3, то они существенны.
Критерий Колмогорова (l) основан на определении максимального расхождения между накопленными частотами эмпирического и теоретического распределений:
где D – максимальная разность между накопленными частотами;
N – сумма всех частот.
Далее по таблицам находится Р(λ) (приложение 3). Чем вероятность ближе к 1, тем увереннее мы можем утверждать, что расхождения между частотами случайны.
На основании полученных значений критериев согласия делаются выводы о близости эмпирических и теоретических частот, таким образом, подтверждается или опровергается гипотеза о наличии того или иного характера распределения в эмпирическом ряду.