Проверка предложенной выборки на наличие промахов по критерию Стьюдента и вариационному критерию, и их исключение
Значения выборки по исходным данным | n=50 | ||||||||
11,82 | 13,54 | 12,33 | 9,12 | 12,21 | 12,00 | 11,79 | 12,24 | 12,97 | 11,85 |
11,37 | 12,48 | 13,18 | 12,53 | 12,05 | 11,36 | 11,91 | 12,72 | 11,27 | 13,18 |
12,23 | 11,41 | 11,39 | 12,11 | 11,12 | 11,90 | 14,82 | 12,15 | 12,05 | 12,22 |
12,92 | 11,08 | 11,95 | 11,27 | 11,65 | 11,97 | 12,90 | 12,01 | 12,47 | 11,31 |
12,51 | 12,60 | 12,17 | 12,88 | 12,70 | 11,31 | 12,73 | 10,80 | 12,36 | 11,52 |
Теперь составляем вариационный ряд:
Вариационный ряд: | ||||
9,12 | 11,39 | 11,97 | 12,23 | 12,72 |
10,8 | 11,41 | 12,24 | 12,73 | |
11,08 | 11,52 | 12,01 | 12,33 | 12,88 |
11,12 | 11,65 | 12,05 | 12,36 | 12,9 |
11,27 | 11,79 | 12,05 | 12,47 | 12,92 |
11,27 | 11,82 | 12,11 | 12,48 | 12,97 |
11,31 | 11,85 | 12,15 | 12,51 | 13,18 |
11,31 | 11,9 | 12,17 | 12,53 | 13,18 |
11,36 | 11,91 | 12,21 | 12,6 | 13,54 |
11,37 | 11,95 | 12,22 | 12,7 | 14,82 |
Предположительно промахами являются крайние члены данного вариационного ряда, т.е. и .
Вариационный критерий.
При использовании этого критерия необходимо анализируемую выборку представить в виде возрастающего вариационного ряда х1, х2, … хn. Тогда подозреваемыми являются крайние значения этого ряда. Для их проверки необходимо вычислить соответствующие отношения.
Если подозреваемой вариантой является «наибольшая», то вычисляется отношение
Если подозреваемой является «наименьшая» варианта, то вычисляется отношение
Если подозреваемыми вариантами являются одновременно «наибольшая и наименьшая», то для проверки наибольшей варианты вычисляется отношение , а для проверки наименьшей варианты – отношение
Если подозреваемыми являются сразу две «наибольшие» варианты, то вычисляется отношение
Если подозреваемыми являются сразу две «наименьшие» варианты, то вычисляется отношение
Вычисленные значения необходимо сравнить с табличными значениями (для данного объема выборки , где – объем исходной выборки, и соответствующего уровню значимости ). Если вычисленные значение превышают табличное, то подозреваемые результаты нехарактерны для рассматриваемой генеральной совокупности и должны быть исключены из рассматриваемой выборки. При этом вероятность рассматриваемого значения составит .
Проверяем по вариационному критерию, являются ли эти значения промахами.
Для :
Для :
Находим для уровня значимости и для объема выборки , где n – объем исходной выборки:
Сравниваем полученные значения и с табличным значением :
Из равенства следует, что оба результата не характерны для данной выборки генеральной совокупности и должны, быть исключены из рассматриваемой выборки.
Критерий Стьюдента.
Для проверки подозреваемых значений необходимо вычислить соотношение: , где – соответственно оценки среднего и СКО, определенные без учета предполагаемых промахов. Далее это значение сравнивается с табличным значением. При этом необходимо задаться уровнем значимости и числом степеней свободы k. В общем случае число степеней свободы равно числу независимых переменных минус число связей, накладываемых на эти переменные. Здесь фактически объем выборки равен . Связь накладывается единственная: при определении используется оценка , полученная по этой же выборки. Таким образом, в данном случае . если , то проверяемое значение исключается из анализируемой выборки как промах. При этом вероятность того, что данное суждение справедливо, составляет .
Проверяем по критерию Стьюдента, являются ли наибольшее и наименьшее значения промахами.
Проверяем по критерию Стьюдента. Является ли промахом наибольшее значение :
Находим табличное значение , учитывая, что ,
– значение исключается из выборки как промах.
Проверим, является ли наименьшее значение промахом :
– значение исключается из выборки.
Следовательно, из данной выборки необходимо исключить максимальное и минимальное значения, так как они были принятыми за промахи. Следовательно, объем выборки стал равным .
Критерий «трех сигм».
Критерий заключается в использовании так называемого «правила 3σ», когда по выборке с предполагаемыми промахами вычисляются оценка среднего и оценка СКО Sx. При этом все значения xi не удовлетворяющие условию , где Sx - оценка среднеквадратического отклонения σ , признаются промахами и удаляются из выборки.
Этот критерий считается достаточно надежным при n > 20...50.
В подобном виде критерий применим только для результатов, распределенных, но нормальному закону.
Проверяем по критерию 3σ . Является ли промахом наибольшее значение :
Проверим, является ли наименьшее значение промахом :
Следовательно, из данной выборки исключаем максимальное и минимальное значения, так как они были принятыми за промахи.
В итоге по 3-м критериям значения являются промахами а, значит, эти значения не остаются в выборке.