Приложение 2. Практические занятия
Практическое занятие 3
Оценка расхождений между средними значениями
Проверим гипотезу, что две независимые частичные совокупности n1 и n2 взяты из одной и той же нормально распределенной общей совокупности, имеющей среднее значение X0 и дисперсию s2 .
Пусть оценки дисперсии S1 и S2 и пусть проверяемая гипотеза верна. Основой проверки является разность Xcp1 и Xcp2 , дисперсия которой равна
s12/n1+s22/n2 = (n1 + n2 )s2 /n1n2
Так как оценки S12 и S22 дисперсии s2 имеют вес n1 -1 и n2 -1, то полная оценка дисперсии s2 будет равна
S2 =[(n1 -1)S12 +(n2 -1)S22]/[(n1 -1)+(n2 -1)] =
= [S(X-Xcp)2 +S(X-Xcp)2]/(n1 +n2 -2)
В результате получаем
t = [(Xср2 -Xcp1)/S][n1n2 /(n1 +n2 )]^0.5
Для оценки значимости расхождения между двумя средними можно воспользоваться таблицей t с числом степеней свободы n1+n2 -2.
В вышеприведенном примере t=2,8, а табличное t=2,567 при n=18 P=0,02. Т.о. вероятность случайных значений t, которые по абсолютной величине не меньше наблюдаемого t ничтожно мала. Следовательно, наблюдаемое расхождение не является случайным.
Практическое занятие 4
Расчет доверительных границ. Оценка брака.
Рассчитаем по результатам выборки контрольных параметров, какой ожидается процент изделий не соответствующих заданным параметрам – процент брака. В соответствии с техническими условиями показатель качества должен быть x±z (например, 25±5).
Задача формулируется следующим образом: Найти вероятность того, что абсолютное отклонение Δх=Х-Хср не превзойдет заданного числа z (5). Чтобы от естественных значений х перейти к нормализованным Х, нужно использовать табличные значения Ф(Х), требуется провести нормализацию
Х=(х-хср)/Sx..
По результатам 15 испытаний рассчитаем S и Хср.
Вероятность противного события Р(Δх<=5)=2Ф(5/σ)=Y. Поэтому Р(Δх>=5)=1-Y.
2Ф(5/2,36)=2*0,482=0,964 Р=1-0,964=0,036 или Р=3,6%
Практическое занятие 5.
Оценка дисперсий. Критерий Фишера.
Пусть есть две независимых совокупности со средними значениями Х1 и Х2.Оценки дисперсий S1 и S2. Необходимо оценить, являются ли эти совокупности существенно различными или эти данные взяты из общей совокупности с дисперсией σ.
Для этого используют критерий Фишера F=S12/S22. По Таблице критериев F Фишера находим отношение. Eсли рассчитанное значение F меньше табличного, то нет основания считать, что разница в разбросе данных (в совокупностях) существенна.
Первое задание посвящено сравнительному анализу дисперсий. Существенная разница дисперсий говорит о плохих методиках измерений, в результате которых были получены экспериментальные данные, или о плохой квалификации лаборантов, которые эти данные получили, или о несовершенстве технологий получения образцов (либо изделий), с помощью которых эти образцы были получены.
Второе задание посвящено сравнительному анализу самих результатов. Существенная разница между результатами Х указывает на то, что химический состав образцов (изделий) разный, либо говорит о разных технологиях их изготовлений.
Соответствующую оценку проводят, используя критерий Стьюдента t.
Сначала рассчитывают суммарную среднеквадратичную погрешность S2
S2 =[(n1 -1)S12 +(n2 -1)S22]/[(n1 -1)+(n2 -1)] =
= [S(X-Xcp)2 +S(X-Xcp)2]/(n1 +n2 -2)
а затем рассчитывают значение критерия t.
В результате получаем
t = [(Xср2 -Xcp1)/S][n1n2 /(n1 +n2 )]1/2
Если значение t превышает допустимое табличное, значит расхождение существенное.
Примечание.
Табличное значение F при вероятности 5% и при количестве результатов испытаний n1=n2=12 составляет F=2,54.
Табличное значение t при вероятности 5% и при количестве результатов испытаний n1=n2=12 составляет t=2,201.
Пример задания: Два столбца цифр – результаты проведения двух серий испытаний. Следует рассчитать средние значения Хср1 и Хср2, затем среднеквадратичные погрешности S1 и S2 и далее провести расчеты F и t как указано выше.
Практическое занятие 6.
Оценка воспроизводимости. Выявление и исключение грубых ошибок.
Перед тем, как сравнивать серии результатов экспериментов, следует установить, нет ли среди результатов грубых ошибок.
Для этого полезно расположить все результаты в порядке возрастания и выделить результат существенно отличающийся от всех остальных.
Затем для резко выделяющегося результата Хв рассчитывают значение
Q=(Хв-Х)/R гдн Х – соседнее значение и R- размах варьирования R=Хмах-Хмин
Если рассчитанное Q больше табличного для выбранного уровня значимости при числе параллельных наблюдений n, то значение Хв может быть отнесено к анормальному, его следует либо перемерить, либо исключить из ряда экспериментальных данных.
Таблица. Значения Q для оценки резко выделяющихся наблюдений при различных уровнях значимости α
Число наблюдений n | α=0,01 | Α=0,05 | α =0,1 |
0,99 | 0,94 | 0,89 | |
0,76 | 0,64 | 0,56 | |
0,58 | 0,48 | 0,40 |
Перед тем, как перейти к планированию экспериментов следует оценить качество методик, по которым будут проводиться эксперименты.
Для этого следует оценить однородность дисперсий результатов. (См. Практическог занятие 5) и провести оценку воспроизводимости.
Для этого следует провести n независимых серий экспериментов, в каждой серии содержится m опытов. Для каждой серии следует рассчитать средние значения
Хср= ΣXi/m
рассчитать выборочные дисперсии
Si2=Σ(Xcp-Xi)2/(m-1)
Рассчитать суммарную величину дисперсий по результатам n серий
Scум2= Σ Si2
Найти отношение максимальной дисперсии из n серий к сумме дисперсий из числа всех серий
G=Simax2/Scум2
И сравнить полученное экспериментальное значение критерия Кохрена G с табличным G при m сериях по n экспериментов в каждой серии.
Если экспериментальное значение G меньше табличного (при вероятности 0,05) Gэксп<Gтаб, то это значит, что эксперименты удовлетворительно воспроизводятся и это заключение верно с вероятностью 95%.
Пример. Имеются три серии экспериментальных результатов
Практическое занятие 7.
Корреляция. Расчет уравнения регрессии.
Методом наименьших квадратов найти уравнение вида Y=bо +b1X, наилучшим образом описывающую положительную регрессионную зависимость Y от X.
Для этого составляем систему уравнений:
Syi - S(b +b1X) = 0 ¶Ф/¶b0 = S(yi -(b0+b1xi)) = 0
Sxiyi - S(b0+b1xi) =0 ¶Ф/¶b1 = S(yi -(b0+b1xi)xi ) = 0
После преобразований находим
b = [SxiSyi - NSxiyi ]/[ (Sxi)2-NSxi2]
b0 =Ycp-b1Xcp
Коэффициент корреляции рассчитываем по формуле
R = [S(xi -xcp)(yi -ycp)]/(n-1)SxSy -1£R£+1
или
R=b1Sx/Sy = b1{[nSxi2 -(Sxi)2 ]/[nSyi2 -(Syi)2 ]}1/2
Проверку вычислений проводят по формуле:
S(xi+yi)2 = Sxi2 + 2Sxiyi + Syi2
Качество аппроксимации оценивают, сравнивая S2ост и дисперсию относительно среднего
Sу2 = [S(yi-Ycp)2]/(n-1)
S2ост = [SS(yin -Yicp)2]/( Smi -L)
где L - число коэффициентов в уравнении регрессии.
Пример
Получены экспериментальные точки зависимости Y(X)
Х | Y | x*y | x*x | y*y |
11,5 | 132,25 | |||
Sum=42 | 64,5 | 753,25 |
После расчетов получили
Y=4,3+0,9214*X
R=b1*((nSxi^2-(Sxi)^2)/(nSyi^2-(Syi)^2))^0,5 | ||||
R=0,9214*((6*364-42^2)/(6*753,25-64,5^2))^0,5 | ||||
R=0,996264 | ||||
R^2=0.99254