Проверка гипотез о числовых значениях математических ожиданий
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Часто для решения вопроса о соответствии произведенной продукции определенным требованиям (например, требованиям ГОСТ или ТУ) при выявлении преимущества того или иного технологического процесса или нового материала и т.д. возникает необходимость по выборочным средним значениям исследуемых случайных величин делать вывод о соответствующих им генеральных значениях математических ожиданий.
При этом может возникнуть задача сравнения неизвестного математического ожидания М,, для которого получена оценка через выборочное среднее xi, с конкретным числовым значением М (например, с известным математическим ожиданием) или задача сравнения двух математических ожиданий Mi и М2, оцененным по двум выборочным средним лиц.
В первом случае в качестве нулевой гипотезы выдвигается предположение о том, что оцененное математическое ожидание Mi равно известному математическому ожиданию М.
1. Но: М-\ = М.
2. Альтернативная гипотеза может быть в трех вариантах:
Н-|(1): М-\ > М; Н-|(2): М-\ < М; Н-|(3): М-\ ф М.
3. Если генеральная дисперсия о2 неизвестна и для нее, по той же самой
выборке, что и для х\ , сделана оценка S2, то используется t-критерий (распределения Стьюдента).
4. t - статистика имеет вид
ы |
Х — М
у/п.
S (3.49)
5. Как и при построении доверительного интервала, для математического ожидания (см. раздел 3.2.1) выбирается уровень значимости а.
6. Для числа степеней свободы т = п -1 (с которым сделана оценка дисперсии) устанавливаются границы критической области по табличным значениям квантилей t-распределения (см., например, [11] или табл. П.6), или их можно определить, воспользовавшись статистической функцией СТЬЮДРАСПОБРиз электронных таблиц Microsoft Excel.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
7. Нулевую гипотезу принимают, т.е. полагают, что M-i = М при выполнении неравенств:
• для альтернативных гипотез Н/1): М^> Mv\ Н/2): М-\< М t < t 2a,m;
• для альтернативной гипотезы Hi(3): М\Ф М Ц < tam .
Появление в последних неравенствах величин а и 2а при определении табличных значений критерия Стьюдента связано с тем, что обычно эти таблицы (см. табл. П.6) приводятся для двустороннего распределения Стьюдента,
т.е. под tam понимается величина, которая при т -»оо будет стремиться к
квантили нормированного нормального закона распределения порядка 1- а/2
ta,m -> Z
р=1-а/2
Поэтому, работая с таблицами критерия Стьюдента, неплохо делать проверку, показывающую для какого распределения (одностороннего или двустороннего) они составлены. Так, по табл. П.6
^05;500 = 1,965 ~ Z^1-0,05/2=0,975 = 1,960 ,
следовательно, это двусторонние пределы распределения Стьюдента.
Аналогичная ситуация связана и с функцией СТЬЮДРАС-ПОБР(вероятность;степени_свободы),где вероятность- это вероятность, соответствующая двустороннему распределению Стьюдента.
Пример 3.6. При проверке Ph-метра с помощью эталонного раствора, имеющего Ph=9,0, получены следующие результаты: 8,7; 9,2; 9,1; 9,0; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8, т.е. п = 14. Обладает ли Ph-метр систематической погрешностью?
Для решения этой задачи предварительно рассчитаем выборочное среднее x и выборочное среднеквадратическое отклонение S в предположении, что показания Ph-метра не противоречат нормальному закону распределения и среди них нет грубых погрешностей (см. формулы (3.5), (3.8) и (3.10)):
х = Ух1 => X; = (8,7+ 9,2+ 9,1+ ... + 8,8) = 9,2; nj-f 14j~f 14
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Ч- |
i-1 j |
2 /-1 х |
S
/ \ \Х{ -х)
п — 1 п — 1
п / и
Z |
2 1 V
(-1 '' v '-1 у
2
14 2 1 X |
Z2 1 V
Х- > X.
I \ ^^^
2
14-1
(8,72 +9,22 +9,12... + 8,82)----- (8,7+ 9,2+ 9,1+ ... + 8,8)
2
0,1646;
Sx = +JS2 = ^/0,1646 = 0,4057.
В электронных таблицах Microsoft Excel для подобных расчетов можно было бы воспользоваться следующими тремя статистическими функциями:
СРЗНАЧ(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 9,2;
ДИСП(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 0,164615;
СТАНДОТКПОН(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 0,4057.
Далее, в соответствии с описанным выше алгоритмом:
1. Выдвигается нулевая гипотеза о том, что математическое ожидание показаний Ph-метра равно Ph эталонного раствора (не имеют систематической погрешности) Н0: Mi= 9 .
2. Альтернативная гипотеза выбирается в виде Иь М^ф 9, поскольку показания Ph-метра не должны как завышать, так и занижать истинное значение Ph раствора.
3. Так как значение генеральной дисперсии о2 показаний Ph-метра неизвестно, а имеется только ее оценка S2 = 0,1646, то используется t-критерий (распределения Стьюдента).
4. t - статистика имеет вид (см. (3.49))
х- М г-
t =------------- у/П
S
=
9,2-9 0,4057
\14 = 1,84.
5. Выбирается (обычный для большинства технических приложений) уровень значимости а = 0,05.
6. При этом уровне значимости, числе степеней свободы т = п —1 = 13 и для альтернативной гипотезы Н-\\ М-\ ф9 устанавливаются границы критической
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
области по табличным значениям квантилей распределения Стьюдента t0,05;i3 = 2,16 или их можно определить, воспользовавшись функцией СТЬЮДРАС-ПОБР(0,05;13) =2,160368 из электронных таблиц Microsoft Excel.
7. Поскольку рассчитанное значение статистики t = 1,84 не попадает в критическую область (1,84 < 2,16), то нулевая гипотеза принимается в качестве рабочей, т.е. можно считать, что М-\ = 9 (вероятность того, что показания Ph-метра имеют систематическую погрешность меньше чем 0,05).
В задаче сравнения двух неизвестных математических ожиданий M-i и М2 прежде всего рассмотрим ситуацию, когда исследуемые выборки, по которым делаются оценки для Mi и М2, независимы между собой.
Если для двух нормально распределенных генеральных совокупностей с неизвестными параметрами М,, ai2 и М2, аг2 получены независимые выборки
объемом соответственно п-\ и п2, то для сравнения выборочных средних х1 и х2 выдвигается нулевая гипотеза о равенстве математических ожиданий:
1. Но: М,= М2 .
2. При этом можно сформулировать три альтернативных гипотезы:
Н-|(1): М-\ > М2; Н-|(2): М-\ < М2; Hi(3): М-\ ф М2.
3. Как и в рассмотренной выше ситуации сравнения с известным матема
тическим ожиданием, используется t-критерий.
4. Вид t-статистики зависит от того, равны ai2 = аг2 = а2 либо не равны
а-,2 ф а22 между собой генеральные дисперсии (для ответа на этот вопрос можно
воспользоваться, например, рассмотренным выше критерием Фишера).
В первом случае, когда дисперсии не имеют значимого отличия, статистика принимает вид
JC1 —х2
S | — | + — |
V | п1 | п2 |
- двухвыборочный t-критерий с равными дисперсиями, где S - обобщенное среднее квадратичное отклонение (см. (3.46)):
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
S
\
(п1 - 1)S12 + (п2 -1)5*2
п1+п2-2
Во втором случае, когда дисперсии значимо отличаются друг от друга,
а-i2 ф а22 , статистика имеет вид
х1 -х2
t |
(3.51)
S12 s22 —- + ^-
\
щ п2
двухвыборочный t-критерий с неравными дисперсиями.
5. В зависимости от условия решаемой задачи выбирается необходимый уровень значимости а.
6. Границы критической области устанавливаются по табличным значениям квантилей t-распределения (см., например, [11] или табл. П.6]) либо их можно определить, воспользовавшись статистической функцией СТЬЮДРАС-ПОБРиз электронных таблиц Microsoft Excel. При этом число степеней свободы т рассчитывается:
для g-i2 = аг2 = а2 как т = п, + п2 - 2;
1 с (1-c)2 щ |
2
для о, ф ъ2 =--------- +,гдес
т щ -1 п2 -1 51 s2
+ п1 п2
7. Нулевую гипотезу принимают, т.е. полагают, что Mi = М2 при выполнении неравенств:
• для альтернативных гипотез Н/1): М-\> М2 ; Н/2): М-\ < М2 t <t2am\
• для альтернативной гипотезы Н/3': М^ ф М2 t <tam.
Пример 3.7. Проведены испытания механической прочности проб окатышей при использовании старой и двух новых технологий их обжига. Холодная прочность окатышей обычно оценивается при испытании на раздавливание (кН/окатыш). Обычно прочность определяют по результатам раздавливания не менее 20 окатышей размером 12-15 мм.
Для иллюстрации процедуры проверки гипотез о числовых значениях математических ожиданий будем предполагать, что имелась возможность ис-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
следовать всего по 8 окатышей для каждой из технологий. Результаты испытаний представлены в табл. 3.4.
Таблица 3.4 Результаты испытаний прочности окатышей, изготовленных по разным технологиям, кН/окатыш
Номер окатыша | Старая технология х0\ | Новая технология, вариант 1 х,\ | Новая технология, вариант 2 х2х | х& = Х-п- Х2\ |
2,11 | 2,21 | 2,21 | ||
2,12 | 2,26 | 2,22 | 0,04 | |
1,97 | 2,19 | 2,08 | 0,11 | |
2,10 | 2,21 | 2,19 | 0,02 | |
2,17 | 2,27 | 2,24 | 0,03 | |
2,12 | 2,24 | 2,21 | 0,03 | |
1,93 | 2,14 | 2,06 | 0,08 | |
2,28 | 2,32 | 2,31 | 0,01 | |
X | 2,10 | 2,23 | 2,19 | 0,04 |
S2 | 0,0120 | 0,003029 | 0,0068 | 0,001371 |
Можно ли по полученным данным сделать вывод, что новая технология по варианту 1 позволяет повысить прочность окатышей?
1. Сформулируем нулевую гипотезу Н0: М,= М0 .
2. Поскольку предполагается, что новая технология по варианту 1 позволит повысить прочность окатышей, то альтернативная гипотеза выбирается в виде Н-ь М-\ > М0.
3. Будем считать, что выборки взяты из генеральных совокупностей с
нормальным законом распределения. Для того чтобы определить вариант ста
тистики для t - критерия, сравним между собой соответствующие дисперсии.
Для этого в качестве нулевой гипотезы примем Н0: gi2 = go2 = а2. В предполо
жении, что новая технология позволяет также снизить и разброс в значениях
прочности (т.е. иметь и более стабильный технологический процесс), в качест
ве альтернативной гипотезы примем Н^ gi2 < g02.
Статистика F-критерия (критерия Фишера) при этом равна F=0,0120/0,003029 = 3,96, и для построения критической области при а = 0,05 находим F0,o5;8-i;8-i = 3,79 (по таблицам либо в Microsoft Excel через FPAC-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
ПОБР(0,05;7;7) = 3,787051). Поскольку 3,96 > 3,79, то с вероятностью большей чем 0,95 можно говорить, что gi2 < g02.
4. t - статистика в этом случае должна иметь вид ( см. (3.51))
2,23-2,10
t = . = = 3,00 .
/0,003029 0,0120
J---------- +--------
V88
5. Как обычно, выберем уровень значимости а = 0,05.
6. Для построения критической области рассчитаем число степей свободы:
0,03029
8 1 0,202 (1-0,20)
с = =0,20; =---------- ь---------- = 0,096883; т = 10,3.
0,03029 0,0120 т 8-1 8-1
88 Табличное значение t2*0,o5;io=1,81 (СТЬЮДРАСПОБР(0,1;10) = 1,812462).
7. Поскольку рассчитанное ранее значение статистики попадает в крити
ческую область 3,00 > 1,81, то нулевая гипотеза Н0: М, = М0 должна быть от
вергнута, т.е. новая технология по варианту 1 действительно позволяет повы
сить прочность окатышей.
Вероятность ошибки подобного утверждения (ошибки первого рода, заключающейся в том, что отвергают нулевую гипотезу Н0: М, = М0, в то время как в действительности эта гипотеза верна), т.е. уровень значимости а при этом можно оценить как СТЬЮДРАСП(3,00;10;1) = 0,006672. При расчете значения функции распределения Стьюдента в данном случае используется: найденная в пункте 4 статистика t = 3,00; определенное в пункте 6 число степеней свободы т «10 и такой параметр, как число возвращаемых "хвостов" распределения. "Хвосты" = 1, и функция СТЬЮДРАСПвозвращает одностороннее распределение, поскольку была принята односторонняя альтернативная гипотеза H-i: М,> Мо.
Для определения найденного выше значения уровня значимости а = 0,0067 в электронных таблицах в Microsoft Excel может быть использована такая статистическая функция, как ТТЕСТ. Она используется для того, чтобы оп-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
ределить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же математическое ожидание:
ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,11;2,12;1,97;2,10;2,17;2,12;1,93 ;2,28};1;3)=0,006459.
В качестве аргументов функции ТТЕСТ, кроме самих выборочных значений (которые стоят в фигурных скобках), используется еще такие два параметра, как "Хвосты" = 1 (для односторонней альтернативной гипотезы) и "Тип" -это вид исполняемого t-теста. В данном случае "Тип" = 3, поскольку необходимо провести двухвыборочный t-тест с неравными дисперсиями. Полученное в данном случае значение t-теста говорит о том, что вероятность равенства математического ожидания прочности окатышей по новой (вариант 1) и старой технологии их обжига очень мала (составляет только 0,6%), следовательно, новая технология по варианту 1 действительно является более предпочтительной, чем старая.
В продолжение примера 3.7 ответим на вопрос: есть или нет какое-либо значимое различие между двумя новыми технологиями обжига (по варианту 1 и 2) с точки зрения повышения механической прочности окатышей?
1. В соответствии с общим алгоритмом проверки статистических гипотез сформулируем Н0: Mi = M2.
2. Поскольку предполагается, что обе новые технологии равнозначны между собой, то альтернативная гипотеза выбирается в виде H-i: M^ф M2.
3. Для того чтобы определить тип t - теста, сравним между собой дисперсии Н0: gi2 = G22 = g2 в предположении, что обе новые технологии дают одинаковый разброс в значениях прочности, альтернативная гипотеза выбирается в виде H-i: g-i2 ^g22.
Статистика критерия Фишера при этом равна F = 0,0068/0,003029 = 2,25 (в числителе критерия Фишера всегда должна стоять большая дисперсия), а
ПОСКОЛЬКУ При О = 0,05 F(0,05/2);8-1;8-1 = 4,99 (СМ. ТЭбл. П.5) И F < F(0,05/2);8-1;8-1 (2,25 <
4,99), то действительно можно считать, что gi2 = g22 = а2.
S - обобщенное среднее квадратичное отклонение тогда будет равно (см.(3.46))
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
/(8 —1)0,003029 +(8 —1)0,0068
S = ,1--------------------------------------- =0,07 .
V8+8-2
4. Поскольку дисперсии не имеют значимого отличия, статистика t - кри
терия принимает вид (см. (3.50))
2,23-2,19
t =-------- , =1,14 .
г, ъ^ /11
0,07-/—l— V88
5. Выбираем уровень значимости а = 0,05 и определяем число степеней свободы m = 8 + 8 - 2 = 14.
6. Для построения критической области находим табличное значение to,o5;i4=2,15 (СТЬЮДРАСПОБР(0,05;14) = 2,144789).
7. Поскольку рассчитанное ранее значение статистики не попадает в критическую область 1,14 < 2,15, то нулевая гипотеза Н0: Mi = M2 принимается в качестве рабочей, т.е. новые технологии как по варианту 1, так и по варианту 2 равнозначны между собой с точки зрения повышения механической прочности окатышей.
Вероятность ошибки (первого рода) при этом можно оценить величиной СТЬЮДРАСП(1,14;14;2) = 0,272934, т.е. если бы мы в подобных ситуациях отвергали нулевую гипотезу, то примерно в 27 случаях из 100 мы поступали неверно. В данном случае "Хвосты" = 2, и функция СТЬЮДРАСПвозвращает двустороннее распределение, поскольку альтернативная гипотеза была принята в виде Н-\\ M-\Ф M2, а не в виде Н-ь Mi > M2.
Для определения найденного нами значения уровня значимости а = 0,27 в электронных таблицах Microsoft Excel также могла быть использована функция
ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2, 21;2,06;2,31};2;2)= 0,272934.
В данном случае "Хвосты" = 2 (для двусторонней альтернативной гипотезы) и "Тип" = 2, поскольку используется двухвыборочный t-тест с равными дисперсиями.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
И наконец, в задаче сравнения двух неизвестных математических ожиданий Л/fi и М2 рассмотрим ситуацию, когда исследуемые выборки зависимы между собой.
t-критерий для зависимых выборок очень полезен в тех довольно часто возникающих на практике ситуациях, когда важный источник внутригрупповой вариации (разброса или ошибки) может быть легко определен и исключен из анализа. Это относится к экспериментам, в которых две сравниваемые группы получены на одной и той же совокупности наблюдений (субъектов), которые тестировались дважды (например, до и после термообработки проката, до и после вакуумирования стали, измерения, производимые на одних и тех же партиях продукции различными методами или различными приборами и т.д.). В подобных экспериментах значительная часть внутригрупповой изменчивости (вариации) в обеих группах может быть объяснена индивидуальными различиями субъектов (различиями в свойствах отдельных прокатанных полос, каждой конкретной плавки или партии продукции). Если та же самая выборка тестируется дважды, то можно легко исключить эту часть вариации. Вместо исследования каждой группы отдельно можно рассматривать просто разности между двумя измерениями для каждого субъекта (например, анализировать одни и те же плавки "до вакуумирования " и "после вакуумирования "). Вычитая первые значения из вторых (для каждого субъекта: прокатанной полосы, плавки или партии продукции) и анализируя затем только эти "чистые (парные) разности", появляется возможность исключить ту часть вариации, которая является результатом различия в исходных уровнях индивидуумов. Именно так и проводятся вычисления в t-критерии для зависимых выборок. В сравнении с t-критерием для независимых выборок такой подход дает всегда "лучший" результат (критерий становится более чувствительным).
Реализация t-критерия для зависимых выборок начинается с того, что строится новая выборка ю п = п-\ = п2 элементов (парные наблюдения), определяемая как разность значений первой и второй выборок: xAi = хц - x2i и по ней
рассчитываются оценки математического ожидания ха и среднеквадратичного отклонения Бд:
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
хА = -^xAi; SA=
'' 1-Х \
--- 7-Z(*A-*A«)2'
1. Выдвигается нулевая гипотеза о том, что математическое ожидание разности равно нулю Н0: Мд = 0.
2. Как и для случая независимых выборок, можно сформулировать три альтернативных гипотезы:
Н-|(1): Л//д > 0; Н-|(2): Мд< 0; Hi(3): М^ф 0;
3. Используется t-критерий для зависимых выборок (парный).
4. Статистика критерия Стьюдента, учитывая, что Мд= 0, примет вид (см. (3.49))
хА - М А г- хА - 0 г- хА г-
SASASA(З-52)
5. В зависимости от условия решаемой задачи выбирается необходимый уровень значимости а. Число степеней свободы для зависимых выборок равно т= п - 1.
6. Границы критической области устанавливаются в зависимости от вида альтернативной гипотезы по значениям квантилей распределения Стьюдента t
a; m ИЛИ t2а; т-
7. Нулевую гипотезу принимают, т.е. полагают, что Мд = 0 при выполне
нии неравенств:
• для альтернативных гипотез Н/1): Л//д > 0; Н/2): Мд< 0 t <t2am\
• для альтернативной гипотезы Н/3': Маф 0
Еще раз обратимся к числовому материалу примера 3.7 и переформулируем условия задачи таким образом, чтобы как по варианту 1, так и по варианту 2 были приведены данные для одной и той же новой технологии, полученные дважды на одних и тех же партиях окатышей, но измерения прочности выполнены по двум различным методикам.
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
Можно ли сказать, что результаты измерения прочности, полученные для новой технологии по различным методикам на одних и тех же партиях окатышей, не имеют значимого различия?
Поскольку при таких условиях задачи выборки по варианту 1 и 2 становятся зависимыми друг от друга (значения прочности окатышей по каждой из восьми партий произведены дважды, но про разным методикам), то для решения необходимо воспользоваться описанным выше парным t-критерием.
Рассчитанные значения хд, ха и S2д приведены в табл. 3.4 (см. последний столбец).
SA = д/0,001371 = 0,037 .
1. Выдвигаем нулевую гипотезу Н0: Mд = 0.
2. Поскольку между двумя методиками не предполагается никакого различия, то альтернативную гипотезу выбираем в виде H1: Mд ф 0
3. Используется t-критерий для зависимых выборок (парный).
4. Статистика критерия Стьюдента в этом случае представляет собой
хА г- 0,04 /-
t - —^ ■ у1п---------- V8 = 3,055.
SA 0,037
5. Выбираем уровень значимости а = 0,05 и определяем число степеней
свободы т = 8 - 1 = 7.
6. Для построения критической области находим табличное значение t0,05;7=2,37 (СТЬЮДРАСПОБР(0,05;7) = 2,364623).
7. Поскольку рассчитанное ранее значение статистики попадает в критическую область 3,06 > 2,37, то нулевая гипотеза Н0: M 1 = 0 отвергается, и в качестве рабочей необходимо принять альтернативную H1: Mд^ 0, т.е. методики определения прочности по варианту 1 и по варианту 2 дают значимо различные результаты на одних и тех же партиях и для одной и той же новой технологии отжига окатышей.
Вероятность ошибки первого рода при этом составляет ("Хвосты" = 2, поскольку H1: M1 ф 0) СТЬЮДРАСП(3,055;7;2) = 0,018453, т.е., отвергая в анало-
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
гичных условиях нулевую гипотезу, мы примерно только в одном или двух случаях из 100 будем допускать ошибку.
Найденная оценка а = 0,018 в электронных таблицах Microsoft Excel может быть рассчитана с использованием функции ТТЕСТ.
ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2,21;2,06 ;2,31};2;1)= 0,018452.
Последний параметр в этой функции "Тип" = 1 (парный t-тест).
Если сравнить результаты, полученные в примере 3.7 по t-тесту на двух совершенно одинаковых выборках (вариант 1 и 2) при условии, что эти выборки независимы (двухвыборочный t-тест с равными дисперсиями) и зависимы (парный t-тест), то можно увидеть, что они дают совершенно противоположные результаты. Когда на выборки по варианту 1 и 2 мы смотрели как на независимые, мы не видели различия в их математических ожиданиях, но при условии зависимости в математических ожиданиях удалось установить значимые расхождения. Этот числовой материал подтверждает ранее уже высказанное положение о том, что t-критерий для зависимых выборок является более чувствительным.
Поскольку методика парного t-теста полностью повторяет алгоритм сравнения неизвестного математического ожидания Mi с конкретным числовым значением M, то статистическая функция ТТЕСТ в электронных таблицах Microsoft Excel применима и для решения задач о соответствии полученного в эксперименте выборочного среднего xi известному математическому ожиданию.
Так, для примера 3.6 (о наличии погрешности в показаниях Ph-метра). ТТЕСТ({8,7;9,2;9,1;9;9,4;9,6;9,7;8,9;8,8;8,7;9,8;9,3;9,8;8,8};{9;9;9;9;9;9;9;9;9;9;9;9;9 ;9};2;1) = 0,088025, что при найденном в этом примере значении статистики t = 1,84, числе степеней свободы m = 14 - 1 = 13 и альтернативной гипотезе Н^ M ф 9 ("Хвосты" = 2) соответствует СТЬЮДРАСП(1,84;13;2) = 0,088706. Полученное значение функции ТТЕСТ говорит о том, что вероятность наличия
3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
систематической погрешности у Ph-метра может быть оценена величиной 1 -0,089 = 0,91 (меньшей, чем 0,95, значения которого мы закладывали, выбирая уровень значимости а = 0,05).
В заключение этого раздела еще раз подчеркнем, что все перечисленные выше критерии могут быть использованы только для случайных величин, не противоречащих нормальному закону распределения (закону распределения Гаусса). Так, например, применительно к t-критерию для зависимых выборок это означает, что попарные разности должны быть нормально распределены. Если это предположение не выполняется (о том, как его можно проверить, смотри следующий раздел), то необходимо воспользоваться одним из альтернативных непараметрических критериев (см. например, [10]).