Проверка гипотез о числовых значениях математических ожиданий


3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Часто для решения вопроса о соответствии произведенной продукции определенным требованиям (например, требованиям ГОСТ или ТУ) при выяв­лении преимущества того или иного технологического процесса или нового ма­териала и т.д. возникает необходимость по выборочным средним значениям исследуемых случайных величин делать вывод о соответствующих им гене­ральных значениях математических ожиданий.

При этом может возникнуть задача сравнения неизвестного математиче­ского ожидания М,, для которого получена оценка через выборочное среднее xi, с конкретным числовым значением М (например, с известным математиче­ским ожиданием) или задача сравнения двух математических ожиданий Mi и М2, оцененным по двум выборочным средним лиц.

В первом случае в качестве нулевой гипотезы выдвигается предполо­жение о том, что оцененное математическое ожидание Mi равно известному математическому ожиданию М.

1. Но: М-\ = М.

2. Альтернативная гипотеза может быть в трех вариантах:

Н-|(1): М-\ > М; Н-|(2): М-\ < М; Н-|(3): М-\ ф М.

3. Если генеральная дисперсия о2 неизвестна и для нее, по той же самой

выборке, что и для х\ , сделана оценка S2, то используется t-критерий (рас­пределения Стьюдента).

4. t - статистика имеет вид


ы

Х — М

у/п.

S (3.49)

5. Как и при построении доверительного интервала, для математического ожидания (см. раздел 3.2.1) выбирается уровень значимости а.

6. Для числа степеней свободы т = п -1 (с которым сделана оценка дис­персии) устанавливаются границы критической области по табличным значени­ям квантилей t-распределения (см., например, [11] или табл. П.6), или их можно определить, воспользовавшись статистической функцией СТЬЮДРАСПОБРиз электронных таблиц Microsoft Excel.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

7. Нулевую гипотезу принимают, т.е. полагают, что M-i = М при выполне­нии неравенств:

• для альтернативных гипотез Н/1): М^> Mv\ Н/2): М-\< М t < t 2a,m;

• для альтернативной гипотезы Hi(3): М\Ф М Ц < tam .

Появление в последних неравенствах величин а и 2а при определении табличных значений критерия Стьюдента связано с тем, что обычно эти табли­цы (см. табл. П.6) приводятся для двустороннего распределения Стьюдента,

т.е. под tam понимается величина, которая при т -»оо будет стремиться к

квантили нормированного нормального закона распределения порядка 1- а/2

ta,m -> Z

р=1-а/2

Поэтому, работая с таблицами критерия Стьюдента, неплохо делать про­верку, показывающую для какого распределения (одностороннего или двусто­роннего) они составлены. Так, по табл. П.6

^05;500 = 1,965 ~ Z^1-0,05/2=0,975 = 1,960 ,

следовательно, это двусторонние пределы распределения Стьюдента.

Аналогичная ситуация связана и с функцией СТЬЮДРАС-ПОБР(вероятность;степени_свободы),где вероятность- это вероятность, соответствующая двустороннему распределению Стьюдента.

Пример 3.6. При проверке Ph-метра с помощью эталонного раствора, имеющего Ph=9,0, получены следующие результаты: 8,7; 9,2; 9,1; 9,0; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8, т.е. п = 14. Обладает ли Ph-метр систематиче­ской погрешностью?

Для решения этой задачи предварительно рассчитаем выборочное сред­нее x и выборочное среднеквадратическое отклонение S в предположении, что показания Ph-метра не противоречат нормальному закону распределения и среди них нет грубых погрешностей (см. формулы (3.5), (3.8) и (3.10)):

х = Ух1 => X; = (8,7+ 9,2+ 9,1+ ... + 8,8) = 9,2; nj-f 14j~f 14

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ


Ч-
i-1 j
2 /-1 х

S


/ \ \Х{ -х)

п — 1 п — 1

п / и

Z

2 1 V

(-1 '' v '-1 у

2




14 2 1 X

Z2 1 V
Х- > X.
I \ ^^^

2





14-1


(8,72 +9,22 +9,12... + 8,82)----- (8,7+ 9,2+ 9,1+ ... + 8,8)

2



0,1646;

Sx = +JS2 = ^/0,1646 = 0,4057.

В электронных таблицах Microsoft Excel для подобных расчетов можно было бы воспользоваться следующими тремя статистическими функциями:

СРЗНАЧ(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 9,2;

ДИСП(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 0,164615;

СТАНДОТКПОН(8,7; 9,2; 9,1; 9; 9,4; 9,6; 9,7; 8,9; 8,8; 8,7; 9,8; 9,3; 9,8; 8,8) = 0,4057.

Далее, в соответствии с описанным выше алгоритмом:

1. Выдвигается нулевая гипотеза о том, что математическое ожидание показаний Ph-метра равно Ph эталонного раствора (не имеют систематической погрешности) Н0: Mi= 9 .

2. Альтернативная гипотеза выбирается в виде Иь М^ф 9, поскольку по­казания Ph-метра не должны как завышать, так и занижать истинное значение Ph раствора.

3. Так как значение генеральной дисперсии о2 показаний Ph-метра неиз­вестно, а имеется только ее оценка S2 = 0,1646, то используется t-критерий (распределения Стьюдента).

4. t - статистика имеет вид (см. (3.49))

х- М г-

t =------------- у/П

S

=

9,2-9 0,4057

\14 = 1,84.

5. Выбирается (обычный для большинства технических приложений) уровень значимости а = 0,05.

6. При этом уровне значимости, числе степеней свободы т = п —1 = 13 и для альтернативной гипотезы Н-\\ М-\ ф9 устанавливаются границы критической

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

области по табличным значениям квантилей распределения Стьюдента t0,05;i3 = 2,16 или их можно определить, воспользовавшись функцией СТЬЮДРАС-ПОБР(0,05;13) =2,160368 из электронных таблиц Microsoft Excel.

7. Поскольку рассчитанное значение статистики t = 1,84 не попадает в критическую область (1,84 < 2,16), то нулевая гипотеза принимается в качестве рабочей, т.е. можно считать, что М-\ = 9 (вероятность того, что показания Ph-метра имеют систематическую погрешность меньше чем 0,05).

В задаче сравнения двух неизвестных математических ожиданий M-i и М2 прежде всего рассмотрим ситуацию, когда исследуемые выборки, по которым делаются оценки для Mi и М2, независимы между собой.

Если для двух нормально распределенных генеральных совокупностей с неизвестными параметрами М,, ai2 и М2, аг2 получены независимые выборки

объемом соответственно п-\ и п2, то для сравнения выборочных средних х1 и х2 выдвигается нулевая гипотеза о равенстве математических ожиданий:

1. Но: М,= М2 .

2. При этом можно сформулировать три альтернативных гипотезы:

Н-|(1): М-\ > М2; Н-|(2): М-\ < М2; Hi(3): М-\ ф М2.

3. Как и в рассмотренной выше ситуации сравнения с известным матема­
тическим ожиданием, используется t-критерий.

4. Вид t-статистики зависит от того, равны ai2 = аг2 = а2 либо не равны
а-,2 ф а22 между собой генеральные дисперсии (для ответа на этот вопрос можно
воспользоваться, например, рассмотренным выше критерием Фишера).

В первом случае, когда дисперсии не имеют значимого отличия, стати­стика принимает вид

JC1 —х2

 
S + —
V п1 п2

- двухвыборочный t-критерий с равными дисперсиями, где S - обобщен­ное среднее квадратичное отклонение (см. (3.46)):

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

S



\

(п1 - 1)S12 + (п2 -1)5*2

п1+п2-2

Во втором случае, когда дисперсии значимо отличаются друг от друга,

а-i2 ф а22 , статистика имеет вид

х12

t
 

(3.51)

S12 s22 —- + ^-

\

щ п2

двухвыборочный t-критерий с неравными дисперсиями.

5. В зависимости от условия решаемой задачи выбирается необходимый уровень значимости а.

6. Границы критической области устанавливаются по табличным значе­ниям квантилей t-распределения (см., например, [11] или табл. П.6]) либо их можно определить, воспользовавшись статистической функцией СТЬЮДРАС-ПОБРиз электронных таблиц Microsoft Excel. При этом число степеней свобо­ды т рассчитывается:

для g-i2 = аг2 = а2 как т = п, + п2 - 2;


1 с (1-c)2 щ

2
для о, ф ъ2 =--------- +,гдес

т щ -1 п2 -1 51 s2

+ п1 п2

7. Нулевую гипотезу принимают, т.е. полагают, что Mi = М2 при выполне­нии неравенств:

• для альтернативных гипотез Н/1): М-\> М2 ; Н/2): М-\ < М2 t <t2am\

• для альтернативной гипотезы Н/3': М^ ф М2 t <tam.

Пример 3.7. Проведены испытания механической прочности проб ока­тышей при использовании старой и двух новых технологий их обжига. Холодная прочность окатышей обычно оценивается при испытании на раздавливание (кН/окатыш). Обычно прочность определяют по результатам раздавливания не менее 20 окатышей размером 12-15 мм.

Для иллюстрации процедуры проверки гипотез о числовых значениях математических ожиданий будем предполагать, что имелась возможность ис-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

следовать всего по 8 окатышей для каждой из технологий. Результаты испыта­ний представлены в табл. 3.4.

Таблица 3.4 Результаты испытаний прочности окатышей, изготовленных по разным технологиям, кН/окатыш

Номер окатыша Старая технология х0\ Новая технология, вариант 1 х,\ Новая технология, вариант 2 х х& = Х-п- Х2\
2,11 2,21 2,21
2,12 2,26 2,22 0,04
1,97 2,19 2,08 0,11
2,10 2,21 2,19 0,02
2,17 2,27 2,24 0,03
2,12 2,24 2,21 0,03
1,93 2,14 2,06 0,08
2,28 2,32 2,31 0,01
X 2,10 2,23 2,19 0,04
S2 0,0120 0,003029 0,0068 0,001371

Можно ли по полученным данным сделать вывод, что новая технология по варианту 1 позволяет повысить прочность окатышей?

1. Сформулируем нулевую гипотезу Н0: М,= М0 .

2. Поскольку предполагается, что новая технология по варианту 1 позво­лит повысить прочность окатышей, то альтернативная гипотеза выбирается в виде Н-ь М-\ > М0.

3. Будем считать, что выборки взяты из генеральных совокупностей с
нормальным законом распределения. Для того чтобы определить вариант ста­
тистики для t - критерия, сравним между собой соответствующие дисперсии.
Для этого в качестве нулевой гипотезы примем Н0: gi2 = go2 = а2. В предполо­
жении, что новая технология позволяет также снизить и разброс в значениях
прочности (т.е. иметь и более стабильный технологический процесс), в качест­
ве альтернативной гипотезы примем Н^ gi2 < g02.

Статистика F-критерия (критерия Фишера) при этом равна F=0,0120/0,003029 = 3,96, и для построения критической области при а = 0,05 находим F0,o5;8-i;8-i = 3,79 (по таблицам либо в Microsoft Excel через FPAC-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

ПОБР(0,05;7;7) = 3,787051). Поскольку 3,96 > 3,79, то с вероятностью большей чем 0,95 можно говорить, что gi2 < g02.

4. t - статистика в этом случае должна иметь вид ( см. (3.51))

2,23-2,10
t = . = = 3,00 .

/0,003029 0,0120

J---------- +--------

V88

5. Как обычно, выберем уровень значимости а = 0,05.

6. Для построения критической области рассчитаем число степей свобо­ды:

0,03029

8 1 0,202 (1-0,20)

с = =0,20; =---------- ь---------- = 0,096883; т = 10,3.

0,03029 0,0120 т 8-1 8-1

88 Табличное значение t2*0,o5;io=1,81 (СТЬЮДРАСПОБР(0,1;10) = 1,812462).

7. Поскольку рассчитанное ранее значение статистики попадает в крити­
ческую область 3,00 > 1,81, то нулевая гипотеза Н0: М, = М0 должна быть от­
вергнута, т.е. новая технология по варианту 1 действительно позволяет повы­
сить прочность окатышей.

Вероятность ошибки подобного утверждения (ошибки первого рода, за­ключающейся в том, что отвергают нулевую гипотезу Н0: М, = М0, в то время как в действительности эта гипотеза верна), т.е. уровень значимости а при этом можно оценить как СТЬЮДРАСП(3,00;10;1) = 0,006672. При расчете значения функции распределения Стьюдента в данном случае используется: найденная в пункте 4 статистика t = 3,00; определенное в пункте 6 число степеней свободы т «10 и такой параметр, как число возвращаемых "хвостов" распределения. "Хвосты" = 1, и функция СТЬЮДРАСПвозвращает одностороннее распределе­ние, поскольку была принята односторонняя альтернативная гипотеза H-i: М,> Мо.

Для определения найденного выше значения уровня значимости а = 0,0067 в электронных таблицах в Microsoft Excel может быть использована та­кая статистическая функция, как ТТЕСТ. Она используется для того, чтобы оп-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

ределить, насколько вероятно, что две выборки взяты из генеральных совокуп­ностей, которые имеют одно и то же математическое ожидание:

ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,11;2,12;1,97;2,10;2,17;2,12;1,93 ;2,28};1;3)=0,006459.

В качестве аргументов функции ТТЕСТ, кроме самих выборочных значе­ний (которые стоят в фигурных скобках), используется еще такие два парамет­ра, как "Хвосты" = 1 (для односторонней альтернативной гипотезы) и "Тип" -это вид исполняемого t-теста. В данном случае "Тип" = 3, поскольку необходимо провести двухвыборочный t-тест с неравными дисперсиями. Полученное в дан­ном случае значение t-теста говорит о том, что вероятность равенства матема­тического ожидания прочности окатышей по новой (вариант 1) и старой техно­логии их обжига очень мала (составляет только 0,6%), следовательно, новая технология по варианту 1 действительно является более предпочтительной, чем старая.

В продолжение примера 3.7 ответим на вопрос: есть или нет какое-либо значимое различие между двумя новыми технологиями обжига (по варианту 1 и 2) с точки зрения повышения механической прочности окатышей?

1. В соответствии с общим алгоритмом проверки статистических гипотез сформулируем Н0: Mi = M2.

2. Поскольку предполагается, что обе новые технологии равнозначны между собой, то альтернативная гипотеза выбирается в виде H-i: M^ф M2.

3. Для того чтобы определить тип t - теста, сравним между собой дис­персии Н0: gi2 = G22 = g2 в предположении, что обе новые технологии дают оди­наковый разброс в значениях прочности, альтернативная гипотеза выбирается в виде H-i: g-i2 ^g22.

Статистика критерия Фишера при этом равна F = 0,0068/0,003029 = 2,25 (в числителе критерия Фишера всегда должна стоять большая дисперсия), а

ПОСКОЛЬКУ При О = 0,05 F(0,05/2);8-1;8-1 = 4,99 (СМ. ТЭбл. П.5) И F < F(0,05/2);8-1;8-1 (2,25 <

4,99), то действительно можно считать, что gi2 = g22 = а2.

S - обобщенное среднее квадратичное отклонение тогда будет равно (см.(3.46))

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

/(8 —1)0,003029 +(8 —1)0,0068

S = ,1--------------------------------------- =0,07 .

V8+8-2

4. Поскольку дисперсии не имеют значимого отличия, статистика t - кри­
терия принимает вид (см. (3.50))

2,23-2,19
t =-------- , =1,14 .

г, ъ^ /11

0,07-/—l— V88

5. Выбираем уровень значимости а = 0,05 и определяем число степеней свободы m = 8 + 8 - 2 = 14.

6. Для построения критической области находим табличное значение to,o5;i4=2,15 (СТЬЮДРАСПОБР(0,05;14) = 2,144789).

7. Поскольку рассчитанное ранее значение статистики не попадает в кри­тическую область 1,14 < 2,15, то нулевая гипотеза Н0: Mi = M2 принимается в качестве рабочей, т.е. новые технологии как по варианту 1, так и по варианту 2 равнозначны между собой с точки зрения повышения механической прочности окатышей.

Вероятность ошибки (первого рода) при этом можно оценить величиной СТЬЮДРАСП(1,14;14;2) = 0,272934, т.е. если бы мы в подобных ситуациях от­вергали нулевую гипотезу, то примерно в 27 случаях из 100 мы поступали не­верно. В данном случае "Хвосты" = 2, и функция СТЬЮДРАСПвозвращает двустороннее распределение, поскольку альтернативная гипотеза была приня­та в виде Н-\\ M-\Ф M2, а не в виде Н-ь Mi > M2.

Для определения найденного нами значения уровня значимости а = 0,27 в электронных таблицах Microsoft Excel также могла быть использована функ­ция

ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2, 21;2,06;2,31};2;2)= 0,272934.

В данном случае "Хвосты" = 2 (для двусторонней альтернативной гипоте­зы) и "Тип" = 2, поскольку используется двухвыборочный t-тест с равными дис­персиями.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

И наконец, в задаче сравнения двух неизвестных математических ожида­ний Л/fi и М2 рассмотрим ситуацию, когда исследуемые выборки зависимы меж­ду собой.

t-критерий для зависимых выборок очень полезен в тех довольно часто возникающих на практике ситуациях, когда важный источник внутригрупповой вариации (разброса или ошибки) может быть легко определен и исключен из анализа. Это относится к экспериментам, в которых две сравниваемые группы получены на одной и той же совокупности наблюдений (субъектов), которые тестировались дважды (например, до и после термообработки проката, до и после вакуумирования стали, измерения, производимые на одних и тех же пар­тиях продукции различными методами или различными приборами и т.д.). В подобных экспериментах значительная часть внутригрупповой изменчивости (вариации) в обеих группах может быть объяснена индивидуальными разли­чиями субъектов (различиями в свойствах отдельных прокатанных полос, каж­дой конкретной плавки или партии продукции). Если та же самая выборка тес­тируется дважды, то можно легко исключить эту часть вариации. Вместо иссле­дования каждой группы отдельно можно рассматривать просто разности между двумя измерениями для каждого субъекта (например, анализировать одни и те же плавки "до вакуумирования " и "после вакуумирования "). Вычитая первые значения из вторых (для каждого субъекта: прокатанной полосы, плавки или партии продукции) и анализируя затем только эти "чистые (парные) разности", появляется возможность исключить ту часть вариации, которая является ре­зультатом различия в исходных уровнях индивидуумов. Именно так и проводят­ся вычисления в t-критерии для зависимых выборок. В сравнении с t-критерием для независимых выборок такой подход дает всегда "лучший" результат (кри­терий становится более чувствительным).

Реализация t-критерия для зависимых выборок начинается с того, что строится новая выборка ю п = п-\ = п2 элементов (парные наблюдения), опре­деляемая как разность значений первой и второй выборок: xAi = хц - x2i и по ней

рассчитываются оценки математического ожидания ха и среднеквадратичного отклонения Бд:

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Проверка гипотез о числовых значениях математических ожиданий - student2.ru хА = -^xAi; SA=

'' 1-Х \

--- 7-Z(*A-*A«)2'

1. Выдвигается нулевая гипотеза о том, что математическое ожидание разности равно нулю Н0: Мд = 0.

2. Как и для случая независимых выборок, можно сформулировать три альтернативных гипотезы:

Н-|(1): Л//д > 0; Н-|(2): Мд< 0; Hi(3): М^ф 0;

3. Используется t-критерий для зависимых выборок (парный).

4. Статистика критерия Стьюдента, учитывая, что Мд= 0, примет вид (см. (3.49))

хА - М А г- хА - 0 г- хА г-

SASASA(З-52)

5. В зависимости от условия решаемой задачи выбирается необходимый уровень значимости а. Число степеней свободы для зависимых выборок равно т= п - 1.

6. Границы критической области устанавливаются в зависимости от вида альтернативной гипотезы по значениям квантилей распределения Стьюдента t

a; m ИЛИ t2а; т-

7. Нулевую гипотезу принимают, т.е. полагают, что Мд = 0 при выполне­
нии неравенств:

• для альтернативных гипотез Н/1): Л//д > 0; Н/2): Мд< 0 t <t2am\

• для альтернативной гипотезы Н/3': Маф 0

Еще раз обратимся к числовому материалу примера 3.7 и переформули­руем условия задачи таким образом, чтобы как по варианту 1, так и по варианту 2 были приведены данные для одной и той же новой технологии, полученные дважды на одних и тех же партиях окатышей, но измерения прочности выпол­нены по двум различным методикам.

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Можно ли сказать, что результаты измерения прочности, полученные для новой технологии по различным методикам на одних и тех же партиях окаты­шей, не имеют значимого различия?

Поскольку при таких условиях задачи выборки по варианту 1 и 2 стано­вятся зависимыми друг от друга (значения прочности окатышей по каждой из восьми партий произведены дважды, но про разным методикам), то для реше­ния необходимо воспользоваться описанным выше парным t-критерием.

Рассчитанные значения хд, ха и S2д приведены в табл. 3.4 (см. послед­ний столбец).

SA = д/0,001371 = 0,037 .

1. Выдвигаем нулевую гипотезу Н0: Mд = 0.

2. Поскольку между двумя методиками не предполагается никакого раз­личия, то альтернативную гипотезу выбираем в виде H1: Mд ф 0

3. Используется t-критерий для зависимых выборок (парный).

4. Статистика критерия Стьюдента в этом случае представляет собой

хА г- 0,04 /-

t - —^ ■ у1п---------- V8 = 3,055.

SA 0,037

5. Выбираем уровень значимости а = 0,05 и определяем число степеней
свободы т = 8 - 1 = 7.

6. Для построения критической области находим табличное значение t0,05;7=2,37 (СТЬЮДРАСПОБР(0,05;7) = 2,364623).

7. Поскольку рассчитанное ранее значение статистики попадает в крити­ческую область 3,06 > 2,37, то нулевая гипотеза Н0: M 1 = 0 отвергается, и в ка­честве рабочей необходимо принять альтернативную H1: Mд^ 0, т.е. методики определения прочности по варианту 1 и по варианту 2 дают значимо различные результаты на одних и тех же партиях и для одной и той же новой технологии отжига окатышей.

Вероятность ошибки первого рода при этом составляет ("Хвосты" = 2, по­скольку H1: M1 ф 0) СТЬЮДРАСП(3,055;7;2) = 0,018453, т.е., отвергая в анало-

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

гичных условиях нулевую гипотезу, мы примерно только в одном или двух слу­чаях из 100 будем допускать ошибку.

Найденная оценка а = 0,018 в электронных таблицах Microsoft Excel мо­жет быть рассчитана с использованием функции ТТЕСТ.

ТТЕСТ({2,21;2,26;2,19;2,21;2,27;2,24;2,14;2,32};{2,21;2,22;2,08;2,19;2,24;2,21;2,06 ;2,31};2;1)= 0,018452.

Последний параметр в этой функции "Тип" = 1 (парный t-тест).

Если сравнить результаты, полученные в примере 3.7 по t-тесту на двух совершенно одинаковых выборках (вариант 1 и 2) при условии, что эти выборки независимы (двухвыборочный t-тест с равными дисперсиями) и зависимы (пар­ный t-тест), то можно увидеть, что они дают совершенно противоположные ре­зультаты. Когда на выборки по варианту 1 и 2 мы смотрели как на независи­мые, мы не видели различия в их математических ожиданиях, но при условии зависимости в математических ожиданиях удалось установить значимые рас­хождения. Этот числовой материал подтверждает ранее уже высказанное по­ложение о том, что t-критерий для зависимых выборок является более чувстви­тельным.

Поскольку методика парного t-теста полностью повторяет алгоритм срав­нения неизвестного математического ожидания Mi с конкретным числовым зна­чением M, то статистическая функция ТТЕСТ в электронных таблицах Microsoft Excel применима и для решения задач о соответствии полученного в экспери­менте выборочного среднего xi известному математическому ожиданию.

Так, для примера 3.6 (о наличии погрешности в показаниях Ph-метра). ТТЕСТ({8,7;9,2;9,1;9;9,4;9,6;9,7;8,9;8,8;8,7;9,8;9,3;9,8;8,8};{9;9;9;9;9;9;9;9;9;9;9;9;9 ;9};2;1) = 0,088025, что при найденном в этом примере значении статистики t = 1,84, числе степеней свободы m = 14 - 1 = 13 и альтернативной гипотезе Н^ M ф 9 ("Хвосты" = 2) соответствует СТЬЮДРАСП(1,84;13;2) = 0,088706. Получен­ное значение функции ТТЕСТ говорит о том, что вероятность наличия

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

систематической погрешности у Ph-метра может быть оценена величиной 1 -0,089 = 0,91 (меньшей, чем 0,95, значения которого мы закладывали, выбирая уровень значимости а = 0,05).

В заключение этого раздела еще раз подчеркнем, что все перечисленные выше критерии могут быть использованы только для случайных величин, не противоречащих нормальному закону распределения (закону распределения Гаусса). Так, например, применительно к t-критерию для зависимых выборок это означает, что попарные разности должны быть нормально распределены. Если это предположение не выполняется (о том, как его можно проверить, смотри следующий раздел), то необходимо воспользоваться одним из альтернативных непараметрических критериев (см. например, [10]).

Наши рекомендации