Правило принятия решения при использовании модифицированного критерия Стьюдента.

По таблице критических точек распределения Стьюдента (или вычисляется в Excel) для заданного уровня значимости a и числа степеней свободы распределения Стьюдента, равного

k=n-1, (4.7)

находится критическая точка двусторонней критической области ta(k). Это значение сравнивается с наблюдаемым значением критерия Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru :

· если Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru <ta(k), то нет оснований отвергнуть основную гипотезу, то есть результаты измерений различаются незначимо;

· если Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru ³ta(k), то основная гипотеза отвергается, то есть различие между результатами измерений признается существенным, систематическим.

Сравнение средних двух зависимых выборок в Excel.

Проверка значимости различия между результатами попарно зависимых измерений по модифицированному критерию Стьюдента (4.5) осуществляется в Excel с помощью инструмента анализа Парный двухвыборочный t-тест для средних. Для его вызова следует выполнить команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выбрать инструмент Парный двухвыборочный t-тест для средних и нажать ОК. В появившемся диалоговом окне с названием выбранного инструмента анализа порядок заполнения точно такой же, как и в диалоговых окнах для t-тестов независимых выборок, описанных в предыдущем параграфе. После заполнения всех необходимых полей этого окна и нажатия на кнопку ОК появится таблица с названием Парный двухвыборочный t-тест для средних,в которой будут содержаться результаты вычислений.

Данный тест вычисляет средние и дисперсии обеих выборок, их объемы, коэффициенты корреляции (в строке: Корреляция Пирсона), число степеней свободы (4.7) (в строке: df), наблюдаемое значение модифицированного критерия Стьюдента (4.5) (в строке: t-статистика), остальные строки называются также как и в таблицах t-тестов независимых выборок, описанных в предыдущем параграфе.

Вычисленное в этом тесте наблюдаемое значение критерия (4.5), находящееся в строке t-статистика, сравнивается с критической точкой распределения Стьюдента, находящееся в строке t критическое двухстороннее (для двухсторонней критической области), а затем принимается решение согласно указанному выше правилу.

Практические задания

5.1. Оценка значимости результатов наблюдений в случае двух независимых выборок

Исследуется результат действия нового препарата на зрительную память человека. В одной группе испытуемых препарат не вводился, а в контрольной группе тест проведен после ведения данного препарата. Результаты теста в первой группе (хi) и в контрольной группе (уi) выглядят следующим образом:



хi
уi

Установить с уровнем значимости a=0,05, влияет ли данный препарат на зрительную память?

Для выполнения этого задания проделайте следующие пункты.

1. Наберите исходные данные в две колонки: Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru - в столбец А, Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru - в столбец В.

2. Сначала следует проверить гипотезу о равенстве генеральных дисперсий по критерию Фишера. Для этого выполните команду Сервис®Анализ данных.

3. В появившемся диалоговом окне Анализ данных выберите среди инструментов анализа необходимый в данном случае Двухвыборочный F-тест для дисперсии и нажмите ОК.

4. В появившемся диалоговом окне Двухвыборочный F-тест для дисперсии поместите курсор в поле Интервал переменной 1 и введите в него адрес интервала ячеек с данными Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru А1:А12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится автоматически в поле, где находится курсор.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru В1:В12 или выделите интервал ячеек с этими данными мышью, тогда адрес выделенного диапазона ячеек появится в поле, где находится курсор.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа установлено значение 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле ввода справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в этом поле. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями критерия Фишера. Сразу, не сбрасывая выделения с этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины.

Полученная таблица должна иметь вид:



Двухвыборочный F-тест для дисперсии  
Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения
df
F 1,153558052  
P(F<=f) одностороннее 0,408471047  
F критическое одностороннее 2,817927225  

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся их вычисленные значения для переменных хi и уi.

10. Из полученной таблицы следует, что средние Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =10,16666667; Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =8,25 (Среднее); исправленные дисперсии Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =2,333333333; Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =2,022727273 (Дисперсия); объемы выборок (Наблюдения) n=12; числа степеней свободы (4.2) распределения Фишера (df) kх=11 и kу=11; наблюдаемое значение критерия Фишера (F) Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,153558052; критические точки распределения Фишера для заданного уровня значимости a=0,05 правосторонней критической области (F критическое одностороннее) Fa(kх, kу)=2,817927225; вероятность того, что наблюдаемое значение критерия не попало в правостороннюю критическую область (P(F<=f) одностороннее)P( Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru <Fa)=0,408471047.

11. Воспользовавшись правилом принятия решения из §5.2. для критерия Фишера в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,15<2,815=F0,05(11;11), то нет оснований отвергнуть основную гипотезу, то есть разница дисперсий генеральных совокупностей является статистически недостоверной (незначимой).

12. Теперь следует сравнить средние двух выборок. Поскольку с помощью F-теста установлено, что различие между дисперсиями этих выборок статистически недостоверно, то для сравнения средних следует использовать инструмент анализа Двухвыборочный t-тест с одинаковыми дисперсиями.

13. Для его вызова выполните команду Сервис®Анализ данных, выделите нужный инструмент и нажмите ОК.

14. В появившемся диалоговом окне Двухвыборочный t-тест с одинаковыми дисперсиями заполните все необходимые поля точно также, как и в предыдущем случае в окне Двухвыборочный F-тест для дисперсии за исключением того, что в группе Параметры вывода в поле Выходной интервал укажите адрес ячейки С12.

15. После заполнения всех необходимых полей (оставьте пустым поле гипотетическая разность и не активизируйте переключатель метка), нажмите на ОК. В результате выполнения t-теста должна появиться таблица:

Двухвыборочный t-тест с одинаковыми дисперсиями
Переменная 1 Переменная 2
Среднее 10,16666667 8,25
Дисперсия 2,333333333 2,022727273
Наблюдения
Объединенная дисперсия 2,178030303  
Гипотетическая разность средних  
df  
t-статистика 3,181194744  
P(T<=t) одностороннее 0,002159563  
t критическое одностороннее 1,717144187  
P(T<=t) двухстороннее 0,004319126  
t критическое двухстороннее 2,073875294  

17. Структура этой таблицы примерно такая же, как и таблицы, появившейся после выполнения F-теста. После t-теста с одинаковыми дисперсиями, помимо выборочных средних и исправленных дисперсий выборок, вычисляются: дисперсия генеральной совокупности (Объединенная дисперсия) s2=2,178030303; число степеней свободы (4.4) распределения Стьюдента (df) k=22; наблюдаемой значение (4.3) критерия Стьюдента (t-статистика) Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =3,181194744; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,717144187 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,073875294; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru <ta)=0,002159563 и в двухстороннюю (P(T<=t) двухстороннее) P(½ Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru ½<ta)=0,004319126 критические области.

18. Воспользовавшись правилом принятия решения из §5.3. для критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =3,18>2,07=t0,05(22), то основная гипотеза отвергается. Это означает, что по измеряемому показателю новый препарат оказывает влияние на зрительную память.

5.2. Сравнение выборочных средних двух зависимых выборок

В результаты семилетних испытаний ячменя и овса на урожайность получены следующие данные:

xi 7,7 9,0 9,4 7,4 7,4 10,9 8,0
yi 8,26 7,22 8,43 5,57 6,35 8,00 9,13

где xi – урожайность ячменя в ц/га и yi – урожайность овса в ц/га в i-ом году. Установить, являются ли эти результаты существенно различными?

Для выполнения этого задания проделайте следующие пункты.

1. Занесите исходные данные в две колонки: xi - в столбец А, yi -в столбец В.

2. Поскольку результаты испытаний связаны попарно, то следует использовать модифицированный критерий Стьюдента (парный t-тест для средних).

3. Выполните команду Сервис®Анализ данных. В появившемся диалоговом окне Анализ данных выберите среди Инструментов анализа необходимый в данном случае Парный двухвыборочный t-тест для средних и нажмите ОК.

4. В появившемся диалоговом окне Парный двухвыборочный t-тест для средних в группе Входные данные поместите курсор в поле Интервал переменной 1. Затем введите адрес интервала ячеек с данными xi A1:A7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

5. Поместите курсор в поле Интервал переменной 2. Затем введите адрес интервала ячеек с данными уi В1:В7, или выделите интервал с этими данными мышью, тогда адрес выделенного диапазона появится автоматически.

6. Проверьте, установлен ли необходимый вам уровень значимости a. По умолчанию в поле Альфа находится 0,05.

7. В группе Параметры вывода активизируйте переключатель Выходной интервал и поместите курсор в ставшее активным (белым) поле справа от него. Затем щелкните мышью по ячейке С1, тогда ее адрес появится в поле Выходного интервала. Нажмите ОК.

8. В результате появится таблица с вычисленными значениями выборочных средних, дисперсии, коэффициента корреляции и модифицированного критерия Стьюдента. Сразу, не сбрасывая выделения этой таблицы, выполните команду Формат®Столбец®Автоподбор ширины. Полученная таблица должна иметь вид:

Парный двухвыборочный t-тест для средних  
Переменная 1 Переменная 2
Среднее 8,542857143 7,565714286
Дисперсия 1,686190476 1,574161905
Наблюдения
Корреляция Пирсона 0,393061395  
Гипотетическая разность средних  
df  
t-статистика 1,83746639  
P(T<=t) одностороннее 0,057891988  
t критическое одностороннее 1,943180905  
P(T<=t) двухстороннее 0,115783975  
t критическое двухстороннее 2,446913641  

9. В первой колонке этой таблицы находятся названия статистических характеристик, вычисленных данным Инструментом анализа. Во второй и третьей колонках содержатся вычисленные значения соответствующих статистических характеристик для переменных хi и уi.

10. Из полученной таблицы следует, что средние Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =8,542857143; Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =7,565714286; исправленные дисперсии Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,686190476; Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,574161905; число наблюдений n=7; коэффициент корреляции (Корреляция Пирсона) rв=0,393061395; число степеней свободы (4.7) распределения Стьюдента (df) k=6; наблюдаемой значение (4.5) модифицированного критерия Стьюдента (t-статистика) Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,83746639; критические точки распределения Стьюдента для заданного уровня значимости a=0,05 правосторонней критической области (t критическое одностороннее) ta(k)=1,943180905 и двусторонней критической области (t критическое двухстороннее) ta(k)=2,446913641; вероятности того, что наблюдаемое значение критерия не попало соответственно в правостороннюю (P(T<=t) одностороннее) P( Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru <ta)=0,057891988 и в двухстороннюю (P(T<=t) двухстороннее) P(½ Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru ½<ta)=0,115783975 критические области.

11. Воспользовавшись правилом принятия решения из §5.4. для модифицированного критерия Стьюдента в случае двусторонней критической области, можно сделать вывод: поскольку выполняется соотношение Правило принятия решения при использовании модифицированного критерия Стьюдента. - student2.ru =1,84<2,45=t0,05(6), то нет оснований отвергнуть основную гипотезу, то есть различие между ежегодной урожайностью ячменя и овса является статистически недостоверной (незначимой).

Задания для самостоятельного выполнения

1. Для сравнения точности двух станков-автоматов взяты две выборки. Результаты измерения контролируемого размера изделий

хi 1,08 1,1 1,12 1,14 1,15 1,25 1,36 1,38 1,4 1,42
уi 1,11 1,12 1,18 1,22 1,33 1,35 1,36 1,38    

Можно ли считать с уровнем значимости a=0,1, что станки обладают одинаковой точностью? (Сравнить дисперсии).

2. В результате контрольных замеров содержания углерода в пробах нелегированной стали данной марки, производимой двумя предприятиями, получены данные:

хi 0,18 0,12 0,12 0,08 0,08 0,12 0,19 0,32 0,27
уi 0,16 0,09 0,08 0,05 0,13 0,10 0,14 0,30 0,31

где хi и уi - процентное содержание углерода в каждой пробе стали, произведенной соответственно на первом и втором предприятиях. Установить, значимо ли различается содержание углерода в нелегированной стали данной марки, производимой на этих предприятиях. (Сначала сравнить дисперсии, а затем средние).

3. Две экспертные группы проводили контрольные замеры процентного содержания азота в органических удобрениях:

первая группа 9,29 9,28 9,35 9,43 9,41 9,34
вторая группа 9,53 9,48 9,61 9,68 9,55  

Установить, является ли значимым различие контрольных замеров этих групп. (Сначала сравнить дисперсии, а затем средние).

4. С целью улучшения успеваемости студентов была разработана новая методика обучения основам менеджмента. Для проверки ее эффективности проводилось тестирование двух параллельных групп 1 курса (группы подобраны таким образом, что результаты тестирования до начала эксперимента в них были одинаковы, т.е. средний уровень успеваемости в этих группах одинаков). В первой группе новая методика обучения не применялась, а во второй группе обучение по этой методике проводилось в течение месяца. После данного периода обучения проведено тестирование, итоги которого имеют вид:

хi
уi

где хi - количество набранных каждым студентом баллов по тесту в первой группе и уi - во второй после периода обучения по новой методике. Установить, улучшилась ли успеваемость студентов после обучения по новой методике. (Сначала сравнить дисперсии, а затем средние).

5. Проведено исследование для определения влияния использования Internet на общую успеваемость студентов. В одной группе студентов в течение периода исследования студентам запрещалось пользоваться возможностями Internet, а в другой предлагалось ежедневно пользоваться средствами Internet не менее двух часов. После этого в обеих группах проведено тестирование, результаты которого имеют вид:

хi    
уi

где хi и уi – результаты теста в баллах соответственно в первой и второй группах. Для уровня значимости a=0,02 установить, повлияло ли использование возможностей Internet на общую успеваемость в этих группах и в какую сторону? (Сначала сравнить дисперсии, а затем средние).

6. Лаборант при помощи двух различных приборов произвел в одном и том же порядке измерение дозы (в %) поглощенного излучения в пробах крови подопытного животного:

xi
yi

где xi - результаты измерений, полученные при помощи первого прибора, уi - результаты измерений, полученные при помощи второго прибора. Оценить, значимо ли различаются результаты измерений при помощи двух различных проборов. (Сравнить средние парным t-тестом).

7. В лаборатории в одном и том же порядке двумя разными методами произведен анализ процентного содержания некоторого вещества в костной ткани:

xi
yi

где xi - результаты измерения первым методом, уi - результаты измерения вторым методом. Сравнить два метода исследования. (Сравнить средние парным t-тестом).

Контрольные вопросы

1. Что называется статистической гипотезой, нулевой, альтернативной гипотезой? Какие бывают виды альтернативных гипотез?

2. Какие бывают виды ошибок при проверки статистических гипотез и что называется уровнем значимости?

3. Что такое статистический критерий?

4. Что называется критической областью и какие они бывают?

5. Сформулируйте основное правило принятия решения.

6. Что такое критерий Фишера, для чего он предназначен. Какое правило принятия решения для него?

7. Опишите последовательность действий для проведения F-теста в Excel.

8. Что такое критерий Стьюдента, для чего он предназначен, что нужно учитывать перед вычислениями критерия Стьюдента?

9. Какое правило принятия решения для критерия Стьюдента?

10. Опишите последовательность действий для проведения t-тестов в Excel и структуру появляющихся после этого таблиц с результатами.

11. В каком случае применяется модифицированный критерий Стьюдента? Сформулируйте правило принятия решения для этого критерия.

12. Опишите последовательность действий при проведении парного t-теста в Excel и структуру появляющейся после этого таблицы с результатами.

Рекомендуемая литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высш. Шк. 2000.

2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высш. Шк. 2000.

3. Кремер Н.Ш. Теория вероятностей и математическая статистика. М.: Юнити, 2001.

4. Лакин Г.Ф. Биометрия. М.: Наука, 1980.

5. Бейли Н. Математика в биологии и медицине. Пер. с англ. М.: Мир, 1970.

6. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория вероятностей и математическая статистика. М.: Высш. Шк., 1991.

7. Боровков А.А. Теория вероятностей. М.: Наука, 1984.

8. Вентцель Е.С. Теория вероятностей. М.: Наука, 2000.

9. Гнеденко Б.В. Курс теории вероятностей. М.: Наука, 1988.

10. Гутер Р.С., Овчинский Б.В. Основы теории вероятностей. М., Просвещение, 1967.

11. Блатнер Патрик, Лори Анн Ульрих. Использование Microsoft Excel 2000. М.: Вильямс, 2000.

12. Додж М., Стинсон К. Эффективная работа с Excel 2000. С-П., 2000.

13. Уокенбах Дж. Microsoft Excel 2000. Библия пользователя. М.: Вильямс, 2000.

14. Рычков В. Самоучитель Excel 2000. С-П., 2000.

15. Кузьмичева Т.Г., Савотченко С.Е. Новые информационные технологии: электронные таблицы Excel. Белгород: Белаудит, 2000..

Наши рекомендации