Двухвыборочный t-тест для средних. Технология работы
Часто в медицинских исследованиях требуется оценить достоверность различий между двумя выборками. Это могут быть выборки из разных совокупностей (например, сравнение опытной и контрольной групп), а также выборки из одной совокупности (например, исследование какого-либо параметра в одной выборке до и после проведения эксперимента).
Двухвыборочный t-тест проверяет равенство средних значений генеральной совокупности по каждой выборке. Расчет проводится по формуле: В пакете статистического анализа Excel реализовано три варианта использования t-теста: равные дисперсии генерального распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.
Режимы работы «Двухвыборочный t-тест с одинаковыми дисперсиями» и «Двухвыборочный t-тест с различными дисперсиями» служат для проверки гипотез о различии между средними (математическими ожиданиями) двух нормальных распределений соответственно с неизвестными, но равными дисперсиями ( ) и с неизвестными дисперсиями, равенство которых не предполагается.
Параметры, задаваемые для расчетов, отображены на рисунке 17.
Рис. 17
Пример. На рабочем листе Microsoft Excel сформирована таблица, отражающая расход в граммах (на 100 м2 площади) на дезинфекцию отделений с использованием старого и нового дезинфицирующего препарата (рис. 18).
Рис. 18
При уровне значимости α = 0,05 требуется проверить гипотезу H0: ах= ау, предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения: 1) с одинаковыми дисперсиями и ; 2) с различными дисперсиями и .
Для проверки предположения 1 используем режим работы «Двухвыборочный t-тест с одинаковыми дисперсиями», а для проверки предположения 2 - «Двухвыборочный t-тест с различными дисперсиями». Значения параметров, установленных в одноименных диалоговых окнах, представлены на рис. 19, а рассчитанные в этих режимах показатели — в табл. 20 соответственно.
Рис. 19 |
Рис. 20 |
Так как и в первом, и во втором варианте расчета показатели t-статистики = 4,04 и 4,17 соответственно превышали t - критическое = 2,09 то гипотезу H0: ах=ау отвергаем, т. е. при переходе на новый дезинфицирующий препарат происходит уменьшение его среднего расхода на обработку 100 м2.
Рассмотренные выше процедуры сравнения двух выборок часто применяются для обнаружения результата какого-либо воздействия либо, напротив, для подтверждения его отсутствия. Чем более однородными окажутся выбранные для эксперимента объекты (для контроля и воздействия), чем меньше их случайные различия, тем точнее можно будет дать ответ на поставленный вопрос. Ясно, что различие между объектами, выбранными для воздействия и для контроля (или для двух разных воздействий, если интерес представляет их сопоставление), будет наименьшим, если в обоих качествах выступает один и тот же объект.
Если это возможно, то далее обычным порядком составляется группа экспериментальных объектов и затем для каждого объекта измеряются два значения интересующей нас характеристики (например, до воздействия и после или при двух разных воздействиях). Так возникают пары наблюдений или парные данные.
Пусть xi и yi — результаты измерений для объекта номер i, i = 1, ..., n, где n - численность экспериментальной группы (число объектов). Тогда совокупность пар случайных величин (x1, y1)..., (xn … уn) образует парные данные. Как обычно, все наблюдения будем считать реализациями случайных величин и предполагать, что методика эксперимента обеспечивает их независимость для разных объектов. Но наблюдения, входящие в одну пару, нельзя считать независимыми, поскольку они относятся к одному и тому же объекту. Эти два наблюдения отражают свойства общего для них индивидуального объекта и потому могут зависеть друг от друга. Для пар наблюдений (x1, y1) введем величину zi =у,- x1, которую будем считать независимой и нормально распределенной. Тем самым задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии.
Режим работы «Парный двухвыборочный t-тест для средних» служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений на основе парных выборочных данных. При этом равенство дисперсий генеральных совокупностей не предполагается ( ≠ ). В диалоговом окне данного режима задаются параметры, аналогичные параметрам, задаваемым выше.
Пример. Проводили клинический эксперимент. Измеряли артериальное давление у группы пациентов в начале лечения препаратом и в конце. Исходные данные и результаты расчетов приведены в таблице, сформированной в MS Excel (рис. 21). Требовалось проверить, повлиял ли препарат на уровень артериального давления.
Рис. 21
Как видно из результатов расчета показатель t-статистики =0,96 превышал t - критическое = 2,26, поэтому гипотезу H0:ах=ау принимаем, т. е. действие препарата не привело к уменьшению средних параметров давления.