Двухвыборочный t-тест для средних. Технология работы

Часто в медицинских исследованиях требуется оценить достоверность различий между двумя выборками. Это могут быть выборки из разных совокупностей (например, сравнение опытной и контрольной групп), а также выборки из одной совокупности (например, исследование какого-либо параметра в одной выборке до и после проведения эксперимента).

Двухвыборочный t-тест проверяет равенство средних значений генеральной совокупности по каждой выборке. Расчет проводится по формуле: Двухвыборочный t-тест для средних. Технология работы - student2.ru В пакете статистического анализа Excel реализовано три варианта использования t-теста: равные дисперсии генерального распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.

Режимы работы «Двухвыборочный t-тест с одинаковыми дисперсиями» и «Двухвыборочный t-тест с различными дисперсиями» служат для проверки гипотез о различии между средними (математическими ожиданиями) двух нормальных распределений соответственно с неизвестными, но равными дисперсиями ( Двухвыборочный t-тест для средних. Технология работы - student2.ru ) и с неизвестными дисперсиями, равенство которых не предполагается.

Параметры, задаваемые для расчетов, отображены на рисунке 17.

Двухвыборочный t-тест для средних. Технология работы - student2.ru Двухвыборочный t-тест для средних. Технология работы - student2.ru

Рис. 17

Пример. На рабочем листе Microsoft Excel сформирована таблица, отражающая расход в граммах (на 100 м2 площади) на дезинфекцию отделений с использованием старого и нового дезинфицирующего препарата (рис. 18).

Двухвыборочный t-тест для средних. Технология работы - student2.ru

Рис. 18

При уровне значимости α = 0,05 требуется проверить гипотезу H0: ах= ау, предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения: 1) с одинаковыми дисперсиями Двухвыборочный t-тест для средних. Технология работы - student2.ru и Двухвыборочный t-тест для средних. Технология работы - student2.ru ; 2) с различными дисперсиями Двухвыборочный t-тест для средних. Технология работы - student2.ru и Двухвыборочный t-тест для средних. Технология работы - student2.ru .

Для проверки предположения 1 используем режим работы «Двухвыборочный t-тест с одинаковыми дисперсиями», а для проверки предположения 2 - «Двухвыборочный t-тест с различными дисперсиями». Значения параметров, установленных в одноименных диалоговых окнах, представлены на рис. 19, а рассчитанные в этих режимах показатели — в табл. 20 соответственно.



Двухвыборочный t-тест для средних. Технология работы - student2.ru  
Двухвыборочный t-тест для средних. Технология работы - student2.ru
Рис. 19
Двухвыборочный t-тест для средних. Технология работы - student2.ru Двухвыборочный t-тест для средних. Технология работы - student2.ru
Рис. 20

Так как и в первом, и во втором варианте расчета показатели t-статистики = 4,04 и 4,17 соответственно превышали t - критическое = 2,09 то гипотезу H0: аху отвергаем, т. е. при переходе на новый дезинфицирующий препарат происходит уменьшение его среднего расхода на обработку 100 м2.

Рассмотренные выше процедуры сравнения двух выборок часто применяются для обнаружения результата какого-либо воздействия либо, напротив, для подтверждения его отсутствия. Чем более однородными окажутся выбранные для эксперимента объекты (для контроля и воздействия), чем меньше их случайные различия, тем точнее можно будет дать ответ на поставленный вопрос. Ясно, что различие между объектами, выбранными для воздействия и для контроля (или для двух разных воздействий, если интерес представляет их сопоставление), будет наименьшим, если в обоих качествах выступает один и тот же объект.

Если это возможно, то далее обычным порядком составляется группа экспериментальных объектов и затем для каждого объекта измеряются два значения интересующей нас характеристики (например, до воздействия и после или при двух разных воздействиях). Так возникают пары наблюдений или парные данные.

Пусть xi и yi — результаты измерений для объекта номер i, i = 1, ..., n, где n - численность экспериментальной группы (число объектов). Тогда совокупность пар случайных величин (x1, y1)..., (xn … уn) образует парные данные. Как обычно, все наблюдения будем считать реализациями случайных величин и предполагать, что методика эксперимента обеспечивает их независимость для разных объектов. Но наблюдения, входящие в одну пару, нельзя считать независимыми, поскольку они относятся к одному и тому же объекту. Эти два наблюдения отражают свойства общего для них индивидуального объекта и потому могут зависеть друг от друга. Для пар наблюдений (x1, y1) введем величину zi =у,- x1, которую будем считать независимой и нормально распределенной. Тем самым задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии.

Режим работы «Парный двухвыборочный t-тест для средних» служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений на основе парных выборочных данных. При этом равенство дисперсий генеральных совокупностей не предполагается ( Двухвыборочный t-тест для средних. Технология работы - student2.ruДвухвыборочный t-тест для средних. Технология работы - student2.ru ). В диалоговом окне данного режима задаются параметры, аналогичные параметрам, задаваемым выше.

Пример. Проводили клинический эксперимент. Измеряли артериальное давление у группы пациентов в начале лечения препаратом и в конце. Исходные данные и результаты расчетов приведены в таблице, сформированной в MS Excel (рис. 21). Требовалось проверить, повлиял ли препарат на уровень артериального давления.

Двухвыборочный t-тест для средних. Технология работы - student2.ru Двухвыборочный t-тест для средних. Технология работы - student2.ru

Рис. 21

Как видно из результатов расчета показатель t-статистики =0,96 превышал t - критическое = 2,26, поэтому гипотезу H0ху принимаем, т. е. действие препарата не привело к уменьшению средних параметров давления.

Наши рекомендации