Достоверность различий средних величин
Для выявления различий между группами (переменными) необходимо провести проверку статистических гипотез о равенстве генеральных средних. Для проверки одной и той же гипотезы могут быть использованы разные статистические критерии. Наибольшей популярностью при проверке гипотез о равенстве генеральных средних (математических ожиданий) пользуется t-критерий Стьюдента (t-критерий различия).
Разберем пример применения пакета Анализ данных для определения t-критерия двух выборок.
Критерий Стьюдента (t) – наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности». Критерий позволяет найти вероятность того, что оба средних относятся к одной и той же совокупности. Если эта вероятность р ниже уровня значимости (р<0,05), то принято считать, что выборки относятся к двум разным совокупностям.
При использовании t-критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная и опытная группа, состоящие, например, из разных пациентов, количество которых в группах может быть различно.
Во втором же случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный t-критерий. Выборки при этом называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения.
В обоих случаях в принципе должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп и равенства дисперсий в сравниваемых совокупностях. Тем не менее, применение t-критерия Стьюдента для двух групп часто бывает сложным, так как достоверно проверить эти условия не всегда является возможным.
Для работы с t-критериями необходимо выполнить команды:
1. Данные – Анализ данных.
2. В появившемся списке Инструменты анализа выбрать необходимую строку t-теста:
Рисунок 1- Функция анализ данных
3. В появившемся окне указать Интервалы переменной 1, 2 и Выходной диапазон:
Рисунок 2- Окно «Двухвыборочный t- тест с одинаковыми дисперсиями»
4. Нажать кнопку ОК.
Пример 1. Позволяют ли приводимые ниже данные утверждать, что Нифедипин влияет на диаметр коронарных артерий
Диаметр коронарной артерии, мм | |
Плацебо | Нифедипин |
2,5 | 2,5 |
2,2 | 1,7 |
2,6 | 1,5 |
2,0 | 2,5 |
1,8 | 1,4 |
2,4 | 1,9 |
2,3 | 2,3 |
2,7 | 2,0 |
2,7 | 2,6 |
1,9 | 2,3 |
2,1 | 2,2 |
Вводим входные данные и нажимаем ОК. Получаем результат (Рис.3)
Рисунок 3- Параметры вывода
Из таблицы можно видеть, что достоверных различий между плацебо и нифедипином нет - р=0,199>0,05 (Р (T<=t) двухстороннее). Нифедипин не влияет на диаметр коронарных артерий (Рис.3).
Пакет Statisticа
Для решения этой задачи в стартовом окне модуля Основные статистики/таблицы (Basic s and Tables) выбираем раздел t-критерий для независимых выборок (t-test for independent, by variables). В появившемся начальном окне нажимаем кнопку Переменные (Variables;) и в появившемся окне в поле Группирующая переменная (Grouping variable:) указываем «плацебо», а в поле Зависимые переменные (Dependent variables:) – «Нифедипин».
Далее, нажав кнопку T-тест (Summary: T-tests) получаем результирующую таблицу.
Рисунок 4 - t-test independent,by variables
Рисунок 4 – Параметры вывода ( пример 3)
Интерпретация результатов. Обычно при сравнении двух выборок делается предварительное предположение (нулевая гипотеза), что средние выборок равны между собой. Если полученное в результате использования t-критерия р-значение меньше уровня значимости р<0,05, то исходное предположение отвергается, и средние выборок считаются достоверно отличающимися друг от друга. Это следует из того, что вероятность реализации нулевой гипотезы мала (р < 0,05). Наиболее важным в этой таблице является уровень значимости р (6-й столбец). Из таблицы можно видеть, что достоверных различий между плацебо и Нифедипином нет - р=0,199 > 0,05. Препарат «Нифедипин» не влияет на диаметр коронарных артерий (Рис.4).
Пакет обработки и анализа социологических данных SPSS –
Statistical Package for Social Science
Пакет обработки и анализа социологических данных SPSS - Statistical Package for Social Science. Пакет содержит все основные разделы анализа данных, и во многих зарубежных и отечественных университетах является базовым для преподавания анализа данных студентам гуманитарного направления.
Структура пакета: включает в себя команды определения данных, преобразования данных, команды выбора объектов.
Рисунок 5 – Ввод переменных в SPSS
Рисунок 6 – База данных в SPSS
Рисунок 7 – Параметры вывода в SPSS
Наиболее важным в этой таблице является уровень значимости р (6-й столбец). Из таблицы можно видеть, что достоверных различий между плацебо и Нифедипином нет - р=0,199 > 0,05. Нифедипин не влияет на диаметр коронарных артерий (Рис.7).