VIII. Дисперсионный анализ
Трудно представить любое медицинское исследование (социально-гигиеническое, гигиеническое, клиническое, экспериментальное и др.), в котором не ставилась бы в той или иной мере задача определения силы влияния различных факторов на размеры изучаемого признака. Определяя различия средних арифметических двух выборочных групп наблюдения путем расчета критерия Стьюдента t, который позволяет выявить статистическую значимость разницы средних, исследователь подразумевает, как само собой разумеющееся, что группы исследуемых совершенно однородны и отличаются только по одному какому-то признаку или методу воздействия на них.
Между тем на практике это условие соблюдается далеко не всегда. На изучаемое явление и, следовательно, его средний уровень оказывают влияние многочисленные факторы, как постоянные (планируемые или сознательно выделяемые для их изучения), так и случайные (неопределенные). Например, больные гипертонической болезнью, отобранные по полу, возрасту, стадии и длительности заболевания, помимо болезни, подвергаются воздействию других неучтенных факторов, в результате чего у разных больных наблюдается различный уровень артериального давления.
При изучении явлений, сравнении их друг с другом в поисках сходства и различий необходимо обращать внимание не только на величину средних, но и на разнообразие вариант, а также вариабельность изучаемых признаков. Исследователь может встретить вариационные ряды, не отличающиеся по центральной тенденции (размеру средней арифметической), но различные по степени варьирования. И наоборот - ряды, одинаковые по величине разброса вариант, могут различаться по размерам средней арифметической. Установление значимости различий средних арифметических, измерение степени влияния факторов и их градаций на варьирующий (результативный) признак наиболее эффективно достигаются путем применения дисперсионного анализа.
Впервые основа дисперсионного анализа была разработана известным английским статистиком Р. Фишером в 1925 году. В нашей стране наиболее полно и систематизировано этот метод представлен в трудах Н.А. Плохинского.
Дисперсионный анализ – это метод в статистической математике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий вариабельности признака в исследуемой совокупности. В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance). Он базируется на определении степени рассеяния (дисперсии) оцениваемых признаков в нескольких группах. Это позволяет измерить силу влияния отдельных факторов на значения показателей.
Известно, что величина отдельных признаков представляет собой результат воздействия разнообразных факторов, различных по силе влияния. Одни факторы имеют значительно большую силу влияния, другие - меньшую. Причем, как правило, факторы сами воздействуют друг на друга, сочетая свое влияние, иногда усиливают действие друг друга, иногда, наоборот, погашают это действие. Преимуществом дисперсионного анализа является то, что он дает возможность изучить и сравнить роль каждого из них.
В отличие от дисперсионного анализа другие общепринятые в медицинских исследованиях статистические методы обработки, как правило, предусматривают проведение попарных сравнений, что приводит к огромному объему расчетов и часто не дает полной оценки.
Сущность дисперсионного анализа заключается в изучении статистического влияния одного или нескольких факторов на результативный признак.
Результативный признак - это элементарное свойство объектов, изучаемое как результат влияния факторов: организованных в исследовании (основных - х) и всех остальных, неорганизованных, не учтенных в данном исследовании (случайных - z).
Фактор - это влияние, воздействие или состояние, которое отражается на размерах и разнообразии результативного признака.
Градации фактора - это степень его воздействия (нулевое действие в контрольной группе) или состояние объектов изучения (пол, возраст и т.д.).
Дисперсионный комплекс - это совокупность градаций комплекса данных (опытных групп исследования) с привлеченными для исследования значениями и средними величинами по каждой градации.
Комплексы, составленные по принципу случайной выборки, называются рандомизированными.
При изучении количественных признаков в градации комплекса заносятся числовые результаты измерения изучаемого признака у каждого отдельного объекта. При изучении качественных признаков в градации комплекса заносится число объектов с наличием признака и общее число объектов.
Статистическое влияние - это отражение в разнообразии результативного признака того разнообразия фактора (его градаций), которое организовано в исследовании.
Сумма основных и случайных факторов составит общие факторы (у). Результативный признак изучается как результат воздействия факторов, организованных в исследовании (х) и неорганизованных (z).
Общее влияние как раз и определяет влияние всех организованных и неорганизованных (случайных) факторов, определивших такое развитие признака, которое наблюдалось в дисперсионном комплексе. Общее влияние служит базой для определения доли влияний - факториальных и случайных.
Факториальное влияние - это простое или комбинированное статистическое влияние изучаемых (учтенных) факторов.
Случайное влияние - это действие тех факторов, которые не учтены в дисперсионном комплексе и составляют общий фон, на котором действуют учитываемые факторы.
Таким образом, дисперсионный анализ исследует важнейшее свойство совокупности – разнообразие (вариабельность, дисперсию) признака. Для этого выделяется три вида разнообразия: межгрупповое, внутригрупповое и общее. Межгрупповое разнообразие зависит от влияния исследуемого фактора, по которому выделяется каждая группа. Иными словами, межгрупповое разнообразие - это различие средних в каждой группе. Внутригрупповое разнообразие зависит от силы влияния каких-то неучтенных случайных факторов. Общее разнообразие складывается из межгруппового и внутригруппового.
В основе дисперсионного анализа лежит предположение о том, что одни переменные могут рассматриваться как причины (факторы, независимые переменные): f1, …, fk, а другие как следствия (зависимые переменные). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте исследователь имеет возможность варьировать ими и анализировать получающийся результат.
Основной целью дисперсионного анализа является исследование значимости различия между группами с помощью сравнения дисперсий. Разделение общей дисперсии на несколько источников позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии. Если выполняется сравнение средних в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий Стьюдента. Однако, помимо этого, он позволяет оценить степень такого влияния, а также может использоваться при сопоставлении более чем 2-х групп.
Сущность дисперсионного анализа заключается в расчленении общей дисперсии (D или SS) изучаемого признака на отдельные компоненты, обусловленные влиянием конкретных факторов, и проверке гипотез о значимости влияния этих факторов на исследуемый признак. Обозначение SS - это сокращение от фразы "суммы квадратов" (Англ. sum of squares). Оно чаще всего используется в зарубежных источниках.
Сравнивая компоненты дисперсии друг с другом посредством F-критерия Фишера, можно определить, какая доля общей вариативности результативного признака обусловлена действием регулируемых факторов.
Критерий Фишера экспериментальных (эмпирических) данных (FЭмп.) вычисляется как отношение среднего квадрата дисперсии, обусловленной изучаемым фактором, к среднему квадрату случайной дисперсии:
,
где: FЭмп. – критерий Фишера, вычисленный в исследуемой совокупности,
MSФакт. – средний квадрат дисперсии, обусловленной изучаемым фактором,
MSСлуч. – средний квадрат дисперсии, обусловленной случайными факторами.
Для оценки достоверности полученного результата вычисленный на экспериментальных данных критерий Фишера сравнивают с его критическим значением (FКрит.) для принятого уровня вероятности (p) и степеней свободы (df ).
С целью уменьшения объема вычислений в программе Excel может применяться надстройка «Анализ данных» и ее модуль «Однофакторный дисперсионный анализ».