Оценивание недостающих данных
Статистический анализ
Предположим, что в общем случае у нас есть а обработок (которые нужно сравнить между собой) и b блоков. Рандомизированный полноблочный план приведен на рисунке.
Рис.1 Рандомизированный полноблочный план
Каждый блок содержит по одному наблюдению на каждую обработку, а порядок, в котором осуществляется выбор обработки внутри блока, определяется случайным образом. Рандомизация проводится только внутри блоков, поэтому мы говорим, что блоки представляют собой ограничение на рандомизацию.
Статистическая модель рассматриваемого плана эксперимента имеет вид
(1)
где μ — математическое ожидание общего среднего;
τi — эффект i-ой обработки;
βi — эффект j-го блока;
εij — случайная ошибка,причем, как обычно, εij ~NlD (0,σ2).
В начале рассмотрений будем считать обработки и блоки фиксированными факторами.
Эффекты обработок и блоков определяются как отклонения от математического ожидания общего среднего, т. е.
и
Нас интересует проверка равенства эффектов обработок, чему соответствуют гипотезы
Пусть уi. — сумма всех наблюдений для i-й обработки;
y.j — сумма всех наблюдений в j-м блоке;
y.. — общая сумма всех наблюдений и N=ab — общее число наблюдений:
(2)
(3)
(4)
Аналогичным образом ӯi.— среднее наблюдений для i-й обработки;
ӯ.j —среднее наблюдений в j-м блоке и
ӯ.. — общее среднее всех наблюдений, т. е.
(5)
Общую скорректированную сумму квадратов можно представить в виде
(6)
Раскроем скобки в правой части этого соотношения, тогда
Простые, но громоздкие выкладки показывают, что смешанные произведения обращаются в нуль, поэтому выражение
(7)
представляет собой разбиение общей суммы квадратов. В символическом виде выражение (7) можно записать как
(8)
Число всех наблюдений составляет N, поэтому SSобщ, обладает N—1 степенью свободы. Поскольку а— число обработок, а b — число блоков, то SSобр и SSбл обладают а-1 и b-1 степенями свободы соответственно. Сумма квадратов, обусловленная ошибкой, — это общая сумма квадратов, уменьшенная на сумму квадратов для обработок и сумму квадратов для блоков. Числу ab всех наблюдений соответствует ab—1 степень свободы, следовательно, SSош обладает ab—1—(а— 1) — (b—1) = (а-1)(b- 1) степенями свободы. Далее сумма чисел степеней свободы слагаемых в правой части выражения (8) совпадает с числом степеней свободы в левой части; поэтому принимая, как обычно, допущение о нормальности ошибок, мы с помощью теоремы получаем, что SSобр/σ2, SSбл/σ2 и SSош/σ2 — независимые случайные переменные, подчиняющиеся распределению хи-квадрат.
Отношение суммы квадратов к соответствующему числу степеней свободы есть средний квадрат. Можно показать, что если обработки и блоки фиксированы, то математические ожидания средних квадратов имеют вид
Следовательно, для проверки равенства эффектов обработок должна использоваться статистика
подчиняющаяся F-распределению с а—1 и (а—1) (b—1) степенями свободы при условии истинности нулевой гипотезы.
Критической областью является верхний шлейф F-распределения, и мы отклоняем H0,если Fo>Fα;а-1;(a-1)(b-1).
Мы можем также проверить гипотезу H0: βi = 0, сравнив статистику F0=MSбл/MSош c Fα;а-1;(b-1)(b-1). Эта гипотеза утверждает, что блоки не отличаются друг от друга. Такая проверка часто используется для того, чтобы определить, следует ли проводить группирование в блоки при аналогичных экспериментах в будущем. При проверке этой гипотезы нужно быть очень осторожным. Блоки представляют собой ограничение на рандомизацию, т. е. ab обработок не распределяются случайным образом по экспериментальным объектам. В действительности блоки часто сами являются объектами эксперимента (как, например, при определении твердости) и рандомизация ограничена их размерами. В этих обстоятельствах проверка гипотезы H0: βi = 0, приведенная выше, не является приемлемой, поскольку блоки образованы и используются не случайным образом. Это замечание важно, потому что экспериментатор иногда применяет фактор, представляющий интерес для характеристики блоков, а затем вводит внутри блоков набор обработок, соответствующий другому фактору. В таком случае, однако, ограничение на рандомизацию, обусловленное группированием в блоки, может зачастую лишить смысла проверку междублокового эффекта. Если исследователя действительно интересуют два фактора, то лучше применить другие методы планирования эксперимента.
Результаты проверки гипотез обычно сводятся в таблицу ДА (табл. 1.2).
Табл.1.2 Дисперсионный анализ для радномизированного полноблочного плана
Расчетные формулы для сумм квадратов можно получить, выразив слагаемые в отношении (7) в терминах сумм для обработок и блоков:
(9)
(10)
(11)
причем сумма квадратов для ошибки находится вычитанием:
(12)
Мы дали описание процедуры проверки гипотез в предположении, что обработки и блоки фиксированы, тем не менее, та же процедура используется и при случайных обработках или блоках. Интерпретация результатов, конечно же, соответствующим образом меняется. Например, если блоки случайны, то мы считаем результаты сравнения обработок одинаковыми для всей совокупности блоков, из которой случайным образом были выбраны те блоки, которые исследовались в эксперименте. Соответствующие изменения претерпевают и математические ожидания средних квадратов. Например, если блоки случайны, то Е (MSбл) = σ2 + аσβ2, где σβ2 — дисперсия эффектов блоков. Во всяком случае, E(MSобр) никогда не зависит от эффекта любого из блоков и для проверки изменчивости по обработкам используется статистика
Пример 1.
Рассмотрим эксперимент по определению твердости описанный в начале. Есть четыре острия и четыре образца металла. Каждое острие по разу проверяется на каждом из образцов, т. е. эксперимент проводится по рандомизированному полноблочному плану. Данные этого эксперимента приведены в табл. 3.
Подчеркнем, что порядок, в котором острия проверялись на конкретном образце, был случайным. Для упрощения вычислений зондируем исходные данные, вычтя из каждого наблюдения 9,5 и умножив результат на 10.
Найдем суммы квадратов:
Результаты ДА приведены в таблице.
При α=0,05 критическое значение F0.05;3; 9 = 3,86. Тогда 14,42>3,86 и мы приходим к выводу, что тип острия влияет на отсчет твердости. Кроме того, различия между блоками оказываются значимыми, так как средний квадрат для блоков велик по сравнению с ошибкой.
Интересно рассмотреть результаты, которые получил бы исследователь, если бы не знал о существовании рандомизированных полноблочных планов. Допустим, что он использовал четыре образца и распределил по ним острия случайным образом, получив (случайно) план, приведенный в табл. 4.3. Некорректный анализ этих данных как результатов полностью рандомизированного однофакторного эксперимента приведен в таблице.
Поскольку F0.05;3; 12 = 3,49, то мы не можем отклонить гипотезу, что четыре острия дают одинаковые результаты определения твердости. Таким образом, использование рандомизированного плана позволило уменьшить уровень шума в данных настолько, что стало возможным обнаружить различия между четырьмя типами острия.
Если в рандомизированном полноблочном плане обработки фиксированы, а анализ показывает, что между ними существуют значимые различия, то можно продолжить исследование средних по обработкам. Для этой цели могут быть использованы ортогональные контрасты или множественный критерий размахов Дункана. В последнем случае стандарт ошибки среднего для обработки определяется выражением
Экспериментатору часто приходится решать, сколько именно блоков включить в план. Например, в задаче об измерении твердости были использованы четыре блока (образца). В общем случае число блоков должно выбираться достаточно большим, с тем чтобы обеспечить соответствующую мощность критерия. Отметим, что при увеличении числа блоков растет также и число степеней свободы ошибки, что повышает мощность критерия. При определении числа блоков можно пользоваться оперативными характеристиками из приложения. Для модели постоянных эффектов используются кривые, где
причем число степеней свободы числителя составляет а-1, а знаменателя — (а - 1) (b-1). Для модели случайных эффектов используются кривые, где
причем число степеней свободы числителя составляет а-1, а знаменателя — (а - 1) (b-1). На практике дисперсия ошибки σ2 обычно заменяется соответствующей оценкой.
Пример 2.
В эксперименте, проводимом по рандомизированному полноблочиому плану, необходимо сравнить пять обработок в шести блоках. Исследователя интересует мощность критерия при уровне значимости α =0,05, если истинные средние по обработкам μ1= 5,0, μ2=8,0, μ3=4,0, μ4=3,0 и μ5=5,0.
Из предыдущих экспериментов известна оценка σ2=4,0. Поскольку среднее для i-ой обработки имеет вид μi= μ+τi и мы накладываем ограничение , то
откуда следует, что τ1= 0, τ2= 3, τ3= -1, τ4= -2 и τ5= 0. Поэтому
и Ф = 2,049. Число степеней свободны (а- 1) (b - 1) = (5- 1) (6- 1) =20;
в соответствии с кривой вероятность правильного отклонения гипотезы Н0: τ0 = 0 при таком плане и условии, что на самом деле составляет приблизительно 0,94.
Предположим, что эксперимент проводился по рандомизированному полноблочному плану, а группирование в блоки не было в действительности необходимым. При рандомизированном полноблочном плане число степеней свободы ошибки составляет (а-1) (b-1). Если бы эксперимент проводился по полностью рандомизированному плану с b репликами, то число степеней ошибки было бы равно а(b-1). Таким образом, необоснованное группирование в блоки приводит к потере а(b-1) - (а-1)(b-1)=b-1 степени свободы ошибки, и мощность критерия без особой необходимости оказывается пониженной. Однако если эффекты блоков действительно важны, а группирование в блоки не проводится, то ошибка эксперимента может оказаться настолько завышенной, что значимые различия между обработками не будут обнаружены. Иллюстрацией этому может служить некорректный анализ данных примера 1. Как правило, если у экспериментатора возникают сомнения относительно существенности эффектов блоков, то лучше все-таки применять блочное планирование. Такое решение, окажись оно неправильным, приведет к небольшой потере степеней свободы ошибки и, если только возможное число степеней свободы ошибки не слишком мало, несущественно повлияет на результаты анализа.
Отметим, наконец, что линейная модель рандомизированного полноблочного плана совершенно аддитивна, т. е. считается, что между блоками и обработками нет взаимодействия. В сущности, это означает, что эффект изменения уровня интересующего нас фактора сохраняется от блока к блоку. Если же взаимодействие между блоками и обработками существует, то средний квадрат ошибки будет отражать как ошибки эксперимента, так и эффекты взаимодействия. Вообще говоря, при этом средний квадрат ошибки увеличивается, а точность сравнения обработок понижается. Исключением является модель со случайными блоками. В этой ситуации как средний квадрат для обработок, так и средний квадрат для ошибки содержат эффекты взаимодействия, и, следовательно, значимость влияния обработок может, как обычно, проверяться сравнением среднего квадрата для обработок со средним квадратом для ошибки. Такая процедура не дает никакой информации о взаимодействии; для обнаружения эффектов взаимодействия необходимо использовать метод.
Оценивание недостающих данных
При проведении экспериментов по рандомизированному полноблочному плану иногда оказывается, что в одном из блоков недостает наблюдения. Это может быть вызвано невнимательностью, промахом или не зависящими от нас обстоятельствами, например, повреждением экспериментального объекта, избежать которого было невозможно. Недостающее данное приводит к новой проблеме при анализе, поскольку обработки уже не ортогональны блокам, т. е. не в каждом из них встречаются все обработки. К этой проблеме существуют два подхода. При одном из них, приближенном анализе, находится оценка недостающего значения, а затем проводится обычный ДА так, как если бы эта оценка была настоящим наблюдением, только число степеней свободы ошибки уменьшается на единицу. Такой подход рассматривается в этом параграфе; второй подход — точный анализ.
Допустим, что недостает наблюдения yij для i-oй обработки в j-oм блоке. Обозначим недостающее данное через х. Пусть, например, в эксперименте по определению твердости (пример 1) при проверке острия 2 на образце 3 сломался образец и наблюдение не было сделано.
В общем случае пусть у..'— общая сумма наблюдений при одном недостающем данном, уi.'— сумма для обработки с одним недостающим данным и у.j'— сумма для блока с одним недостающим данным. Предположим, что мы хотим выбрать оценку недостающего данного так, чтобы х давало наименьший вклад в сумму квадратов ошибки. Поскольку
то это эквивалентно выбору значения х, минимизирующего
(13)
где R включает в себя все слагаемые, не зависящие от х.
Из условия dSSoш/dx = 0 получаем выражение
(14)
которое является оценкой недостающего данного.
Для данных предыдущей таблицы находим, что y2.'=1, у.3'=6 и у..'=17. Следовательно, в соответствии с соотношением (14)
Теперь можно провести обычный ДА, используя y23 = 1,22 и уменьшив число степеней свободы для ошибки на единицу. Результаты такого анализа приведены в таблице.
Если недостает нескольких данных, то их оценки можно найти, записав сумму квадратов для ошибки как функцию недостающих значений, приравнять нулю производные этой функции по каждому из них и решить получившиеся уравнения. Можно поступить по-другому и оценить недостающие данные итерационным способом с помощью уравнения (14). Допустим, что недостает двух данных. Тогда мы выберем значение одного из них произвольно и используем его вместе с настоящими данными для оценки второго данного по уравнению (14). Затем из этого уравнения находится новая оценка первого недостающего данного, затем новая оценка второго и т. д. Процесс продолжается до тех пор, пока результаты не сойдутся к некоторому пределу. В любой задаче с недостающими данными число степеней свободы ошибки уменьшается на единицу на каждое недостающее наблюдение.