Дробный факторный эксперимент
Во многих практических задачах взаимодействия второго и высших порядков отсутствуют или пренебрежимо малы. Кроме того, на первых этапах исследования часто необходимо получить в первом приближении лишь линейную аппроксимацию изучаемого уравнения связи при минимальном числе экспериментов. Так, для трех факторов вместо уравнения (1.9) достаточно рассмотреть уравнение вида
(1.19)
и определить только четыре коэффициента. Поэтому использование ПФЭ для определения коэффициентов только при линейных членах неэффективно из-за реализации большого числа опытов, особенно при большом числе факторов k.
Если при решении задачи можно ограничиться линейным приближением, то в ПФЭ оказывается много "лишних" опытов. Так, для трех факторов достаточно 4 опыта, а в ПФЭ их 8. Следовательно, есть четыре "лишних". Результаты этих "лишних" опытов могут быть использованы двояко: во-первых, с их помощью можно получить более точные оценки коэффициентов регрессии; во-вторых, их можно использовать для проверки адекватности модели. Однако при 7 факторах ПФЭ содержит 27=128 опытов, а для линейного уравнения требуется всего 8. Таким образом, остается 120 лишних и, конечно, нет необходимости их все реализовать, а достаточно лишь несколько из них использовать для проверки адекватности и уточнения оценок.
Другими словами, ПФЭ обладает большой избыточностью опытов. В связи с этим возникает вопрос: “Нельзя ли сократить число опытов, необходимых для определения коэффициентов регрессии?”.
Так, для определения коэффициентов уравнения (1.22) достаточно ограничиться четырьмя опытами, если в ПФЭ 23 использовать х1х2 в качестве плана для х3, тогда матрица планирования эксперимента примет вид, представленный в табл. 2.
Таблица 2 - Дробный факторный эксперимент
Номер опыта | План | Результат | |||
x0 | x1 | x2 | x3= x1x2 | yj | |
+1 | -1 | -1 | +1 | y1 | |
+1 | +1 | -1 | -1 | y2 | |
+1 | -1 | +1 | -1 | y3 | |
+1 | +1 | +1 | +1 | y4 |
Заметим, что мы использовали не все точки с "крайними" координатами, т.е. ±1, или, говоря другими словами, не все возможные комбинации выбранных уровней. На самом деле всех возможных комбинаций 23=8, мы же использовали из них только 4. Такой сокращенный план носит название дробного факторного эксперимента (ДФЭ).
Следует подчеркнуть, что формальное приравнивание произведения факторов фактору, не входящему в это произведение, является основополагающей идеей метода ДФЭ. В данном случае используется только половина ПФЭ 23. После реализации плана получают 4 уравнения с 4 неизвестными, их решение и даст оценку всех четырех коэффициентов регрессии bi. Например, матрица из 8 опытов для четырехфакторного планирования будет полурепликой от ПФЭ 24, а для пятифакторного планирования — четвертьрепликой от 25.
Для того чтобы дробная реплика представляла собой ортогональный план, в качестве реплики следует брать ближайший полный факторный эксперимент. При этом число опытов должно быть не менее числа искомых коэффициентов.
Если коэффициенты регрессии при парных произведениях не равны нулю, то найденные коэффициенты bi будут смешанными оценками их теоретических коэффициентов βi. На практике обычно не удается априорно постулировать равенство нулю эффектов взаимодействия, однако часто имеются основания полагать, что некоторые из них малы по сравнению с линейными эффектами. Операцию смешивания оценок принято условно записывать в виде выражений
(1.20)
где β – математическое ожидание для соответствующего коэффициента.
Эти генерирующие коэффициенты не могут быть раздельно оценены по плану, включающему всего четыре опыта, так как в этом случае неразличимы столбцы для линейных членов и парных произведений. Если, например, в дополнение к столбцам, приведенным в табл. 2, вычислить еще столбцы для произведения х1х3, то увидим, что элементы этого столбца в точности равны элементам столбца х2. Таким образом, сокращение числа опытов приводит к получению смешанных оценок для коэффициентов.
Для того чтобы определить, какие коэффициенты смешаны, удобно пользоваться следующим приемом: подставив х3 на место х1х2, получим соотношение х3=х1х2, называемое генерирующим соотношением.
Умножив обе части генерирующего соотношения на х3, получим
(1.21)
Это произведение носит название определяющего контраста.
Умножив поочередно определяющий контраст на х1, х2, х3, находим
(1.22)
Полученным соотношениям соответствует система смешанных оценок, т.е. β1 смешана с β23, β2 – с β13, а β3 – с β12.
Таким образом, при использовании ДФЭ необходимо иметь четкое представление о так называемой разрешающей способности дробных реплик, т.е. определить заранее, какие коэффициенты являются несмешанными оценками для соответствующих коэффициентов. Тогда в зависимости от постановки задачи подбирается дробная реплика, с помощью которой можно извлечь максимальную информацию из эксперимента.
Например, в задаче с четырьмя факторами (k=4) в качестве генерирующего соотношения можно взять х4=х1х2х3 или любой из эффектов двойного взаимодействия, например х4=х1х2. Таблица планирования такого эксперимента представлена в табл. 3.
Таблица 3 - Планирование ДФЭ
Номер опыта | План | Генерирующие соотношения | ||||
x0 | x1 | x2 | x3 | x4=x1x2x3 | x4=x1x2 | |
+1 | -1 | -1 | -1 | -1 | +1 | |
+1 | +1 | -1 | -1 | +1 | -1 | |
+1 | -1 | +1 | -1 | +1 | -1 | |
+1 | +1 | +1 | -1 | -1 | +1 | |
+1 | -1 | -1 | +1 | +1 | +1 | |
+1 | +1 | -1 | +1 | -1 | -1 | |
+1 | -1 | +1 | +1 | -1 | -1 | |
+1 | +1 | +1 | +1 | +1 | +1 |
В первом случае определяющий контраст X42=X1X2X3X4=1. Получим оценку совместных оценок:
В реальных задачах тройные взаимодействия бывают равными нулю значительно чаще, чем двойные. Значит, если по физическому смыслу задачи нас более всего интересуют оценки для линейный эффектов, следует использовать генерирующее соотношение X4= X1X2X3.
Во втором случае определяющий контраст выражается соотношением X42=X1X2X4=1; X1X2X4=1.
При этом получим следующую систему оценок:
Следовательно, дробную реплику с генерирующим соотношением X4=X1X2 имеет смысл использовать, если нас более всего интересуют коэффициенты β12, β23, β34.
Дробную реплику, в которой Р линейных эффектов приравнены к эффектам взаимодействия, обозначают 2k-P
Таким образом, планы первого порядка, оптимальные двухуровневые планы ПФЭ 2K и ДФЭ 2k-P имеют следующие преимущества:
1 – планы ортогональны, поэтому все вычисления просты;
2 – все коэффициенты определяются независимо один от другого;
3 – каждый коэффициент определяется по результатам всех n опытов;
4 – все коэффициенты регрессии определяются с одинаковой дисперсией, т.е. эти планы обладают и свойством ротатабельности.
Регрессионный анализ
Ниже излагаются основные положения регрессионного анализа, применение которого для обработки результатов наблюдений связано с меньшим числом ограничений, чем при корреляционном анализе. Как и корреляционный анализ, регрессионный анализ включает в себя построение уравнения регрессии, например, методом наименьших квадратов и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется теми же методами, например наименьших квадратов, то его теоретические предпосылки требуют других способов статистической оценки результатов.
При проведении регрессионного анализа примем следующие допущения:
1) входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе не выявленных переменных и случайных воздействий, не вошедших в уравнение регрессии;
2) результаты наблюдений y1, y12,..., yi,..., yn над выходной величиной представляют собой независимые нормально распределенные случайные величины;
3) при проведении эксперимента с объемом выборки n при условии, что каждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2 должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнивать только тогда, когда их дисперсии однородны. Это означает принадлежность экспериментальных данных к одной и той же генеральной совокупности. Напомним: однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бы все остальные, т.е. была бы большая ошибка. При одинаковом числе параллельных опытов однородность дисперсии, как мы уже показали, можно оценить по критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера.
После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.