Анализ факторных экспериментов
1. Полные факторные эксперименты и кодированные переменные. При проведении экспериментальных исследований часто применяются факторные эксперименты.
Пусть – функция отклика и задан план, матрица которого есть (i = 1, 2, ..., k; u = 1, 2, ..., N), где – значение переменной (фактора) в u‑м опыте. Каждое из различных значений, принимаемых переменной в эксперименте, называют уровнем этой переменной. Обозначим через si число различных уровней фактора Xi.
Определение 1. Эксперимент, в котором уровни каждого фактора комбинируются со всеми уровнями других факторов, называется полным факторным экспериментом.
Полный факторный эксперимент состоит из различных экспериментов, поэтому его называют экспериментом типа .
Определение 2.План называется симметричным, если все факторы имеют одинаковое число уровней, т. е. В этом случае полный факторный эксперимент принято называть экспериментом типа sk, где k – число факторов.
Предположим, что число различных значений, которые может принимать переменная , в каждом опыте равно 2, т. е. s = 2. Тогда говорят, что переменная в каждом опыте варьируется на двух уровнях. Обозначим эти уровни через и . Если , то называют верхним уровнем, а – нижним уровнем фактора .
Обозначим , и введем новые переменные
(i = 1, 2, ..., k).
Переменные xi называют кодированными переменными. Легко проверить, что они могут принимать лишь два значения 1 (верхний уровень) и –1 (нижний уровень). Заменяя переменные кодированными переменными , можно представить функцию отклика в виде
. (1)
2. Полные факторные эксперименты типа 22 и 23. Если число независимых переменных равно двум, то равенство (1) приводится к виду . Результаты наблюдений, отвечающих всевозможным комбинациям уровней переменных x1 и x2, сводятся в таблицу.
Номер опыта | Наблюдения | |||
– 1 | – 1 | y1 | ||
– 1 | – 1 | y2 | ||
– 1 | – 1 | y3 | ||
y4 |
Пусть функция отклика имеет вид
и в каждом варианте испытаний проводится по одному наблюдению. Тогда имеем полный факторный эксперимент типа 22. Матрица плана и матрица планирования:
, .
Столбцы матрицы X попарно ортогональны, следовательно, планирование является ортогональным. Отсюда, используя результаты п. 7 § 1, получаем, что МНК‑оценки параметров некоррелированны и имеют вид
,
где Xj – j-й столбец матрицы Х, при этом .
Пусть теперь число переменных равно трем и функция отклика имеет вид
.
Рассмотрим все возможные комбинации уровней кодированных переменных , и .
Номер опыта | Наблю- дения | |||||||
– 1 | – 1 | – 1 | – 1 | y1 | ||||
– 1 | – 1 | – 1 | – 1 | y2 | ||||
– 1 | – 1 | – 1 | – 1 | y3 | ||||
– 1 | – 1 | – 1 | – 1 | y4 | ||||
– 1 | – 1 | – 1 | – 1 | y5 | ||||
– 1 | – 1 | – 1 | – 1 | y6 | ||||
– 1 | – 1 | – 1 | – 1 | y7 | ||||
y8 |
Здесь, как легко убедиться, планирование является ортогональным. Поэтому МНК-оценки параметров bj некоррелированны и имеют вид
,
при этом .
Пример 1. Полный двухфакторный эксперимент проводится на двух уровнях.
Переменные | X1 | X2 |
Нижний уровень | ||
Верхний уровень |
Получены результаты исследований: , , , .
Для нахождения МНК-оценок параметров ортогонального плана пользуются расчетной таблицей.
i | |||||||
– 1 | – 1 | – 66 | – 66 | ||||
– 1 | – 1 | – 68 | – 68 | ||||
– 1 | – 1 | – 48 | – 48 | ||||
С помощью расчетной таблицы получаем требуемые оценки:
; ;
; .
Значит, оценка функции отклика есть
. (2)
Возвращаясь к исходным переменным, имеем:
, , , , значит, , . Подставляя найденные выражения в (2), получаем
= = .
Пример 2. Полный трехфакторный эксперимент проводится на двух уровнях.
Переменные | X1 | X2 | X3 |
Нижний уровень | |||
Верхний уровень |
Результаты исследований: ; ; ; ; ; ; ; .
Составим расчетную таблицу для нахождения МНК‑оценок параметров ортогонального плана.
i | ||||||||
x1 | –1 | –1 | –1 | –1 | ||||
x2 | –1 | –1 | –1 | –1 | ||||
x3 | –1 | –1 | –1 | –1 | ||||
x1x2 | –1 | –1 | –1 | –1 | ||||
x1x3 | –1 | –1 | –1 | –1 | ||||
x2x3 | –1 | –1 | –1 | –1 | ||||
x1x2x3 | –1 | –1 | –1 | –1 | ||||
yi | 5,6 | 7,7 | 8,1 | 9,6 | 8,6 | 5,1 | 6,4 | 6,9 |
x1yi | –5,6 | 7,7 | –8,1 | 9,6 | –8,6 | 5,1 | –6,4 | 6,9 |
x2yi | –5,6 | –7,7 | 8,1 | 9,6 | –8,6 | –5,1 | 6,4 | 6,9 |
x3yi | –5,6 | –7,7 | –8,1 | –9,6 | 8,6 | 5,1 | 6,4 | 6,9 |
x1x2yi | 5,6 | –7,7 | –8,1 | 9,6 | 8,6 | –5,1 | –6,4 | 6,9 |
x1x3yi | 5,6 | –7,7 | 8,1 | –9,6 | –8,6 | 5,1 | –6,4 | 6,9 |
x2x3yi | 5,6 | 7,7 | –8,1 | –9,6 | –8,6 | –5,1 | 6,4 | 6,9 |
x1x2x3yi | –5,6 | 7,7 | 8,1 | –9,6 | 8,6 | –5,1 | –6,4 | 6,9 |
Используя расчетную таблицу, так же, как и в предыдущем примере, получаем требуемые оценки параметров: ; ; ; ; ; ; ; . Следовательно,
. (3)
Возвращаемся к исходным переменным.
; ; ; ; ; , значит, , , . Подставляя эти выражения в (3), получаем окончательно
3. Факторные эксперименты с повторными наблюдениями. Пусть – функция отклика, ; m, m, ..., m – спектр плана (число наблюдений в каждой точке xl одно и то же и равно m), mn = N. Пусть xl = (x1l, x2l, ..., xkl) и – повторные наблюдения в точке xl .
Матрицу плана можно представить в виде матрицы из m блоков следующим образом:
, где .
Таким образом, – матрица размеров с различными строками, – матрица размеров .
Определение. План называется полным факторным планом типа 2k с повторными наблюдениями кратности m, если матрица является матрицей полного факторного плана типа 2k.
Пример. Пусть – функция отклика и задан план: , , , , причем в каждой точке число наблюдений m = 2. Тогда матрица плана записывается в виде:
, где .
Так как – матрица плана полного факторного эксперимента типа 22, то данный план является полным факторным планом с повторными наблюдениями кратности 2.
Матрица планирования имеет вид
и является матрицей ортогонального планирования.
Если – матрица планирования, соответствующая функции отклика и матрице плана , то из ортогональности планирования для МНК-оценки вектора β имеем равенство , в котором , , а значит, ( j = 0, 1, ..., p). В этом случае оценки некоррелированны и имеют дисперсию .
4. Насыщенное и ненасыщенное планирование.
Определение 1. Пусть матрица планирования X имеет ранг, равный числу p неизвестных параметров в функции отклика. Факторный план называется насыщенным, если p = N, и ненасыщенным, если p < N.
Ненасыщенность плана полного факторного эксперимента означает, что имеется избыточность опытов, необходимых для нахождения МНК-оценок параметров в функции .
Пример 1. Пусть и планируется полный факторный эксперимент типа 22. Тогда планирование будет насыщенным, т. к. ранг матрицы планирования Xравен 4 и при этом число наблюдений N и число неизвестных параметров p также равны 4.
Пример 2. Если и имеется полный факторный эксперимент типа 22, то планирование будет ненасыщенным, т. к. ранг матрицы планирования
равен 3, а .
Определение 2. Пусть n – число точек спектра факторного плана с повторными наблюдениями кратности m (N = mn) и r – ранг матрицы планирования X. Тогда план называется насыщенным, если , и ненасыщенным, если .
5. Проверка гипотезы адекватности. Рассмотрим факторный эксперимент с кратными повторными наблюдениями yls (l = 1, 2, ..., n; s = 1, 2, ..., m). Проверим гипотезу H0 адекватности модели
, (4)
где – известные функции, задаваемые равенствами вида (1 m i1 < i2 < ... < iq m k), а – неизвестные параметры. Функции отклика (4) и матрице (i = 1, 2, ..., k; u = 1, 2, ..., N; N = mn) полного факторного плана соответствует матрица планирования ( j = 1, 2, ..., p0; u = 1, 2, ..., N). Столбцы матрицы X0 должны удовлетворять условиям:
( j = 2, 3, …, p); (5)
( j = 1, 2, …, p); (6)
. (7)
Будем предполагать, что наблюдения yls являются нормальными и некоррелированными, причем , где – вектор-столбец наблюдений; – неизвестный параметр.
Гипотеза состоит в том, что My = X0β0, где . Эта гипотеза проверяется при альтернативной гипотезе : My ¹ X0β0.
Для проверки гипотезы нужно вычислить отношение . Величина представляет собой несмещенную оценку для . Полагая в формуле (6) § 2 m1 = m2 = ... = mi = m, получаем
.
Таким образом,
. (8)
Оценка (5) § 2 дисперсии , связанная с неадекватностью модели, есть , где r – ранг матрицы X0.
Пусть r = , тогда, учитывая (5) – (7), получаем
, (9)
где , j = 1, 2, ..., p0.
Далее вычисляем и по таблице распределения Фишера по уровню значимости a и степеням свободы n – r и N – n находим .
Если , то гипотеза H0 принимается.
Если , то гипотеза H0 отклоняется.
Пример. Предположим, что зависимость прочности бетона R от двух факторов – расхода цемента X1 и расхода воды X2 – имеет вид: . Полный двухфакторный эксперимент проводится на двух уровнях:
Уровень | Расход цемента X1 | Расход воды X2 |
Нижний | ||
Верхний |
Результаты исследований представлены таблицей.
i | ||||
28,6 | 31,1 | 29,5 | 29,7 | |
44,3 | 47,8 | 46,2 | 46,1 | |
22,9 | 24,6 | 21,9 | 23,1 | |
38,7 | 38,7 | 35,3 | 36,7 |
МНК-оценки параметров ортогонального планирования находятся так же, как в примере 1 п. 3: ; ; , отсюда оценка функции отклика – , или, переходя к исходным переменным, .
Проверим, является ли полученная модель адекватной. Имеем N = 12, n = 4, m = 3, r = 3. По формулам (8) и (9)
,
.
Следовательно, . Далее по таблице критических точек распределения Фишера по уровню значимости a = 0,05 и степеням свободы n – r = 1 и N – n = 8 находим . Так как , то гипотеза, утверждающая, что модель адекватна, принимается.
§ 4. Оптимизация планов. Поиск экстремума функции отклика
1. Построение линейных оптимальных планов. Пусть функция отклика является полиномом первой степени от k переменных:
. (1)
Определение 1. План называется линейным, если ему соответствует функция отклика (1) и он позволяет получить несмещенные МНК-оценки параметров .
Если матрица линейного плана есть
, (2)
то матрица планирования для этого плана имеет вид
.
Определение 2. Линейный план называется линейным ортогональным планом, если столбцы матрицы Xпопарно ортогональны, т. е.
. (3)
Линейные планы широко используются в экспериментальных исследованиях, где эффекты взаимодействий факторов незначимы или вообще отсутствуют. Они используются также в задачах поиска экстремума функции отклика.
Пусть матрица планирования X имеет ранг k + 1 и вектор наблюдений удовлетворяет условиям ; , тогда для ковариационной матрицы МНК-оценок вектора β имеем равенство
.
Будем предполагать, что
, , (4)
где величины ci заданы; положим также .
Требуется выбрать матрицу планирования Xили матрицу линейного плана , так чтобы дисперсии МНК-оценок параметров в классе линейных планов с ограничениями (4) были минимальными.
План, минимизирующий дисперсии оценок параметров, называют линейным оптимальным планом. Задача построения таких планов решается с помощью теоремы Бокса, которую мы приведем без доказательства.
Теорема Бокса. Пусть функция отклика имеет вид (1), столбцы матрицы линейного плана удовлетворяют условиям (4) и ранг матрицы X равен k + 1. Тогда для МНК-оценок параметров выполняется неравенство
( ), (5)
причем минимум дисперсий в классе линейных планов с ограничениями (4) достигается тогда и только тогда, когда столбцы матрицы Xпопарно ортогональны.
В частности, поскольку первый столбец матрицы X состоит из единиц (x0u = 1), из условия ортогональности (3) при j = 0 следует . Таким образом, получаем
Следствие. Необходимым условием минимума дисперсий МНК-оценок является выполнение при всех i = 1, 2, ..., k равенства (условие симметрии плана).
2. Градиентный метод. Будем предполагать, что функция отклика непрерывна и имеет непрерывные частные производные 1-го порядка в ограниченной замкнутой области G Í Ñk.
Определение 1. Функция f называется унимодальной в области G, если она в этой области имеет единственный экстремум.
Пусть изменение функции многих переменных вдоль некоторой траектории, проведенной из точки в точку и определенной в области G, задается уравнением , где l – параметр, пробегающий числовой отрезок [0; 1].
Траекторию назовем строго возрастающей (строго убывающей), если функция h(l) строго возрастает (строго убывает) на отрезке [0; 1].
Определение 2. Пусть – функция отклика, определенная в области G и имеющая во внутренней точке максимум или минимум. Функция называется строго унимодальной, если отрезок, проведенный из любой точки в точку , является строго возрастающей траекторией в случае максимума или строго убывающей траекторией в случае минимума.
Экстремум функции отыскивается методом спуска (или подъема) по исследуемой поверхности. Этот метод основан на построении последовательности точек , лежащих в области G и таких, что (метод спуска) или (метод подъема).
Наиболее часто применяемая в практике исследований разновидность метода спуска и подъема – так называемый градиентный метод, при котором последовательность точек определяется с помощью равенства
, (6)
где – градиент функции f в точке ; a – некоторое положительное число. В этом случае функция f предполагается строго унимодальной.
Различные варианты градиентного метода отличаются друг от друга способом выбора a. Одним из вариантов градиентного метода является метод наискорейшего спуска (или подъема). При оптимизации технологических процессов в теории планированияэксперимента используется его статистический аналог – метод Бокса и Уилсона. В этом методе используется не сам градиент, а его оценка.
3. Оценивание градиента.Пусть функция отклика
(7)
определена в области G Ì Ñk.
Выберем произвольно точку . Используя эту точку, построим полный факторный эксперимент. Выберем для каждого i = 1, 2, ..., k нижний уровень и верхний уровень так, чтобы было . Положим , введем кодированные переменные и выразим функцию отклика (7) через кодированные переменные:
. (8)
Под задачей оценивания градиента будем понимать определение оценки градиента функции отклика (8) в точке x0 = (0, 0, ..., 0). Предположим, что в окрестности точки x0 функция (8) допускает разложение по формуле Маклорена:
(9)
где . Введем обозначения: , , , . Тогда равенство (9) перепишется в виде
.
Так как , задача оценивания градиента сводится к нахождению МНК-оценок параметров .
Пусть матрица полного факторного плана с центром в точке задана равенством (2).
Для простоты будем считать, что в замкнутой области функция отклика достаточно точно аппроксимируется линейной функцией, т. е.
. (10)
Тогда матрице плана и функции отклика (10) соответствует матрица планирования ( j = 0, 1, 2, ..., k; u = 1, 2, ..., N; x0u = 1) и для МНК-оценки параметра имеем равенство
( j = 0, 1, 2, ..., k),
где – наблюдения в точках плана.
Поскольку являются оценками компонент градиента , т. е. частных производных , то МНК-оценка градиента функции отклика в точке определяется равенством
.
Пример. Пусть h = f (x1, x2) – функция отклика (x1, x2 –кодированные переменные), матрица плана и результаты наблюдений . Используя аппроксимацию вида h » b0 + b1x1 + b2x2 + b3x1x2 ( ), найдем оценку градиента в центре плана (0, 0). Так как и , то планирование ортогонально, = (–y1 + y2 – y3 + y4) : 4 = –3, = (–y1 – y2 + y3 + y4) : 4 = –10 и, следовательно, получаем .
4. Метод Бокса и Уилсона. Будем предполагать, что функция отклика (7) в области G строго унимодальна. Поиск ее максимума может быть осуществлен методом, предложенным Боксом и Уилсоном.
Пусть – начальная точка поиска максимума. При переходе к кодированным переменным точке соответствует точка , а функция отклика (7) принимает вид (8).
Пусть – оценка градиента в точке , полученная с использованием факторного эксперимента, матрица плана которого задана равенством (2). Для поиска максимума сделаем некоторый шаг из точки в направлении оценки градиента . Положим
, (11)
где параметр , – МНК-оценка градиента, , (i = 1, 2, ..., k).
Точке в системе координат кодированных переменных соответствует точка в системе координат исходных переменных, при этом имеем .
Выполним в точке наблюдения и найдем в ней оценку функции отклика
. (12)
Так как измерение функции отклика происходит с ошибкой, то в точке можно найти только ее оценку, а не точное значение. Предположим, что оценка значимо больше оценки функции отклика в точке , где согласно (10) .
В этом случае делаем второй шаг в направлении оценки градиента и т. д. В общем виде, учитывая (11), для l-го шага имеем:
, (i = 1, 2, ..., k), (13)
где