Оценивание функции отклика и ее параметров.
Пусть – одномерная функция отклика. Ее оценка в любой точке
имеет вид:
. (15)
Если – МНК-оценка вектор-столбца неизвестных параметров β = (b1 b2 ... bp)T, полученная по наблюдениям в точках x1, x2, ..., xN, и ранг матрицы планирования X равен p, то оценка (15) является несмещенной и при заданной матрице плана (12) в классе линейных несмещенных оценок имеет минимальную дисперсию.
Пример 1. Пусть ; тогда оценка будет иметь вид
.
Если столбцы матрицы планирования попарно ортогональны, т. е. при i ¹ j (i, j = 1, 2, ..., p) выполняются равенства
fi(x1) fj(x1) + fi(x2) fj(x2) + ... + fi(xN) fj(xN) = 0, (16)
то говорят, что имеет место ортогональное планирование.
Обозначим Xj = ( fj(x1), fj(x2), ..., fj(xN)), тогда имеем
fi(x1)2 + fi(x2)2 + ... + fi(xN)2 = |Xj |2 . (17)
Заметим, что вектор Xj, рассматриваемый как вектор‑столбец, совпадает с j-м столбцом матрицы X, поэтому из (16) и (17) следует
,
откуда и по формуле (9)
.
Отсюда при всех j = 1, 2, ..., p следует
. (18)
Равенство (10) показывает, что МНК-оценки (18) некоррелированы и при этом .
Пример 2. Пусть ,
и
. Тогда f0(x) = 1, f1(x) = x,
,
причем , так что имеет место ортогональное планирование. Поскольку
|X1|2 = 12 + 12 + + 12 + 12 = 4,
,
то по формуле (18) получаем
,
.
Если планирование не является ортогональным, но матрицу X можно разбить на подматрицы: X = (X1 X2 ... Xl) так, что будет (i < j; i, j = 1, 2, ..., l; O – нулевая матрица), то для оценок
можно получить формулу, обобщающую формулу (18). Например, пусть имеет место случай l = 2, т. е.
,
где . Пусть β = (b1 b2 ... bp)T, β1 = (b1 b2 ... bq)T и β2 = (bq+1 bq+2 ... bp)T, тогда
.
В п. 3 было доказано, что МНК-оценка вектора
удовлетворяет нормальному уравнению (8), поэтому имеем
, или, поскольку
,
.
Отсюда следует ,
, и, таким образом, получаем формулы
,
. (18´)
Пример 3. Пусть заданы ,
и вектор-столбец наблюдений
.
Тогда fj(x) = xj ( j = 1, 2, 3, 4), следовательно, . Полагая
, где
,
, имеем
,
,
.
По формулам (18´) находим
,
.
8. Оценивание параметров модели при повторных наблюдениях.Пусть задана функция отклика, определенная в области G: . Введем в рассмотрение вектор-функцию f = ( f1, f2, ..., fp) (отождествляемую, как обычно, с одностолбцовой матрицей ( f1 f2 ... fp)T ). Тогда функцию отклика можно записать в матричном виде
.
Пусть также задан план, спектр которого m1, m2, ..., mn (mi – число наблюдений в точке xi).
Наблюдения в одной точке
называют повторными. Матрица плана при наличии повторных наблюдений имеет вид
, где каждый блок
– матрица размера
, имеющая
одинаковых строк. Вектор-столбец наблюдений можно записать в виде
, где блок
соответствует матрице
.
Матрица планирования также может быть записана в блочном виде: , где
– матрица размера
(i = 1, 2, ..., n). Отсюда
где
,
так что и, следовательно,
. (19)
Определим теперь матрицы
,
.
Матрица состоит из строк матрицы
, отвечающих различным точкам плана.
Легко убедиться, что . Отсюда и из (19) следует матричное равенство
. (20)
Обозначим (среднее значение повторных наблюдений в точке
, i = 1, 2, ..., n), тогда получаем
,
где обозначено .
Используя этот результат и формулы (9) и (20), получаем .
Если, в частности, , при всех i = 1, 2, ..., n, то
и тогда имеем
.
Пример. Пусть даны функция отклика и матрица плана
.
Знаком « » указаны наблюдения в соответствующих точках плана. Здесь
, а значит,
.
Имеем ,
,
, где
;
. Следовательно,
=
=
.
§ 2. Доверительные интервалы для параметров функции отклика и гипотеза адекватности
1. Дополнительные сведения из дисперсионного анализа. В этом параграфе будет предполагаться, что наблюдения yis (i = 1, 2, ..., n; s = 1, 2, ..., mi) нормально распределены и при этом выполняются условия:
;
, (1)
где ,
– матрица размера
с одинаковыми строками (i =1, 2, ..., n), β = (b1 b2 ... bp)T и
.
Из первого уравнения (1) получаем при всех i = 1, 2, ..., n где обозначено
. Следовательно, имеем
(i = 1, 2, ..., n; s = 1, 2, ..., ml).
Положим ,
(
– произвольный вектор-столбец размерности p). Возведем в квадрат обе части тождества
и просуммируем по s и по i. Получим
поскольку (i = 1, 2, ..., n). Таким образом, имеем равенство
S0 = S1 + S2, (2)
где обозначено ,
,
. Предположим теперь, что эти суммы получены при условии, что
– МНК-оценка вектора β параметров функции отклика, найденная в п. 8 § 1, и введем в рассмотрение следующие величины
,
,
.
Можно доказать, что при сделанных предположениях эти величины обладают свойствами, аналогичными свойствам величин ,
и
, установленным в пунктах 3 и 4 § 4 гл. 1. Именно, все они являются несмещенными оценками дисперсии s2 и при этом случайные величины
,
и
распределены по закону с числами степеней свободы соответственно N – p, n – p и N – n, причем две последние из них являются независимыми.
2. Доверительные интервалы для параметров функции отклика. Напомним (см. гл. 1, § 2, п. 1), что доверительным интервалом называют интервал, который с заданной надежностью g покрывает оцениваемый параметр.
Пусть – вектор-столбец МНК-оценок параметров функции отклика. Поскольку
, где y – случайный вектор с независимыми компонентами, распределенными по нормальному закону, то все
также распределены по нормальному закону. Так как МНК-оценки являются несмещенными (см. § 1, п. 3), имеем
( j = 1, 2, ..., p). Кроме того, равенство (10) из п. 4 § 1 показывает, что
, где
– элемент матрицы
. Значит, случайная величина
распределена по нормальному закону c параметрами Mx = 0 и Dx = 1. Обозначим также
,
где сумма S0 построена по оценкам так же, как в п. 1. Поскольку эта случайная величина распределена по закону χ2 с числом степеней свободы N – p, случайная величина
(3)
распределена по закону Стьюдента с N – p степенями свободы.
При заданном g (0 < g < 1) по таблице для распределения Стьюдента можно найти число tg, удовлетворяющее уравнению P(| tN-p | < tg) = g, так что с вероятностью g будем иметь , или, что равносильно,
,
откуда следует что – доверительный интервал для параметра
с надежностью g.
Замечание. Случайная величина (3) может быть использована для проверки гипотезы H0 о том, что некоторый параметр функции отклика равен 0. Действительно, если эта гипотеза верна, то получаем
,
причем эта случайная величина должна распределяться по закону Стьюдента с N – p степенями свободы. При альтернативной гипотезе HA: критическая область является двусторонней. Найдем для заданного уровня значимости a и числа степеней свободы N – p по таблице 4 правую критическую точку
. Тогда имеем следующие возможности:
, в этом случае нет оснований отвергать гипотезу H0; если же
, то гипотеза H0 отвергается.
3. Проверка гипотезы адекватности модели. Пусть определенная в области G функция отклика
неизвестна, т. е. неизвестны функции и параметры bj, и задан спектр плана:
;
, где
. Если
– повторные наблюдения в точке xi (i = 1, 2, ..., n), то матрица плана
имеет вид
, где
– матрица размера
, строки которой одинаковы, и
– вектор-столбец наблюдений в точке xi, соответствующий матрице
(это соответствие показано стрелками).
Положим
, (4)
где – заданные функции.
Гипотезу H0 о том, что при всех xÎG выполняется равенство , называют гипотезой адекватности регрессионной модели или функции отклика (4). Она проверяется при альтернативной гипотезе HА:
.
Если гипотеза H0 верна, то МНК-оценка функции отклика равна
.
Пусть и
(i = 1, 2, ..., n). Рассмотрим суммы
,
, где
.
Как доказано в п. 1, для таких сумм имеет место равенство (2). Заметим также, что сумма S1 должна, очевидно, быть небольшой, если модель адекватна, так что ее величина является характеристикой степени адекватности; сумма S2 связана с дисперсией ошибок наблюдения, поэтому ее называют ошибкой эксперимента. Обозначим
,
.
Если гипотеза H0 верна, то эти величины совпадают соответственно с величинами и
, рассмотренными в п. 1, значит, случайные величины
и
независимы и распределены по закону с числами степеней свободы соответственно
и N – n. Отсюда следует, что если основная гипотеза верна, то случайная величина
имеет распределение Фишера с и N – n степенями свободы.
Вычислив и найдя по таблице распределения Фишера по уровню значимости a и степеням свободы n – p0 и N – n
, получаем следующие возможности:
, в этом случае нет оснований отвергать основную гипотезу;
, тогда основную гипотезу отвергаем.
Если гипотеза H0 отвергается, модель (4) считается неадекватной и приходится выбирать другую модель. Выбор новой модели зависит от характера задачи, стоящей перед исследователем. Может возникнуть необходимость в проведении дополнительных наблюдений для проверки новой гипотезы.
§ 3. Полные факторные эксперименты типа 2k .