Методы нахождения оценок максимального правдоподобия

ВВОДНЫЕ ЗАМЕЧАНИЯ

Из результатов предыдущей главы видно, что нахождение оценок максимального правдоподобия является существенным элементом адап­тивного байесова подхода и до некоторой степени даже его основой в случае параметрически заданной априорной неопределенности. Метод максимального правдоподобия, как мы видели ранее в гл. 2, 4, 5, имеет и большое самостоятельное значение. Он позволяет в ряде случаев най­ти минимаксное решение задачи с гарантированным уровнем риска и дает возможность выявить достаточные или квазидостаточные статисти­ки. В связи с этим в настоящей главе более подробно рассмотрим мето­ды получения и свойства оценок максимального правдоподобия.

Этому вопросу посвящена довольно обширная литература, начиная сранних работ по классической математической статистике, поэтому, возможно, значительная часть того, что будет изложено ниже, хорошо известна многим читателям. Это в особенности относится к случаю ре­гулярных оценок по совокупности независимых данных наблюде­ния, соответствующему этому случаю неравенству Крамера-Рао и асимптотической эффективности регулярных оценок максимального правдоподобия. Наряду с этим имеется много сравнительно малоиз­вестных аспектов метода максимального правдоподобия: влияние ста­тистической зависимости данных наблюдения на сходимость и точность оценок максимального правдоподобия; нерегулярность, когда функция правдоподобия недифференцируема по оцениваемым параметрам; ре­куррентные процедуры нахождения оценок максимального правдоподо­бия и их свойства и т. д. Наличие подобных аспектов, а также большое значение метода максимального правдоподобия для решения задач син­теза в условиях априорной неопределенности делают целесообразным систематическое изложение основных фактов, относящихся к методам получения и свойствам оценок максимального правдоподобия. Большин­ство этих фактов будет приведено без доказательства со ссылками на оригинальные и популярные работы, в которых такие доказательства имеются.

Прежде чем перейти к дальнейшему изложению, напомним некото­рые основные определения. Пусть имеется совокупность данных наблю­дения методы нахождения оценок максимального правдоподобия - student2.ru , которую обычно будем представлять в виде вектора методы нахождения оценок максимального правдоподобия - student2.ru , каждая компонента которого методы нахождения оценок максимального правдоподобия - student2.ru соответствует одному наблюде­нию и, в свою очередь, может быть вектором того или иного порядка или даже отрезком реализации некоторого непрерывного случайного процесса. Пусть эти данные наблюдения зависят от некоторого парамет­ра методы нахождения оценок максимального правдоподобия - student2.ruразмерности методы нахождения оценок максимального правдоподобия - student2.ru . (Нам удобно ввести здесь новое обозначение для неизвестных параметров, чтобы иметь возможность в дальнейшем понимать под методы нахождения оценок максимального правдоподобия - student2.ruкак параметры методы нахождения оценок максимального правдоподобия - student2.ru, характеризующие ап­риорную неопределенность в статистическом описании методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru, так и сами параметры методы нахождения оценок максимального правдоподобия - student2.ru, влияющие на последствия принимаемых решений и являющиеся предметом оценки в исходной задаче статистического ре­шения, так и, наконец, совокупность тех и других параметров.) Зависи­мость данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru от параметров методы нахождения оценок максимального правдоподобия - student2.ruописывается функцией правдоподобия

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.1)

где методы нахождения оценок максимального правдоподобия - student2.ru - плотность совместного распределения вероятности методы нахождения оценок максимального правдоподобия - student2.ru при заданном значении методы нахождения оценок максимального правдоподобия - student2.ru, а оценка максимального прав­доподобия методы нахождения оценок максимального правдоподобия - student2.ru определяется из уравнения максимального правдоподобия

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.2)

где максимум находится по области допустимых значений методы нахождения оценок максимального правдоподобия - student2.ru. Уравнение (7.1.2) эквивалентно следующему уравнению для логарифма функции правдоподобия, которым часто будем пользоваться в дальнейшем:

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.3)

где

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.4)

Если для каждого из допустимого множества значений для почти всех значений методы нахождения оценок максимального правдоподобия - student2.ru существуют частные производные методы нахождения оценок максимального правдоподобия - student2.ru причем

методы нахождения оценок максимального правдоподобия - student2.ru

где методы нахождения оценок максимального правдоподобия - student2.ru - интегрируемые по всему пространству методы нахождения оценок максимального правдоподобия - student2.ru функции, то оценка максимального правдоподобия является регулярной и уравнение макси­мального правдоподобия может быть представлено в одной из эквива­лентных форм

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.5)

или

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.6)

где методы нахождения оценок максимального правдоподобия - student2.ru - оператор градиента по компонентам век­тора методы нахождения оценок максимального правдоподобия - student2.ru.

Регулярный случай, пожалуй, чаще всего встречается на практике. Однако во многих важных практических задачах свойство регулярности не выполняется, что заставляет рассматривать и более общий случай, для которого некоторые закономерности поведения регулярных оценок могут и не соблюдаться. Если наряду с оценкой максимального правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru рассмотреть какую-либо другую функцию методы нахождения оценок максимального правдоподобия - student2.ru , которая не является решением уравнения максимального прав­доподобия, то очевидно, что при весьма общих предположениях о виде этой функции можно считать ее оценкой параметра методы нахождения оценок максимального правдоподобия - student2.ru, более того, и совершенно произвольную функцию вектора методы нахождения оценок максимального правдоподобия - student2.ru можно также назвать оценкой методы нахождения оценок максимального правдоподобия - student2.ru, хотя возможно, что точность этой оценки будет со­вершенно неудовлетворительной. В дальнейшем нам понадобится опре­деление регулярности и для оценки методы нахождения оценок максимального правдоподобия - student2.ru произвольного вида. Чтобы ввести это определение, зададим взаимно однозначное преобразование




методы нахождения оценок максимального правдоподобия - student2.ru (7.1.7)

где методы нахождения оценок максимального правдоподобия - student2.ru - некоторая многомерная функция методы нахождения оценок максимального правдоподобия - student2.ru дополняющая преобразование методы нахождения оценок максимального правдоподобия - student2.ru до взаимно однозначного. В силу взаимной однозначности этого преобразования две совокупности методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru статистически эквивалентны, по­этому вместо исходной совокупности данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru можно рассматривать преобразованную совокупность методы нахождения оценок максимального правдоподобия - student2.ru статистическое описание которой задается функцией правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru , получающейся применением преобразования (7.1.7) к исходной функции правдоподобия (7.1.1).

Функцию правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru , очевидно, можно записать в виде

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.8)

где методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru - соответствующие условные плотности ве­роятности. Оценка методы нахождения оценок максимального правдоподобия - student2.ru называется регулярной, если для каждого методы нахождения оценок максимального правдоподобия - student2.ruиз заданного множества значений для почти всех значений методы нахождения оценок максимального правдоподобия - student2.ruи методы нахождения оценок максимального правдоподобия - student2.ruсуществуют частные производные методы нахождения оценок максимального правдоподобия - student2.ru , причем

методы нахождения оценок максимального правдоподобия - student2.ru

где методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru - функции, интегрируемые по всему пространству методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru соответственно.

Совокупность этих условий несколько жестче, чем простое требова­ние дифференцируемости функции правдоподобия. Они накладывают определенные ограничения не только на методы нахождения оценок максимального правдоподобия - student2.ru , но и на возможные виды преобразования методы нахождения оценок максимального правдоподобия - student2.ru , то есть на структуру оценочных функций.

Всякая оценка методы нахождения оценок максимального правдоподобия - student2.ru отличается от истинного значения методы нахождения оценок максимального правдоподобия - student2.ru. Про­стейшей характеристикой этого отличия является математическое ожи­дание разности методы нахождения оценок максимального правдоподобия - student2.ru

методы нахождения оценок максимального правдоподобия - student2.ru (7.1.9)

вообще говоря, зависящее от методы нахождения оценок максимального правдоподобия - student2.ruи называемое смещением оценки. Оцен­ка, для которой методы нахождения оценок максимального правдоподобия - student2.ru называется несмещенной.

Важным понятием является также понятие достаточной оценки. Оценка методы нахождения оценок максимального правдоподобия - student2.ru называется достаточной, если условная плотность ве­роятности методы нахождения оценок максимального правдоподобия - student2.ru в (7.1.8) не зависит от методы нахождения оценок максимального правдоподобия - student2.ru. Достаточная оценка является, очевидно, минимальной достаточной статистикой для пара­метра методы нахождения оценок максимального правдоподобия - student2.ru: достаточной в силу того, что она удовлетворяет основному требованию к любой достаточной статистике (гл. 2), а минимальной - в силу того, что размерность этой статистики (вектора методы нахождения оценок максимального правдоподобия - student2.ru ) совпадает с размерностью вектора неизвестных параметров методы нахождения оценок максимального правдоподобия - student2.ru . Если существует какая-либо достаточная оценка методы нахождения оценок максимального правдоподобия - student2.ru , то любая лучшая оценка может быть только функцией методы нахождения оценок максимального правдоподобия - student2.ru .

Конечные методы

При решении уравнения правдоподобия (7.1.2), (7.1.3) может быть использован любой из известных методов максимизации функции век­торной переменной методы нахождения оценок максимального правдоподобия - student2.ru. Только в редких случаях максими­зирующее значение - оценка максимального правдоподобия методы нахождения оценок максимального правдоподобия - student2.ruнахо­дится точно. В частности, это заведомо удается сделать, если функция правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru такова, что

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.1)

где матрица методы нахождения оценок максимального правдоподобия - student2.ru положительно (или отрицательно) определен­ная при всех методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru , а уравнения

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.2)

имеют решения. Эти решения

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.3)

где методы нахождения оценок максимального правдоподобия - student2.ru - функция, обратная методы нахождения оценок максимального правдоподобия - student2.ru , и являются компонентами вектора оцен­ки максимального правдоподобия.

Простейшим частным случаем (7.5.1) является случай, когда лога­рифм функции правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru квадратично зависит от методы нахождения оценок максимального правдоподобия - student2.ru , то есть

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.4)

где методы нахождения оценок максимального правдоподобия - student2.ru - скаляр; методы нахождения оценок максимального правдоподобия - student2.ru - вектор той же размерности т, что и методы нахождения оценок максимального правдоподобия - student2.ru ; методы нахождения оценок максимального правдоподобия - student2.ru - неособая матрица порядка методы нахождения оценок максимального правдоподобия - student2.ru . При этом оценка максималь­ного правдоподобия

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.5)

где методы нахождения оценок максимального правдоподобия - student2.ru - матрица, обратная методы нахождения оценок максимального правдоподобия - student2.ru .

Другим распространенным примером, для которого выполняется (7.5.1), является случай, когда

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.6)

В этом случае оценка максимального правдоподобия

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.7)

Число таких примеров, как соответствующих (7.5.1), так и несоот­ветствующих этому условию, но допускающих точное решение уравнения правдоподобия, в том числе и для нерегулярного случая (примеры § 7.4 и др.), довольно велико, однако еще более многочисленны случаи, когда точное аналитическое решение уравнения правдоподобия получить невозможно. При этом для нахождения оценки используются различ­ные приближенные методы. Выбор того или иного из них определяется исходя из точности приближенного решения и вычислительной просто­ты. В частности, в регулярном случае широко распространены различ­ные варианты итеративных процедур, в том числе градиентный метод, метод наискорейшего спуска, метод Ньютона, метод золотого сечения и т.д. Любой из них является методом последовательных приближений и при определенных условиях обеспечивает достаточно быструю схо­димость к истинному решению уравнения максимального правдоподо­бия. Приведем для примера алгоритм нахождения оценки максималь­ного правдоподобия, соответствующий методу Ньютона. В этом случае k-я итерация, определяющая очередное приближение методы нахождения оценок максимального правдоподобия - student2.ru к оценке мак­симального правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru , производится по правилу

методы нахождения оценок максимального правдоподобия - student2.ru , (7.5.8)

где методы нахождения оценок максимального правдоподобия - student2.ru - приближение, полученное на методы нахождения оценок максимального правдоподобия - student2.ru -м шаге, а начальное приближение выбирается произвольно с учетом имеющихся представлений о существе задачи. Входящий в (7.5.8) оператор методы нахождения оценок максимального правдоподобия - student2.ru представляет со­бой результат умножения вектора-столбца методы нахождения оценок максимального правдоподобия - student2.ru на транс­понированный ему вектор (строку) и является матрицей вида методы нахождения оценок максимального правдоподобия - student2.ru так что результат воздействия этого опе­ратора на функцию методы нахождения оценок максимального правдоподобия - student2.ru также представляет собой матрицу

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.9)

a методы нахождения оценок максимального правдоподобия - student2.ru , как всегда, обратная матрица.

Проиллюстрируем применение этого алгоритма на примере оценки единственного параметра методы нахождения оценок максимального правдоподобия - student2.ru для случая, когда логарифм функ­ции правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru представляется в виде

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.10)

где х - вектор некоторой размерности; методы нахождения оценок максимального правдоподобия - student2.ru - некоторые функ­ции х; методы нахождения оценок максимального правдоподобия - student2.ru - известная величина, функция методы нахождения оценок максимального правдоподобия - student2.ru имеет единственный мак­симум (для определенности при методы нахождения оценок максимального правдоподобия - student2.ru ) и является четной относительно этого значения, а суммирование производится по такому множеству значений j, что интервал от методы нахождения оценок максимального правдоподобия - student2.ru до методы нахождения оценок максимального правдоподобия - student2.ru полностью перекрывает диапазон возможных значений параметра методы нахождения оценок максимального правдоподобия - student2.ru . К функции правдоподобия, соответствующей (7.5.10), приводят многие задачи радиотехнических измерений (частоты, задержки радиолокационного сигнала, направле­ния на источник излучения).

Выберем в качестве нулевого приближения методы нахождения оценок максимального правдоподобия - student2.ru для оценки макси­мального правдоподобия методы нахождения оценок максимального правдоподобия - student2.ru величину, соответствующую какому-либо из дискретных значений методы нахождения оценок максимального правдоподобия - student2.ru , например методы нахождения оценок максимального правдоподобия - student2.ru . Для того чтобы это значение давало максимально возможную величину функции правдоподобия, очевидно, его нужно выбрать так, чтобы

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.11)

В силу свойств функции методы нахождения оценок максимального правдоподобия - student2.ru выбор любого другого т приведет к уменьшению логарифма функции правдоподобия. Таким образом, наи­более правдоподобным дискретным приближением к оценке максималь­ного правдоподобия является величина

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.12)

где m определяется условием (7.5.11) и соответствует тому номеру j, для которого величина методы нахождения оценок максимального правдоподобия - student2.ru максимальна.

Следующее приближение вычисляется в соответствии с алгорит­мом Ньютона (7.5.8) и дается выражением

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.13)

где учтена четность функции методы нахождения оценок максимального правдоподобия - student2.ru . Если последняя, как это бывает в практических задачах, достаточно быстро убывает с увеличением методы нахождения оценок максимального правдоподобия - student2.ru , так что методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru , то в числителе и знаменате­ле выражения (7.5.13) можно ограничиться только первыми слагаемы­ми. В результате

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.14)

то есть оценка получается зависящей только от наибольшей из величин методы нахождения оценок максимального правдоподобия - student2.ru и двух ближайших к ней. Приближение (7.5.14), как правило, оказывается достаточно точным, и следующие итерации не требуются.

Рекуррентные методы

При большом объеме совокупности данных наблюдения х конечные методы решения уравнения правдоподобия приводят к значительным вычислительным трудностям, связанным с необходимостью запомина­ния большого числа исходных данных и промежуточных результатов вычислений. В связи с этим особый интерес представляют рекуррентные методы, в которых оценка максимального правдоподобия вычисляется по шагам с постепенно увеличивающейся точностью, причем каждый шаг связан с получением новых данных наблюдения, а рекуррентная проце­дура строится так, чтобы хранить в памяти по возможности наименьшее количество данных от предыдущих шагов. Дополнительным и весьма существенным с практической точки зрения преимуществом рекуррент­ных методов является готовность к выдаче результата на любом про­межуточном шаге.

Это обусловливает целесообразность применения рекуррентных ме­тодов даже в тех случаях, если удается получить точное решение урав­нения максимального правдоподобия конечным методом, и делает их еще более ценными, когда невозможно найти точное аналитическое вы­ражение для оценки максимального правдоподобия.

Пусть совокупность данных наблюдения представляет собой по­следовательность методы нахождения оценок максимального правдоподобия - student2.ru для описания которой введем вектор методы нахождения оценок максимального правдоподобия - student2.ru . (Как всегда, каждая его компонента методы нахождения оценок максимального правдоподобия - student2.ru , в свою очередь, может быть вектором, отрезком случайного процесса и т. д.). Пусть методы нахождения оценок максимального правдоподобия - student2.ru - функция правдоподобия, а

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.15)

ее логарифм. Последний всегда можно представить в виде

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.16)

где

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.17)

- логарифм функции правдоподобия для совокупности данных наблю­дения методы нахождения оценок максимального правдоподобия - student2.ru без последнего значения, а

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.18)

- логарифм условной плотности вероятности значения методы нахождения оценок максимального правдоподобия - student2.ru при заданных значениях методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru .

Представление (7,5.16) для логарифма функции правдоподобия яв­ляется основой для получения рекуррентной процедуры вычисления оценки максимального правдоподобия. Рассмотрим регулярный случай. При этом оценка максимального правдоподобия может быть найдена как решение уравнения

методы нахождения оценок максимального правдоподобия - student2.ru , (7.5.19)

которое отличается от (7.1.6) только введением индекса п у логарифма функции правдоподобия.

Обозначим решение этого уравнения через методы нахождения оценок максимального правдоподобия - student2.ru подчеркнув тем са­мым, что эта оценка получена по совокупности данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru . Аналогично обозначим через методы нахождения оценок максимального правдоподобия - student2.ru решение уравнения методы нахождения оценок максимального правдоподобия - student2.ru - оценку максимального правдоподобия, полученную по совокупности данных методы нахождения оценок максимального правдоподобия - student2.ru .

Уравнение (7.5.19) можно переписать с учетом (7.5.16) в следующем виде:

методы нахождения оценок максимального правдоподобия - student2.ru . (7.5.20)

Разложим левую часть (7.5.20) в ряд Тейлора в окрестности точки методы нахождения оценок максимального правдоподобия - student2.ru . При этом

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.21)

где

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.22)

- вектор градиента функции методы нахождения оценок максимального правдоподобия - student2.ruв точке методы нахождения оценок максимального правдоподобия - student2.ru ; слагаемое методы нахождения оценок максимального правдоподобия - student2.ru обращается в нуль благодаря тому, что методы нахождения оценок максимального правдоподобия - student2.ru , является решением уравнения правдоподобия для предыдущего (п - 1)-го шага:

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.23)

- симметричная матрица вторых производных логарифма функции правдоподобия в точке методы нахождения оценок максимального правдоподобия - student2.ru , взятая с обратным знаком, аненапи­санные члены разложения имеют квадратичный и более высокий поря­док малости относительно разности методы нахождения оценок максимального правдоподобия - student2.ru . Пренебрегая этими по­следними, получаем следующее приближенное решение уравнения ма­ксимального правдоподобия:

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.24)

где методы нахождения оценок максимального правдоподобия - student2.ru - матрица, обратная методы нахождения оценок максимального правдоподобия - student2.ru .

Это решение представлено в форме рекуррентного соотношения, определяющего очередное значение оценки методы нахождения оценок максимального правдоподобия - student2.ru через оценку методы нахождения оценок максимального правдоподобия - student2.ru на предыдущем шаге и поправку методы нахождения оценок максимального правдоподобия - student2.ru , зависящую от имеющихся данных наблюдения непосредственно и через предыдущую оценку. Поправка формируется как произведение градиента логарифма условной плотно­сти вероятности методы нахождения оценок максимального правдоподобия - student2.ru вновь полученного значения хn в точке методы нахождения оценок максимального правдоподобия - student2.ru , равной предыдущей оценке, на весовую матрицу методы нахождения оценок максимального правдоподобия - student2.ru . По­следняя определяется выражением (7.5.23) и также зависит от оценки методы нахождения оценок максимального правдоподобия - student2.ru на предыдущем шаге, а ее зависимость от новых данных наблюдения целиком определяется видом логарифма условной плотности веро­ятности методы нахождения оценок максимального правдоподобия - student2.ru .

По форме соотношение (7.5.24) очень похоже на (7.5.8), реализую­щее итеративный способ вычисления оценки максимального правдоподо­бия по методу Ньютона. Однако на самом деле они существенно отли­чаются друг от друга. В (7.5.8) поправка к предыдущему значению оцен­ки определяется величиной градиента логарифма всей функции правдо­подобия, который всегда зависит от всех имеющихся данных наблюде­ния методы нахождения оценок максимального правдоподобия - student2.ru , что требует запоминания всей этой совокупности. В соответствии с (7.5.24) поправка к методы нахождения оценок максимального правдоподобия - student2.ru определяется величиной гра­диента методы нахождения оценок максимального правдоподобия - student2.ru , который благодаря свойствам условной плотности вероятности методы нахождения оценок максимального правдоподобия - student2.ru фактически зависит только от тех значений методы нахождения оценок максимального правдоподобия - student2.ru ( методы нахождения оценок максимального правдоподобия - student2.ru ), которые находятся в сильной статистической связи с хn. Это различие является следствием специального выбора предыдущего приближения методы нахождения оценок максимального правдоподобия - student2.ru как оценки максимального правдоподобия, найденной по уменьшенной на одно значение совокупности данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru , и особенно ярко проявляется при независимых значениях методы нахождения оценок максимального правдоподобия - student2.ru ( методы нахождения оценок максимального правдоподобия - student2.ru ). В этом последнем случае

методы нахождения оценок максимального правдоподобия - student2.ru

благодаря чему методы нахождения оценок максимального правдоподобия - student2.ru зависит только от методы нахождения оценок максимального правдоподобия - student2.ru и хn, а градиент методы нахождения оценок максимального правдоподобия - student2.ru - только от предыдущего значения оценки методы нахождения оценок максимального правдоподобия - student2.ru и вновь полученных на п-мшаге данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru . Поэтому при незави­симых значениях методы нахождения оценок максимального правдоподобия - student2.ru для формирования вектора методы нахождения оценок максимального правдоподобия - student2.ru не требуется запо­минать с предыдущего шага никакой иной информации, кроме значения оценки методы нахождения оценок максимального правдоподобия - student2.ru .

Аналогично, в случае марковской последовательности данных на­блюдения, то есть при

методы нахождения оценок максимального правдоподобия - student2.ru

вектор методы нахождения оценок максимального правдоподобия - student2.ru зависит только от методы нахождения оценок максимального правдоподобия - student2.ru , текущего методы нахождения оценок максимального правдоподобия - student2.ru и одного предыдущего значения методы нахождения оценок максимального правдоподобия - student2.ru .В этом случае для вычисления методы нахождения оценок максимального правдоподобия - student2.ru требуется запомнить с предыдущего шага, помимо значения методы нахождения оценок максимального правдоподобия - student2.ru , еще только значение методы нахождения оценок максимального правдоподобия - student2.ru , но не всю совокупность данных наблюдения, как в ите­ративной процедуре. В общем случае для вычисления методы нахождения оценок максимального правдоподобия - student2.ru может потребоваться запоминание большего числа предыдущих значений методы нахождения оценок максимального правдоподобия - student2.ru ( методы нахождения оценок максимального правдоподобия - student2.ru ), однако из-за необходимости учета только тех значе­ний методы нахождения оценок максимального правдоподобия - student2.ru , которые статистически зависимы с методы нахождения оценок максимального правдоподобия - student2.ru , это число практически всегда меньше полного объема совокупности данных наблюдения методы нахождения оценок максимального правдоподобия - student2.ru . Так, если вектор методы нахождения оценок максимального правдоподобия - student2.ru описывает временную последователь­ность, то количество подлежащих запоминанию членов этой последова­тельности определяется временем ее корреляции, а относительная их доля убывает обратно пропорционально n, как и в случае независимых значений методы нахождения оценок максимального правдоподобия - student2.ru .

Рассмотрим теперь структуру весовой матрицы методы нахождения оценок максимального правдоподобия - student2.ru , входящей в ре­куррентное соотношение (7.5.24). Согласно определению (7.5.23), из-за наличия слагаемого методы нахождения оценок максимального правдоподобия - student2.ru она, вообще говоря, зависит от всех значений методы нахождения оценок максимального правдоподобия - student2.ru даже при независимых значениях методы нахождения оценок максимального правдоподобия - student2.ru , что ли­шает рекуррентное соотношение (7.5.24) преимуществ, связанных с воз­можным сокращением количества запоминаемых с предыдущего шага данных. Существует несколько способов приближенного вычисления ма­трицы методы нахождения оценок максимального правдоподобия - student2.ru ,которые устраняют этот недостаток.

Первый из них основан на более последовательном использовании основного предположения о малом различии двух очередных значений оценки методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru , которое является основой для получения рекур­рентного соотношения (7.5.24). Это позволяет получить аналогичное ре­куррентное соотношение для весовой матрицы методы нахождения оценок максимального правдоподобия - student2.ru .Действительно, используя малость методы нахождения оценок максимального правдоподобия - student2.ru из (7.5.23), имеем

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.25)

Введя обозначение

методы нахождения оценок максимального правдоподобия - student2.ru , (7.5.26)

из (7.5.24) и (7.5.25) получим систему рекуррентных соотношений для вектора методы нахождения оценок максимального правдоподобия - student2.ru и весовой матрицы методы нахождения оценок максимального правдоподобия - student2.ru

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.27)

Эта система совместно с начальными значениями методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru полностью определяет значение оценки методы нахождения оценок максимального правдоподобия - student2.ru на любом шаге, требуя на каждом из них вычисления только градиента методы нахождения оценок максимального правдоподобия - student2.ru и матрицы вторых производных методы нахождения оценок максимального правдоподобия - student2.ru от логарифма условной плотности вероятности для текущего наблюдаемого значения методы нахождения оценок максимального правдоподобия - student2.ru . Начальные значе­ния выбираются с учетом имеющихся априорных данных о возможных значениях и диапазоне изменения параметров методы нахождения оценок максимального правдоподобия - student2.ru , а при полном отсутст­вии этих данных принимаются нулевыми ( методы нахождения оценок максимального правдоподобия - student2.ru , методы нахождения оценок максимального правдоподобия - student2.ru ).

При независимых значениях методы нахождения оценок максимального правдоподобия - student2.ru система рекуррентных соотношений (7.5.27), очевидно, описывает многомерный (размерности методы нахождения оценок максимального правдоподобия - student2.ru ) марковский случайный процесс, компонента которого методы нахождения оценок максимального правдоподобия - student2.ru сходит­ся к истинному значению параметра методы нахождения оценок максимального правдоподобия - student2.ru , а компонента методы нахождения оценок максимального правдоподобия - student2.ru сходится к ин­формационной матрице Фишера методы нахождения оценок максимального правдоподобия - student2.ru (7.3.8), где методы нахождения оценок максимального правдоподобия - student2.ru - истинное значение оцениваемого параметра, и неограниченно увеличивается с ростом п. Аналогичные свойства сходимости система (7.5.27) имеет и при более общихусловиях, если последовательность методы нахождения оценок максимального правдоподобия - student2.ru явля­ется эргодической.

Второй из упомянутых способов основан на замене матрицы вторых производных от логарифма функции правдоподобия методы нахождения оценок максимального правдоподобия - student2.ruее матема­тическим ожиданием - информационной матрицей Фишера, которая с учетом (7.5.16) может быть записана в виде:

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.28)

где аналогично (7.5.26)

методы нахождения оценок максимального правдоподобия - student2.ru . (7.5.29)

Заменяя в (7.5.24) матрицу методы нахождения оценок максимального правдоподобия - student2.ru матрицей методы нахождения оценок максимального правдоподобия - student2.ru , получаем ре­куррентное соотношение

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.30)

для приближенного вычисления оценок максимального правдоподобия, предложенное Сакрисоном (в оригинале для независимых одина­ково распределенных методы нахождения оценок максимального правдоподобия - student2.ru , когда методы нахождения оценок максимального правдоподобия - student2.ru и методы нахождения оценок максимального правдоподобия - student2.ru . Это рекуррентное соотношение проще системы (7.5.27), поскольку оптимальная весовая матрица методы нахождения оценок максимального правдоподобия - student2.ru заменена ее мате­матическим ожиданием, и для ее нахождения не требуются имеющиеся данные наблюдения, кроме тех, которые сконцентрированы в значении оценки методы нахождения оценок максимального правдоподобия - student2.ru . В то же время очевидно, что подобная замена означает необходимость выполнения дополнительного по сравнению с (7.5.27) требования близости матрицы вторых производных к своему математи­ческому ожиданию.

Если плотность распределения вероятности методы нахождения оценок максимального правдоподобия - student2.ru и матри­ца методы нахождения оценок максимального правдоподобия - student2.ru меняются от шага к шагу, прямое нахождение методы нахождения оценок максимального правдоподобия - student2.ru на каждом шаге может потребовать слишком большого числа вычисле­ний. При этом за счет дополнительного уменьшения точности ре­зультатов, определяемого неравенством нулю малых разностей методы нахождения оценок максимального правдоподобия - student2.ru , можно перейти к рекуррентному вычислению приближен­ного значения матрицы методы нахождения оценок максимального правдоподобия - student2.ru . Возвращаясь к прежнему обозначе­нию методы нахождения оценок максимального правдоподобия - student2.ru для этого приближенного значения, получаем еще одну систему рекуррентных соотношений

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.31)

где

методы нахождения оценок максимального правдоподобия - student2.ru (7.5.32)

- математическое ожидание матрицы методы нахождения оценок максимального правдоподобия - student2.ru (информационная матри­ца Фишера для одного наблюдения методы нахождения оценок максимального правдоподобия - student2.ru ), взятое в точке методы нахождения оценок максимального правдоподобия - student2.ru . Эта система отличается от (7.5.27) тем, что во втором из рекуррентных соот­ношений (7.5.31) не участвуют непосредственно данные наблюдения методы нахождения оценок максимального правдоподобия - student2.ru .

Любая из рассмотренных выше систем рекуррентных соотношений является совершенно точной, если функция методы нахождения оценок максимального правдоподобия - student2.ru квадратично зависит от методы нахождения оценок максимального правдоподобия - student2.ru , и дополнительно матрица вторых производных методы нахождения оценок максимального правдоподобия - student2.ru не зависит от методы нахождения оценок максимального правдоподобия - student2.ru . Фактически это соответствует случаю независимых нормально рас­пределенных (не обязательно одинаково) значений методы нахождения оценок максимального правдоподобия - student2.ru с неизвестным математическим ожиданием методы нахождения оценок максимального правдоподобия - student2.ru , которое и представляет собой оценивае­мый параметр.

Система рекуррентных соотношений (7.5.24) дает точное решение уравнения максимального правдоподобия в гораздо более широких условиях при единственном требовании, чтобы функция методы нахождения оценок максимального правдоподобия - student2.ru квадра­тично зависела от методы нахождения оценок максимального правдоподобия - student2.ru . При этом зависимость методы нахождения оценок максимального правдоподобия - student2.ru от методы нахождения оценок максимального правдоподобия - student2.ru произвольна, что соответствует широкому классу распределений вероятности совокуп­ности методы нахождения оценок максимального правдоподобия - student2.ru как с независимыми, так и с зависимыми значениями.

Наряду с рассмотренными общими способами существует еще ряд методов выбора матрицы весовых коэффициентов методы нахождения оценок максимального правдоподобия - student2.ru в рекуррентном соотношении (7.5.24), приспособленных к тем или иным конкретным ограничениям. Простейшим из них является выбор методы нахождения оценок максимального правдоподобия - student2.ru в виде диагональной матрицы, так что методы нахождения оценок максимального правдоподобия - student2.ru , (I - единичная матрица), где методы нахождения оценок максимального правдоподобия - student2.ru - убывающая последовательность чис­ловых коэффициентов, выбираемая независимо от свойств функции правдоподобия так же, как в процедуре стохастической аппроксимации Робинса - Монро, которая будет рассмотрена в следующих главах.

Стоит отметить, что любые итерационные или рекуррентные про­цедуры нахождения оценок максимального правдоподобия в общем случае являются приближенными. Поэтому, вообще говоря, для оценок, получающихся в результате применения этих процедур, состоятельность, асимптотическую эффект

Наши рекомендации