Метод наибольшего правдоподобия

Существует два способа оценки параметров распределения: интервальный и точечный. Точечные методы указывают лишь точку, в окрестности которой находится неизвестный оцениваемый параметр. Интервальные способы дают возможность найти интервал, в котором с некоторой вероятностью (задаваемой исследователем) находится неизвестное значение параметра. Рассмотрим некоторые методы точечной оценки параметров.

Пусть имеется генеральная совокупность, Х – случайная величина, имеющая распределение р(x,Q). Если Х – дискретная, то р(x,Q) – вероятность, если Х – непрерывная, то р(x,Q) – плотность, Х1, …, Хn – выборка. Необходимо найти такое распределение р(x,Q), которое бы лучше всего соответствовало выборке. Соответствие выборки Х1, …, Хn закону распределения, содержащего параметр Q, означает, что вероятность получить тот же набор Х при другом значении параметра меньше. Приходим к следующей оптимизационной задаче – при заданных Х1, …, Хn определить значение параметра Θ, чтобы р(x,Q) (вероятность или плотность распределения) была наибольшей. В такой постановке х – фиксированная точка, а Θ ­– переменная. Функцию L(Θ) = р(x,Q) называют функцией правдоподобия.

Более точная математическая формулировка задачи оптимизации следующая.

Если Θ Î q – замкнутой области допустимых значений, необходимо найти такое Θ*, чтобы

Метод наибольшего правдоподобия - student2.ru . (1)

Из анализа известно, что точка максимума не изменится, если вместо L(Q) рассмотреть lnL(Q), которая называется логарифмической функцией максимального правдоподобия. Если максимум функции lnL(Q) достигается внутри допустимой области q, то в точке максимума Q* справедливо необходимое условие экстремума

Метод наибольшего правдоподобия - student2.ru (2)

Система уравнений (2) называется системой уравнений правдоподобия. Так как система (2) является лишь необходимым условие, то найденные Q* могут быть и точками перегиба. Поэтому необходимо проверить выполнение достаточных условий экстремума (например, по знаку второй производной). Если система не имеет решений внутри области, то это означает, что решение может быть на границе области.

Так как Х – выборка и следовательно Х1, …, Хn – независимые, одинаково распределенные случайные величины, то

L(Q) = р(X,Θ) = р(X1,Θ), …, р(Xn, Θ), Метод наибольшего правдоподобия - student2.ru . (3)

Пример 1. Пусть Х имеет нормальное распределение. Есть выборка объема n, Q1 = a, Q2 = s2, тогда Метод наибольшего правдоподобия - student2.ru Метод наибольшего правдоподобия - student2.ru

Метод наибольшего правдоподобия - student2.ru Метод наибольшего правдоподобия - student2.ru

Первое уравнение системы будет иметь вид

Метод наибольшего правдоподобия - student2.ru , Метод наибольшего правдоподобия - student2.ru . (4)

Второе уравнение системы будет иметь вид

Метод наибольшего правдоподобия - student2.ru или Метод наибольшего правдоподобия - student2.ru

Метод наибольшего правдоподобия - student2.ru (5)

Из соотношений (5), (6) составим систему (7), которая называется системой уравнений правдоподобия

Метод наибольшего правдоподобия - student2.ru (6)

Решив систему относительно неизвестных Q1, Q2, получим

Метод наибольшего правдоподобия - student2.ru

Метод моментов

Известно, что эмпирическая функция распределения (плотность) является состоятельной оценкой теоретической функции распределения (плотности), т.е. с увеличением числа наблюдений эмпирическая функция сколь угодно мало отличается от теоретической. Если теоретическая функция распределения зависит от каких-либо параметров, то для оценки этих параметров можно воспользоваться выборочными моментами. Пусть, например, плотность распределения содержит два параметра Θ1 и Θ2 т.е. Θ = (Θ1, Θ2). Первые два момента можно выразить через функцию распределения и Q следующим образом:

 
  Метод наибольшего правдоподобия - student2.ru

Если есть выборка из генеральной совокупности, то выборочные моменты можно найти по известным формулам:

Так как выборочные моменты являются состоятельными оценками, то они с ростом n сходятся по вероятности к функциям a1(q) и a2(Q) в точке Θ = (Θ1, Θ2)

 
  Метод наибольшего правдоподобия - student2.ru

Следовательно, при больших n, a1(Q) » Метод наибольшего правдоподобия - student2.ru , a2(Q) » Метод наибольшего правдоподобия - student2.ru . Заменяя приближенное равенство на точное, получим систему, состоящую из двух уравнений с двумя неизвестными:

Метод наибольшего правдоподобия - student2.ru , (7)

которую надо решить относительно Q1 и Q2.

Метод моментов содержит неоднозначность, так как можно получить систему уравнений (7), используя также и центральные моменты – Метод наибольшего правдоподобия - student2.ru , а следовательно, получим и другие значения Q1 и Q2.

Пример 2. Пусть имеется нормальное распределение с неизвестными параметрами:

а = Q1, s2 = Q2.

 
  Метод наибольшего правдоподобия - student2.ru

Таким образом, если случайная величина имеет нормальное распределение, то оценки а и σ2 вычисляются по формулам Метод наибольшего правдоподобия - student2.ru

Интервальная оценка

Если получена точечная оценка неизвестного параметра по выборке, то говорить о полученной оценке как об истинном параметре довольно рискованно. В некоторых случаях, целесообразнее, получив разброс оценки параметра, говорить об интервальной оценке истинного значения параметра. В качестве иллюстрации сказанного рассмотрим построение доверительного интервала для математического ожидания нормального распределения.

Мы показали, что Метод наибольшего правдоподобия - student2.ru – наилучшая оценка (абсолютно корректная) для математического ожидания МХ = Q, поэтому Метод наибольшего правдоподобия - student2.ru является абсолютно корректной оценкой также и для параметра a = Метод наибольшего правдоподобия - student2.ru нормального распределения

Метод наибольшего правдоподобия - student2.ru

по выборке объема n. Предположим, что задана выборка Хi, i= Метод наибольшего правдоподобия - student2.ru Метод наибольшего правдоподобия - student2.ru . Дисперсия генеральной совокупности известна и равна s2. Как далеко может находиться случайная величина Метод наибольшего правдоподобия - student2.ru от неизвестного математического ожидания Q, оценкой которого она является? Чтобы ответить на этот вопрос, рассмотрим случайную величину Метод наибольшего правдоподобия - student2.ru , представляющую отклонение Метод наибольшего правдоподобия - student2.ru от Q. Отклонение D может изменяться от 0 до +¥, но нас интересует, прежде всего, вероятность того, что отклонение D не превысит предельной ошибки e допустимого уровня

Метод наибольшего правдоподобия - student2.ru . (8)

В формуле (8) только величина Метод наибольшего правдоподобия - student2.ru является случайной, поэтому вероятность Р зависит только от распределения Метод наибольшего правдоподобия - student2.ru .

Очевидно, что события A = {–e<Q– Метод наибольшего правдоподобия - student2.ru <e} и B = {–e+ Метод наибольшего правдоподобия - student2.ru <Q<e+ Метод наибольшего правдоподобия - student2.ru } эквивалентны, так как если произойдет событие А, то произойдет и событие В и наоборот. Поэтому

Р{–e+Q< Метод наибольшего правдоподобия - student2.ru <e+Q} = Р{–e+ Метод наибольшего правдоподобия - student2.ru <Q<e+ Метод наибольшего правдоподобия - student2.ru }. (9)

Таким образом, если Метод наибольшего правдоподобия - student2.ru – функция распределения непрерывной, случайной величины Метод наибольшего правдоподобия - student2.ru , то

Р{–e+Q< Метод наибольшего правдоподобия - student2.ru <e+Q}= Метод наибольшего правдоподобия - student2.ruМетод наибольшего правдоподобия - student2.ru (10)

Определим функцию распределения Метод наибольшего правдоподобия - student2.ru случайной величины Метод наибольшего правдоподобия - student2.ru , где хi Î N(q,s2). Известно, что линейная функция от нормальных случайных величин является нормальной. Поэтому Метод наибольшего правдоподобия - student2.ru – нормальная, а нормальная случайная величина задается двумя параметрами – математическим ожиданием и дисперсией, но

Метод наибольшего правдоподобия - student2.ru .

Таким образом, плотность распределения Метод наибольшего правдоподобия - student2.ru имеет вид

Метод наибольшего правдоподобия - student2.ru .

Поэтому Р{-e+Q< Метод наибольшего правдоподобия - student2.ru <e+Q}= Метод наибольшего правдоподобия - student2.ru Метод наибольшего правдоподобия - student2.ru .

В полученном интеграле произведем замену переменных u= Метод наибольшего правдоподобия - student2.ru , получим

Р{-e+Q< Метод наибольшего правдоподобия - student2.ru <e+Q}= Метод наибольшего правдоподобия - student2.ru

где Ф(z) – функция распределения нормированной нормальной случайной величины.

Таким образом,

Р{-e+ Метод наибольшего правдоподобия - student2.ru <Q<e+ Метод наибольшего правдоподобия - student2.ru }= Метод наибольшего правдоподобия - student2.ru . (11)

Если обозначить -e+ Метод наибольшего правдоподобия - student2.ru = Q1, e+ Метод наибольшего правдоподобия - student2.ru = Q2, то получим интервал (Q1, Q2), который накрывает с вероятностью, равной Метод наибольшего правдоподобия - student2.ru , неизвестную величину Q и эта вероятность не зависит от Q, т.е., она одна и та же для любых значений Q. Чтобы найти сам интервал, надо по выборке вычислить Метод наибольшего правдоподобия - student2.ru и задать e.

Можно по заданной вероятности Р найти концы интервала. Для этого надо воспользоваться формулой Метод наибольшего правдоподобия - student2.ru , где t – значение аргумента функции Лапласа, при котором Ф(t ) = Метод наибольшего правдоподобия - student2.ru , e = Метод наибольшего правдоподобия - student2.ru .

Наши рекомендации