Глава 8. адаптивный байесов подход при непараметрической априорной неопределенности

ВВОДНЫЕ ЗАМЕЧАНИЯ

Несколько последующих глав будет посвящено детальному рассмот­рению адаптивного байесова подхода при наличии параметрической априорной неопределенности применительно к широким классам задач с доведением правил решения до детальной структуры и исследованием эффективности этих правил решения. В этой главе на ряде примеров, каждый из которых также относится к достаточно широкой совокупности задач, проиллюстрируем возможности адаптивного байесова подхо­да в непараметрическом случае.

В § 6.1 мы уже рассмотрели пример применения адаптивного байе­сова подхода в случае непараметрической априорной неопределенности (пример 2). Этот пример в некотором отношении является крайним: характер априорной неопределенности таков, что какие-либо сведения об аналитическом описании исходного материала полностью отсутству­ют: совсем неизвестно распределение вероятности наблюдаемых значе­ний глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ),полностью неизвестен вид функции потерь и тем более природа и статистическое описание параметров глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , влияющих на величину потерь и последствия от принятия того или иного решения.

Нужно отметить, что за эту крайность приходится расплачиваться до­вольно серьезными ограничениями: предположениями о дискретности мно­жества решений U, о дискретности множества значений глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , о независимости и одинаковости распределений вероятности всех значений глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ), об одинаковости истинных (неизвестных нам) функций потерь на всех шагах глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и требованием, чтобы полная совокупность данных наблюдения х содержала значения принятых при глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru N решений глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и появившихся при этом потерь глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Указанные ограничения выражают иную форму представления имеющихся априорных знаний, отличную от параметрического статистического описания неизвестных распределений вероятности и функций потерь, причем, как видно из перечисленных ограничений, необходимый для нахождения правила решения объем этих априорных знаний довольно велик.

Возникающее иногда противопоставление параметрического и не­параметрического подходов к решению задач синтеза и обсуждение, ка­кой из них является более подходящим в условиях априорной неопре­деленности и соответствует более глубокой степени этой неопределен­ности, представляются довольно беспочвенными: параметрическое и не­параметрическое описания исходных данных задачи просто соответству­ют разным видам имеющихся ограниченных априорных знаний и взаим­но дополняют друг друга.

Характерной чертой непараметрического случая является использо­вание в той или иной степени эмпирических распределений вероятности вместо истинных и эмпирических средних значений вместо математиче­ских ожиданий, подобно тому, как это было сделано в примере 2 § 6.1 при замене апостериорного риска (условного математического ожида­ния функции потерь) его оценкой - эмпирическим средним значением ожидаемых при данном результате наблюдения потерь. Это обстоятель­ство приводит к определенным требованиям к объему и составу полной совокупности данных наблюдения х, для того чтобы эмпирическое осред­нение приводило к состоятельным оценкам необходимых для отыскания правил решения математических ожиданий (среднего риска, апостериорного риска, минимального значения апостериорного риска и т. д.). Указанная совокупность х должна иметь вполне определенный состав и содержать достаточное для построения таких оценок количество данных наблюдения.

Так, в условиях примера 2 § 6.1 (при неизвестной функции потерь) совершенно необходимо, помимо величин глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ), знать значе­ние принятого при каждом глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru решения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и величину потерь глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru от принятия этого решения. В противном случае никакого адаптивного байесова или любого другого правила решения, обладающего хотя бы свой­ством асимптотической оптимальности, построить невозможно.

В этом отношении непараметрические задачи имеют широкий спектр возможностей: чем больше объем наших сведений (качественного или количественного характера) об аналитических свойствах распределений вероятности х и глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , и функций потерь, тем менее жесткие требования предъявляются к составу и объему совокупности данных наблюдения и наоборот.

8.4. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ

В гл. 4 мы уже упоминалиоб обширном классе двухальтернативных задач, связанных с проверкой гипотезы о том, что совокупность наблю­даемых данных подчиняется некоторому заданному распределению ве­роятности при свободной альтернативе, то есть в предположении, что наря­ду с выполнением этой гипотезы могут встретиться какие угодно слу­чаи. Там же был рассмотрен пример такой задачи в параметрическом варианте, когда класс возможных распределений вероятности ограничен некоторым параметрическим семейством с совершенно произвольными значениями параметров. При отсутствии такого ограничения задача приобретает дополнительную специфику, связанную с очень большой степенью априорной неопределенности и необходимостью ей непарамет­рического решения. Правило решения этой задачи, по установившейся терминологии, называется критерием согласия и неоднократно рассма­тривалось в литературе по математической статистике, являясь класси­ческим примером задачи принятия решения в условиях априорной не­определенности. Покажем, как получить известные и новые непараме­трические критерии согласия на основе адаптивного байесова подхода.

Сформулируем более четко постановку задачи. Пусть имеется сово­купность независимых наблюдений глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и функция распреде­ления величины глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ) есть либо глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , либо глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , причем функция распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru известна, а функция распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru полностью неизвестна и совершенно произвольна. На основании наблюдения совокупности данных глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru требует­ся решить, какая из альтернатив имеет место в действительности:

1) глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - выборка глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru описывается распределением веро­ятности с функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ;

2) глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - выборка глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru не описывается распределением вероятности с функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , а описывается распре­делением вероятности с какой-то иной отличной от глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru .

Обозначим решения, состоящие в принятии первой и второй аль­тернативы, через глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru соответственно и определим функцию потерь глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Обычно для правильных решений принимаются нулевые потери глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , а значение потерь от принятия решения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (реше­ние о том, что выборка не согласуется с заданной функцией распре­деления глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , когда на самом деле совокупность данных глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru описывается функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru )) может быть при­нято равным произвольной константе, без ограничения общности глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Потери глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru от принятия решения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru о том, что выборка описывается функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , когда на самом деле она не описывается ей ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ), естественно задать так, чтобы они были малы, если различие между функциями распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru мало, и увеличивались по мере роста различий между этими функ­циями распределения, то есть глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru .

Для того чтобы задача имела нетривиальное решение, функционал глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru должен обращаться в нуль при глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Это естественное тре­бование соответствует тому очевидному факту, что при глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru потери должны обращаться в нуль, поскольку вторая альтернатива совпадает с первой. В качестве функционала глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , удовлетворяющего всем перечисленным требованиям, удобно взять ту или иную меру различия в функциональном пространстве функций распределения. Примерами таких мер являются

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.1)

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.2)

и т. д.

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . (8.4.3)

Зададим также априорные вероятности альтернатив глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и введем произвольное рандомизированное пра­вило решения, определив для этого решающую функцию ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - вероятность принять решение глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , если наблюдаемая совокупность данных есть глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Тогда средний риск

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (8.4.4)

естественно зависит от неизвестной функции распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и по­этому также неизвестен.

Предположим на время, что функция распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru известна и равна глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , то есть речь идет о задаче проверки гипотезы с простой заданной альтернативой глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Тогда, применяя обычный байесов подход, получаем нерандомизированное правило решения:

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru или глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru при глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . (8.4.5)

Неравенство (8.4.5), определяющее условия принятия решения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru о том, что выборочные данные согласуются с распределением вероят­ности, задаваемым функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , можно переписать в следующем виде:

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.6)

где глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - некоторая функция выборочных данных, опре­деляемая при известной глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru левой частью неравенства (8.4.5).

При неизвестной функции распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru в соответствии с об­щими принципами адаптивного байесова подхода нужно заменить неизвестные нам статистические описания данных наблюдения оценоч­ными значениями, полученными с помощью тех же данных наблюдения. В данном случае нам неизвестны как функция потерь - величина глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , зависящая от неизвестной функции распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - так и отношение правдоподобия глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , входящее в функцию С = С(х) и зависящее от неизвестной плотности вероятности глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Состоятельной оценкой функции распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru в предположении, что имеет место вторая альтернатива, является вы­борочная функция распределения

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.7)

где

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (8.4.8)

а состоятельной оценкой глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - величина

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.9)

которая зависит от совокупности имеющихся данных глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Нужно отметить, что, используя (8.4.7), мы уже израсходовали все имеющиеся данные наблюдения на оценку функции распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и функции потерь глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Такая политика в отношении распреде­ления имеющейся информации для устранения априорной неопределен­ности является в данном случае правильной, поскольку все равно без дополнительных предположений о возможном виде функции распреде­ления глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (то есть ограничения второй альтернативы) никакой состоя­тельной оценки плотности вероятности глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и функции прав­доподобия, входящей в величину С = С(х), не существует. Лучшее, что можно сделать в этих условиях - заменить в (8.4.6) глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru его состоятельной оценкой глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru из (8.4.9), а глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru - некоторой константой.

В результате приходим к следующему правилу решения, опреде­ляющему непараметрический критерий согласия: решение глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru о том, что совокупность данных наблюдения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru подчиняется рас­пределению с функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , принимается в том слу­чае, если выполняется неравенство

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (8.4.10)

Различным определениям меры различия глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru соответствуют разные критерии согласия: для (8.4.1) получается критерий Колмогоро­ва, для (8.4.2) - критерий w2 Мизеса - Смирнова и т. д. Константа С в (8.4.10) обычно выбирается так, чтобы вероятность принять решение глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , когда выполняется первая альтернатива ( глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru ), была равна заданной величине.

Правило решения(8.4.10) обладает следующими свойствами асимптотической инвариантности: при глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru распределение вероятности случайной величины глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru в случае, если выборка глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru опи­сывается функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , не зависит от вида этой функции, то есть получается универсальным для всех глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , а в случае, если выборка описывается функцией распределения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , зависит от истинной величины глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Асимптотические свойства критериев согласия (8.4.10) и их поведение при конечных п подробно исследованы в литературе по математической статистике.

Совершенно аналогично можно получить решение некоторых более сложных задач проверки гипотезы со свободной альтернативой. Пусть, например, имеется две совокупности данных наблюдения глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и требуется решить, подчиняются ли они од­ному и тому же распределению вероятности (на этот раз неизвестному) или нет. Если обозначить

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , (8.4.11)

выборочные фикции распределения, построенные по совокупности х и у соответственно, то аналогично (8.4.10) правило решения для этой зада­чи определяется следующим неравенством:

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru (8.4.12)

При этом меру глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru обычно задают так, что она удовлетворяет требованиям, вытекающим из обычного определения расстояния, то есть глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . (Заметим, что функции глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru из (8.4.2), (8.4.3) не отвечают этому свойству.) В частности, для глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru из (8.4.1) полу­чаем известный критерий Смирнова.

Можно еще усложнить постановку задачи с учетом возникающих практических потребностей. Пусть, например, задана некоторая функ­ция глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , и производятся две независимые серии наблюдений глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru

Требуется принять решение, связаны ли эти величины заданной функциональной зависимостью, то есть являются ли случайные величины глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru зна­чениями функции глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru от случайного аргумента глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , с тем же распределением вероятности, что и любая из величин глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Осуществим преобразование случайных величин глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru в соответствии с правилом глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru , в результате чего получим совокупность данных глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . Тогда постав­ленная задача статистического решения сводится к задаче проверки ги­потезы о том, что совокупности глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru и у подчиняются одному и тому же распределению вероятности, а непараметрическое правило ее решения дается неравенством (8.4.12), где

глава 8. адаптивный байесов подход при непараметрической априорной неопределенности - student2.ru . (8.4.13)

В заключение отметим, что приведенные в этой главе примеры применения адаптивного байесова подхода, несмотря на довольно зна­чительную общность каждого из них, ни в коей мере не исчерпывают даже небольшой доли того громадного множества задач, которое воз­никает в практических приложениях. Однако читатель получил опреде­ленное представление о возможностях применения адаптивного байесова подхода к задачам с непараметрической априорной неопреде­ленностью и сможет применить при необходимости изложенные выше методы.

Наши рекомендации