Геометрическая иллюстрация байесовских стратегий
Рассмотрим статистическую - игру для двух состояний природы и , определяемую выпуклой областью :
0
Рис. 3.8
Вычислим средние потери (3.9):
,
где . Геометрически - это так называемая опорная прямая с градиентом , направленным от начала координат в сторону области .
Будем увеличивать от нуля до тех пор, пока эта прямая не станет касательной к границе области в точке , представляющей собой допустимую стратегию. Видно, что эта точка и определяет, при заданных и , оптимальную байесовскую стратегию, так как дальнейшее увеличение по направлению , приведет к недопустимым стратегиям.
Таким образом:
1) Каждая допустимая стратегия является байесовской для некоторых априорных вероятностей и .
2) Учитывая, что границей области является многоугольник, то опорная прямая в оптимальном положении обязательно пройдет через одну из вершин многоугольника. То есть, при заданных вероятностях и , всегда существует байесовская стратегия (хотя бы одна), являющейся чистой.
Если состояний природы более двух, то все вышесказанное остается в силе, только геометрическая иллюстрация становится практически невозможной.
Отметим также, что геометрическая иллюстрация байесовских стратегий представляет собой не что иное, как графическое решение задачи линейного программирования.
СТАТИСТИЧЕСКИЕ ИГРЫ С ПРОВЕДЕНИЕМ ЕДИНИЧНОГО ЭКСПЕРИМЕНТА
Постановка задачи
Особенностью статистической игры является возможность проведения эксперимента с целью расширения и уточнения знаний о состояниях природы. И возможность проведения эксперимента чрезвычайно расширяет класс возможных стратегий статистика.
Прежде всего, статистик должен принять решение о том, проводить или не проводить эксперимент. В случае положительного ответа на этот вопрос, он должен далее решить:
а) каким должен быть этот эксперимент;
б) сколько следует провести испытаний, чтобы считать эксперимент законченным;
в) какие предпринять действия при тех или иных исходах эксперимента.
Предположим, что статистик принял решение о проведении единичного эксперимента, под которым будем понимать такой эксперимент, объем и порядок проведения которого заранее определены.
Так, если надо проверить, является ли данная монета симметричной, можно провести единичный эксперимент, состоящий в бросании монеты раз. При этом пространство исходов этого эксперимента состоит из элементов вида:
.
Например, для определения вероятности выпадения герба при одном бросании монеты, Пирсон провел эксперимент, состоящий из 24000 бросаний монеты. То есть пространство возможных исходов эксперимента состояло из элементов.
Пространство выборок
Обозначим пространство исходов эксперимента через , а элементы этого пространства как . Тогда на пространстве можем определить условное распределение вероятностей :
, , , (3.11)
где - условная вероятность того, что исходом эксперимента будет при данном состоянии природы .
Совокупность трех элементов: пространства исходов эксперимента , пространства состояний природы и распределения вероятностей называют пространством выборок:
. (3.12)
Пространство выборок удобно задавать в виде таблицы, содержащей распределение вероятностей на прямом произведении множеств .
№ 3.7.Рассмотрим задачу о технологической линии и предположим, что эксперимент заключается в грубом предварительном анализе содержания примесей. Точный лабораторный анализ проводить нецелесообразно, так как это требует значительных затрат времени, а следовательно, и простоя оборудования.
Результаты эксперимента ( - примесей не обнаружено, - примеси в небольшом количестве, - примесей много) представим в следующей таблице:
0,60 | 0,20 | |
0,25 | 0,30 | |
0,15 | 0,50 |
Например, 0,25 - это вероятность того, что при действительном состоянии природы (сырье с малым количеством примесей), эксперимент обнаружит их в небольшом количестве.
Решающая функция
Если в задаче без эксперимента статистик должен принять решение из пространства решений , исходя из априорной информации о состояниях природы, то в задаче с экспериментом, он принимает решение в зависимости от исхода эксперимента .
Чтобы формализовать эту задачу нужно заранее проанализировать все возможные исходы эксперимента, и составить правило , определяющее, какое решение следует принять при каждом из возможных исходов эксперимента . Это правило представляет собой отображение пространства исходов эксперимента на пространство решений :
, (3.13)
или
.
Правило , определяющее решение , которое должен принять статистик при каждом возможном исходе эксперимента , называется решающей функцией, а полный перечень возможных решающих функций называется пространством решающих функций .
№ 3.8.Рассмотрим решающие функции в условиях № 3.7. Это
,
где , и - решения, которые принимает статистик при исходах эксперимента , и соответственно. Например, означает, что при исходе эксперимента принимается решение , при исходе - решение , при исходе - решение .
Видно, что число чистых стратегий статистика значительно увеличилось. В № 8 это число равно , а в общем случае , где - количество возможных решений статистика , а - количество возможных исходов эксперимента .
Понятие решающей функции позволяет более четко сформулировать задачу статистика. Эта задача состоит в том, чтобы из пространства решающих функций , выбрать такую решающую функцию , которая позволит принимать наиболее выгодные решения. Для этого необходимо уметь оценивать различные решающие функции, что можно сделать при помощи, так называемых, функций риска.
Функции риска
Если статистик остановил свой выбор на некоторой решающей функции , то он, тем самым, определил для каждого исхода эксперимента , , соответствующее решение , которому при данном состоянии природы будут соответствовать потери:
. (3.14)
Но при заданном , исход эксперимента будет случайной величиной с вероятностями:
,
на пространстве . Поэтому и потери будут случайными величинами с вероятностями .
Следовательно, необходимо вести речь о средних потерях, определенных на всем пространстве возможных исходов эксперимента . Эти средние потери называются функцией риска:
. (3.15)
Функция риска определяется для каждого состояния природы и для каждой решающей функции . То есть определяется на прямом произведении множеств точно так же, как функция потерь , в игре без эксперимента, определялась на прямом произведении множеств . Следовательно, пространство решающих функций и функция риска , в игре с единичным экспериментом, играют ту же роль, что и пространство возможных стратегий статистика и функция потерь в игре без эксперимента. Это означает, что игру с единичным экспериментом можно решить теми же самыми методами, что и игру без эксперимента. Плохо только то, что количество чистых стратегий статистика неимоверно возрастает.
В игре с экспериментом статистик может применять и смешанные стратегии. Для этого он должен иметь механизм случайного выбора, задающий распределение вероятностей в пространстве .
Тогда функция риска, при применении смешанных стратегий, будет вычисляться как математическое ожидание (среднее):
, (3.16)
или с учетом (3.15):
. (3.17)
Естественно, что при поиске наилучшей стратегии в игре с экспериментом статистик должен исходить только из допустимых стратегий, которые определяются аналогично игре без эксперимента.
№ 3.9.Вычислить функции риска в задаче о технологической линии.
Решение. Для удобства расчетов потери статистика и вероятности сведем в одну таблицу:
0,60 | 0,25 | 0,15 | ||||
0,20 | 0,30 | 0,50 |
Вычислим, например, . Согласно формуле (3.15), получаем:
.
Тогда
,
.
И так далее, можно вычислить все значения функции риска.