Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов

Рассмотрим некоторые конструкции автоматов и их поведение в стационарной случайной среде Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Стационарная случайная среда Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru означает, что за действие Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru среда с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru получает вознаграждение, а с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru штраф. За второе действие Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru среда выдает поощрение с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , а с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru - штраф.

1. Автоматы с линейной тактикой, предложенные М.Л. Цетлиным [3].

Рассмотрим простейший пример автомата, обладающего целесообразным поведением. Рассмотрим автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , имеющий два состояния памяти Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и два действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Автомат сохраняет свои состояния (действия) при выигрыше и изменяет при проигрыше. Матрицы состояний имеют вид Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Графы переходов состояний имеют вид

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 1

Найдем математическое ожидание выигрыша этого автомата в стационарной случайной среде С( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ). Обозначим через Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ) финальную вероятность действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Тогда:

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ,

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Учитывая условие нормировки - Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , имеем:

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ,

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Тогда математическое ожидание выигрыша Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru автомата А в среде С определяется как:

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Если автомат выбирает свои действия независимо от реакций среды и равновероятно, то математическое ожидание его выигрыша

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Очевидно, что Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , т.е. автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru обладает целесообразным поведением в стационарной случайной среде С ( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ).

Рассмотрим автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru (с линейной тактикой), являющийся естественным обобщением автомата Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Он имеет 2m состояний Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и два различных действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Графы переходов состояний имеют вид (рисунок 2):

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 2

Рассмотрим поведение автомата Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru в стационарной случайной среде Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Пусть Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru > Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Докажем целесообразность его поведения, показав, что он выбирает с большей вероятностью то действие, у которого предпочтение больше: Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Имеем дискретную цепь Маркова, задающую поведение системы “автомат – среда”. Как и раньше, Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ) - финальная вероятность действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Зададим Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ; Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Найдем финальную вероятность Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru каждого действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , а затем математическое ожидание выигрыша.

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

……..

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

……….

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru - Условие нормировки

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru = Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru = Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

….

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , если Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

….

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru > Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , если Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Мат. ожидание выигрыша возрастает, значит эти автоматы целесообразны.

Замечание: Если рассмотреть последовательность таких автоматов, у которых память Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , то такая последовательность автоматов называется асимптотически-оптимальной.

Автомат с линейной тактикой Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru является обобщением конструкций М.Л. Цетлина, рассмотренных выше. Автомат имеет Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru внутренних состояний и Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru действий (параметр Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru - глубина памяти). Состоянием автомата Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru соответствует выходное действие Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . При Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru = +1 (поощрении) автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru не меняет своего действия Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и из состояния Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru переходит в состояние Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , а в состоянии Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru остаётся. При Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru = -1 (штрафе) из состояния Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru переходит в состояние Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru и в состояние Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , меняя своё действие Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru на Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ) или на Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ). Граф смены состояний приведён на рисунке 3.

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 3

Автомат с линейной тактикой Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru также является целесообразным в стационарной случайной среде С( Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru ), и относится к асимптотически-оптимальной последовательности автоматов.

2. Автомат Крылова Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 4

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Добавляем условие нормировки: Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Тогда из первого уравнения Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru получаем: Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Итак, Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , если Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Т.е. математическое ожидание выигрыша возрастает, значит, эта конструкция обладает целесообразностью поведения.

Автоматы Крылова образуют асимптотически-оптимальную последовательность во всех стационарных случайных средах.

Аналогично, можно доказать целесообразность поведения автоматов, представленных ниже [2,3].

3. Автомат Роббинса Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 5

4. Автомат Кринского Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru (“доверчивый” автомат)

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 6

5. Автомат Вайсборда Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 7

Запишем финальные вероятности состояний:

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

….

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Автомат обладает целесообразностью поведения, т.к. Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , если Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru .

6. Стохастический автомат с линейной тактикой Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru . Данная конструкция представляет собой стохастический вариант автомата с линейной тактикой М.Л. Цетлина. При входном сигнале S автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru осуществляет те же переходы, что и автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при таком же входном сигнале, а с вероятностью Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru осуществляет такие же переходы, которые осуществляет автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при противоположном входном сигнале. При Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru =1 стохастический автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru становится детерминированным автоматом с линейной тактикой. Автомат Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru при Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru является целесообразным в стационарной случайной среде С и относится к асимптотически-оптимальной последовательности автоматов.

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 8

7. Автомат Валаха (с избирательной тактикой) Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

S = +1

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

S = ‑1

Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru

Рисунок 9

Граф смены состояний автомата Валаха аналогичен графу стохастического автомата с линейной тактикой, только при S = +1 вместо Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , вместо Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru : Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , а в случае S = -1 вместо Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru , вместо Некоторые конструкции целесообразных асимптотически-оптимальных симметрических автоматов - student2.ru :

Наши рекомендации