Приближенный метод решения матричных игр

Если точное решение матричной игры оказывается громоздким, можно ограничиться приближенным решением. В основе этого метода лежит предположение, что игроки выбирают свои стратегии в очередной партии, руководствуясь накапливающимся опытом уже сыгранных партий. Достоинство метода – его простота.

Пример 1.9.Найти приближенное решение матричной игры, смоделировав 10 партий: Приближенный метод решения матричных игр - student2.ru

Решение.Чтобы избавиться от дробей, умножим все элементы матрицы на 10. От этого оптимальные стратегии игроков не изменятся, а цена игры тоже умножится на 10.

Получим матрицу Приближенный метод решения матричных игр - student2.ru Составляем таблицу.

Номер партии Игрок А Игрок В Приближенные значения цены
Стратегия Накопленный выигрыш при различных стратегиях игрока В Стратегия Накопленный выигрыш при различных стратегиях игрока А
В1 В2 В3 А1 А2 А3 α β v = = (α + β)/2
А1 В1
А2 В3 15/2 17/2
А2 В2 23/3 24/3 47/6
А2 В2 30/4 32/4 62/8
А1 В3 38/5 39/5 77/10
А1 В3 45/6 47/6 92/12
А2 В3 53/7 55/7 108/14
А2 В3 61/8 63/8 124/16
А2 В2 69/9 71/9 140/18
А3 В2 7,7 7,9 7,8

Ниже описано как заполняется таблица.

Игрок А начинает со своей первой стратегии. Соответствующие выигрыши (первая строка матрицы) запишем в столбцы В1, В2, В3 и определим среди них минимальный: min (7, 9, 7) = 7 (в случае, когда их несколько, берем тот, что расположен левее). Этот минимум выделим. Он соответствует стратегии В1. Поэтому соответствующие выигрыши (первый столбец матрицы) запишем в столбцы А1, А2, А3 и определим среди них максимальный: max (7, 9, 7) = 9 (в случае, когда их несколько, берем тот, что расположен левее). Этот максимум выделим. Он соответствует стратегии А2. Поэтому во второй партии игрок А ответит стратегией А2. Соответствующие выигрыши (вторая строка) надо прибавить к числам в столбцах В1, В2, В3 предыдущей строки игрока А и определить минимальное среди полученных: min (16, 16, 15) = 15, что соответствует стратегии В3. Поэтому соответствующие выигрыши (третий столбец) надо прибавить к числам в столбцах А1, А2, А3 предыдущей строки игрока В и определить среди них максимальный: max (14, 17, 15) = 17, что соответствует стратегии А2. И т.д.

Приближенное значение нижней цены игры в каждой партии α = (выделенное число в столбцах В1, В2, В3)/(номер партии).

Приближенное значение верхней цены игры в каждой партии β = (выделенное число в столбцах А1, А2, А3)/(номер партии).

После 10 партий v ≈ 7,8. Поэтому для исходной матрицы v ≈ 7,8/10 = 0,78.

pi ≈ (число использования стратегии Аi)/(число партий).

qi ≈ (число использования стратегии Bj)/(число партий).

Число использования стратегии Аi = число отмеченных элементов в столбце Аi.

Число использования стратегии Вj = число отмеченных элементов в столбце Вj.

После 10 партий p1 ≈ 3/10, p2 ≈ 6/10, p3 ≈ 1/10 (за 10 партий игрок А 3 раза воспользовался стратегией А1, 6 раз – стратегией А2, 1 раз – стратегией А3).

q1 ≈ 1/10, q2 ≈ 4/10, q3 ≈ 5/10.

Наши рекомендации