Приближенный метод решения матричных игр
Если точное решение матричной игры оказывается громоздким, можно ограничиться приближенным решением. В основе этого метода лежит предположение, что игроки выбирают свои стратегии в очередной партии, руководствуясь накапливающимся опытом уже сыгранных партий. Достоинство метода – его простота.
Пример 1.9.Найти приближенное решение матричной игры, смоделировав 10 партий:
Решение.Чтобы избавиться от дробей, умножим все элементы матрицы на 10. От этого оптимальные стратегии игроков не изменятся, а цена игры тоже умножится на 10.
Получим матрицу Составляем таблицу.
Номер партии | Игрок А | Игрок В | Приближенные значения цены | ||||||||
Стратегия | Накопленный выигрыш при различных стратегиях игрока В | Стратегия | Накопленный выигрыш при различных стратегиях игрока А | ||||||||
В1 | В2 | В3 | А1 | А2 | А3 | α | β | v = = (α + β)/2 | |||
А1 | В1 | ||||||||||
А2 | В3 | 15/2 | 17/2 | ||||||||
А2 | В2 | 23/3 | 24/3 | 47/6 | |||||||
А2 | В2 | 30/4 | 32/4 | 62/8 | |||||||
А1 | В3 | 38/5 | 39/5 | 77/10 | |||||||
А1 | В3 | 45/6 | 47/6 | 92/12 | |||||||
А2 | В3 | 53/7 | 55/7 | 108/14 | |||||||
А2 | В3 | 61/8 | 63/8 | 124/16 | |||||||
А2 | В2 | 69/9 | 71/9 | 140/18 | |||||||
А3 | В2 | 7,7 | 7,9 | 7,8 |
Ниже описано как заполняется таблица.
Игрок А начинает со своей первой стратегии. Соответствующие выигрыши (первая строка матрицы) запишем в столбцы В1, В2, В3 и определим среди них минимальный: min (7, 9, 7) = 7 (в случае, когда их несколько, берем тот, что расположен левее). Этот минимум выделим. Он соответствует стратегии В1. Поэтому соответствующие выигрыши (первый столбец матрицы) запишем в столбцы А1, А2, А3 и определим среди них максимальный: max (7, 9, 7) = 9 (в случае, когда их несколько, берем тот, что расположен левее). Этот максимум выделим. Он соответствует стратегии А2. Поэтому во второй партии игрок А ответит стратегией А2. Соответствующие выигрыши (вторая строка) надо прибавить к числам в столбцах В1, В2, В3 предыдущей строки игрока А и определить минимальное среди полученных: min (16, 16, 15) = 15, что соответствует стратегии В3. Поэтому соответствующие выигрыши (третий столбец) надо прибавить к числам в столбцах А1, А2, А3 предыдущей строки игрока В и определить среди них максимальный: max (14, 17, 15) = 17, что соответствует стратегии А2. И т.д.
Приближенное значение нижней цены игры в каждой партии α = (выделенное число в столбцах В1, В2, В3)/(номер партии).
Приближенное значение верхней цены игры в каждой партии β = (выделенное число в столбцах А1, А2, А3)/(номер партии).
После 10 партий v ≈ 7,8. Поэтому для исходной матрицы v ≈ 7,8/10 = 0,78.
pi ≈ (число использования стратегии Аi)/(число партий).
qi ≈ (число использования стратегии Bj)/(число партий).
Число использования стратегии Аi = число отмеченных элементов в столбце Аi.
Число использования стратегии Вj = число отмеченных элементов в столбце Вj.
После 10 партий p1 ≈ 3/10, p2 ≈ 6/10, p3 ≈ 1/10 (за 10 партий игрок А 3 раза воспользовался стратегией А1, 6 раз – стратегией А2, 1 раз – стратегией А3).
q1 ≈ 1/10, q2 ≈ 4/10, q3 ≈ 5/10.