Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии.

Теорема фон Неймана.

Пусть задана антагонистическая игра с платежной матрицей A (m, n) = (|aij|)

Определение. Смешанной стратегией игрока А называется дискретная случайная величина, принимающая значения 1,2,3,…m с определенной вероятностью; . смешанной стратегией игрока В называется дискретная случайная величина, принимающая значения 1,2,3,… n с определенной вероятностью.

    m
P1 P2       pm

P = (p1, p2 … pm), pi ≥ 0 , ∑pi = 1. Q = (q1, q2 … qn) (аналогично для Q).

Чистые стратегии игроков являются частными случаями смешанных, при этом

А1=(1,0,0,……0), А2=(0,1,0,……0) ….. Аm=(0,0,….0,1);

В1=(1,0,0,……0), В2=(0,1,0,……0) ….. Вn=(0,0,….0,1);

Тогда смешанные стратегии можно представить в виде

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru , Ai - базисные векторы

Проанализируем структуру множества смешанных стратегий. Пусть у игрока А есть две чистые стратегии.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - это множество называется одномерным симплексом.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Для трех чистых стратегий имеем 2-мерный симплекс смешанных стратегий – треугольник с вершинами (1,0,0), (0,1,0), (0,0,1) (концы векторов P принадлежат треугольнику) и т.д.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Определение. Пара (P, Q) – образует исход игры (или игровую ситуацию). В которой выигрыш игрока A, равный aij , достигается с вероятностью piqj. H(P,Q) есть математическое ожидание выигрыша (средний выигрыш) при избранных стратегиях игроков Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - средний выигрыш A (проигрыш B) при (P,Q). В матричном виде: Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Пример. Пусть задана платежная матрица и стратегии игроков:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru , Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru . Считаем векторы P, Q столбцами.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - нижняя цена игры.

Определение. Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - показатель эффективности стратегии P игрока A относительно смешанной стратегии Q игрока B. (SB - множество смешанных стратегий игрока B.)

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - показатель неэффективности стратегии Q игрока B.

Теорема. Показатели α и β достижимы.Т.е.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Доказательство:

Рассмотрим функцию α(P,SB). Для Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru фиксированной стратегии P H(P,Q) - есть функция одной векторной переменной Q на ограниченном замкнутом контуре.

Ограниченность:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru , ∑qi = 1, qi≥ 0

Замкнутость.

Вспомним, что множество называется замкнутым, если оно содержит все свои предельные точки

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru . Если каждый элемент сходящейся числовой последовательности неотрицателен, то и ее предел (очевидно) также неотрицателен, т.е. Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru Далее: Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru . Это доказывает, что симплекс – замкнутое множество.

Теорема.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru - множество чистых стратегий является подмножеством смешанных стратегий.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Верно для H(P, Q0) = α(P, SB)

Определение. Нижней ценой игры в смешанных стратегиях называется величина:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Верхней ценой игры в смешанных стратегиях называется величина:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Теорема.

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru где α, β - цены игры в чистых стратегиях.

Доказательство:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Докажем, что Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru : Для произвольных стратегий P и Q имеем:

Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru

Определение. Если Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru , то игра имеет цену в смешанных стратегиях => Максиминная и минимаксная стратегии тогда являются оптимальными.

Теорема. (Основная теорема антагонистических игр.) Для любой матричной игры существует решение в смешанных стратегиях ( Тема 3. Лекция 8. Антагонистические игры. Смешанные стратегии. - student2.ru , минимаксные стратегии оптимальны).

Без доказательства.

Тема 3. Лекция 9. Антагонистические игры.

Наши рекомендации