Ігри з природою в умовах визначеності

Тема 3. УХВАЛЕННЯ РІШЕНЬ В УМОВАХ ЧАСТКОВОЇ НЕВИЗНАЧЕНОСТІ. ТЕОРІЯ СТАТИСТИЧНИХ РІШЕНЬ

Сутність ігор з природою. Предметом розгляду служать статистичні моделі ухвалення рішень, які трактують як статистичні ігри або ігри з природою за використання додаткової статистичної інформації про її стратегії. Характерна риса статистичної гри – можливість отримання інформації в результаті деякого статистичного експерименту для оцінки розподілу вірогідності стратегій природи. Дослідження механізму випадкового вибору стратегії природою дозволяє прийняти оптимальне рішення, яке буде найкращою стратегією у грі з неантагоністичним супротивником людини – природою.

У попередніх розділах теорії ігор передбачалося, що обидва супротивники (чи більше двох) активно протидіють один одному, що обидва вони достатньо розумні, щоб шукати і знайти свою оптимальну стратегію, і обережні, щоб не відступати від неї. Така ситуація дає можливість передбачати поведінку гравців. Невизначеність була лише у виборі супротивником конкретної чистої стратегії в кожній окремій партії.

Однак можливий випадок, коли невизначеність в грі викликана не свідомою протидією супротивника, а незнанням умов, за яких прийматиметься рішення, випадкових обставин. Такі ігри називаються "іграми з природою".

Гра людини з природою теж відбиває конфліктну ситуацію, що виникає під час зіткнень інтересів у процесі вибору рішення. Але "стихійним силам природи" не можна приписати розумні дії, спрямовані проти людини і тим більше який-небудь "злого наміру". Таким чином, коректніше говорити про конфліктну ситуацію, викликану зіткненням інтересів людини і невизначеністю дій природи.

Дії природи можуть як завдавати збитків, так і приносити прибуток. Поведінку природи можна оцінити статистичними методами, визначити притаманні їй закономірності. Залежно від міри знання закономірностей, які визначають поведінку природи, розрізняють ігри з природою в умовах визначеності та ігри з природою в умовах невизначеності.

У першому випадку поведінка природи відома повністю (задана вірогідністю), другому - дії природи є невідомими, або вивченими частково.

До явищ природи, які впливають на результат рішення, відносять не лише погодні і сезонні явища (дощ, посуха, урожай, неврожай), але і прояв будь-яких, не залежних від нас обставин: наприклад, затримка на транспорті.

Пошуком рішень в таких ситуаціях і займається теорія статистичних рішень.

Людина, граючи з природою, прагне максимізувати свій виграш. Тому якщо вона є обережним гравцем (теорія ігор розглядає саме таких гравців), то людина повинна під час вибору своєї стратегії керуватися тим, чи приведуть відомі чи невідомі їй закономірні дії природи до найменш сприятливих наслідків. Саме тому такі ігри можна розглядати як ігри двох осіб з нульовою сумою, які вже були розглянуті.

Формалізація завдання відбувається таким чином: у активного гравця (людини) можливі дії також називаються стратегіями, а можливі дії пасивного гравця (природи) – станами або умовами природи.

Першим гравцем завжди виступає людина, тому в матриці записується його виграш. Оскільки нас цікавить оптимальна стратегія людини і її гарантований виграш, то достатньо визначити максимінну стратегію першого гравця і нижню ціну гри.

Визначення верхньої ціни гри має сенс, якщо дана гра повторюється багаторазово, тому тут оптимальна стратегія може бути змішаною.

Ігри з природою в умовах визначеності

Якщо людина, яка виступає проти природи, має статистичні дані про закономірності в конкретних проявах природи, то завдання легко вирішити ймовірнісними методами.

Таким чином, якщо вірогідність станів природи відома і не змінюються з часом (стаціонарність), то визначається рішення, яке дає найбільше математичне очікування виграшу в умовах відомої стратегії природи – стану або умови.

Приклад.

Фірма купила верстат за 100 гр.од. Для ремонту верстата можна купити спеціальне устаткування за 50 гр.од. чи обійтися старим устаткуванням. Якщо верстат виходить з ладу, його ремонт за допомогою спецобладнання обходиться в 10 гр.од., без спецобладнання – в 40 гр.од. Відомо, що протягом терміну експлуатації верстат виходить з ладу не більше трьох разів: вірогідність того, що верстат не зламається – 0,3; зламається 1 раз – 0,4; зламається 2 рази – 0,2; зламається 3 рази – 0,1. Потрібно визначити доцільність придбання спеціалізованого ремонтного устаткування.

Формалізація. Перший гравець має дві чисті стратегії: купувати і не купувати спеціалізоване ремонтне устаткування. У природи – другого гравця – чотири стани: верстат не вийде з ладу, вийде один раз, зламається двічі і три рази. Функція виграшу – витрати фірми на купівлю і ремонт верстата, задається платіжною матрицею:

Ремонтне устаткування Вихід верстата з ладу
жодного разу 1 раз 2 рази 3 рази
не купити -100 -140 -180 -220
купити -150 -160 -170 -180

Рішення. Розглянемо спочатку задачу як антагоністичну гру.

Методом мінімаксу знаходимо сідлову точку: (2,4). Таким чином:

x* = ( 0, 1 );

y* = ( 0, 0, 0, 1 );

v* = – 180 гр.од.

Відповідь: треба купити спеціалізоване устаткування.

Проте в іграх з природою ситуація докорінно змінюється: вже в умові закладена стійка змішана стратегія природи:

у = ( 0,3; 0,4; 0,2; 0,1)

і ми знаємо, що саме цієї стратегії дотримується природа.

Якщо ж людина – перший гравець – продовжуватиме грати оптимально, то його виграш складе

v(x*) = – 150*0,3 – 160*0,4 – 170*0,2 – 180*0,1 = – 161,

а якщо застосує першу, неоптимальну стратегію, то математичне очікування його виграшу складе

v(x') = – 100*0,3 – 140*0,4 – 180*0,2 – 220*0,1 = – 144 .

Таким чином, першому гравцеві вигідно грати неоптимально!

Відповідь: не купувати спеціалізоване устаткування.

Істотна відмінність між значеннями v(x*) і v(x') пояснюється тим, що змішана стратегія природи неоптимальна і вона, "відхиляючись" від своєї оптимальної стратегії "недоотримує" 36 гр. од. виграшу.

Наши рекомендации