Теорія ігор нехай гра задається матрицею. Приклад розв'язання задачі теорії ігор у змішаних стратегіях нашим сервісом

16.07.2019 Техніка

Математична теорія ігор, що виникла в сорокових роках XX століття, найчастіше застосовується саме в економіці. Але як за допомогою концепції ігор змоделювати поведінку людей у ​​суспільстві? Навіщо економісти вивчають, у який кут частіше б'ють пенальті футболісти, та як виграти у «Каміні, ножиці, папір» у своїй лекції розповів старший викладач кафедри мікроекономічного аналізу ВШЕ Данило Федорова.

Джон Неш і блондинка в барі

Гра - це будь-яка ситуація, у якій прибуток агента залежить тільки від його власних дій, а й від поведінки інших учасників. Якщо ви розкладаєте вдома пасьянс, з погляду економіста та теорії ігор, це не гра. Вона має на увазі обов'язкову наявність зіткнення інтересів.

У фільмі «Ігри розуму» про Джона Неша, нобелівському лауреатіз економіки, є сцена з білявкою в барі. У ній показана ідея, за яку вчений і отримав премію, - це ідея рівноваги по Нешу, яку він сам називав динамікою, що управляє.

Гра- Будь-яка ситуація, в якій виграші агентів залежать один від одного.

Стратегія – опис дій гравця у всіх можливих ситуаціях.

Результат – комбінація обраних стратегій.

Отже, з погляду теорії, гравцями у цій ситуації є лише чоловіки, тобто ті, хто ухвалює рішення. Їхні переваги прості: блондинка краща за брюнетку, а брюнетка краща, ніж нічого. Діяти можна двома способами: піти до білявки або до своєї брюнетки. Гра складається з єдиного ходу, рішення приймаються одночасно (тобто не можна подивитися, куди пішли інші, і потім бути схожим самому). Якщо якась дівчина відкидає чоловіка, гра закінчується: неможливо повернутись до неї або вибрати іншу.

Яким є ймовірний фінал цієї ігрової ситуації? Тобто якою є її стійка конфігурація, з якої всі зрозуміють, що зробили найкращий вибір? По-перше, як правильно зауважує Неш, якщо всі підуть до білявки, нічим добрим це не скінчиться. Тому далі вчений припускає, що всім потрібно піти до брюнеток. Але тоді, якщо відомо, що всі підуть до брюнеток, йому слід йти до білявки, адже вона краща.

У цьому полягає справжня рівновага - результат, у якому один йде до блондинці, інші - до брюнеткам. Може здатися, що це несправедливо. Але в ситуації рівноваги ніхто не може пошкодувати про свій вибір: ті, хто піде до брюнеток, розуміють, що від блондинки вони все одно нічого не отримали б. Таким чином, рівновага по Нешу - це конфігурація, за якої ніхто окремо не хоче змінювати обрану всіма стратегію. Тобто, рефлексуючи наприкінці гри, кожен учасник розуміє, що навіть знаючи, як сходяться інші, він зробив би те саме. Інакше можна назвати це результатом, де кожен учасник оптимально відповідає на дії інших.

"Камінь ножиці папір"

Розглянемо інші ігри щодо рівноваги. Наприклад, у «Каміні, ножицях, папері» немає рівноваги по Нешу: у всіх її можливих наслідках немає варіанта, в якому обидва учасники були б задоволені своїм вибором. Тим не менш, існує Чемпіонат світу та World Rock Paper Scissors Society, що збирає ігрову статистику. Очевидно, що ви можете підвищити свої шанси на перемогу, якщо будете щось знати про звичайну поведінку людей у ​​цій грі.

Чиста стратегія у грі - це така стратегія, коли людина завжди грає однаково, вибираючи одні й самі ходи.

За даними World RPS Society, камінь є ходом, що найчастіше вибирається (37,8%). Папір ставлять 32,6%, ножиці – 29,6%. Тепер ви знаєте, що потрібно вибирати папір. Однак, якщо ви граєте з тим, хто теж це знає, вам уже не треба вибирати папір, тому що від вас очікується те саме. Є знаменитий випадок: у 2005 році два аукціонні будинки Sotheby's та Christie's вирішували, кому дістанеться дуже великий лот - колекція Пікассо та Ван Гога зі стартовою ціною 20 мільйонів доларів. Власник запропонував їм зіграти в Камінь, ножиці, папір, і представники будинків відправили йому свої варіанти електронною поштою. Sotheby“s, як вони пізніше розповіли, особливо не замислюючись, вибрали папір. Виграв Christie”s. Ухвалюючи рішення, вони звернулися до експерта - 11-річної дочки одного з топ-менеджерів. Вона сказала: «Камінь здається найсильнішим, тому більшість людей його обирають. Але якщо ми граємо не з зовсім безглуздим новачком, він камінь не викине, чекатиме, що це зробимо ми, і сам викине папір. Але ми думатимемо на хід уперед, і викинемо ножиці».

Таким чином, ви можете думати на хід вперед, але це не обов'язково призведе до перемоги, адже ви можете не знати про компетенцію вашого суперника. Тому іноді замість чистих стратегій краще вибирати змішані, тобто приймати рішення випадково. Так, у «Каміні, ножицях, папері» рівновага, яку ми до цього не знайшли, знаходиться якраз у змішаних стратегіях: вибирати кожен із трьох варіантів ходу з ймовірністю в одну третю. Якщо ви обиратимете камінь частіше, суперник скоригує свій вибір. Знаючи це, ви скоректуєте свій, і рівноваги не вийде. Але ніхто з вас не почне змінювати поведінку, якщо кожен просто вибиратиме камінь, ножиці або папір з однаковою ймовірністю. Все тому, що в змішаних стратегіях по попередніх діях неможливо передбачити ваш наступний хід.

Змішані стратегії та спорт

Більше серйозних прикладів змішаних стратегій дуже багато. Наприклад, куди подавати у тенісі чи бити/приймати пенальті у футболі. Якщо ви нічого не знаєте про вашого суперника або просто постійно граєте проти різних, найкращою стратегією буде чинити більш-менш випадково. Професор Лондонської школи економіки Ігнасіо Паласіос-Уерта в 2003 році опублікував в American Economic Review роботу, суть якої полягала в пошуку рівноваги Нешу в змішаних стратегіях. Предметом дослідження Паласіос-Уерта обрав футбол і у зв'язку з цим переглянув понад 1400 ударів пенальті. Зрозуміло, у спорті все влаштовано хитріші, ніж у «Каміні, ножицях, папері»: там враховується сильна нога спортсмена, попадання в різні кути при ударі з усієї сили тощо. Рівновага по Нешу тут полягає у розрахунку варіантів, тобто, наприклад, визначенні кутів воріт, в які треба бити, щоб виграти з більшою ймовірністю, знаючи свої слабкі та сильні сторони. Статистика щодо кожного футболіста і знайдена в ній рівновага в змішаних стратегіях показала, що футболісти роблять приблизно так, як передбачають економісти. Навряд чи варто стверджувати, що люди, які б'ють пенальті, читали підручники з теорії ігор та займалися досить непростою математикою. Швидше за все, є різні способинавчитися оптимально поводитися: можна бути геніальним футболістом, і відчувати, що робити, а можна - економістом, і шукати рівновагу в змішаних стратегіях.

2008 року професор Ігнасіо Паласіос-Уерта познайомився з Авраамом Грантом, тренером «Челсі», який грав тоді у фіналі Ліги чемпіонів у Москві. Вчений написав записку тренеру з рекомендаціями щодо серії пенальті, які стосувалися поведінки воротаря суперника – Едвіна ван дер Сара з «Манчестер Юнайтед». Наприклад, за статистикою, він майже завжди відбивав удари на середньому рівні і частіше кидався в природний для пенальті бік. Як ми визначили вище, правильніше все-таки рандомізувати свою поведінку з урахуванням знань про суперника. Коли рахунок із пенальті був уже 6:5, Ніколя Анелька, нападник «Челсі», мав забивати. Показуючи перед ударом у правий кут, ван дер Сар ніби запитав Анелька, чи не збирається він бити туди.

Суть у тому, що всі попередні удари «Челсі» були завдані саме у правий від кута, що пробиває. Ми не знаємо точно чому, можливо, через консультацію економіста бити в неприродний для них бік, адже за статистикою до цього менш готовий ван дер Сар. Більшість футболістів «Челсі» були правшами: ударяючи в неприродний для себе правий кут, вони, крім Террі, забивали. Мабуть, стратегія була в тому, щоб Анелька пробив туди. Але ван дер Сар, мабуть, це зрозумів. Він вчинив геніально: показав у лівий кут мовляв «туди зібрався бити?», від чого Анелька, напевно, жахнувся, адже його розгадали. В останній момент він прийняв рішення діяти по-іншому, вдарив у природний для себе бік, що й потрібне було ван дер Сару, який взяв цей удар і забезпечив «Манчестеру» перемогу. Ця ситуація вчить випадковому вибору, адже інакше ваше рішення може бути прораховано, і ви програєте.

«Дилема ув'язненого»

Напевно, найвідоміша гра, з якої розпочинаються університетські курси про теорію ігор, - це «Дилема ув'язненого». За легендою двох підозрюваних у серйозному злочині спіймали та замкнули у різні камери. Є доказ, що вони зберігали зброю, і це дає змогу посадити їх на якийсь невеликий термін. Однак доказів, що вони скоїли цей страшний злочин, немає. Кожному окремо слідчий розповідає про умови гри. Якщо обидва злочинці зізнаються, обидва сядуть на три роки. Якщо зізнається один, а спільник мовчатиме, хто зізнається вийде відразу, а другого посадять на п'ять років. Якщо, навпаки, перший не зізнається, а другий його здасть, перший сяде на п'ять років, а другий вийде одразу. Якщо ж ніхто не зізнається, обидва сядуть на рік за зберігання зброї.

Рівновага по Нешу тут полягає в першій комбінації, коли обидва підозрювані не мовчать і обидва сідають на три роки. Міркування кожного такі: «якщо я говоритиму, я сяду на три роки, якщо мовчати – на п'ять років. Якщо другий мовчатиме, мені теж краще говорити: не сісти краще, ніж сісти на рік». Це домінуюча стратегія: говорити вигідно незалежно від того, що робить інший. Однак у ній є проблема – наявність варіанта кращого, адже сісти на три роки гірше, ніж сісти на рік (якщо розглядати історію лише з погляду учасників та не враховувати питання моралі). Але сісти на рік неможливо, адже, як ми зрозуміли вище, мовчати обом злочинцям невигідно.

Поліпшення по Парето

Є відома метафора про невидиму руку ринку, що належить Адаму Сміту. Він казав, що якщо м'ясник сам для себе намагатиметься заробити гроші, від цього буде найкраще: він зробить смачне м'ясо, яке купить булочник на гроші від продажу булок, які він, у свою чергу, теж повинен буде робити смачними, щоб вони продавалися. . Але виявляється, ця невидима рука не завжди працює і таких ситуацій, коли кожен діє за себе, а всім погано, дуже багато.

Тому іноді економісти та фахівці з теорії ігор думають не про оптимальну поведінку кожного гравця, тобто не про рівновагу по Нешу, а про результат, при якому буде краще всьому суспільству (у «Ділемі» суспільство складається з двох злочинців). З цієї точки зору, результат ефективний, коли в ньому немає покращення за Парето, тобто неможливо зробити комусь краще, не зробивши при цьому гіршим за інших. Якщо люди просто змінюються товарами та послугами, то це Парето-покращення: вони роблять це добровільно, і навряд чи комусь від цього погано. Але іноді, якщо просто дати людям взаємодіяти і навіть не втручатися, то, до чого вони прийдуть, не буде оптимальним за Парето. Це і відбувається у «Дилемі ув'язненого». У ній, якщо ми даємо кожному діяти так, як їм вигідно, виявляється, що всім це погано. Усім було б краще, якби кожен діяв не оптимально для себе, тобто мовчав.

Трагедія громади

«Дилема ув'язненого» – це іграшкова стилізована історія. Навряд чи ви очікуєте опинитися в подібній ситуації, але схожі ефекти є навколо нас. Розглянемо «Ділемму» з великою кількістю гравців, її іноді називають трагедією громади. Наприклад, на дорогах – пробки, і я вирішую, як їхати на роботу: машиною чи автобусом. Це роблять інші. Якщо я поїду на машині, і все вирішать зробити те саме, буде пробка, але ми доїдемо з комфортом. Якщо я поїду на автобусі, пробка все одно буде, але їхати я буду некомфортно і не особливо швидше, тому такий результат ще гірший. Якщо ж у середньому всі їздять автобусом, то я, зробивши те саме, досить швидко доїду без пробки. Але якщо за таких умов поїхати машиною, я теж доїду швидко, але ще й з комфортом. Отже, наявність пробки залежить від моїх дій. Рівнавага по Нешу тут - у ситуації, коли всі обирають їхати машиною. Що б не робили решта, мені краще вибрати машину, бо буде там пробка чи ні, невідомо, але я в будь-якому разі доїду з комфортом. Це домінуюча стратегія, тому у результаті всі їдуть машиною, і ми маємо те, що маємо. Завдання держави - зробити подорож автобусом найкращим варіантомхоча б для деяких, тому з'являються платні в'їзди до центру, паркування тощо.

Інша класична історія – раціональне незнання виборця. Уявіть, що ви не знаєте результату виборів заздалегідь. Ви можете вивчити програму всіх кандидатів, послухати дебати та після проголосувати за найкращого. Друга стратегія - прийти на дільницю і проголосувати абияк або за того, кого частіше показували по телевізору. Яка поведінка є оптимальною, якщо від мого голосу ніколи не залежить, хто виграє (а в 140-мільйонній країні один голос ніколи нічого не вирішить)? Звичайно, я хочу, щоб у країні був добрий президент, але ж я знаю, що ніхто більше не вивчатиме програми кандидатів уважно. Тому не витрачати на цей час – домінуюча стратегія поведінки.

Коли вас закликають прийти на суботник, ні від кого окремо не залежатиме, стане двір чистим чи ні: якщо я вийду один, я не зможу прибрати все, або, якщо вийдуть усі, то не вийду я, бо все і без мене приберуть. Інший приклад – перевезення вантажів у Китаї, про який я дізнався у чудовій книзі Стівена Ландсбурга «Економіст на дивані». 100-150 років тому в Китаї був поширений спосіб перевезення вантажів: все складалося у великий кузов, який тягли сім людей. Замовники платили, якщо вантаж доставлявся вчасно. Уявіть, що ви - один із цих шести. Ви можете докладати зусиль, і тягнути щосили, і якщо всі так робитимуть, вантаж доїде вчасно. Якщо хтось один так робити не буде, то всі теж доїдуть вчасно. Кожен думає: «Якщо всі інші тягнуть як слід, навіщо це робити мені, а якщо решта тягне не з усієї сили, то я нічого не зможу змінити». У результаті, з часом доставки все було дуже погано, і самі вантажники знайшли вихід: вони стали наймати сьомого і платити йому гроші за те, щоб він хльопав батогом батогом. Сама наявність такої людини змушувала всіх працювати щосили, бо інакше всі потрапляли в погану рівновагу, з якої нікому окремо з вигодою не вийти.

Такий приклад можна спостерігати в природі. Дерево, що росте в саду, відрізняється від того, що росте в лісі своєю кроною. У першому випадку вона оточує весь стовбур, у другому – знаходиться лише вгорі. У лісі це є рівновагою Нешу. Якби всі дерева домовилися і виросли однаково, вони порівну розподілили б кількість фотонів, і всім було б краще. Але нікому окремо робити так невигідно. Тому кожне дерево хоче вирости трохи вище за оточуючих.

Commitment device

У багатьох ситуаціях одному з учасників гри може знадобитися інструмент, який переконає решту, що той не блефує. Він називається commitment device. Наприклад, закон деяких країн забороняє платити викуп викрадачам людей, щоб зменшити мотивацію злочинців. Однак це законодавство часто не працює. Якщо вашого родича захопили, і ви маєте можливість врятувати його, обійшовши закон, ви це зробите. Уявімо ситуацію, що закон можна оминути, але родичі виявилися бідними і викуп їм платити нема чим. У злочинця у цій ситуації два шляхи: відпустити чи вбити жертву. Вбивати він не любить, але в'язницю не любить більше. Відпущений постраждалий, своєю чергою, може або дати свідчення, щоб викрадач було покарано, або мовчати. Самий найкращий результатдля злочинця: відпустити жертву, яка його не здасть. Жертва хоче бути відпущеною і дати свідчення.

Рівновага тут у тому, що терорист не хоче бути спійманим, а отже, жертва гине. Але це не рівновага щодо Парето, тому що існує варіант, при якому всім краще – жертва на волі зберігає мовчання. Але для цього треба зробити так, щоб мовчати їй було вигідно. Десь я прочитав варіант, коли вона може попросити терориста влаштувати еротичну фотосесію. Якщо злочинця посадять, його спільники викладуть фотографії в інтернет. Тепер, якщо викрадач залишиться на волі – це погано, але фотографії у відкритому доступі – ще гірші, тому виходить рівновага. Для жертви це спосіб залишитися живим.

Інші приклади ігор:

Модель Бертрана

Якщо ми говоримо про економіку, розглянемо економічний приклад. У моделі Бертрана два магазини продають той самий товар, купуючи його у виробника за однією ціною. Якщо ціни в магазинах однакові, то приблизно однаковий і їхній прибуток, адже тоді покупці вибирають магазин випадково. Єдина рівновага по Нешу тут – продавати товар за собівартістю. Але магазини хочуть заробляти. Тому якщо один поставить ціну 10 рублів, другий знизить її на копійку, збільшивши тим самим свою виручку вдвічі, оскільки до неї підуть усі покупці. Тому учасникам ринку вигідно знижувати ціни, розподіляючи цим прибуток між собою.

Роз'їзд на вузькій дорозі

Розглянемо приклади вибору між двома можливими рівновагами. Уявіть, що Петя та Маша їдуть назустріч один одному вузькою дорогою. Дорога настільки вузька, що їм обом потрібно з'їхати на узбіччя. Якщо вони вирішать повернути ліворуч чи праворуч від себе, вони просто роз'їдуться. Якщо ж один поверне праворуч, а інший ліворуч від себе, або навпаки, трапиться аварія. Як вибрати, куди поїхати? Щоб допомагати шукати рівновагу у подібних іграх, існують, наприклад, правила дорожнього руху. У Росії кожному треба повернути праворуч.

У забаві Chiken, коли дві людини їдуть на великій швидкості назустріч один одному, також є дві рівноваги. Якщо обоє повертають на узбіччя, виникає ситуація, яка називається Chiken out, якщо обоє не повертають, то гинуть у страшній аварії. Якщо я знаю, що мій суперник їде прямо, то мені вигідно з'їхати, щоб вижити. Якщо я знаю, що мій суперник з'їде, то мені вигідно їхати прямо, щоб одержати 100 доларів. Важко передбачити, що трапиться насправді, однак кожен з гравців має свій метод виграти. Уявіть, що я закріпив кермо так, що його не можна повернути і показав це своєму супернику. Знаючи, що я не маю вибору, суперник відскочить.

QWERTY-ефект

Іноді буває дуже складно перейти з однієї рівноваги до іншої, навіть якщо вона означає користь для всіх. Розкладка QWERTY була створена, щоб уповільнити швидкість друку. Оскільки якби всі друкували надто швидко, головки друкарської машинки, які б'ють по паперу, чіплялися б один за одного. Тому Крістофер Шоулз розмістив літери, що часто стоять поруч, на максимально далекій відстані. Якщо ви зайдете в налаштування клавіатури на своєму комп'ютері, ви зможете вибрати розкладку Dvorak і друкувати набагато швидше, оскільки зараз немає проблеми аналогових друкарських машин. Дворак розраховував, що світ перейде на його клавіатуру, але ми живемо з QWERTY. Звичайно, якби ми перейшли на розклад Дворака, майбутнє покоління було б нам вдячне. Всі ми доклали б зусиль і перевчилися, в результаті вийшла б рівновага, в якій всі друкують швидко. Зараз ми теж у рівновазі – у поганому. Але нікому не вигідно бути єдиним, хто перевчиться, бо за будь-яким комп'ютером, окрім особистого, працювати буде незручно.

Теорія ігор є математичною теорією оптимальної поведінки за умов конфліктної ситуації. Предмет її вивчення – формалізована модель конфлікту чи так звана «гра».

Конфліктна ситуація або "конфлікт" визначається як наявність у елементів системи кількох цілей та пов'язана з цим відмінність інтересів та образів дій або стратегій у прагненні до досягнення цих цілей. Конфлікти поділяються на антагоністичні, коли дві особи переслідують протилежні інтереси та неантагоністичні, коли інтереси хоч і різні, але не протилежні.

У разі конфлікти виражаються над вигляді боротьби двох осіб, а вигляді несумісності цілей у системі чи різного (протилежного) характеру використання ресурсів, з участю у грі невизначених чинників " природи " ,у ситуаціях зі змаганням тощо.

У завданнях дослідження операцій, як говорилося вище, ми завжди шукаємо оптимальне рішення. Наша "операція" як сукупність дій спрямованих на досягнення певної мети проводиться на основі теоретичних методів оптимізації в деякому найкращому розумінні щодо реальних умов і може розглядатися як "боротьба" з цими умовами, які виступають як "противник". У такій постановці ми також досягаємо свого успіху як би за рахунок шкоди "противника".

Проте дослідження операцій береться вирішувати такі завдання лише у випадках, коли образ дій “противника” під час операції не змінюється й у тому мірою нам відомий. У основу вибору стратегії зазвичай кладеться принцип гарантованого результату: хоч би яке рішення ухвалив противник, певний виграш має бути нам гарантований.

Однак така конфліктна ситуація предметом дослідження не є і розглядається як тло, на якому проходять дії сторін. Дослідження операції займає позицію лише однієї сторони.

У кожній грі вирішуються три основні питання:

    У чому полягає оптимальність поведінки кожного з гравців у цій грі?

    Чи реалізується таке розуміння оптимальності?

    Чи існують відповідні стратегії? Якщооптимальні стратегії

існують, як їх знайти?

В результаті позитивного вирішення всіх трьох питань визначається шлях вирішення задачі та побудови відповідної моделі.

Теорія ігор є дуже молодою дисципліною і запас теоретично розроблених методів та моделей значно ступить дослідженню операцій. При цьому дається взнаки і значна складність завдань теорії ігор. Не маючи можливості докладно розглядати весь відомий комплекс моделей, зазначимо лише деякі найпростіші з них.

1) Ігри з нульовою сумою. Будь-які стратегії гравців призводять до результату, коли виграш однієї сторони точно дорівнює програшу іншої. Матриця виграшів має всі позитивні елементи і всім можливих комбінацій стратегій можна рекомендувати кожній стороні оптимальний варіант. Цей вид гри є антагоністичним. 2) Ігри з ненульовою сумою.Загальний вигляд ігри. Якщо не існує жодного зв'язку між сторонами і сторони не можуть становити коаліції, то гра є антагоністичною, інакше – коаліційною грою з не протилежними інтересами.Аналіз таких ігор здебільшого складний, особливо для

складних систем

та рекомендації щодо вибору стратегій залежать від багатьох факторів.

Важливим видом в умовах АСУ є коаліційні чи кооперативні ігри. Така гра передбачає виконання учасниками певних договірних зобов'язань (передача частини виграшу партнерам, обмін інформацією тощо). При цьому постає питання стійкості такої коаліції у разі, якщо одна сторона у вигідній ситуації спробує порушити договір. Звідси виникає варіант із запровадженням третього контрольного органу покарання можливих сепаратистів.

Воно вимагає витрат коаліціонерів, що зменшують виграші. Очевидно, що гра сильно ускладниться, проте практична цінність таких завдань не викликає сумнівів.

Лекція 11: Теорія ігор та прийняття рішень

Розроблено спеціальні математичні методи, призначені для обґрунтування рішень за умов ризику та невизначеності. У деяких найпростіших випадках ці методи дають можливість фактично знайти і вибрати оптимальне рішення. У більш складних випадках ці методи доставляють допоміжний матеріал, що дозволяє глибше розібратися в складній ситуації та оцінити кожне з них. можливих рішеньз різних точок зору, і ухвалити рішення з урахуванням його можливих наслідків. Однією з важливих умов прийняття рішень у цьому випадку є мінімізація ризику.

При вирішенні низки практичних завдань дослідження операцій (в галузі екології, забезпечення безпеки життєдіяльності тощо) доводиться аналізувати ситуації, в яких стикаються дві (або більше) ворогуючі сторони, які переслідують різні цілі, причому результат будь-якого заходу кожної із сторін залежить від цього, який спосіб дій обере противник. Такі ситуації можна віднести до конфліктним ситуаціям.

Теорія ігор є математичною теорією конфліктних ситуацій, з якої можна виробити рекомендації щодо раціонального образу дій учасників конфлікту. Щоб уможливити математичний аналіз ситуації без урахування другорядних факторів, будують спрощену, схематизовану модель ситуації, яка називається грою. гра ведеться за цілком певними правилами, під якими розуміється система умов, що регламентує можливі варіанти дій гравців; обсяг інформації кожної сторони про поведінку іншої; результат гри, якого призводить кожна дана сукупність ходів.

Результат гри (виграш чи програш) взагалі має кількісне вираз, але зазвичай можна, хоча б умовно, висловити його числовим значенням.

Хід - вибір одного з передбачених правилами гри дій та його здійснення. Ходи діляться на особисті та випадкові. Особистим ходом називається свідомий вибіргравцем одного з можливих варіантівдій та його здійснення. Випадковим ходом називається вибір із ряду можливостей, здійснюваний не рішенням гравця, а будь-яким механізмом випадкового вибору (кидання монети, вибір карти з перетасованої колоди тощо). До кожного випадкового ходу правила гри визначають розподіл ймовірностей можливих результатів. Гра може складатися тільки з їх особистих або тільки з випадкових ходів, або з їх комбінації. p align="justify"> Наступним основним поняттям теорії ігор є поняття стратегії. Стратегія - це апріорі прийнята гравцем система рішень (виду "якщо - то"), яких він дотримується під час ведення гри, яка може бути представлена ​​у вигляді алгоритму та виконуватися автоматично.

Метою теорії ігор є вироблення рекомендацій для розумної поведінки гравців конфліктної ситуації, т. е. визначення «оптимальної стратегії» кожному з них. Стратегія, оптимальна за одним показником, необов'язково буде оптимальною за іншими. Усвідомлюючи ці обмеження і тому не дотримуючись сліпо рекомендацій, отриманих ігровими методами, можна все ж таки розумно використовувати математичний апарат теорії ігор для вироблення, якщо не в точності оптимальної, то принаймні «прийнятної» стратегії.

Ігриможна класифікувати: за кількістю гравців, кількістю стратегій, характером взаємодії гравців, характером виграшу, кількістю ходів, станом інформації тощо. .

Залежно від кількості гравціврозрізняють ігри двох та n гравців. Перші їх найбільш вивчені. Ігри трьох і більше гравців менш досліджені через важливі труднощі і технічні можливості отримання рішення.

Залежно від кількості можливих стратегій гри поділяються на « кінцеві» та « нескінченні».

Гра називається кінцевою, якщо в кожного гравця є лише кінцева кількість стратегій, і нескінченною, якщо хоча б у одного з гравців є нескінченна кількість стратегій.

За характером взаємодіїІгри діляться на безкоаліційні: гравці не мають права вступати в угоди, утворювати коаліції; коаліційні (кооперативні) можуть вступати в коаліції.

У кооперативних ігорах коаліції заздалегідь визначено.

За характером виграшівігри діляться на: ігри з нульовою сумою (загальний капітал всіх гравців не змінюється, а перерозподіляється між гравцями; сума виграшів усіх гравців дорівнює нулю) та ігри з ненульовою сумою.

За видом функцій виграшуігри поділяються на: матричні, біматричні, безперервні, опуклі та ін.

Матричнагра — це кінцева гра двох гравців з нульовою сумою, в якій задається виграш гравця 1 у вигляді матриці (рядок матриці відповідає номеру стратегії гравця 1, що застосовується, стовпець — номеру стратегії гравця, що застосовується на перетині рядка і стовпця матриці знаходиться виграш гравця 1, відповідний застосовуємо ).

Для матричних ігор доведено, що кожна з них має рішення і може бути легко знайдено шляхом зведення гри до завдання лінійного програмування.

Біматричнагра — це кінцева гра двох гравців з ненульовою сумою, в якій виграші кожного гравця задаються матрицями окремо для відповідного гравця (у кожній матриці рядок відповідає стратегії гравця 1, стовпець — стратегії гравця 2, на перетині рядка та стовпця у першій матриці знаходиться виграш гравця 1 , у другій матриці - виграш гравця)

Безперервнийвважається гра, у якій функція виграшів кожного гравця є безперервною. Доведено, що ігри цього класу мають рішення, проте не розроблено практично прийнятних методів їхнього знаходження.

Якщо функція виграшів є опуклою, то така гра називається опуклою. Їх розроблені прийнятні методи рішення, які перебувають у відшуканні чистої оптимальної стратегії (певного числа) одного гравця і можливостей застосування чистих оптимальних стратегій іншого гравця. Таке завдання вирішується порівняно легко.

Запис матричної гри у вигляді платіжної матриці

Розглянемо кінцеву гру, в якій перший гравець має m стратегій, а другий гравець B-nстратегії. Така гра називається грою m×n. Позначимо стратегії A 1, А 2, ..., А m; і В 1, В 2, ..., В n. Припустимо, кожна сторона вибрала певну стратегію: A i чи B j . Якщо гра складається лише з особистих ходів, то вибір стратегій однозначно визначає результат гри - виграш однієї зі сторін a ij. Якщо гра містить крім особистих випадкових ходів, то виграш при парі стратегій A i і B є випадковою величиною, яка залежить від результатів всіх випадкових ходів. У цьому випадку природною оцінкою очікуваного виграшу є математичне очікування випадкового виграшу, яке також позначається a ij .

Припустимо, що нам відомі значення a ij за кожної пари стратегій. Ці значення можна записати як прямокутної таблиці (матриці), рядки якої відповідають стратегіям A i , а стовпці — стратегіям B j .

Тоді, у загальному вигляді матрична гра може бути записана наступною платіжною матрицею:

B 1 B 2 ... B n
A 1 a 11 a 12 ... a 1n
A 2 a 21 a 22 ... a 2n
... ... ... ... ...
A m a m1 a m2 ... a mn

Таблиця - Загальний вид платіжної матриці матричної гри

де A i - назви стратегій гравця 1, B j - назви стратегій гравця 2, a ij - значення виграшів гравця 1 при виборі ним i-ї стратегії, а гравцем 2 - j-ї стратегії. Оскільки гра є грою з нульовою сумою, значення виграшу для гравця 2 є величиною, протилежною за знаком значення виграшу гравця 1.

Поняття про нижню та верхню ціну гри. Рішення гри в чистих стратегіях

Кожен із гравців прагне максимізувати свій виграш з урахуванням поведінки протидіючого йому гравця. Тому для гравця 1 необхідно визначити мінімальні значення виграшів у кожній із стратегій, а потім знайти максимум із цих значень, тобто визначити величину

V н = max i min j a ij

або знайти мінімальні значення для кожного з рядків платіжної матриці, а потім визначити максимальне з цих значень. Величина V н називається максиміномматриці або нижньою ціною гри. Та стратегія гравця, яка відповідає максиміну V н, ​​називається максимінною стратегією.

Очевидно, якщо ми дотримуватимемося максимічної стратегії, то при будь-якій поведінці противника гарантований виграш, не менший V н. Тому величина V н — це гарантований мінімум, який ми можемо собі забезпечити, дотримуючись своєї найбільш обережної стратегії.

Величина виграшу гравця 1 дорівнює, за визначенням матричної гри, величині програшу гравця Тому для гравця 2 необхідно визначити значення

V = min j max i a ij

Або знайти максимальні значення по кожному зі стовпців платіжної матриці, а потім визначити мінімальне з цих значень. Величина V називається мінімаксомматриці, верхньою ціною гриабо мінімаксним виграшем. Відповідна виграшу стратегія супротивника називається його мінімаксною стратегією. Дотримуючись своєї найбільш обережної мінімаксної стратегії, противник гарантований, що у будь-якому разі він програє не більше V ст.

У разі, якщо значення V н і V не збігаються, при збереженні правил гри (коефіцієнтів a ij) у тривалій перспективі, вибір стратегій кожним з гравців виявляється нестійким. Стійкість він набуває лише за рівності V н = V в = V. У цьому випадку кажуть, що гра має рішення у чистих стратегіях, а стратегії, в яких досягається V - оптимальними чистими стратегіями. Величина V називається чистою ціною гри .

Наприклад, у матриці:

B 1 B 2 B 3 B 4 Min j
A 1 17 16 15 14 14
A 2 11 18 12 13 11
A 3 18 11 13 12 11
Max i 18 18 15 14

Таблиця - Платіжна матриця, в якій існує рішення в чистих стратегіях

існує рішення у чистих стратегіях. Для гравця 1 оптимальною чистою стратегією буде стратегія A 1 , а для гравця 2 — стратегія B 4 .

У матриці рішення в чистих стратегіях немає, оскільки нижня ціна гри досягається в стратегії A 1 і її значення дорівнює 12, в той час як верхня ціна гри досягається в стратегії B 4 і її значення дорівнює 13.

B 1 B 2 B 3 B 4 Min j
A 1 17 16 15 12 12
A 2 11 18 12 13 11
A 3 18 11 13 12 11
Max i 18 18 15 13

Таблиця - Платіжна матриця, в якій не існує рішення в чистих стратегіях

Зменшення порядку платіжної матриці

Порядок платіжної матриці (кількість рядків та стовпців) може бути зменшений за рахунок виключення домінованих та дублюючих стратегій.

Стратегія K* називається домінованоїстратегією K**, якщо за будь-якого варіанта поведінки протидіючого гравця виконується співвідношення

A k*< A k** ,

де A k* та A k** — значення виграшів при виборі гравцем, відповідно, стратегій K* та K**.

У разі, якщо виконується співвідношення

стратегія K* називається дублюючою стосовно стратегії K**.

Наприклад, у матриці з домінованими і дублюючими стратегіями стратегія A 1 є домінованою щодо стратегії A 2 , стратегія B 6 є домінованою по відношенню до стратегій B 3 , B 4 і B 5 4 .

B 1 B 2 B 3 B 4 B 5 B 6
A 1 1 2 3 4 4 7
A 2 7 6 5 4 4 8
A 3 1 8 2 3 3 6
A 4 8 1 3 2 2 5

Таблиця - Платіжна матриця з домінованими і дублюючими стратегіями

Дані стратегії не будуть обрані гравцями, оскільки є свідомо програшними і видалення цих стратегій із платіжної матриці не вплине на визначення нижньої та верхньої ціни гри, описаної цією матрицею.

Багато недомінованих стратегій, отриманих після зменшення розмірності платіжної матриці, називається ще безліччю Парето.

Приклади ігор

1. Гра «Курча»

Гра «Курча» полягає в тому, що гравці вступають у взаємодію, яка веде до завдання серйозної шкоди кожному з них, поки один з гравців не вийде з гри. Приклад використання цієї гри — взаємодія автотранспортних засобів, наприклад, ситуації, коли два автомобілі йдуть назустріч один одному, і той, який першим повертає убік, вважається «слабаком» або «курчам». Сенс гри полягає у створенні напруги, яка б призвела до усунення гравця. Подібна ситуація часто зустрічається в середовищі підлітків або агресивно налаштованих молодих людей, хоча іноді несе менший ризик. Ще одне із застосувань цієї гри — ситуація, в якій дві політичні партіївступають у контакт, у якому вони можуть нічого виграти, і лише гордість змушує їх зберігати протистояння. Партії зволікають із поступками доти, доки не дійдуть до фінальної точки. Психологічне напруження, що виникає, може призвести одного з гравців до неправильної стратегії поведінки: якщо ніхто з гравців не поступається, то зіткнення і фатальна розв'язка неминучі.

Платіжна матриця гри виглядає такою:

Поступитися Не поступатись
Поступитися 0, 0 -1, +1
Не поступатись +1, -1 -100, -100

2. Гра «шуліка і голуб»

Гра «шуліка і голуб» є біологічним прикладом гри. У цій версії двоє гравців, які мають необмежені ресурси, обирають одну з двох стратегій поведінки. Перша («голуб») полягає в тому, що гравець демонструє свою силу, залякуючи супротивника, а друга («коршун») у тому, що гравець фізично атакує супротивника. Якщо обидва з гравців вибирають стратегію «шуліки», вони борються, завдаючи один одному каліцтва. Якщо один із гравців обирає стратегію «шуліки», а другий «голублячи» — то перший перемагає другого. У випадку, якщо обидва гравці — «голуби», то суперники приходять до компромісу, отримуючи виграш, який виявляється меншим, ніж виграш «коршуна», який перемагає «голубя», як це випливає з платіжної матриці цієї гри.

Тут V - ціна угоди, C - ціна конфлікту, причому V

У грі «шуліка і голуб» є три точки рівноваги по Нешу:

  1. перший гравець обирає «шуліка», а другий «голубячи».
  2. перший гравець обирає «голуб», а другий «шуліка».
  3. обидва гравці вибирають змішану стратегію, в якій "шуліка" вибирається з ймовірністю p, а "голуб" - з ймовірністю 1-p.

3. Дилема ув'язненого

«Дилема ув'язненого» — одне з найпоширеніших конфліктних ситуацій, що у теорії ігор.

Класична «дилема ув'язненого» звучить так: двоє підозрюваних, A і B, перебувають у різних камерах. Слідчий, відвідуючи їх поодинці, пропонує угоду наступного змісту: якщо один із них свідчитиме проти іншого, а другий мовчатиме, то перший ув'язнений буде звільнений, а другого засудять на 10 років. Якщо обидва мовчати, то відсидять по 6 місяців. Якщо обидва зрадять один одного, то кожен отримає по 2 роки. Кожен із ув'язнених повинен ухвалити рішення: зрадити спільника або мовчати, не знаючи про те, яке рішення ухвалив інший. Дилема: яке рішення ухвалять ув'язнені?

Платіжна матриця гри:

У даному випадку, Результат базується на рішенні кожного з ув'язнених. Становище гравців ускладнюється тим, що вони не знають про те, яке рішення ухвалив інший, і тим, що вони не довіряють одне одному.

Найкращою стратегією гравців буде кооперація, при якій обоє мовчать, і одержують максимальний виграш (менший термін), кожне інше рішення буде менш виграшним.

Проаналізуємо «дилему ув'язненого», перейшовши для наочності до платіжної матриці канонічного виду:

Кооперація Відмова від кооперації
Кооперація 3, 3 0, 5
Відмова від кооперації 5, 0 1, 1

Згідно з цією матрицею, ціна взаємної відмови від кооперації (S) становить по 1 балу для кожного з гравців, ціна за кооперацію (R) — по 3 бали, а ціна спокуси зрадити іншого (T) становить 5 балів. Можемо записати таку нерівність: T > R > S. При повторенні гри кілька разів, вибір кооперації перевершує спокусу зрадити і отримати максимальний виграш: 2 R > T + S.

Рівнавага по Нешу.

Рівновага по Нешу - це ситуація, коли в жодного гравця немає стимулів змінювати свою стратегію при даній стратегії іншого гравця (іншої фірми), що дозволяє гравцям досягти компромісного рішення.

Визначення рівноваги по Нешу та її існування визначається наступним чином.

Нехай (S, f) - це гра, в якій S - безліч стратегій, f - безліч виграшів. Коли кожен із гравців i ∈ (1, ..., n) вибирає стратегію x i &isin S, де x = (x 1 , ..., x n), тоді гравець i отримує виграш f i (x). Виграш залежить від стратегії, яку вибрали всі гравці. Стратегія x* ∈ S є рівновагою по Нешу, якщо ніяке відхилення від неї якимось одним гравцем не приносить йому прибуток, тобто для всіх i виконується така нерівність:

f i (x*) ≥ f i (x i , x* -i)

Наприклад, гра «дилема ув'язненого» має одну рівновагу по Нешу — ситуацію, коли обидва в'язні зраджують один одного.

Найпростіше визначити рівновагу по Нешу можна за платіжною матрицею, особливо у випадках, коли у грі беруть участь два гравці, які мають в арсеналі більше двох стратегій. Так як у цьому випадку формальний аналіз буде досить складним, застосовується мнемонічне правило, яке полягає в наступному: осередок платіжної матриці є рівновагою по Нешу, якщо перше число, що стоїть в ній, є максимальним серед усіх значень, представлених у стовпцях, а друге число , що стоїть у комірці — максимальне число серед усіх рядків.

Наприклад, застосуємо це правило для матриці 3x3:

A B C
A 0, 0 25, 40 5, 10
B 40, 25 0, 0 5, 15
C 10, 5 15, 5 10, 10

Точки рівноваги Нешу: (B,A), (A,B) і (C,C). Indeed, for cell (B,A), тому що 40 максимальне значенняу першому стовпці, 25 максимальне значення у другому ряду. Для комірки (A, B) 25 – це максимальне значення у другому стовпці, 40 – максимальне значення у другому ряду. Те саме і для комірки (C, C).

Розглянемо приклад гри у забруднення ( довкілля). Тут об'єктом нашої уваги стане такий вигляд побічних ефектіввиробництва, як забруднення. Якби фірми ніколи і нікого не питали про те, як їм вчинити, будь-яка з них скоріше воліла б створювати забруднення, ніж встановлювати дорогі очисники. Якщо ж якась фірма зважилася б зменшити шкідливі викиди, то витрати, отже, і ціни її продукцію, зросли б, а попит впав. Цілком можливо, ця фірма просто збанкрутувала б. Які живуть у жорстокому світі природного відбору, фірми швидше віддадуть перевагу залишатися в умовах рівноваги по Нешу (осередок D), при якому не потрібно витрачати кошти на очисні споруди та технології. Жодній фірмі не вдасться підвищити прибуток, зменшуючи забруднення.

Фірма 1
Фірма 2 Низький рівень забруднення Високий рівень забруднення
Низький рівень забруднення А
100,100
У
-30,120
Високий рівень забруднення З
120,-30
D
100,100

Таблиця - Платіжна матриця гри в забруднення навколишнього середовища.

Вступивши в економічну гру, кожна неконтрольована державою та максимізуючий прибуток сталеливарна фірма буде виробляти забруднення води та повітря. Якщо якась фірма спробує очищати свої викиди, то цим вона буде змушена підвищити ціни і зазнати збитків. Некооперативна поведінка встановить рівновагу Нешу в умовах високих викидів. Уряд може вжити заходів для того, щоб рівновага перемістилася в осередок А. У цьому положенні забруднення буде незначним, прибутки ж залишаться тими самими.

Ігри забруднення – один із випадків того, як механізм дії «невидимої руки» не спрацьовує. Це ситуація, коли рівновага по Нешу неефективна. Іноді подібні неконтрольовані ігри стають загрозливими і тут може втрутитися уряд. Встановивши систему штрафів і квот на викиди, уряд може спонукати фірми обрати результат А, відповідний низькому рівнюзабруднення. Фірми заробляють рівно стільки ж, скільки і раніше, при великих викидах, а світ стає дещо чистішим.

Приклад вирішення матричної гри у чистих стратегіях

Розглянемо приклад вирішення матричної гри у чистих стратегіях, за умов реальної економіки, у ситуації боротьби двох підприємств за ринок продукції регіону.

Завдання.

Два підприємства виробляють продукцію та постачають її на ринок регіону. Вони є єдиними постачальниками продукції регіон, тому повністю визначають ринок цієї продукції регіоні.

Кожне з підприємств має можливість виробляти продукцію із застосуванням однієї з трьох різних технологій. Залежно від екологічності технологічного процесу та якості продукції, виробленої за кожною технологією, підприємства можуть встановити ціну одиниці продукції на рівні 10, 6 та 2 грошових одиниць відповідно. У цьому підприємства мають різні видатки виробництво одиниці виробленої продукції.

Таблиця - Витрати на одиницю продукції, виробленої на підприємствах регіону (тобто).

В результаті маркетингового дослідження ринку продукції регіону було визначено функцію попиту на продукцію:

Y = 6 - 0.5⋅X,

де Y - кількість продукції, яку придбає населення регіону (тис. од.), а X - середня ціна продукції підприємств, тобто.

Дані про попит продукції залежно від цін реалізації наведено у таблице:

Вартість реалізації 1 од. продукції, тобто.

Середня вартість реалізації 1 од. продукції, тобто.

Попит на продукцію, тис. од.

Підприємство 1 Підприємство 2
10 10 10 1
10 6 8 2
10 2 6 3
6 10 8 2
6 6 6 3
6 2 4 4
2 10 6 3
2 6 4 4
2 2 2 5

Таблиця - Попит на продукцію в регіоні, тис. од.

Значення Часткою продукції підприємства 1, придбаної населенням, залежать від співвідношення цін на продукцію підприємства 1 та підприємства У результаті маркетингового дослідження цю залежність встановлено і значення обчислено:

Таблиця - Частка продукції підприємства 1, що купується населенням залежно від співвідношення цін на продукцію

За умовою завдання на ринку регіону діють лише 2 підприємства. Тому частку продукції другого підприємства, придбаної населенням, залежно від співвідношення ціни продукції можна визначити як одиниця мінус частка першого підприємства.

Стратегіями підприємств у цій задачі є їх вирішення щодо технологій виробництва продукції. Ці рішення визначають собівартість та ціну реалізації одиниці продукції. У задачі необхідно визначити:

  1. Чи існує у цій задачі ситуація рівноваги під час виборів технологій виробництва продукції обома підприємствами?
  2. Чи існують технології, які підприємства наперед не вибиратимуть внаслідок невигідності?
  3. Скільки продукції буде реалізовано у ситуації рівноваги? Яке підприємство опиниться у виграшному становищі?

Рішення завдання

  1. Визначимо економічний сенс коефіцієнтів виграшів у платіжній матриці завдання. Кожне підприємство прагне максимізації прибутку від виробництва. Але, крім того, у цьому випадку підприємства ведуть боротьбу за ринок продукції в регіоні. У цьому виграш одного підприємства означає програш іншого. Таке завдання може бути зведене до матричної гри з нульовою сумою. При цьому коефіцієнтами виграшів будуть значення різниці прибутку підприємства 1 та 2 від виробництва продукції. У разі, якщо ця різниця позитивна, виграє підприємство 1, а якщо вона негативна — підприємство 2.
  2. Розрахуємо коефіцієнти виграшів платіжної матриці. Для цього необхідно визначити значення прибутку підприємства 1 та 2 від виробництва продукції.

Прибуток підприємства у цій задачі залежить:

  • від ціни та собівартості продукції;
  • від кількості продукції, яку купує населення регіону;
  • від частки продукції, придбаної населенням у підприємства.

Таким чином, значення різниці прибутку підприємств, що відповідають коефіцієнтам платіжної матриці, необхідно визначити за такою формулою:

D = p⋅(S⋅R1 - S⋅C1) - (1 - p)⋅(S⋅R2 - S⋅C2),

де D - значення різниці прибутку від виробництва продукції підприємства 1 та підприємства

p - частка продукції підприємства 1, що купується населенням регіону;

S - кількість продукції, що купується населенням регіону;

R1 та R2 — ціни реалізації одиниці продукції підприємствами 1 та

C1 і C2 - повна собівартість одиниці продукції, виробленої на підприємствах 1 і

Обчислимо один із коефіцієнтів платіжної матриці.

Нехай, наприклад, підприємство 1 приймає рішення про виробництво продукції відповідно до технології III, а підприємство 2 - відповідно до технології II. Тоді вартість реалізації одиниці. продукції підприємства 1 складе 2 д.е. за собівартості одиниці. продукції 1,5 д.о. Для підприємства 2 вартість реалізації одиниці. продукції становитиме 6 д.е. при собівартості 4 д.е.

Кількість продукції, яку населення регіону придбає за середньої ціни 4 д.е., дорівнює 4 тис. од. (Таблиця 1). Частка продукції, яку населення придбає у підприємства 1, становитиме 0,85, а підприємства 2 — 0,15 (табл. 1.3). Обчислимо коефіцієнт платіжної матриці a 32 за формулою:

a 32 = 0,85⋅(4⋅2 - 4×1,5) - 0,15⋅(4⋅6 - 4⋅4) = 0,5 тис. од.

де i = 3 - номер технології першого підприємства, а j = 2 - номер технології другого підприємства.

Аналогічно обчислимо всі коефіцієнти платіжної матриці. У платіжній матриці стратегії A 1 - A 3 - являють собою рішення про технології виробництва продукції підприємством 1, стратегії B 1 - B 3 - рішення про технології виробництва продукції підприємством 2, коефіцієнти виграшів - різницю прибутку підприємства 1 та підприємства

B 1 B 2 B 3 Min j
A 1 0,17 0,62 0,24 0,17
A 2 0,3 -1,5 -0,8 -1
A 3 0,9 0,5 0,4 0,4
Max i 3 0,62 0,4

Таблиця - Платіжна матриця у грі «Боротьба двох підприємств».

У цій матриці немає ні домінованих, ні дублюючих стратегій. Це означає, що для обох підприємств немає наперед невигідних технологій виробництва продукції. Визначимо мінімальні елементи рядків матриці. Для підприємства 1 кожен із цих елементів має значення мінімально гарантованого виграшу при виборі відповідної стратегії. Мінімальні елементи матриці рядків мають значення: 0,17, -1,5, 0,4.

Визначимо максимальні елементи стовпців матриці. Для підприємства 2 кожен із цих елементів також має значення мінімально гарантованого виграшу при виборі відповідної стратегії. Максимальні елементи матриці по шпальтах мають значення: 3, 0,62, 0,4.

Нижня ціна гри у матриці дорівнює 0,4. Верхня ціна гри також дорівнює 0,4. Таким чином, нижня та верхня ціна гри в матриці збігаються. Це означає, що є технологія виробництва, яка є оптимальною для обох підприємств в умовах даного завдання. Ця технологія III, яка відповідає стратегіям A 3 підприємства 1 та B 3 підприємства Стратегії A 3 та B 3 – чисті оптимальні стратегії в даному завданні.

Значення різниці прибутку підприємства 1 і 2 при виборі чистої оптимальної стратегії позитивно. Це означає, що підприємство 1 виграє у цій грі. Виграш підприємства 1 становитиме 0,4 тис. д.о. При цьому на ринку буде реалізовано 5 тис. од. продукції (реалізація дорівнює попиту продукцію, таблиця 1).. Обидва підприємства встановлять ціну за одиницю продукції 2 д.е. При цьому для першого підприємства повна собівартість одиниці продукції складе 1,5 д.о., а для другого - 1 д.о. Підприємство 1 виявиться у виграші лише за рахунок високої частки продукції, яку придбає у нього населення.

Критерії прийняття рішення

ЛПР визначає найвигіднішу стратегію залежно від цільової установки, яку він реалізує у процесі розв'язання задачі. Результат розв'язання задачі ЛПР визначає по одному з критеріїв прийняття рішення. Для того, щоб дійти однозначного і по можливості найвигіднішого варіанту рішення, необхідно ввести оцінну (цільову) функцію. У цьому кожній стратегії ЛПР (A i) приписується певний результат W i , характеризує всі наслідки цього рішення. З масиву результатів прийняття рішень ЛПР вибирає елемент W, який якнайкраще відображає мотивацію його поведінки.

Залежно від умов довкілля та ступеня інформативності ЛПР проводиться наступна класифікація завдань прийняття рішень:

  • в умовах ризику;
  • за умов невизначеності;
  • в умовах конфлікту чи протидії (активного супротивника).

Ухвалення рішень в умовах ризику.

1. Критерій очікуваного значення.

Використання критерію очікуваного значення обумовлено прагненням максимізувати очікуваний прибуток (або мінімізувати очікувані витрати). Використання очікуваних величин передбачає можливість багаторазового вирішення одного і того ж завдання, доки не будуть отримані досить точні розрахункові формули. Математично це виглядає так: нехай Х - випадкова величина з математичним очікуванням MX та дисперсією DX. Якщо x 1 , x 2 , ..., x n — значення випадкової величини (с.в.) X, то середнє арифметичне їх (вибіркове середнє) значень x^=(x 1 +x 2 +...+x n)/ n має дисперсію DX/n. Таким чином, коли n→∞ DX/n→∞ та X→MX.

Тобто при досить великому обсязі вибірки різниця між середнім арифметичним і математичним очікуванням прагне нуля (так звана гранична теорема теорії ймовірності). Отже, використання критерію очікуване значення справедливе лише у разі, коли одне й теж рішення доводиться застосовувати досить багато разів. Правильне і зворотне: орієнтація на очікування призводитиме до невірних результатів, для рішень, які доводиться приймати невелику кількість разів.

Приклад 1. Потрібно прийняти рішення, коли необхідно проводити профілактичний ремонт ПЕОМ, щоб мінімізувати втрати через несправність. Якщо ремонт буде проводитися занадто часто, витрати на обслуговування будуть більшими при малих втратах через випадкові поломки.

Так як неможливо передбачити заздалегідь, коли виникне несправність, необхідно знайти ймовірність того, що ПЕОМ вийде з ладу в період t. У цьому полягає елемент «ризику».

Математично це виглядає так: ПЕОМ ремонтується індивідуально, якщо вона зупинилася через поломку. Через T інтервалів часу виконується профілактичний ремонт всіх n ПЕОМ. Необхідно визначити оптимальне значення m, у якому мінімізуються загальні витрати на ремонт несправних ПЕОМ та проведення профілактичного ремонту з розрахунку на один інтервал часу.

Нехай р t - ймовірність виходу з ладу однієї ПЕОМ в момент t, а n t - випадкова величина, що дорівнює кількості всіх, що вийшли з ладу ПЕОМ в той же момент. Нехай далі С1 – витрати на ремонт несправної ПЕОМ та С2 – витрати на профілактичний ремонт однієї машини.

Застосування критерію очікуваного значення у разі виправдано, якщо ПЕОМ працюють протягом великого періодучасу. При цьому очікувані витрати на один інтервал становитимуть

ОЗ = (C 1 ∑M(n t)+C 1 n)/T,

де M(n t) — математичне очікування числа ПЕОМ, що вийшли з ладу, в момент t. Оскільки n t має біномний розподіл з параметрами (n, p t), то M(n t) = np t . Таким чином

ОЗ = n(C 1 ∑p t +C 2)/T.

Необхідні умови оптимальності T* мають вигляд:

ОЗ (T * -1) ≥ ОЗ (T *),

ОЗ (T * +1) ≥ ОЗ (T *).

Отже, починаючи з малого значення T обчислюють ОЗ(

T), доки не будуть задоволені необхідні умови оптимальності.

Нехай 1 = 100; З 2 = 10; n = 50. Значення p t мають вигляд:

T р t ∑р t ОЗ(Т)
1 0.05 0 50(100⋅0+10)/1=500
2 0.07 0.05 375
3 0.10 0.12 366.7
4 0.13 02 400
5 0.18 0.35 450

T* →3, ОЗ(Т*)→366.7

Отже, профілактичний ремонт необхідно робити через T * =3 інтервалу часу.

Критерій «очікуване значення – дисперсія».

Критерій очікуваного значення можна модифікувати так, що його можна буде застосувати і для ситуацій, що рідко повторюються.

Якщо х – с. в. з дисперсією DX, то середнє арифметичне x має дисперсію DX/n, де n - число доданків в x ^. Отже, якщо DX зменшується, і ймовірність того, що x ^ близько до MX, збільшується. Отже, доцільно запровадити критерій, у якому максимізація очікуваного значення прибутку узгоджується з мінімізацією її дисперсії.

Приклад 2. Застосуємо критерій «очікуване значення — дисперсія» для прикладу 1. І тому необхідно визначити дисперсію витрат за один інтервал часу, тобто. дисперсію

з Т = (C 1 ∑n t +C 2 n)/T

Т.к. n t , t = (1, T-1) - с.в., то з Т також с.в. С.В. n t має біноміальний розподіл з M(n t) = np t та D(n t) = np t (1–p t). Отже,

D(з Т) = D((C 1 ∑n t +C 2 n)/T) = (C 1 /T) 2 D(∑n t) =

= (C 1 /T) 2 ∑Dn t = (C 1 /T) 2 ∑np t (1-p t) = (C 1 /T) 2 (∑p t - ∑p t 2 ),

де 2 n = const.

З прикладу 1 випливає, що

М(з Т) = М(з(Т)).

Отже шуканим критерієм буде мінімум виразу

М(з(Т)) + до D(з Т).

Зауваження. Константу «к» можна як рівень не схильність до ризику, т.к. «к» визначає «ступінь можливості» дисперсії Д(з Т) стосовно математичного очікування. Наприклад, якщо підприємець, особливо гостро реагує на великі негативні відхилення прибутку вниз від М(з(Т)), він може вибрати «к» набагато більше 1. Це надає більшу вагу дисперсії і призводить до рішення, що зменшує ймовірність великих втрат прибутку.

При к=1 отримуємо завдання

M(з(T))+D(з(T)) = n ( (C 1 /T+C 1 2 /T 2)∑p t - C 1 2 /T 2 ∑p t 2 + C 2 /T )

За даними прикладу 1 можна скласти наступну таблицю

T p t p t 2 ∑p t ∑p t 2 М(з(Т))+D(з(Т))
1 0,05 0,0025 0 0 500.00
2 0,07 0,0049 0,05 0,0025 6312,50
3 0,10 0,0100 0,12 0,0074 6622,22
4 0,13 0,0169 0,2 0,0174 6731,25
5 0,18 0,0324 0,35 0,0343 6764,00

З таблиці видно, що профілактичний ремонт потрібно робити протягом кожного інтервалу Т * =1.

3. Критерій граничного рівня

Критерій граничного рівня не дає оптимального рішення, що максимізує, наприклад, прибуток або мінімізує витрати. Швидше він відповідає визначенню прийнятногометоду действий.

Приклад 3. Припустимо, що величина попиту x в одиницю часу (інтенсивність попиту) деякий товар задається безперервною функцією розподілу f(x). Якщо запаси в початковий моментневеликі, надалі можливий дефіцит товару. В іншому випадку до кінця періоду, що розглядається, запаси нереалізованого товару можуть виявитися дуже великими. В обох випадках можливі втрати.

Т.к. визначити втрати від дефіциту дуже важко, ЛПР може встановити необхідний рівень запасів таким чином, щоб величина очікуваногодефіциту не перевищувала A 1 одиниць, а величина очікуванихнадлишків не перевищувала A 2 одиниць. Іншими словами, нехай I — рівень запасів, що шукається. Тоді

очікуваний дефіцит = ∫(x-I)f(x)dx ≤ A 1 ,

очікувані надлишки = ∫(I-x)f(x)dx ≤ A 2 .

При довільному виборі A 1 і A 2 ці умови можуть виявитися суперечливими. І тут необхідно послабити одне з обмежень, щоб забезпечити допустимість.

Нехай, наприклад,

f(x) = 20/x 2 , 10≤x≤20,

f(x) = 0, x≤10 та x≥20.

∫(x-I)f(x)dx = ∫(x-I)(20/x 2)dx = 20(ln(20/I) + I/20 – 1)

∫(I-x)f(x)dx = ∫(I-x)(20/x 2)dx = 20(ln(10/I) + I/10 – 1)

Застосування критерію граничного рівня призводить до нерівностей

ln(I) - I/20 ≥ ln(20) – A 1 /20 – 1 = 1,996 - A 1 /20

ln(I) - I/10 ≥ ln(10) – A 2 /20 – 1 = 1,302 - A 2 /20

Граничні значення A 1 і A 2 повинні бути обрані так, щоб обидві нерівності виконувались хоча б для одного значення I.

Наприклад, якщо A 1 = 2 і A 2 = 4, нерівності набувають вигляду

ln(I) - I/20 ≥ 1,896

ln(I) - I/10 ≥ 1,102

Значення I має бути між 10 і 20, т.к. саме у цих межах змінюється попит. З таблиці видно, що обидві умови виконуються для I, з інтервалу (13,17)

I 10 11 12 13 14 15 16 17 18 19 20
ln(I) - I/20 1,8 1,84 1,88 1,91 1,94 1,96 1,97 1,98 1,99 1,99 1,99
ln(I) - I/10 1,3 19 18 16 14 11 1,17 1,13 1,09 1,04 0,99

Будь-яке з цих значень відповідає умовам завдання.

Ухвалення рішень в умовах невизначеності

Припускатимемо, що особі, яка приймає рішення, не протистоїть розумнийсупротивник.

Дані, необхідні прийняття рішення за умови невизначеності, зазвичай задаються у вигляді матриці, рядки якої відповідають можливим діям, а стовпці — можливим станам системи.

Нехай, наприклад, з деякого матеріалу потрібно виготовити виріб, довговічність якого за допустимих витрат неможливо визначити. Навантаження вважаються відомими. Потрібно вирішити, які розміри повинен мати виріб із цього матеріалу.

Варіанти рішення такі:

Е 1 - Вибір розмірів з міркувань максимальної довговічності;

Е m - Вибір розмірів з міркувань мінімальної довговічності;

E i – проміжні рішення.

Умови, що вимагають розгляду, такі:

F 1 - умови, що забезпечують максимальну довговічність;

F n - Умови, що забезпечують min довговічність;

Fi — проміжні умови.

Під результатом рішення e ij = е(E i ; F j) тут можна розуміти оцінку, що відповідає варіанту E i та умовам F j і що характеризують прибуток, корисність чи надійність. Зазвичай ми називатимемо такий результат корисністю рішення.

Тоді сімейство (матриця) рішень | | e ij | | має вигляд:

F 1 F 2 ... F n
E 1 e 11 e 12 ... e 1n
E 2 e 21 e 22 ... e 2n
... ... ... ... ...
E m e m1 e m2 ... e mn

Щоб дійти однозначного і наскільки можна найвигіднішого варіанту рішення необхідно запровадити оцінну (цільову) функцію. У цьому матриця рішень ||e ij || зводиться до одного стовпця. Кожному варіанту E i приписується, тобто деякий результат e ir , що характеризує, в цілому, всі наслідки цього рішення. Такий результат ми будемо надалі позначати тим самим символом e ir.

Класичні критерії прийняття рішень

1. Мінімаксний критерій.

Правило вибору рішення відповідно до мінімаксного критерію (ММ-критерію) можна інтерпретувати таким чином:

матриця рішень доповнюється ще одним стовпцем із найменших результатів e ir кожного рядка. Необхідно вибрати ті варіанти, у рядках яких стоять найбільше значення e ir цього стовпця.

Вибрані т.ч. Випадки повністю виключають ризик. Це означає, що той, хто приймає рішення, не може зіткнутися з гіршим результатом, ніж той, на який він орієнтується. Ця властивість дозволяє вважати ММ-критерій одним із фундаментальних.

Застосування ММ-критерію буває виправданим, якщо ситуація, в якій приймається рішення така:

  1. Про можливість появи зовнішніх станів Fj нічого не відомо;
  2. Доводиться зважати на появу різних зовнішніх станів F j ;
  3. Рішення реалізується лише один раз;
  4. Необхідно виключити будь-який ризик.

2. Критерій Байєса-Лапласа.

Позначимо через q i - ймовірність появи зовнішнього стану Fj.

Відповідне правило вибору можна інтерпретувати так:

матриця рішень доповнюється ще одним стовпцем, що містить математичне очікування значень кожного рядка. Вибираються варіанти, у рядках яких стоїть найбільше значення e ir цього стовпця.

При цьому передбачається, що ситуація, в якій приймається рішення, характеризується такими обставинами:

  1. Імовірність появи стану F j відомі і не залежать від часу.
  2. Рішення реалізується (теоретично) нескінченно багато разів.
  3. Для небагатьох реалізацій рішення допускається певний ризик.

При достатньо велику кількістьреалізацій середнє значення поступово стабілізується. Тому за повної (нескінченної) реалізації будь-який ризик практично виключено.

Т.о. критерій Байєса-Лапласа (B-L-критерій) більш оптимістичний, ніж мінімаксний критерій, проте він передбачає більшу поінформованість та досить тривалу реалізацію.

3. Критерій Севіджа.

a ij: = max i (e ij) - e ij

e ir: = max i (a ij) = max j (max i (e ij) - e ij)

Величину a ij можна трактувати як додатковий максимальний виграш, який досягається, якщо в стані F j замість варіанта E i вибирати інший, оптимальний для цього зовнішнього стану варіант. Величину a ij можна інтерпретувати і як втрати (штрафи), що виникають у стані F j при заміні оптимального для нього варіанта на варіант E i . В останньому випадку e ir являє собою максимально можливі (за всіма зовнішніми станами F j , j = (1,n)) втрати у разі вибору варіанта E i .

Відповідне критерію Севіджа правило вибору тепер трактується так:

  1. Кожен елемент матриці розв'язків ||e ij || віднімається з найбільшого результату max(e ij) відповідного стовпця.
  2. Різниці a ij утворюють матрицю залишків | | e ij | |. Ця матриця поповнюється стовпцем найбільших різниць e ir. Вибирають ті варіанти, у рядках яких стоїть найменше для цього стовпця значення.

Вимоги до ситуації, в якій приймається рішення, збігаються з вимогою до ММ-критерію.

4. Приклад та висновки.

З вимог, що ставляться до розглянутим критеріям стає зрозуміло, що з їхніх жорстких вихідних позицій застосовні лише ідеалізованих практичних рішень. У разі, коли можлива дуже сильна ідеалізація, можна застосовувати одночасно по черзі різні критерії. Після цього серед кількох варіантів ЛПР вольовим методом обирає остаточне рішення. Такий підхід дозволяє, по-перше, краще проникнути у всі внутрішні зв'язкипроблеми прийняття рішень та, по-друге, послаблює вплив суб'єктивного чинника.

приклад. Працюючи ЕОМ необхідно періодично призупиняти обробку інформації та перевіряти ЕОМ на наявність у ній вірусів. Припинення в обробці інформації призводить до певних економічних витрат. Якщо ж вірус вчасно виявлений не буде, можлива втрата і деякої частини інформації, що призведе і ще до великих збитків.

Варіанти рішення такі:

Е 1 - Повна перевірка;

Е 2 - Мінімальна перевірка;

Е 3 - Відмова від перевірки.

ЕОМ може перебувати у таких станах:

F 1 - вірус відсутня;

F 2 - вірус є, але він не встиг пошкодити інформацію;

F 3 — є файли, які потребують відновлення.

Результати, що включають витрати на пошук вірусу та його ліквідацію, а також витрати, пов'язані з відновленням інформації, мають вигляд:

F 1 F 2 F 3 ММ-критерій критерій B-L
e ir = min j (e ij) max i (e ir) e ir = ∑e ij max i (e ir)
E 1 -20,0 -20 -25,0 -25,0 -25,0 -22,33
E 2 -14,0 -23,0 -31,0 -31,0 -22,67
E 3 0 -24.0 -40.0 -40.0 -21.33 -21.33

Відповідно до ММ-критерію слід проводити повну перевірку. Критерій Байєса-Лапласа, припущення, що всі стани машини рівноймовірні.

F 1 F 2 F 3 Критерій Севіджа
e ir = min j (a ij) min j (e ir)
E 1 +20,0 0 0 +20,0
E 2 +14,0 +1,0 +6,0 +14,0 +14,0
E 3 0 +2,0 +15,0 +15,0

Приклад спеціально підібраний так, що кожний критерій пропонує нове рішення. Невизначеність стану, у якому перевірка застає ЕОМ, перетворюється на неясність, яким критерієм слідувати.

Оскільки різні критерії пов'язані з різними умовами, в яких приймається рішення, найкраще для порівняльної оцінки рекомендації тих чи інших критеріїв отримати додаткову інформацію про ситуацію. Зокрема, якщо прийняте рішення стосується сотень машин з однаковими параметрами, то рекомендується застосовувати критерій Байєса-Лапласа. Якщо ж число машин не велике, краще скористатися критеріями мінімакса або Севіджа.

Похідні критерії.

1. Критерій Гурвіца.

Намагаючись зайняти найбільш урівноважену позицію, Гурвіц припустив оцінну функцію, яка знаходиться десь між точкою зору крайнього оптимізму та крайнього песимізму:

max i (e ir) = (C⋅min j (e ij) + (1-C)⋅max j (e ij) ),

де С - ваговий множник.

Правило вибору згідно з критерієм Гурвіца, формується таким чином:

матриця рішень | | e ij | | доповнюється стовпцем, що містить середнє зважене найменшого та найбільшого результатів для кожного рядка. Вибираються лише ті варіанти, у рядках яких стоять найбільші елементи e ir цього стовпця.

При С=1 критерій Гурвіца перетворюється на ММ-критерій. При С = 0 він перетворюється на критерій «азартного гравця»

max i (e ir) = max i (max j (e ij)),

тобто. ми стаємо на думку азартного гравця, що робить ставку на те, що «випаде» найвигідніший випадок.

У технічних додатках складно вибрати ваговий множник, т.к. важко знайти кількісну характеристику тим часток оптимізму і песимізму, які є присутніми під час ухвалення рішення. Тому найчастіше З:=1/2.

Критерій Гурвіца застосовується у разі, коли:

  1. про ймовірність появи стану F j нічого не відомо;
  2. з появою стану F j необхідно рахуватися;
  3. реалізується лише мала кількість рішень;
  4. допускається певний ризик.

2. Критерій Ходжа-Лемана.

Цей критерій спирається одночасно на ММ-критерій та критерій Баєса-Лапласа. За допомогою параметра n виражається ступінь довіри до використовуваних розподілів ймовірностей. Якщо довіра велика, то домінує критерій Баєса-Лапласа, інакше - ММ-критерій, тобто. ми шукаємо

max i (e ir) = max i (v⋅∑e ij ⋅q i + (1-v) min j (e ir)), 0 ≤ n ≤ 1.

Правило вибору, яке відповідає критерію Ходжа-Лемана формується таким чином:

матриця рішень | | e ij | | доповнюється стовпцем, складеним із середніх зважених (з вагою v≡const) математичних очікувань та найменшого результату кожного рядка (*). Відбираються варіанти рішень у рядках якого стоїть найбільше значення цього стовпця.

При v = 1 критерій Ходжа-Лемана перетворюється на критерій Байєса-Лапласа, а за v = 0 стає мінімаксним.

Вибір v суб'єктивний т. до. Ступінь достовірності будь-якої функції розподілу - справа темна.

Для застосування критерію Ходжа-Лемана бажано, щоб ситуація, в якій приймається рішення, задовольняла властивостям:

  1. ймовірності появи стану Fj невідомі, але деякі припущення про розподіл ймовірностей можливі;
  2. ухвалене рішення теоретично допускає нескінченно багато реалізацій;
  3. при малих числах реалізації допускається певний ризик.

3. Критерій Гермейєра.

Цей критерій спрямовано величину втрат, тобто. на негативні значення всіх e ij. При цьому

max i (e ir) = max i (min j (e ij) q j).

Т.к. у господарських завданнях переважно мають справу з цінами та витратами, умовами e ij<0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij -a при подходящем образом подобранном a>0. У цьому оптимальний варіант рішення залежить від а.

Правило вибору згідно з критерієм Гермейєра формулюється так:

матриця рішень | | e ij | | доповнюється ще одним стовпцем що містить у кожному рядку найменший добуток наявного в ньому результату на ймовірність відповідного стану F j . Вибираються ті варіанти в рядках яких є найбільше значення e ij цього стовпця.

У певному сенсі критерій Гермейера узагальнює ММ-критерій: у разі рівномірного розподілу q j = 1/n, j=(1,n), вони стають ідентичними.

Умови його застосування такі:

  1. з появою тих чи інших станів, окремо чи комплексно, необхідно рахуватися;
  2. допускається певний ризик;
  3. Рішення може реалізуватися один або кілька разів.

Якщо функція розподілу відома не дуже надійно, а числа реалізації малі, то, дотримуючись критерію Гермейера, отримують, взагалі кажучи, невиправдано великий ризик.

4. Об'єднаний критерій Байєса-Лапласа та мінімакса.

Прагнення отримати критерії, які краще пристосовувалися до наявної ситуації, ніж усі досі розглянуті, призвело до побудови про складових критеріїв. Як приклад розглянемо критерій, отриманий шляхом поєднання критеріїв Байєса-Лапласа та мінімаксу (BL(MM)-критерій).

Правило вибору цього критерію формулюється так:

матриця рішень | | e ij | | доповнюється ще трьома стовпцями. У першому записуються математичні очікування кожного з рядків, у другому — різницю між опорним значенням

e i 0 j 0 = max i (max j (e ij))

та найменшим значенням

відповідного рядка. У третьому стовпці розміщуються різниці між найбільшим значенням

кожного рядка та найбільшим значенням max j (e i 0 j) того рядка, в якому знаходиться значення e i 0 j 0 . Вибираються варіанти, рядки яких (при дотриманні наведених нижче співвідношень між елементами другого і третього стовпців) дають найбільше математичне очікування. А саме, відповідне значення

e i 0 j 0 - max j (e ij)

з другого стовпця має бути або дорівнює деякому заздалегідь заданому рівню ризику E дод. Значення ж із третього стовпця має бути більше значення другого стовпця.

Застосування цього критерію обумовлено такими ознаками ситуації, у якій приймається рішення:

  1. ймовірності появи станів F j невідомі, проте є деяка апріорна інформація на користь якогось певного розподілу;
  2. необхідно зважати на появу різних станівяк окремо, так і в комплексі;
  3. допускається обмежений ризик;
  4. ухвалене рішення реалізується один раз або багаторазово.

BL(MM)-критерій добре пристосований для побудови практичних рішень насамперед у галузі техніки і може вважатися досить надійним. Однак задані межі ризику E додаткових і, відповідно, оцінок ризику E i не враховує ні кількість застосування рішення, ні іншу подібну інформацію. Вплив суб'єктивного чинника хоч і ослаблений, але не виключений повністю.

max j (e ij)-max j (e i 0 j)≥E i

істотно у випадках, коли рішення реалізується лише одне чи мало разів. У цих умовах недостатньо орієнтуватися на ризик, пов'язаний лише з невигідними зовнішніми станами та середніми значеннями. Через це, щоправда, можна зазнати деяких втрат у вдалих зовнішніх станах. За великої кількості реалізацій ця умова перестає бути такою вже важливою. Воно навіть припускає розумні альтернативи. При цьому не відомо, однак, чітких кількісних вказівок, у яких випадках цю умову слід опускати.

5. Критерій творів.

max i (e ir): = max i (∏e ij)

Правило вибору у разі формулюється так:

Матриця розв'язків ||e ij || доповнюється новим стовпцем, що містить добутки всіх результатів кожного рядка. Вибираються варіанти, у рядках яких перебувають найбільші значенняцього стовпця.

Застосування цього критерію обумовлено такими обставинами:

  1. ймовірності появи стану Fj невідомі;
  2. з появою кожного із станів F j окремо необхідно рахуватися;
  3. критерій застосуємо і за малому числі реалізацій рішення;
  4. деякий ризик допускається.

Критерій творів пристосований насамперед випадків, коли всі e ij позитивні. Якщо умова позитивності порушується, слід виконувати деякий зсув e ij +а з деякою константою а>|min ij (e ij)|. Результат при цьому, звичайно, залежатиме від а. На практиці найчастіше

а: = | min ij (e ij) | +1.

Якщо ж жодна константа може бути визнана має сенс, то критерій творів не застосовний.

приклад.

Розглянемо той самий приклад, як і раніше (див. вище).

Побудова оптимального рішення для матриці рішень про перевірки за критерієм Гурвіца має вигляд (при С=0, 10 3):

||e ij || С⋅min j (e ij) (1-С)⋅max j (e ij) e ir max i (e ir)
-20,0 -22,0 -25,0 -12,5 -10.0 -22,5
-14,0 -23.0 -31.0 -15,5 -7.0 -22,5
0 -24.0 -40.0 -20.0 0 -20.0 -20.0

У даному прикладіу розв'язку є поворотна точка щодо вагового множника С: до С=0,57 як оптимальний вибирається Е 3 , а при великих значеннях - Е 1 .

Застосування критерію Ходжа-Лемана (q=0,33, v=0, 10 3):

∑e ij ⋅q j min j (e ij) v⋅∑e ij ⋅q j (1-v)⋅∑e ij ⋅q j e ir max i (e ir)
-22,33 -25,0 -11,17 -12,5 -23,67 -23,67
-22,67 -31,0 -11,34 -15,5 -26,84
-21,33 -40,0 -10,67 -20,0 -30,76

Критерій Ходжа-Лемана рекомендує варіант Е 1 (повна перевірка) - як і ММ-критерій. Зміна варіанта, що рекомендується, відбувається тільки при v=0,94. Тому рівномірний розподіл станів машини, що розглядається, повинен розпізнаватись з дуже високою ймовірністю, щоб його можна було вибрати за більшим математичним очікуванням. При цьому кількість реалізацій рішення завжди залишається довільною.

Критерій Гермейера при q j = 0.33 дає наступний результат (10 3):

||e ij || ||e ij q j || e ir = min j (e ij q j) max i (e ir)
-20,0 -22,0 -25,0 -6,67 -7,33 -8,33 -8,33 -8,33
-14,0 -23,0 -31,.0 -4,67 -7,67 -10,33 -10,33
0 -24,0 -40,0 0 -8,0 -13,33 -13,33

Як оптимальний вибирається варіант Е 1 . Порівняння варіантів за допомогою величини e ir показує, що спосіб дії критерію Гермейера навіть більш гнучким, ніж у ММ-критерію.

У таблиці, наведеній нижче, рішення вибирається відповідно до BL(MM)-критерієм при q 1 =q 2 =q 3 =1/2 (дані 10 3).

||e ij || ∑e ij q j e i 0 j 0 - min j (e ij) max j (e ij) max j (e ij) - max j (e i 0 j)
-20,0 -22,0 -25,0 -23,33 0 -20,0 0
-14,0 -23,0 -31,0 -22,67 +6,0 -14,0 +6,0
0 -24,0 -40,0 -21,33 +15,0 0 +20,0

Варіант Е 3 (відмова від перевірки) приймається цим критерієм лише тоді, коли ризик наближається до E можн = 15⋅10 3 . В іншому випадку оптимальним виявляється Е1. У багатьох технічних та господарських завданнях допустимий ризик буває набагато нижчим, становлячи зазвичай лише незначний відсоток від загальних витрат. У подібних випадках буває особливо цінним, якщо неточне значення розподілу ймовірностей позначається не дуже сильно. Якщо при цьому виявляється неможливим встановити допустимий ризик E додаткове заздалегідь, незалежно від прийнятого рішення, то допомогти може обчислення очікуваного ризику E можл. Тоді стає можливим подумати, чи виправданий такий ризик. Таке дослідження зазвичай дається легше.

Результати застосування критерію твору при а = 41⋅10 3 і а = 200⋅10 3 мають вигляд:

a ||e ij + a|| e ir = ∏ j e ij max i e ir
41 +21 +19 +16 6384 6384
+27 +18 +10 4860
+41 +17 +1 697
200 +180 +178 +175 5607
+186 +177 +169 5563
+200 +176 +160 5632 5632

Умову e ij > 0 для цієї матриці неможливо. Тому до елементів матриці додається (за зовнішнім свавіллям) спочатку а = 41⋅10 3 , а потім а = 200⋅10 3 .

Для а = 41⋅10 3 оптимальним виявляється варіант Е 1, а для а = 200⋅10 3 - варіант Е 3 , так що залежність оптимального варіанта від очевидна.

Теорія ігор - Сукупність математичних методів вирішення конфліктних ситуацій (зіткнень інтересів). Теоретично ігор грою називається математична модель конфліктної ситуації Предмет особливого інтересу теорії ігор – дослідження стратегій прийняття рішень учасників гри в умовах невизначеності. Невизначеність пов'язана з тим, що дві або більше сторони мають протилежні цілі, а результати будь-якої дії кожної із сторін залежать від ходів партнера. При цьому кожна зі сторін прагне приймати оптимальні рішення, які реалізують поставлену мету найбільшою мірою.

Найбільш послідовно теорія ігор застосовується в економіці, де конфліктні ситуаціївиникають, наприклад, у відносинах між постачальником та споживачем, покупцем і продавцем, банком та клієнтом. Застосування теорії ігор можна знайти й у політиці, соціології, біології, військовому мистецтві.

З історії теорії ігор

Історія теорії ігор як самостійної дисципліни починається у 1944 році, коли Джон фон Нейман та Оскар Моргенштерн опублікували книгу "Теорія ігор та економічна поведінка" ("Theory of Games and Economic Behavior"). Хоча приклади теорії ігор зустрічалися й раніше: трактат Вавилонського Талмуду про поділ майна померлого чоловіка між його дружинами, карткові ігри в 18-му столітті, розвиток теорії шахової гри на початку 20-го століття, доказ теореми про мінімакс того ж Джона фон Неймана в 1928 року, без якої не було б жодної теорії ігор.

У 50-х роках 20-го століття Мелвін Дрешер і Меріл Флод з Rand Corporationпершими експериментально застосували дилему ув'язненого, Джон Неш у роботах про стан рівноваги в іграх двох осіб розвинув поняття рівноваги Неша.

Рейнхард Селтен в 1965 опублікував книгу "Обробка олігополії в теорії ігор на вимогу" ("Spieltheoretische Behandlung eines Oligomodells mit Nachfrageträgheit"), з якою застосування теорії ігор в економіці отримало нову рушійну силу. Кроком вперед у еволюції теорії ігор пов'язані з роботою Джона Мейнарда Сміта " Еволюційно стабільна стратегія " ( " Evolutionary Stable Strategy " , 1974). Дилема ув'язненого була популяризована у книзі Роберта Аксельрода "Еволюція кооперації" ("The Evolution of Cooperation"), опублікованій 1984 року. У 1994 році саме за внесок у теорію ігор Нобелівської премії були удостоєні Джон Неш, Джон Харсаньї та Рейнхард Селтен.

Теорія ігор у житті та бізнесі

Зупинимося докладніше на суті кофліктної ситуації (зіткненні інтересів) у тому сенсі, як він розуміється в теорії ігор для подальшого моделювання різних ситуацій у житті та бізнесі. Нехай індивід знаходиться в такому положенні, яке призводить до одного з декількох можливих результатів, причому у індивідуума по відношенню до цих результатів деякі особисті переваги. Але хоча може певною мірою управляти змінними чинниками, визначальними результат, не має повної влади з них. Іноді управління знаходиться в руках кількох індивідуумів, які, подібно до нього, мають якісь переваги по відношенню до можливих результатів, але в загальному випадку інтереси цих індивідуумів не узгоджуються. В інших випадках кінцевий результат може залежати як від випадковостей (які в юридичних науках іноді називаються стихійними лихами), і від інших індивідуумів. Теорія ігор систематизує спостереження за такими ситуаціями та формулювання загальних принципів для керівництва розумними діями у таких ситуаціях.

У деяких відносинах назва "теорія ігор" невдала, оскільки наводить на думку, що теорія ігор розглядає лише не мають соціального значення зіткнення, що відбуваються в салонних іграх, але все ж таки ця теорія має значно ширше значення.

Про застосування теорії ігор може дати уявлення така економічна ситуація. Нехай є кілька підприємців, кожен із яких прагне отримати максимум прибутку, маючи при цьому лише обмежену владу над змінними, що визначають цей прибуток. Підприємець не має влади над змінними, якими розпоряджається інший підприємець, але які можуть сильно впливати на прибуток першого. Трактування цієї ситуації як гри може викликати таке заперечення. В ігровій моделі передбачається, що кожен підприємець робить один вибір з області можливих виборівта цими одиничними виборами визначаються прибутки. Очевидно, що цього майже не може бути насправді, тому що при цьому в промисловості не були б потрібні складні управлінські апарати. Просто є низка рішень та модифікацій цих рішень, які залежать від виборів, скоєних іншими учасниками економічної системи (гравцями). Але в принципі можна уявити, що будь-який адміністратор передбачає всі можливі випадковості і докладно описує дію, яку потрібно робити в кожному випадку, замість того, щоб вирішувати кожне завдання в міру її виникнення.

Військовий кофлікт, за визначенням, є зіткнення інтересів, у якому жодна із сторін не розпоряджається повністю змінними, визначальними результатом, що вирішується поруч битв. Можна просто вважати результат виграшем чи програшем і приписати їм чисельні значення 1 та 0.

Одна з найпростіших конфліктних ситуацій, яка може бути записана і вирішена в теорії ігор - дуель, що є конфліктом двох гравців 1 і 2, які мають відповідно pі qпостріли. Для кожного гравця існує функція, що вказує на ймовірність того, що постріл гравця iу момент часу tдасть влучення, яке виявиться смертельним.

У результаті теорія ігор приходить до такого формулювання деякого класу зіткнень інтересів: є nгравців, і кожному потрібно вибрати одну можливість зі стого певного набору, причому при здійсненні вибору гравець не має жодних відомостей про вибори інших гравців. Область можливих виборів гравця може містити такі елементи, як "хід тузом пік", "виробництво танків замість автомобілів", або загалом, стратегію, що визначає всі дії, які потрібно вчинити за всіх можливих обставин. Перед кожним гравцем стоїть завдання: який вибір він має зробити, щоб його приватний вплив на результат приніс йому якнайбільший виграш?

Математична модель у теорії ігор та формалізація завдань

Як ми вже зазначали, гра є математичною моделлю конфліктної ситуації і вимагає наявності наступних компонентів:

  1. зацікавлених сторін;
  2. можливі дії з кожної сторони;
  3. інтересів сторін.

Зацікавлені у грі сторони називаються гравцями , кожен із новачків може зробити щонайменше двох дій (якщо у розпорядженні гравця лише одне дію, він фактично не бере участь у грі, оскільки заздалегідь відомо, що він предпримет). Результат гри називається виграшем .

Реальна конфліктна ситуація не завжди, а гра (в понятті теорії ігор) – завжди – протікає по певним правилам , які точно визначають:

  1. варіанти дій гравців;
  2. обсяг інформації кожного гравця про поведінку партнера;
  3. виграш, якого призводить кожна сукупність дій.

Прикладами формалізованих ігор можуть бути футбол, карткова гра, шахи.

Але в економіці модель поведінки гравців виникає, наприклад, коли кілька фірм прагнуть зайняти вигідніше місце на ринку, кілька осіб намагаються поділити між собою якесь благо (ресурси, фінанси) так, щоб кожному дісталося якомога більше. Гравцями у конфліктних ситуаціях економіки, які можна моделювати як гри, є фірми, банки, окремі люди та інші економічні агенти. У свою чергу в умовах війни модель гри використовується, наприклад, у виборі кращої зброї (з наявної чи потенційно можливої) для розгрому противника чи захисту від нападу.

Для гри характерна невизначеність результату . Причини невизначеності можна розподілити за такими групами:

  1. комбінаторні (як у шахах);
  2. вплив випадкових факторів (як у грі "орел чи решка", кістки, карткові ігри);
  3. стратегічні (гравець не знає, яку дію вдасться противник).

Стратегією гравця називається сукупність правил, що визначають його дії при кожному ході в залежності від ситуації, що склалася.

Метою теорії ігор є визначення оптимальної стратегії кожного гравця. Визначити таку стратегію – значить вирішити гру. Оптимальність стратегії досягається, коли один із гравців повинен отримати максимальний виграш, при тому, що другий дотримується своєї стратегії. А другий гравець повинен мати мінімальний програш, якщо перший дотримується своєї стратегії.

Класифікація ігор

  1. Класифікація за кількістю гравців (Гра двох і більше осіб). Ігри двох осіб посідають центральне місце у всій теорії ігор. p align="justify"> Основним поняттям теорії ігор для гри двох осіб є узагальнення дуже істотної ідеї рівноваги, яка природно з'являється в іграх двох осіб. Що ж до ігор nосіб, одна частина теорії ігор присвячена іграм, у яких співробітництво між гравцями заборонено. В іншій частині теорії ігор nосіб передбачається, що гравці можуть співпрацювати для взаємної користі (див. далі у цьому параграфі про некооперативні та кооперативні ігри).
  2. Класифікація за кількістю гравців та їх стратегіями (кількість стратегій не менше двох, може бути нескінченністю).
  3. Класифікація за кількістю інформації щодо минулих ходів: ігри з повною інформацієюта неповною інформацією. Нехай є гравець 1 – покупець і гравець 2 – продавець. Якщо гравець 1 не має повної інформації про дії гравця 2, то гравець 1 може і не розрізнити дві альтернативи, між якими йому належить зробити вибір. Наприклад, вибираючи між двома видами деякого товару та не знаючи про те, що за деякими ознаками товар Aгірше за товар B, гравець 1 може не бачити різницю між альтернативами.
  4. Класифікація за принципами поділу виграшу : кооперативні, коаліційні з одного боку та некооперативні, безкоаліційні з іншого боку. У некооперативної гри , або інакше - безкоаліційної гри гравці вибирають стратегії одночасно, не знаючи, яку стратегію вибере другий гравець. Комунікація між гравцями неможлива. У кооперативної гри , або інакше - коаліційної гри , гравці можуть об'єднуватися в коаліції та робити колективні дії, щоб збільшити свої виграші.
  5. Кінцева гра двох осіб із нульовою сумою або антогоністична гра – це стратегічна гра з повною інформацією, в якій беруть участь сторони із протилежними інтересами. Анатагоністичними іграми є матричні ігри .

Класичний приклад з теорії ігор – дилема ув'язненого

Двох підозрюваних беруть під варту та ізолюють один від одного. Окружний прокурор переконаний, що вони вчинили тяжкий злочин, але немає достатніх доказів, щоб пред'явити їм обвинувачення на суді. Він каже кожному з ув'язнених, що має дві альтернативи: зізнатися у злочині, який на переконання поліції він скоїв, або не зізнаватися. Якщо обидва не визнаються, то окружний прокурор висуне їм звинувачення у якомусь незначному злочині, наприклад, дрібну крадіжку або незаконне володіння зброєю, і вони обоє отримають невелике покарання. Якщо вони обидва зізнаються, то підлягатимуть судовій відповідальності, але він не вимагатиме найсуворішого вироку. Якщо ж один визнається, а інший ні, то вирок, що зізнався, буде пом'якшений за видачу спільника, тоді як затятий отримає "на повну котушку".

Якщо це стратегічне завдання сформулювати у термінах ув'язнення, то воно зводиться до наступного:

Таким чином, якщо обидва ув'язнені не визнаються, вони отримають по 1 році кожен. Якщо обидва зізнаються, кожен отримає по 8 років. А якщо один зізнається, інший не визнається, то той, який зізнався, відбудеться трьома місяцями ув'язнення, а той, який не визнається, отримає 10 років. Наведена вище матриця правильно відбиває дилему ув'язненого: перед кожним стоїть питання - зізнатися чи зізнатися. Гра, яку окружний прокурор пропонує ув'язненим, є некооперативну гру чи інакше - безкоаліційну гру . Якби обидва в'язні мали можливість співпрацювати (тобто гра була б кооперативною чи інакше коаліційною грою ), то обидва не зізналися б і отримали за роком в'язниці кожен.

Приклади використання математичних засобів теорії ігор

Переходимо тепер до розгляду рішень прикладів поширених класів ігор, котрим теоретично ігор існують методи дослідження та рішення.

Приклад формалізації некооперативної (безкоаліційної) гри двох осіб

У попередньому параграфі ми вже розглянули приклад некооперативної (безкоаліційної) гри (дилема ув'язненого). Давайте закріпимо наші навички. Для цього підійде класичний сюжет, навіяний "Пригодами Шерлока Холмса" Артура Конан Дойля. Можна, звичайно, заперечити: приклад не з життя, а з літератури, але Конан Дойль не зарекомендував себе як письменник-фантаст! Класичний ще й тому, що завдання виконане Оскаром Моргенштерном, як ми вже встановили – одним із засновників теорії ігор.

приклад 1.Буде наведено скорочений виклад фрагмента однієї з "Пригод Шерлока Холмса". Відповідно до відомих понять теорії ігор скласти модель конфліктної ситуації та формально записати гру.

Шерлок Холмс має намір вирушити з Лондона в Дувр з подальшою метою потрапити на континент (європейський), щоб врятуватися від професора Моріарті, який переслідує його. Сівши в поїзд, він побачив на вокзальній платформі професора Моріарті. Шерлок Холмс припускає, що Моріарті може вибрати особливий поїзд і обігнати його. Шерлок Холмс має дві альтернативи: продовжувати поїздку до Дувру або зійти на станції Кентерберрі, яка є єдиною проміжною станцією на його маршруті. Ми приймаємо, що його противник досить розумний, щоб визначити можливості Холмса, тому перед ним ті самі дві альтернативи. Обидва противники повинні вибрати станцію, щоб зійти з поїзда, не знаючи, яке рішення прийме кожен із них. Якщо в результаті ухвалення рішення обидва виявляться на одній і тій же станції, то можна однозначно вважати, що Шерлок Холмс буде вбитий професором Моріарті. Якщо ж Шерлок Холмс добереться до Дувру, то його буде врятовано.

Рішення. Героїв Конан Дойля можемо розглядати як учасників гри, тобто гравців. У розпорядженні кожного гравця i (i=1,2) дві чисті стратегії:

  • зійти в Дуврі (стратегія si1 ( i=1,2) );
  • зійти на проміжній станції (стратегія si2 ( i=1,2) )

Залежно від того, яку з двох стратегій вибере кожен із двох гравців, буде створено особливу комбінацію стратегій як пару s = (s1 , s 2 ) .

Кожній комбінації можна поставити у відповідність подію - результат спроби вбивства Шерлока Холмса професором Моріарті. Складаємо матрицю цієї гри з можливими подіями.

Під кожною з подій вказано індекс, що означає придбання професора Моріарті, і розраховується залежно від порятунку Холмса. Обидва герої обирають стратегію одночасно, не знаючи, що вибере противник. Таким чином, гра є некооперативною, оскільки, по-перше, гравці знаходяться у різних поїздах, а по-друге, мають протилежні інтереси.

Приклад формалізації та рішення кооперативної (коаліційної) гри nосіб

У цьому пункті практична частина, тобто хід розв'язання прикладу завдання, буде передована теоретичною частиною, в якій знайомитимемося з поняттями теорії ігор для вирішення кооперативних (безкоаліційних) ігор. Для цього завдання теорія ігор пропонує:

  • характеристичну функцію (якщо говорити спрощено, вона відбиває величину вигоди об'єднання гравців у коаліцію);
  • поняття адитивності (властивості величин, що полягає в тому, що значення величини, відповідне цілому об'єкту, дорівнює сумі значень величин, відповідних його частинам, в деякому класі розбиття об'єкта на частини) і суперадитивності (значення величини, відповідне цілому об'єкту, більше суми значень величин, відповідних його частин) характеристичної функції.

Суперадитивність характеристичної функції свідчить, що об'єднання в коаліції вигідна гравцям, оскільки у разі величина виграшу коаліції збільшується зі збільшенням числа гравців.

Для формалізації гри нам потрібно запровадити формальні позначення вищезгаданих понять.

Для гри nпозначимо безліч її гравців як N= (1,2,...,n) Будь-яке непусте підмножина множини Nпозначимо як Т(включаючи саме Nі всі підмножини, що складаються з одного елемента). На сайті є заняття Множини та операції над множинами", яке при переході за посиланням відкривається у новому вікні.

Характеристична функція позначається як vі область її визначення складається з можливих підмножин множини N. v(T) - значення характеристичної функції для того чи іншого підмножини, наприклад, дохід, отриманий коаліцією, у тому числі, можливо, що складається з одного гравця. Це важливо з тієї причини, що теорія ігор вимагає перевірити наявність суперадитивності для значень характеристичної функції всіх коаліцій, що не перетинаються.

Для двох непустих коаліцій із підмножин T1 і T2 адитивність характеристичної функції кооперативної (коаліційної) гри записується так:

А суперадитивність так:

приклад 2.Троє студентів музичної школи підробляють у різних клубах, свою виручку вони одержують від відвідувачів клубів. Встановити, чи вигідно їм поєднувати свої сили (якщо так, то з якими умовами), використовуючи поняття теорії ігор для вирішення кооперативних ігор nосіб, за таких вихідних даних.

В середньому їх виручка за один вечір складала:

  • у скрипаля 600 одиниць;
  • у гітариста 700 одиниць;
  • у співачки 900 одиниць.

Намагаючись збільшити виторг, студенти протягом кількох місяців створювали різні групи. Результати показали, що, об'єднавшись, вони можуть збільшити свою виручку за вечір таким чином:

  • скрипаль + гітарист заробляли 1500 одиниць;
  • скрипаль + співачка заробляли 1800 одиниць;
  • гітарист + співачка заробляли 1900 одиниць;
  • скрипаль + гітарист + співачка заробляли 3000 одиниць.

Рішення. У цьому прикладі кількість учасників гри n= 3 , отже, область визначення характеристичної функції гри складається з 2³ = 8 можливих підмножин безлічі всіх гравців. Перерахуємо всі можливі коаліції T:

  • коаліції з одного елемента, кожна з яких складається з одного гравця – музиканта: T{1} , T{2} , T{3} ;
  • коаліції із двох елементів: T{1,2} , T{1,3} , T{2,3} ;
  • коаліція із трьох елементів: T{1,2,3} .

Кожному з гравців надамо порядковий номер:

  • скрипаль – 1-й гравець;
  • гітарист – 2-й гравець;
  • співачка – 3-й гравець.

За даними завдання визначимо характеристичну функцію гри v:

v(T(1)) = 600; v(T(2)) = 700; v(T(3)) = 900; ці значення характеристичної функції визначені виходячи з виграшів відповідно першого, другого та третього гравців, коли вони не поєднуються в коаліції;

v(T(1,2)) = 1500; v(T(1,3)) = 1800; v(T(2,3)) = 1900; ці значення характеристичної функції визначені за виручкою кожної пари гравців, котрі об'єдналися у коаліції;

v(T(1,2,3)) = 3000; це значення характеристичної функції визначено за середнім виторгом у разі, коли гравці об'єднувалися в трійки.

Таким чином, ми перерахували всі можливі коаліції гравців, їх вийшло вісім, як і має бути, оскільки область визначення характеристичної функції гри складається саме з восьми можливих підмножин безлічі всіх гравців. Що і вимагає теорія ігор, тому що нам потрібно перевірити наявність суперадитивності для значень характеристичної функції всіх коаліцій, що не перетинаються.

Як виконуються умови суперадитивності у цьому прикладі? Визначимо, як гравці утворюють коаліції, що не перетинаються. T1 і T2 . Якщо частина гравців входить до коаліції T1 , то всі інші гравці входять до коаліції T2 і за визначенням ця коаліція утворюється як різниця всієї множини гравців і множини T1 . Тоді, якщо T1 - коаліція з одного гравця, то в коаліції T2 будуть другий та третій гравці, якщо в коаліції T1 будуть перший та третій гравці, то коаліція T2 складатиметься тільки з другого гравця, і таке інше.

Теорія ігоряк розділ дослідження операцій – це теорія математичних моделей прийняття оптимальних рішень за умов невизначеності чи конфлікту кількох сторін, мають різні інтереси. Теорія ігор досліджує оптимальні стратегії ситуаціях ігрового характеру. До них належать ситуації, пов'язані з вибором найвигідніших виробничих рішень системи наукових та господарських експериментів, організацією статистичного контролю, господарських взаємин між підприємствами промисловості та інших галузей. Формалізуючи конфліктні ситуації математично, їх можна як гру двох, трьох тощо. гравців, кожен із яких має на меті максимізації своєї вигоди, свого виграшу за рахунок іншого.

Розділ "Теорія ігор" представлений трьома онлайн-калькуляторами:

  1. Оптимальні стратегії гравців. У таких завданнях задана платіжна матриця. Потрібно знайти чисті чи змішані стратегії гравців та, ціну гри. Для вирішення необхідно вказати розмірність матриці та метод рішення. У сервісі реалізовано такі методи вирішення гри двох гравців:
    1. Мінімакс. Якщо потрібно знайти чисту стратегію гравців або відповісти на питання про сідлову точку гри, виберіть цей метод рішення.
    2. Симплекс-метод. Використовується на вирішення гри у змішаних стратегіях методами лінійного програмування.
    3. Графічний метод. Використовується для вирішення гри у змішаних стратегіях. Якщо є сідлова точка, рішення припиняється. Приклад: За заданою платіжною матрицею знайти оптимальні змішані стратегії гравців та ціну гри за допомогою графічного методу вирішення гри.
    4. Ітераційний метод Брауна-Робінсона. Ітеративний метод застосовується тоді, коли не застосовується графічний метод і коли практично не застосовуються алгебраїчний і матричний методи. Цей метод дає наближене значення ціни гри, причому справжнє значення можна отримати з будь-яким потрібним ступенем точності. Цей метод недостатній для знаходження оптимальних стратегій, але дозволяє відслідковувати динаміку покрокової грита визначити ціну гри для кожного з гравців на кожному кроці.
    Наприклад, завдання може звучати як "вказати оптимальні стратегії гравців для гри, заданої платіжною матрицею".
    У всіх методах застосовується перевірка на домінуючі рядки та стовпці.
  2. Біматрична гра. Зазвичай у такій грі задають дві матриці однакового розміру виграшів першого та другого гравців. Рядки цих матриць відповідають стратегіям першого гравця, а стовпці матриць – стратегіям другого гравця. При цьому у першій матриці представлені виграші першого гравця, а у другій матриці – виграші другого.
  3. Ігри з природою. Використовується, коли необхідно вибрати управлінське рішення за критеріями Максимакса, Байєса, Лапласа, Вальда, Севіджа, Гурвіца.
    Для критерію Байєса необхідно також запровадити ймовірність настання подій. Якщо вони не задані, залиште значення за промовчанням (будуть рівнозначні події).
    Для критерію Гурвіца вкажіть рівень оптимізму λ. Якщо в умовах цього параметра не заданий можна використовувати значення 0, 0.5 і 1 .

Багато завданнях потрібно шукати рішення засобами ЕОМ. Одним з інструментів є вищенаведені послуги та функції