Оптимальна стратегія за критерієм вальду. Методи вибору альтернатив за умов невизначеності

16.07.2019 Подорожі
Призначення сервісу. Цей тип завдань відноситься до завдань прийняття рішень в умовах невизначеності. За допомогою сервісу можна вибрати оптимальну стратегію, використовуючи:
  • критерій мінімаксу, критерій максимаксу, критерій Байєса, критерій Вальда, критерій Севіджа, критерій Лапласа, критерій Ходжа-Лемана див. типові завдання;
  • критерій Гурвіца, узагальнений критерій Гурвіца з розрахунком ефективності.
Також проводиться планування ідеального експерименту. Результати онлайн обчислень оформлюються у звіті формату Word (див. приклад оформлення).

Інструкція. Для вибору оптимальної стратегії в режимі онлайн необхідно задати розмірність матриці. Потім у новому діалоговому вікні вибрати необхідні критерії та коефіцієнти. Також можна вставити дані з Excel.

Розмірність платіжної матриці(цільова функція ЗПР за умов невизначеності)
2 3 4 5 6 7 8 9 10 x 2 3 4 5 6 7 8 9 10 ",0);">
Примітка: Спочатку, якщо можливо, спрощують матрицю, викреслюючи невигідні стратегії A. Стратегії природи викреслювати не можна, тому що кожен стан природи може наступити випадковим чином, незалежно від дій A .

Будь-яку господарську діяльність людини можна як гру з природою. У сенсі під " природою " розуміється сукупність невизначених чинників; що впливають ефективність прийнятих рішень. Байдужість природи до гри (виграшу) до можливості отримання економістом (статистиком) додаткової інформації про її стан відрізняють гру економіста з природою від звичайної матричної гри, в якій беруть участь два свідомі гравці.

Приклад. Підприємство може випускати 3 види продукції А 1 , А 2 і А 3 , одержуючи у своїй прибуток, залежить від попиту, що може бути одному з 4-х станів (В 1 , В 2 , В 3 , В 4). Елементи платіжної матриці характеризують прибуток, який отримають під час випуску i-ї продукціїпри j-му станіпопиту. Гра підприємства А проти попиту В задана платіжною матрицею:



В 1

В 2

У 3

В 4

А 1

2

7

8

6

А 2

2

8

7

3

А 3

4

3

4

2

Визначити оптимальні пропорції в продукції, що гарантують максимізацію середньої величини прибутку при будь-якому стані попиту, вважаючи його певним. Завдання зводиться до ігрової моделі, у якій.

Рішення.
Критерій максимаксу.


Вибираємо з (8; 8; 4) максимальний елемент max = 8

Критерій Лапласа.


Вибираємо з (5.75; 5; 3.25) максимальний елемент max=5.75
Висновок: вибираємо стратегію N = 1.

Критерій Вальда.


Вибираємо із (2; 2; 2) максимальний елемент max=2
Висновок: вибираємо стратегію N = 1.

Критерій Севіджа.
Знаходимо матрицю ризиків.
Ризик- міра невідповідності між різними можливими результатами ухвалення певних стратегій. Максимальний виграш у j-му стовпчику b j = max(a ij) характеризує сприятливість стану природи.
1. Розраховуємо 1-й стовпець матриці ризиків.
r 11 = 4 - 2 = 2; r 21 = 4 - 2 = 2; r 31 = 4 - 4 = 0;
2. Розраховуємо 2-й стовпець матриці ризиків.
r 12 = 8 - 7 = 1; r 22 = 8 - 8 = 0; r 32 = 8 - 3 = 5;
3. Розраховуємо 3 стовпець матриці ризиків.
r 13 = 8 - 8 = 0; r 23 = 8 - 7 = 1; r 33 = 8 - 4 = 4;
4. Розраховуємо 4 стовпець матриці ризиків.
r 14 = 6 - 6 = 0; r 24 = 6 - 3 = 3; r 34 = 6 - 2 = 4;


Результати обчислень оформимо у вигляді таблиці.

Вибираємо з (2; 3; 5) мінімальний елемент min=2
Висновок: вибираємо стратегію N = 1.

Таким чином, в результаті вирішення статистичної гри по різним критеріямНайчастіше рекомендувалася стратегія A 1 .

Близькою за ідеями та методами до теорії ігор є теорія статистичних рішень. Від теорії ігор вона відрізняється тим, що ситуація невизначеності не має конфліктного забарвлення - ніхто ні кому не протидіє, але є елементом невизначеності. У завданнях теорії статистичних рішень невідомі умови операції залежать немає від свідомо чинного противника, як від об'єктивної дійсності, що у теорії статистичних рішень прийнято називати “природою”. Відповідні ситуації часто називають іграми з природою (статистичними іграми).

Часто ці ситуації взагалі відносять до теорії ігор, застерігаючи у визначенні гри, що з учасників може бути середовище (природа), що діє як сума дезорганізуючих обставин, весь комплекс зовнішніх умов, у яких гравцю доводиться приймати рішення. Назвемо цього гравця – статистиком.

Природа байдужа до виграшу і прагне звернути на користь промахи статистика. Нехай статистика маєmстратегій, а природа може реалізуватиnсвоїх станів. Якщо статистик має можливість оцінити чисельно наслідки кожної своєї чистої стратегії за будь-якого стану природи, гру можна задати платіжної матрицею. При спрощенні платіжної матриці є специфіка: не можна відкидати ті чи інші стратегії “природи”, оскільки може реалізувати їх незалежно від цього, вигідні вони статистику чи ні.

При вирішенні таких ігор можуть бути 2 ситуації:

· гравцю А невідомі ймовірностіpj, з якими природа реалізує свої статки;

· ймовірності pjвідомі.

Для ухвалення рішення у таких іграх використовують різні критерії.

Якщо ймовірностіpj станів природи невідомі, можна користуватися критеріями Вальда, Лапласа, Севіджа, Гурвіца тощо. Основне різницю між названими критеріями визначається стратегією поведінки особи, приймає рішення за умов невизначеності. Наприклад, критерій Лапласа ґрунтується на більш оптимістичних припущеннях, ніж критерій Вальда. Критерій Гурвіца можна використовувати при різних підходах: від найбільш оптимістичного до песимістичного. Отже, перелічені критерії, попри їх кількісну природу, відбивають суб'єктивну оцінку ситуації, у якій статистику доводиться приймати рішення. На жаль, не існує загальних правилоцінки застосовності тієї чи іншої критерію, оскільки поведінка особи, приймає рішення, очевидно, є найважливішим чинником під час виборів відповідного критерію. Сформулюємо ці критерії.

1. Критерій Лапласа

Цей критерій спирається на принцип недостатнього обґрунтування, за яким вважається, що настання всіх станів природи рівноймовірне, тобтоp 1 = p 2 =...= p n = 1/ n, а оптимальною вважається стратегія Ai , що забезпечує

. (5.1)

2. Критерій Вальда (мінімаксний чи максмінний критерій) )

Цей критерій є найбільш обережним, оскільки заснований на виборі найкращої з найгірших можливостей:

– у разі перебування виграшу;

– у разі знаходження втрат.

Це песимістичні критерії.

3. Критерій Севіджа (мінімаксного ризику)

Критерій Вальда настільки песимістичний, що може призвести до нелогічних висновків. Розглянемо наступну матрицю втрат, яка зазвичай наводиться як класичний приклад для обґрунтування “менш песимістичного” критерію Севіджа.

11000

10000

10000

Застосування мінімаксного критерію призводить до вибору стратегії А2, хоча інтуїтивно можна вибрати А1, тому що при цьому виборі можна сподіватися програти 90, тоді як вибір А2 завжди призводить до втрат в 10000 одиниць за будь-якого стану погоди.

Критерій Севіджа “виправляє” положення запровадженням нової матриці втрат, у якійзамінюються на font-size:14.0pt;line-height: 150%">, що визначаються таким чином:

Це означає, щоє різниця між найкращим значенням у стовпціj і значенням.

По суті, висловлює співчуття особи, яка приймає рішення, з приводу того, що вона не вибрала найкращої діїщодо стануj . Матриця R =() ê називається матрицею жалю чи матрицею ризику.

Знайдемо оптимальну стратегію попереднього завдання за цим критерієм:

.

Застосуємо до матриці “жалі” R мінімаксний критерій. Отримаємо, що оптимальною стратегією буде - А1.

Зазначимо, що незалежно від того,- Дохід або втрати,- Завжди втрати. Тому до матриці "жалю" завжди застосовується мінімаксний критерій.

4. Критерій Гурвіца (песимізму-оптимізму)

Цей критерій охоплює низку різних підходів до прийняття рішень: від найоптимістичнішого до найбільш песимістичного.

За оптимістичного підходу вибирають стратегію, що дає :

, якщо - виграш, і

якщо – втрати.

Аналогічно при найбільш песимістичних припущеннях вибирається рішення відповідає: , якщо - виграш, і

font-size:14.0pt;line-height: 150%">, якщо – втрати.

Критерій Гурвіца встановлює баланс між випадками крайнього оптимізму та песимізму зважуванням обох способів поведінки з відповідними вагами a і 1- a , де 0 £ a £ 1.

Якщо - Прибуток, то вибирається стратегія за правилом:

Якщо - Витрати, критерій вибирає стратегію, що дає

Параметр a інтерпретується як показник оптимізму;при a =1 критерій занадто оптимістичний, при a =0 він занадто песимістичний. Значення a між 0 і 1 може визначатися в залежності від схильності особи, яка приймає рішення, до песимізму або оптимізму. a =0,5 є найбільш розумним.

Аналіз практичних ситуацій зазвичай проводиться з урахуванням кількох критеріїв, що дозволяє глибше досліджувати суть явища.

приклад.

Одне з підприємств має визначити рівень пропозиції послуг, щоб задовольнити потреби клієнтів. Точна кількість клієнтів не відома, але очікується, що вона може приймати одне з наступних значень: 200, 250, 300, 350. Для кожного з цих можливих значеньІснує найкращий рівень пропозиції (з погляду можливих витрат). Відхилення від цих рівнів призводять до додаткових витрат через перевищення пропозиції над попитом, або через неповне задоволення попиту.

Втрати в залежності від ситуації наведені в таблиці:


Клієнти

Запропоновано.

a 1

a 2

a 3

a 4

· Критерій Вальда. Так як - Втрати, застосовуємо мінімаксний критерій.

Оптимальною стратегією буде А3.

· Критерій Лапласа. Нехай стратегії 2-го гравця є рівноймовірними. Отже. Тоді:

EN-US">EN-US">EN-US">font-size:14.0pt;line-height:150%">Таким чином, найкращим рівнемпропозиції відповідно до критерію Лапласа буде стратегія А2.

· Критерій Севіджа . Побудуємо матрицю ризику:

position:absolute; z-index:2;left:0px;margin-left:68px;margin-top:21px;width:213px;height:2px">

Найкраща стратегія А2.

· Критерій Гурвіца. Нехай a = 1/2.

5/2+25/2=15

7/2+23/2=15

12/2+21/2=16,5

15/2+30/2=22,5

Найкращі стратегії А1 та А2.

Якщо знаходити рішення методами теорії ігор, то спочатку шукаємо наявність сідлової точки:

Ця гра має сідлову точку та оптимальною буде стратегія А3.

5. Критерій Байєса

Якщо ймовірність станів природи– pj відомі, то можна користуватися критерієм Байєса, згідно з яким:

оптимальною вважається чиста стратегія, що відповідає максимальному середньому виграшу: , якщо – виграш та мінімальні середні втрати: , якщо -Втрати.

Якщо у попередньому прикладі відомі ймовірності попиту font-size:14.0pt;line-height: 150%">, то для знаходження оптимальної стратегії необхідно знайти середні втрати для кожної чистої стратегії підприємства та вибрати ту, яка забезпечує мінімум середніх втрат: font-size:14.0pt;line-height : 150%;font-family:Symbol">® стратегія А2.

Можна показати, що та стратегія, яка обертає максимум середній виграш, звертає в мінімум і середній ризик.

Усі розглянуті критерії були сформульовані для чистих стратегій, але кожен з них може бути поширений і на змішані стратегії, подібно до того, як це робиться в теорії ігор. Теоретично статистичних рішень змішані стратегії мають сенс при багаторазовому повторенні гри.

Але багаторазово повторюючи гру, можна визначити частоти повторень тієї чи іншої ситуації та надалі застосовувати стохастичний підхід до завдання прийняття рішень.

Якщо використати змішані стратегії, то критерій Вальдаформулюється так: оптимальною буде змішана стратегія , що забезпечує , Т. е. максимізує середній виграш(якщо -Виграш)

Критерій Севіджа для змішаних стратегій : оптимальною вважається та змішана стратегія, за якої максимальний середній ризик статистика мінімальний, тобто стратегія , знайдена з умови .

Оптимальні змішані стратегії в цьому випадку знаходяться так само, як у звичайній матричній грі.

Багато хто з нас не любить потрапляти в ситуацію, коли інформації про зовнішні чинники дуже мало, або вона геть-чисто відсутня, і при цьому потрібно терміново зробити важливий вибір. Швидше за все, саме тому більшість людей воліє уникати на роботі відповідальності та задовольняється скромним, але водночас щодо спокійним службовим становищем. Якби вони знали про теорію ігор і про те, яку користь можуть послужити критерії Вальда, Севіджа, Гурвіца, кар'єра найбільш кмітливих з них напевно стрімко пішла б вгору.

Розраховуй на найгірше

Саме так можна охарактеризувати перший із перерахованих принципів. Критерій Вальда нерідко називають ще критерієм крайнього песимізму чи правилом мінімального зла. В умовах і хиткого, нестійкого становища цілком логічним видається перестрахувальна позиція, яка розрахована на найгірший випадок. Максимальний критерій Вальда орієнтує на максимізацію виграшу за найбільш несприятливих обставин. Прикладом його використання може бути максимальне збільшення мінімального доходу, максимізація мінімальних обсягів готівки тощо. п. Така стратегія виправдовує себе у випадках, коли людина, яка приймає рішення, не так зацікавлений у великій удачі, скільки хоче застрахувати себе від раптових втрат. Іншими словами, критерій Вальда зводить ризик до мінімуму та дозволяє приймати найбільш безпечні рішення. Подібний підхід дає можливість отримати гарантований мінімум, хоча фактичний результат може виявитися не таким вже й поганим.

Критерій Вальда: приклад використання

Припустимо, якесь підприємство збирається випускати нові види товарів. При цьому слід зробити вибір між одним з чотирьох варіантів 1, 2, 3, 4, кожен з яких передбачає певний тип випуску або їх поєднання. Від ухвалення рішення зрештою залежатиме, яку підприємство отримає прибуток. Як конкретно складеться ринкова кон'юнктура в майбутньому, невідомо, проте аналітики прогнозують три основні сценарії розвитку подій: С1, С2, С3. Отримані дані дозволяють скласти таблицю можливих варіантіввиграшу, які відповідають кожній парі можливого рішеннята можливої ​​обстановки.

Види продукції

Сценарії ринкової кон'юнктури

Найгірший результат

Використовуючи критерій Вальда, слід вибрати таку, яка буде для підприємства найбільш оптимальною. У нашому випадку показник ефективності

Е = мах (25; 22; 15; 20) = 25.

Його ми отримали, обравши по кожному з варіантів мінімальний результат і вичленувавши серед них той, який принесе найбільший дохід. Це означає, що рішення 1 буде для фірми, згідно з цим критерієм, найоптимальнішим. Навіть при найнесприятливішій обстановці буде отримано результат 25 (1), в той же час не виключено, що він досягне 45 (3).

Зазначимо ще раз, що критерій Вальда орієнтує людину максимально обережну лінію поведінки. За інших обставин цілком можливо керуватися іншими міркуваннями. Наприклад, варіант В 3 міг би принести виграш у 90 при гарантованому результаті в 15. Однак цей випадок виходить за межі теми цієї статті, і тому розглядати його ми не будемо.

У ситуації невизначеності неможливо визначити ймовірність настання тих чи інших наслідків прийнятих рішень. Тому критерій математичного очікування, який широко використовується в ситуації ризику, і для якого обов'язково потрібні згадані ймовірності, тут не застосовується. Натомість використовуються інші критерії.

Для вибору оптимальної стратегії у ситуації невизначеності існує два основних критерії: максимін та мінімакс. Максимін називають ще критерієм песиміста чи критерієм Вальда, а мінімакс - критерієм Севіджа.

Критерій Вальда (Уолда) – максимінний. Цей критерій спирається на принцип найбільшої обережності – критерій крайнього песимізму, що ґрунтується на виборі "з гіршого – найкраще". По суті, це критерій мінімаксу - основний теоретично ігор. Відповідно до цього критерію природа (середовище) веде себе як розумний агресивний супротивник, який робить все, щоб перешкодити нам досягти успіху. Оптимальною вважається та стратегія, яка гарантує виграш найбільший (max) з усіх найгірших (min) можливих наслідків дії щодо кожної стратегії – рівень безпеки:

Вибрана таким чином оптимальна за критерієм Вальда стратегія називається максимінною, а величина W – максимін.

Критерій Севіджа мінімаксного ризику. Критерій передбачає попереднє складання так званої матриці "ризиків" (втрат, жалю). У теорії статистичних рішень ризиком rij при користуванні стратегією Qi в умовах Gj називається різниця між виграшем, який міг би бути отриманий, якби були відомі умови Gj, і виграшем, який буде отримано, не знаючи їх і вибираючи стратегію Qi:

Мінімакс орієнтований не так на мінімізацію втрат, як на мінімізацію жаль з приводу втраченого прибутку. Він допускає розумний ризик для отримання додаткового прибутку. Користуватися цим критерієм для вибору стратегії поведінки у ситуації невизначеності можна лише тоді, коли є впевненість у тому, що випадкові збитки не призведуть фірму до повного краху.



Критерій творів

Високоприбуткові акції рідко бувають досить надійними, а найнадійніші - високоприбутковими. Тому при купівлі акцій завжди доводиться вибирати між їхньою прибутковістю та їхньою надійністю і якось ув'язувати їх між собою. Така проблема завжди постає за будь-якого інвестиційному проекті. Якщо відомі ймовірності збереження чи втрати інвестицій, ця проблема вирішується за допомогою критерію математичного очікування. Якщо їх немає, доводиться звертатись до інших критеріїв. Одним із таких критеріїв є критерій творів. Він дозволяє вибрати такий проект, який би був найбільш прибутковим і водночас найменш ризикованим. Критерій творів розраховується за такою формулою:

Критерій творів здатний працювати на мінімумі інформації.

Приклад розв'язання задачі

Припустимо, що за умов коливання попиту G j = (3000, 6000, 9000,12000) у торгового підприємства є три стратегії збуту будь-якого товару: Q п (1) = 6000 прим; Q п (2) = 9000 прим; Q п (3) = 12000 прим. за ціною реалізації C р = 70 руб. за ціни купівлі C п = 30 руб. і середніх витрат І = 10руб./шт.

Відповідно до ресурсних можливостей торговельного підприємства розрахуємо варіанти середньорічного прибутку за формулою (1), а результати зведемо в таблиці 3.

Таблиця 3 - Матриця виграшів (прибутків) комерційних стратегій за невизначеної ринкової кон'юнктури

1. Критерій Вальда. Для визначення оптимальної стратегії за критерієм найбільшої обережності доповнимо табл. 3 стовпцем 6 праворуч, вкажемо для кожного рядка мінімум прибутку та виберемо ту стратегію, при якій мінімум рядка максимальний (див. табл. 4).

Таблиця 4 - Зведена матриця прибутків

2. Критерій Гурвіца. Нехай показник песимізму визначено λ = 0,4.

Для обчислення значень стратегій за критерієм зваженої (розумної) обережності додатковому стовпці 7 табл. 4 знайдемо максимальні значеннядля кожного рядка. Тоді:

Максимальне значення відповідає двом стратегіям закупівлі Q п (1) і Q п (2).

3. Критерій Лапласа. З принципу рівноймовірності станів природи знайдемо середні значення " виграшів " – прибутків кожної стратегії:

За критерієм усереднення виграшів Лапласа найкращою є стратегія закупівлі Q п (2)

4. Критерій Байєса-Лапласа. Для визначення оптимальної стратегії за критерієм середньозваженої оцінки виграшів необхідно знати розподіл ймовірностей попиту. Нехай із минулого досвіду чи експертним шляхом такі ймовірності визначено (нижній рядок у табл. 4).

Тоді оцінки за критерієм кожної стратегії складуть:

Максимальне значення відповідає стратегії Q п (2).

Таблиця 5 - Матриця ризиків комерційних стратегій

5. Критерій Севіджа. Перейдемо від матриці виграшів до матриці ризиків (табл. 5). Для цього попередньо вкажемо в додатковому рядку таблиці максимально можливі виграші за кожним станом природи (передостанній рядок) і потім розрахуємо відповідні ризики r i j = max П i j – П i j

для заповнення матриці ризиків (табл. 5). Виходячи з принципу найбільшої обережності, знаходимо максимальні значення ризиків по рядках і з них вибираємо стратегії Q п (1) і Q п (2) з мінімальним значенням максимально можливого ризику. Перенесемо отримані значення табл. 4 для підбиття підсумків вибору.

Отже, конкуруючими виявилися стратегії Qп(1) і Qп(2) (вибір стратегії Qп(3) за критерієм Гурвіца викликаний, швидше за все, зайвим оптимізмом при виборі показника?). Стратегія Q п (1) обрана за критеріями Вальда, Лапласа та Севіджа, стратегія Q п (2) – за критеріями Лапласа, Байєса-Лапласа та Севіджа.

Перевага тій чи іншій стратегії вибирається найкращою за більшістю критеріїв. Але у разі дві стратегії Q п (1) і Q п (2) рівнозначні у сенсі.

Завдання за варіантами:

Таблиця 6 - Матриця прибутків комерційних стратегій за невизначеної ринкової кон'юнктури

Варіант 1

Варіант 2

Варіант 3

Варіант 4

Варіант 5

Варіант 6

Варіант 7

Варіант 8

Варіант 9