खेल सिद्धांत सरल उदाहरण. व्यावहारिक अनुप्रयोग: समाजोपथों की पहचान करना

16.07.2019 खेल

एक शून्य-राशि खेल जिसमें प्रत्येक खिलाड़ी के पास रणनीतियों का एक सीमित सेट होता है। नियम मैट्रिक्स खेलभुगतान मैट्रिक्स द्वारा निर्धारित किया जाता है, जिसके तत्व पहले खिलाड़ी की जीत हैं, जो दूसरे खिलाड़ी की हार भी हैं।

मैट्रिक्स खेल एक विरोधी खेल है. पहले खिलाड़ी को खेल की कीमत के बराबर अधिकतम गारंटीकृत (दूसरे खिलाड़ी के व्यवहार से स्वतंत्र) जीत मिलती है, उसी तरह, दूसरे खिलाड़ी को न्यूनतम गारंटीकृत हानि प्राप्त होती है;

अंतर्गत रणनीति इसे नियमों (सिद्धांतों) के एक समूह के रूप में समझा जाता है जो वर्तमान स्थिति के आधार पर खिलाड़ी के प्रत्येक व्यक्तिगत कदम के लिए कार्रवाई का विकल्प निर्धारित करता है।

अब सब कुछ क्रम में और विस्तार से।

भुगतान मैट्रिक्स, शुद्ध रणनीतियाँ, खेल की कीमत

में मैट्रिक्स खेल इसके नियम निर्धारित हैं भुगतान मैट्रिक्स .

एक ऐसे खेल पर विचार करें जिसमें दो प्रतिभागी हों: पहला खिलाड़ी और दूसरा खिलाड़ी। पहले खिलाड़ी को अपने अधिकार में रहने दें एमशुद्ध रणनीतियाँ, और दूसरे खिलाड़ी के निपटान में - एनशुद्ध रणनीतियाँ. चूँकि खेल पर विचार किया जा रहा है तो स्वाभाविक है कि इस खेल में जीत भी होगी और हार भी होगी।

में भुगतान मैट्रिक्स तत्व खिलाड़ियों की जीत और हार को व्यक्त करने वाली संख्याएँ हैं। जीत और हार को अंकों, धनराशि या अन्य इकाइयों में व्यक्त किया जा सकता है।

आइए एक भुगतान मैट्रिक्स बनाएं:

यदि पहला खिलाड़ी चुनता है मैं-वीं शुद्ध रणनीति, और दूसरा खिलाड़ी - जेशुद्ध रणनीति, तो पहले खिलाड़ी का भुगतान होगा आईजेइकाइयाँ, और दूसरे खिलाड़ी का नुकसान भी है आईजेइकाइयाँ।

क्योंकि आईजे + (- आईजे) = 0, तो वर्णित गेम एक शून्य-योग मैट्रिक्स गेम है।

मैट्रिक्स गेम का सबसे सरल उदाहरण सिक्का उछालना है। खेल के नियम इस प्रकार हैं. पहले और दूसरे खिलाड़ी एक सिक्का फेंकते हैं और नतीजा या तो हेड या टेल होता है। यदि "हेड्स" और "हेड्स" या "टेल्स" या "टेल्स" एक ही समय में फेंके जाते हैं, तो पहला खिलाड़ी एक यूनिट जीतेगा, और अन्य मामलों में वह एक यूनिट खो देगा (दूसरा खिलाड़ी एक यूनिट जीतेगा) . वही दो रणनीतियाँ दूसरे खिलाड़ी के पास हैं। संबंधित भुगतान मैट्रिक्स इस प्रकार होगा:

गेम थ्योरी का कार्य पहले खिलाड़ी की रणनीति का चयन करना है, जो उसे अधिकतम औसत जीत की गारंटी देगी, साथ ही दूसरे खिलाड़ी की रणनीति का चयन करना है, जो उसे अधिकतम औसत हानि की गारंटी देगी।

आप मैट्रिक्स गेम में रणनीति कैसे चुनते हैं?

आइए भुगतान मैट्रिक्स को फिर से देखें:

सबसे पहले, आइए पहले खिलाड़ी के लिए जीत की राशि निर्धारित करें यदि वह उपयोग करता है मैंवें शुद्ध रणनीति. यदि पहला खिलाड़ी उपयोग करता है मैंशुद्ध रणनीति, तो यह मान लेना तर्कसंगत है कि दूसरा खिलाड़ी ऐसी शुद्ध रणनीति का उपयोग करेगा जिसके कारण पहले खिलाड़ी का भुगतान न्यूनतम होगा। बदले में, पहला खिलाड़ी ऐसी शुद्ध रणनीति का उपयोग करेगा जो उसे अधिकतम जीत प्रदान करेगी। इन शर्तों के आधार पर, पहले खिलाड़ी की जीत, जिसे हम दर्शाते हैं वी1 , बुलाया अधिकतम जीत या खेल की सबसे कम कीमत .

पर इन मानों के लिए, पहले खिलाड़ी को निम्नानुसार आगे बढ़ना चाहिए। प्रत्येक पंक्ति से न्यूनतम तत्व का मान लिखें और उनमें से अधिकतम एक का चयन करें। इस प्रकार, पहले खिलाड़ी की जीत न्यूनतम में से अधिकतम होगी। इसलिए नाम - मैक्सिमम विनिंग। इस तत्व की पंक्ति संख्या उस शुद्ध रणनीति की संख्या होगी जिसे पहला खिलाड़ी चुनता है।

आइए अब दूसरे खिलाड़ी के लिए नुकसान की मात्रा निर्धारित करें यदि वह उपयोग करता है जेवें रणनीति. इस मामले में, पहला खिलाड़ी अपनी शुद्ध रणनीति का उपयोग करता है जिसमें दूसरे खिलाड़ी का नुकसान अधिकतम होगा। दूसरे खिलाड़ी को शुद्ध रणनीति चुननी होगी जिसमें उसका नुकसान न्यूनतम हो। दूसरे खिलाड़ी की हार, जिसे हम इस रूप में दर्शाते हैं वी2 , बुलाया न्यूनतम हानि या खेल की शीर्ष कीमत .

पर खेल की कीमत पर समस्याओं को हल करना और रणनीति निर्धारित करना दूसरे खिलाड़ी के लिए ये मान निर्धारित करने के लिए, निम्नानुसार आगे बढ़ें। प्रत्येक कॉलम से अधिकतम तत्व का मान लिखें और उनमें से न्यूनतम का चयन करें। इस प्रकार, दूसरे खिलाड़ी की हानि अधिकतम में से न्यूनतम होगी। इसलिए नाम - मिनिमैक्स जीत। इस तत्व की कॉलम संख्या उस शुद्ध रणनीति की संख्या होगी जिसे दूसरा खिलाड़ी चुनता है। यदि दूसरा खिलाड़ी "मिनीमैक्स" का उपयोग करता है, तो पहले खिलाड़ी द्वारा चुनी गई रणनीति की परवाह किए बिना, उसे इससे अधिक की हानि नहीं होगी वी2 इकाइयाँ।

उदाहरण 1।

.

पंक्तियों के सबसे छोटे तत्वों में से सबसे बड़ा 2 है, यह खेल की कम कीमत है, पहली पंक्ति इसके अनुरूप है, इसलिए, पहले खिलाड़ी की अधिकतम रणनीति पहली है। कॉलम के सबसे बड़े तत्वों में से सबसे छोटा 5 है, यह गेम की ऊपरी कीमत है, दूसरा कॉलम इसके अनुरूप है, इसलिए, दूसरे खिलाड़ी की न्यूनतम रणनीति दूसरी है।

अब जब हमने गेम की निचली और ऊपरी कीमत, मैक्सिमम और मिनिमैक्स रणनीतियों का पता लगाना सीख लिया है, तो यह सीखने का समय है कि इन अवधारणाओं को औपचारिक रूप से कैसे परिभाषित किया जाए।

तो, पहले खिलाड़ी की जीत की गारंटी है:

पहले खिलाड़ी को एक शुद्ध रणनीति चुननी होगी जो उसे न्यूनतम जीत में से अधिकतम प्रदान करेगी। यह लाभ (अधिकतम) इस प्रकार दर्शाया गया है:

.

पहला खिलाड़ी अपनी शुद्ध रणनीति का उपयोग करता है ताकि दूसरे खिलाड़ी का नुकसान अधिकतम हो। इस हानि को इस प्रकार दर्शाया गया है:

दूसरे खिलाड़ी को अपनी शुद्ध रणनीति चुननी होगी ताकि उसका नुकसान कम से कम हो। यह हानि (मिनीमैक्स) इस प्रकार दर्शाई गई है:

.

उसी शृंखला से एक और उदाहरण.

उदाहरण 2.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

पहले खिलाड़ी की अधिकतम रणनीति, दूसरे खिलाड़ी की न्यूनतम रणनीति, खेल की निचली और ऊपरी कीमत निर्धारित करें।

समाधान। भुगतान मैट्रिक्स के दाईं ओर हम इसकी पंक्तियों में सबसे छोटे तत्वों को लिखते हैं और उनमें से अधिकतम को चिह्नित करते हैं, और मैट्रिक्स के नीचे - सबसे बड़े तत्वकॉलम में और उनमें से सबसे छोटे का चयन करें:

पंक्तियों के सबसे छोटे तत्वों में से सबसे बड़ा 3 है, यह खेल की कम कीमत है, दूसरी पंक्ति इसके अनुरूप है, इसलिए, पहले खिलाड़ी की अधिकतम रणनीति दूसरी है। कॉलम के सबसे बड़े तत्वों में से सबसे छोटा 5 है, यह गेम की ऊपरी कीमत है, पहला कॉलम इसके अनुरूप है, इसलिए, दूसरे खिलाड़ी की मिनिमैक्स रणनीति पहली है।

मैट्रिक्स गेम में सैडल पॉइंट

यदि गेम की ऊपरी और निचली कीमतें समान हैं, तो मैट्रिक्स गेम को सैडल पॉइंट माना जाता है। इसका विपरीत भी सत्य है: यदि मैट्रिक्स गेम में सैडल पॉइंट है, तो मैट्रिक्स गेम की ऊपरी और निचली कीमतें समान हैं। संबंधित तत्व पंक्ति में सबसे छोटा और कॉलम में सबसे बड़ा दोनों है और खेल की कीमत के बराबर है।

इस प्रकार, यदि, तो पहले खिलाड़ी की इष्टतम शुद्ध रणनीति है, और दूसरे खिलाड़ी की इष्टतम शुद्ध रणनीति है। अर्थात्, रणनीतियों की एक ही जोड़ी का उपयोग करके समान निचले और ऊपरी खेल की कीमतें हासिल की जाती हैं।

इस मामले में मैट्रिक्स गेम का समाधान शुद्ध रणनीतियों में है .

उदाहरण 3.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

समाधान। भुगतान मैट्रिक्स के दाईं ओर, हम इसकी पंक्तियों में सबसे छोटे तत्वों को लिखेंगे और उनमें से अधिकतम को नोट करेंगे, और मैट्रिक्स के नीचे - कॉलम में सबसे बड़े तत्वों को लिखेंगे और उनमें से न्यूनतम का चयन करेंगे:

खेल की कम कीमत खेल की ऊपरी कीमत से मेल खाती है। इस प्रकार, गेम की कीमत 5 है। गेम की कीमत सैडल पॉइंट के मूल्य के बराबर है। पहले खिलाड़ी की मैक्सिन रणनीति दूसरी शुद्ध रणनीति है, और दूसरे खिलाड़ी की मिनिमैक्स रणनीति तीसरी शुद्ध रणनीति है। इस मैट्रिक्स गेम का समाधान शुद्ध रणनीतियों में है।

मैट्रिक्स गेम की समस्या को स्वयं हल करें, और फिर समाधान देखें

उदाहरण 4.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

गेम की निचली और ऊपरी कीमत ज्ञात करें। क्या इस मैट्रिक्स गेम में सैडल पॉइंट है?

इष्टतम मिश्रित रणनीति के साथ मैट्रिक्स गेम

ज्यादातर मामलों में, मैट्रिक्स गेम में सैडल पॉइंट नहीं होता है, इसलिए संबंधित मैट्रिक्स गेम में शुद्ध रणनीतियों में कोई समाधान नहीं होता है।

लेकिन इष्टतम मिश्रित रणनीतियों में इसका समाधान है। उन्हें ढूंढने के लिए, आपको यह मान लेना होगा कि खेल को पर्याप्त संख्या में दोहराया गया है ताकि अनुभव के आधार पर आप अनुमान लगा सकें कि कौन सी रणनीति अधिक बेहतर है। इसलिए, निर्णय संभाव्यता और औसत (गणितीय अपेक्षा) की अवधारणा से जुड़ा है। अंतिम समाधान में सैडल पॉइंट का एक एनालॉग (यानी, गेम की निचली और ऊपरी कीमतों की समानता) और उनके अनुरूप रणनीतियों का एक एनालॉग दोनों मौजूद हैं।

इसलिए, पहले खिलाड़ी को अधिकतम औसत जीत दिलाने के लिए और दूसरे खिलाड़ी को न्यूनतम औसत हानि प्राप्त करने के लिए, एक निश्चित संभावना के साथ शुद्ध रणनीतियों का उपयोग किया जाना चाहिए।

यदि पहला खिलाड़ी संभावनाओं के साथ शुद्ध रणनीतियों का उपयोग करता है , फिर वेक्टर इसे मिश्रित प्रथम खिलाड़ी रणनीति कहा जाता है। दूसरे शब्दों में, यह शुद्ध रणनीतियों का "मिश्रण" है। इस स्थिति में, इन संभावनाओं का योग एक के बराबर है:

.

यदि दूसरा खिलाड़ी संभावनाओं के साथ शुद्ध रणनीतियों का उपयोग करता है , फिर वेक्टर इसे दूसरे खिलाड़ी की मिश्रित रणनीति कहा जाता है। इस स्थिति में, इन संभावनाओं का योग एक के बराबर है:

.

यदि पहला खिलाड़ी मिश्रित रणनीति का उपयोग करता है पी, और दूसरा खिलाड़ी - एक मिश्रित रणनीति क्यू, तो यह समझ में आता है अपेक्षित मूल्य पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार)। इसे खोजने के लिए, आपको पहले खिलाड़ी की मिश्रित रणनीति वेक्टर (जो एक-पंक्ति मैट्रिक्स होगा), भुगतान मैट्रिक्स और दूसरे खिलाड़ी की मिश्रित रणनीति वेक्टर (जो एक-स्तंभ मैट्रिक्स होगा) को गुणा करना होगा:

.

उदाहरण 5.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार) की गणितीय अपेक्षा निर्धारित करें, यदि पहले खिलाड़ी की मिश्रित रणनीति है, और दूसरे खिलाड़ी की मिश्रित रणनीति है।

समाधान। पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार) की गणितीय अपेक्षा के सूत्र के अनुसार, यह पहले खिलाड़ी की मिश्रित रणनीति वेक्टर, भुगतान मैट्रिक्स और दूसरे खिलाड़ी की मिश्रित रणनीति वेक्टर के उत्पाद के बराबर है:

पहले खिलाड़ी को ऐसी मिश्रित रणनीति कहा जाता है जो खेल को पर्याप्त संख्या में दोहराए जाने पर उसे अधिकतम औसत भुगतान प्रदान करेगी।

इष्टतम मिश्रित रणनीति दूसरे खिलाड़ी को ऐसी मिश्रित रणनीति कहा जाता है जो खेल को पर्याप्त संख्या में दोहराए जाने पर उसे न्यूनतम औसत हानि प्रदान करेगी।

शुद्ध रणनीतियों के मामले में मैक्सिमम और मिनिमैक्स के अंकन के अनुरूप, इष्टतम मिश्रित रणनीतियों को निम्नानुसार दर्शाया जाता है (और गणितीय अपेक्षा से जुड़े होते हैं, यानी, पहले खिलाड़ी की जीत और दूसरे खिलाड़ी की हार का औसत):

,

.

इस मामले में, समारोह के लिए वहाँ एक काठी बिंदु है , जिसका अर्थ है समानता।

इष्टतम मिश्रित रणनीतियों और एक काठी बिंदु को खोजने के लिए, अर्थात, मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करें , आपको मैट्रिक्स गेम को एक रैखिक प्रोग्रामिंग समस्या, यानी अनुकूलन समस्या में कम करने और संबंधित रैखिक प्रोग्रामिंग समस्या को हल करने की आवश्यकता है।

एक मैट्रिक्स गेम को एक रैखिक प्रोग्रामिंग समस्या में कम करना

मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करने के लिए, आपको एक सीधी रेखा बनाने की आवश्यकता है रैखिक प्रोग्रामिंग समस्याऔर दोहरा कार्य. दोहरी समस्या में, विस्तारित मैट्रिक्स, जो बाधाओं की प्रणाली में चर के गुणांक, मुक्त शर्तों और उद्देश्य फ़ंक्शन में चर के गुणांक को संग्रहीत करता है, को स्थानांतरित किया जाता है। इस मामले में, मूल समस्या का न्यूनतम लक्ष्य फ़ंक्शन दोहरी समस्या में अधिकतम से मेल खाता है।

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या में लक्ष्य फ़ंक्शन:

.

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या में बाधाओं की प्रणाली:

दोहरी समस्या में लक्ष्य कार्य है:

.

दोहरी समस्या में प्रतिबंधों की प्रणाली:

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या के लिए इष्टतम योजना को दर्शाया गया है

,

और दोहरी समस्या के लिए इष्टतम योजना को दर्शाया गया है

हम संबंधित इष्टतम योजनाओं के लिए रैखिक रूपों को और द्वारा निरूपित करते हैं,

और उन्हें इष्टतम योजनाओं के संगत निर्देशांक के योग के रूप में पाया जाना चाहिए।

पिछले पैराग्राफ की परिभाषाओं और इष्टतम योजनाओं के निर्देशांक के अनुसार, पहले और दूसरे खिलाड़ियों की निम्नलिखित मिश्रित रणनीतियाँ मान्य हैं:

.

सैद्धांतिक गणितज्ञों ने इसे सिद्ध कर दिया है खेल की कीमत इष्टतम योजनाओं के रैखिक रूपों के माध्यम से निम्नलिखित तरीके से व्यक्त किया गया है:

,

अर्थात्, यह इष्टतम योजनाओं के निर्देशांकों के योग का व्युत्क्रम है।

हम, व्यवसायी, केवल मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करने के लिए इस सूत्र का उपयोग कर सकते हैं। पसंद इष्टतम मिश्रित रणनीतियाँ खोजने के लिए सूत्र क्रमशः प्रथम और द्वितीय खिलाड़ी:

जिसमें दूसरे कारक सदिश हैं। इष्टतम मिश्रित रणनीतियाँ भी हैं, जैसा कि हम पहले ही पिछले पैराग्राफ में परिभाषित कर चुके हैं, वैक्टर। इसलिए, संख्या (खेल मूल्य) को एक वेक्टर (इष्टतम योजनाओं के निर्देशांक के साथ) से गुणा करने पर हमें एक वेक्टर भी प्राप्त होता है।

उदाहरण 6.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

गेम की कीमत ज्ञात करें वीऔर इष्टतम मिश्रित रणनीतियाँ और।

समाधान। हम इस मैट्रिक्स गेम के अनुरूप एक रैखिक प्रोग्रामिंग समस्या बनाते हैं:

हमें प्रत्यक्ष समस्या का समाधान मिलता है:

.

हम पाए गए निर्देशांकों के योग के रूप में इष्टतम योजनाओं का रैखिक रूप पाते हैं।

सूचना!आपकी विशिष्ट समस्या का समाधान समान दिखेगा यह उदाहरण, जिसमें नीचे प्रस्तुत सभी तालिकाएँ, व्याख्यात्मक पाठ और आंकड़े शामिल हैं, लेकिन आपके प्रारंभिक डेटा को ध्यान में रखते हुए...

काम:
मैट्रिक्स गेम निम्नलिखित भुगतान मैट्रिक्स द्वारा दिया गया है:

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2
ए 1 3 5
ए 2 6
3
2

मैट्रिक्स गेम का समाधान खोजें, अर्थात्:
- खेल की शीर्ष कीमत का पता लगाएं;
- खेल की कम कीमत;
- खेल का शुद्ध मूल्य;
- खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें;
- यदि आवश्यक हो तो एक ग्राफिक समाधान (ज्यामितीय व्याख्या) प्रदान करें।

स्टेप 1

आइए खेल की कम कीमत निर्धारित करें - α

खेल की सबसे कम कीमतα वह अधिकतम जीत है जो हम एक उचित प्रतिद्वंद्वी के खिलाफ खेल में खुद को गारंटी दे सकते हैं यदि हम पूरे खेल में एक और केवल एक रणनीति का उपयोग करते हैं (इस रणनीति को "शुद्ध" कहा जाता है)।

आइए भुगतान मैट्रिक्स की प्रत्येक पंक्ति में खोजें न्यूनतमतत्व और इसे एक अतिरिक्त कॉलम (चयनित) में लिखें पीलातालिका 1 देखें)।

फिर हम ढूंढ लेंगे अधिकतमअतिरिक्त कॉलम का तत्व (तारांकन चिह्न से चिह्नित), यह गेम की कम कीमत होगी।

तालिका नंबर एक

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2 पंक्ति मिनिमा
ए 1 3 5 3 *
ए 2 6
3
2
3
2

हमारे मामले में, खेल की कम कीमत है: α = 3, और 3 से अधिक खराब जीत की गारंटी के लिए हमें रणनीति ए 1 पर कायम रहना चाहिए

चरण दो

आइए खेल की ऊपरी कीमत निर्धारित करें - β

शीर्ष गेम कीमतβ वह न्यूनतम हानि है जो खिलाड़ी बी एक उचित प्रतिद्वंद्वी के खिलाफ खेल में खुद को गारंटी दे सकता है यदि वह पूरे खेल में एक और केवल एक रणनीति का उपयोग करता है।

आइए भुगतान मैट्रिक्स के प्रत्येक कॉलम में खोजें अधिकतमतत्व और इसे नीचे एक अतिरिक्त पंक्ति में लिखें (पीले रंग में हाइलाइट किया गया, तालिका 2 देखें)।

फिर हम ढूंढ लेंगे न्यूनतमअतिरिक्त लाइन का तत्व (प्लस के साथ चिह्नित), यह गेम की ऊपरी कीमत होगी।

तालिका 2

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2 पंक्ति मिनिमा
ए 1 3 5 3 *
ए 2 6
3
2

हमारे मामले में, खेल की ऊपरी कीमत है: β = 5, और 5 से अधिक की हानि की गारंटी के लिए, प्रतिद्वंद्वी (खिलाड़ी "बी") को रणनीति बी 2 का पालन करना होगा

चरण 3
आइए खेल की निचली और ऊपरी कीमतों की तुलना करें, इस समस्या में वे भिन्न हैं, यानी। α ≠ β, पेऑफ मैट्रिक्स में सैडल पॉइंट नहीं होता है। इसका मतलब यह है कि गेम में शुद्ध मिनिमैक्स रणनीतियों में कोई समाधान नहीं है, लेकिन मिश्रित रणनीतियों में इसका हमेशा समाधान होता है।

मिश्रित रणनीति, ये कुछ निश्चित संभावनाओं (आवृत्तियों) के साथ, बेतरतीब ढंग से बदलने वाली शुद्ध रणनीतियाँ हैं।

हम खिलाड़ी "ए" की मिश्रित रणनीति को निरूपित करेंगे

एसए=

जहां बी 1, बी 2 खिलाड़ी "बी" की रणनीतियां हैं, और क्यू 1, क्यू 2 क्रमशः संभावनाएं हैं जिनके साथ इन रणनीतियों को लागू किया जाता है, और क्यू 1 + क्यू 2 = 1।

खिलाड़ी "ए" के लिए इष्टतम मिश्रित रणनीति वह है जो उसे अधिकतम भुगतान प्रदान करती है। तदनुसार, "बी" के लिए न्यूनतम हानि है। ये रणनीतियाँ निर्दिष्ट हैं एसए* और एसबी* क्रमशः. इष्टतम रणनीतियों की एक जोड़ी खेल का समाधान बनाती है।

सामान्य स्थिति में, किसी खिलाड़ी की इष्टतम रणनीति में सभी प्रारंभिक रणनीतियाँ शामिल नहीं हो सकती हैं, बल्कि उनमें से केवल कुछ ही शामिल हो सकती हैं। ऐसी रणनीतियों को कहा जाता है सक्रिय रणनीतियाँ.

चरण 4


कहाँ: पी 1 , पी 2 - संभावनाएँ (आवृत्तियाँ) जिनके साथ क्रमशः ए 1 और ए 2 रणनीतियाँ लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "ए" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "बी" अपनी सक्रिय रणनीतियों के ढांचे के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी बी अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। और हमारे मामले में, दोनों रणनीतियाँ सक्रिय हैं, अन्यथा खेल का समाधान शुद्ध रणनीतियों में होता। इसलिए, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 पी 1 + के 21 पी 2 = वी (1)

कहाँ: ij - भुगतान मैट्रिक्स के तत्व।

दूसरी ओर, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 2 का उपयोग करेगा, तो औसत भुगतान होगा:

के 12 पी 1 + के 22 पी 2 = वी (2)

समीकरण (1) और (2) के बाएँ पक्षों को बराबर करने पर हम प्राप्त करते हैं:

के 11 पी 1 + के 21 पी 2 = के 12 पी 1 + के 22 पी 2

और इस तथ्य को ध्यान में रखते हुए पी 1 + पी 2 = 1 हमारे पास है:

के 11 पी 1 + के 21 (1 - पी 1 ) = के 12 पी 1 + के 22 (1 - पी 1 )


जहां रणनीति ए 1 की इष्टतम आवृत्ति खोजना आसान है:
पी 1 =
22 - 21
11 + 22 - 12 - 21
(3)

इस कार्य में:

पी 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

संभावना आर 2 घटाव द्वारा ज्ञात करें आर 1 इकाई से:
पी 2 = 1 - पी 1 = 1 -
9
13
= + 6 ·

कहाँ: क्यू 1 , क्यू 2 - संभावनाएँ (आवृत्तियाँ) जिनके साथ क्रमशः रणनीतियाँ बी 1 और बी 2 लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "बी" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "ए" अपनी सक्रिय रणनीतियों के ढांचे के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी A अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। इसलिए, यदि हम मान लें कि खिलाड़ी "ए" शुद्ध रणनीति ए 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 क्यू 1 + के 12 क्यू 2 = वी (4)


खेल की कीमत के बाद से वी हम पहले से ही जानते हैं और उस पर विचार कर रहे हैं क्यू 1 + क्यू 2 = 1 , तो रणनीति बी 1 की इष्टतम आवृत्ति इस प्रकार पाई जा सकती है:
क्यू 1 =
वी - 12
11 - 12
(5)

इस कार्य में:

क्यू 1 =
51
13
- 5
3 - 5
=
7
13

संभावना क्यू 2 घटाव द्वारा ज्ञात करें क्यू 1 इकाई से:
क्यू 2 = 1 - क्यू 1 = 1 -
7
13
=
6
13

उत्तर:

खेल की न्यूनतम कीमत: α = 3
शीर्ष खेल मूल्य: β = 5
गेम की कीमत: वी =
51
13
खिलाड़ी "ए" के लिए इष्टतम रणनीति:
एसए*=
ए 1ए 2
9
13
4
13

खिलाड़ी "बी" के लिए इष्टतम रणनीति:
एसबी*=
बी 1बी 2
7
13
6
13

ज्यामितीय व्याख्या (चित्रमय समाधान):

आइए हम विचाराधीन खेल की एक ज्यामितीय व्याख्या दें। आइए भुज अक्ष का एक भाग लें इकाई लंबाईऔर इसके सिरों से होकर लंबवत सीधी रेखाएँ खींचें 1 और 2 हमारी रणनीतियों ए 1 और ए 2 के अनुरूप। आइए अब मान लें कि खिलाड़ी "बी" अपने शुद्ध रूप में रणनीति बी 1 का उपयोग करेगा। फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 3 होगा। आइए अक्ष पर संबंधित बिंदु को चिह्नित करें 1 .
यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 6 होगा। आइए अक्ष पर संबंधित बिंदु को चिह्नित करें 2
(चित्र 1 देखें)। जाहिर है, अगर हम रणनीतियों ए 1 और ए 2 को अलग-अलग अनुपात में मिलाकर लागू करते हैं, तो हमारी जीत निर्देशांक (0, 3) और (1, 6) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगी, आइए इसे रणनीति बी की रेखा कहें। 1 (चित्र 1 में लाल रंग में दिखाया गया है)। किसी दी गई रेखा पर किसी भी बिंदु का भुज प्रायिकता के बराबर होता है पी 2 (आवृत्ति) जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि - परिणामी लाभ (चित्र 1 देखें)।

चित्र 1।
अदायगी ग्राफ आवृत्ति से पी 2 , जब दुश्मन रणनीति का उपयोग करता है बी 1.

आइए अब मान लें कि खिलाड़ी "बी" अपने शुद्ध रूप में रणनीति बी 2 का उपयोग करेगा। फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 5 होगा। यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 3/2 होगा (चित्र 2 देखें)। इसी तरह, यदि हम रणनीतियों ए 1 और ए 2 को अलग-अलग अनुपात में मिलाते हैं, तो हमारी जीत निर्देशांक (0, 5) और (1, 3/2) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगी, आइए इसे रणनीति की रेखा कहते हैं बी 2. पिछले मामले की तरह, इस रेखा पर किसी भी बिंदु का भुज उस संभावना के बराबर है जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि परिणामी लाभ है, लेकिन केवल रणनीति बी 2 के लिए (चित्र 2 देखें)।

चित्र 2।
वी और इष्टतम आवृत्ति पी 2 खिलाड़ी के लिए "ए".

में असली खेल, जब एक उचित खिलाड़ी "बी" अपनी सभी रणनीतियों का उपयोग करता है, तो हमारी जीत चित्र 2 में लाल रंग में दिखाई गई टूटी हुई रेखा के साथ बदल जाएगी। यह पंक्ति तथाकथित को परिभाषित करती है जीत की निचली सीमा. जाहिर है, इस टूटी हुई रेखा का उच्चतम बिंदु हमारी इष्टतम रणनीति से मेल खाता है। में इस मामले में, यह रणनीति बी 1 और बी 2 की रेखाओं का प्रतिच्छेदन बिंदु है। कृपया ध्यान दें कि यदि आप कोई आवृत्ति चुनते हैं पी 2 इसके भुज के बराबर, तो हमारा लाभ अपरिवर्तित और बराबर रहेगा वी खिलाड़ी "बी" की किसी भी रणनीति के लिए, यह वह अधिकतम होगी जिसकी हम स्वयं गारंटी दे सकते हैं। आवृत्ति (संभावना) पी 2 इस मामले में, हमारी इष्टतम मिश्रित रणनीति की संगत आवृत्ति है। वैसे, चित्र 2 से आप आवृत्ति देख सकते हैं पी 1 , हमारी इष्टतम मिश्रित रणनीति, खंड की लंबाई है [ पी 2 ; 1] एक्स-अक्ष पर। (ये इसलिए पी 1 + पी 2 = 1 )

पूरी तरह से समान तर्क का उपयोग करके, हम खिलाड़ी "बी" के लिए इष्टतम रणनीति की आवृत्तियों को पा सकते हैं, जिसे चित्र 3 में दिखाया गया है।

चित्र तीन।
गेम की कीमत का ग्राफ़िक निर्धारण वी और इष्टतम आवृत्ति प्रश्न 2 खिलाड़ी के लिए "में".

केवल उसके लिए तथाकथित होना चाहिए हानि की ऊपरी सीमा(लाल टूटी हुई रेखा) और उस पर सबसे निचले बिंदु की तलाश करें, क्योंकि खिलाड़ी "बी" के लिए लक्ष्य नुकसान को कम करना है। समान आवृत्ति मान क्यू 1 , यह खंड की लंबाई है [ क्यू 2 ; 1] एक्स-अक्ष पर।

खेल सिद्धांत - संघर्ष स्थितियों (हितों के टकराव) को हल करने के लिए गणितीय तरीकों का एक सेट। गेम थ्योरी में गेम कहा जाता है गणित का मॉडल संघर्ष की स्थिति. खेल सिद्धांत में विशेष रुचि का विषय अनिश्चितता की स्थिति में खेल प्रतिभागियों की निर्णय लेने की रणनीतियों का अध्ययन है। अनिश्चितता इस तथ्य से उत्पन्न होती है कि दो या दो से अधिक पार्टियाँ विरोधी लक्ष्यों का पीछा करती हैं, और प्रत्येक पार्टी की किसी भी कार्रवाई के परिणाम साझेदार की चाल पर निर्भर करते हैं। साथ ही, प्रत्येक पक्ष अधिकतम सीमा तक निर्धारित लक्ष्यों को साकार करने वाले इष्टतम निर्णय लेने का प्रयास करता है।

गेम थ्योरी को अर्थशास्त्र में सबसे अधिक लगातार लागू किया जाता है, जहां संघर्ष की स्थिति उत्पन्न होती है, उदाहरण के लिए, आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंक और ग्राहक के बीच संबंधों में। गेम थ्योरी का अनुप्रयोग राजनीति, समाजशास्त्र, जीव विज्ञान और सैन्य कला में भी पाया जा सकता है।

गेम थ्योरी के इतिहास से

गेम थ्योरी का इतिहास एक स्वतंत्र अनुशासन के रूप में 1944 में शुरुआत हुई, जब जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने "द थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर" पुस्तक प्रकाशित की। हालाँकि गेम थ्योरी के उदाहरण पहले भी सामने आ चुके हैं: मृत पति की संपत्ति को उसकी पत्नियों के बीच बांटने पर बेबीलोनियाई तल्मूड का ग्रंथ, 18वीं सदी में कार्ड गेम, 20वीं सदी की शुरुआत में शतरंज के सिद्धांत का विकास सदी, 1928 वर्ष में उसी जॉन वॉन न्यूमैन के मिनिमैक्स प्रमेय का प्रमाण, जिसके बिना कोई खेल सिद्धांत नहीं होता।

20वीं सदी के 50 के दशक में मेल्विन ड्रेशर और मेरिल फ्लड से रैंड कॉर्पोरेशनकैदी की दुविधा को प्रयोगात्मक रूप से लागू करने वाले पहले व्यक्ति जॉन नैश ने दो-व्यक्ति खेलों में संतुलन की स्थिति पर अपने कार्यों में नैश संतुलन की अवधारणा विकसित की।

रेइनहार्ड साल्टेन ने 1965 में "द ट्रीटमेंट ऑफ ओलिगोपॉली इन गेम थ्योरी ऑन डिमांड" ("स्पीलथियोरेटिस बेहंडलुंग ईन्स ओलिगोमोडेल्स मिट नचफ्रागेट्राघेइट") पुस्तक प्रकाशित की, जिसके साथ अर्थशास्त्र में गेम थ्योरी के अनुप्रयोग को एक नई प्रेरणा शक्ति मिली। गेम थ्योरी के विकास में एक कदम आगे जॉन मेनार्ड स्मिथ के काम, "इवोल्यूशनरी स्टेबल स्ट्रैटेजी" (1974) से जुड़ा है। कैदी की दुविधा को रॉबर्ट एक्सेलरोड की 1984 की पुस्तक द इवोल्यूशन ऑफ कोऑपरेशन में लोकप्रिय बनाया गया था। 1994 में, जॉन नैश, जॉन हरसैनी और रेनहार्ड साल्टेन को गेम थ्योरी में उनके योगदान के लिए नोबेल पुरस्कार से सम्मानित किया गया था।

जीवन और व्यवसाय में खेल सिद्धांत

आइए हम संघर्ष की स्थिति (हितों के टकराव) के सार पर अधिक विस्तार से ध्यान दें, जैसा कि जीवन और व्यवसाय में विभिन्न स्थितियों के आगे के मॉडलिंग के लिए गेम थ्योरी में समझा जाता है। मान लीजिए कि एक व्यक्ति ऐसी स्थिति में है जो कई संभावित परिणामों में से एक की ओर ले जाता है, और इन परिणामों के संबंध में व्यक्ति की कुछ व्यक्तिगत प्राथमिकताएँ होती हैं। हालाँकि, वह कुछ हद तक उन चरों को नियंत्रित कर सकता है जो परिणाम निर्धारित करते हैं, लेकिन उसके पास उन पर पूर्ण शक्ति नहीं है। कभी-कभी नियंत्रण कुछ व्यक्तियों के हाथों में होता है, जिनकी, उनकी तरह, संभावित परिणामों के संबंध में कुछ प्राथमिकताएँ होती हैं, लेकिन सामान्य तौर पर इन व्यक्तियों के हित सुसंगत नहीं होते हैं। अन्य मामलों में, अंतिम परिणाम संयोग (जिसे कानूनी विज्ञान में कभी-कभी कहा जाता है) दोनों पर निर्भर हो सकता है प्राकृतिक आपदाएं), और अन्य व्यक्तियों से। गेम थ्योरी ऐसी स्थितियों के अवलोकन को व्यवस्थित करती है और ऐसी स्थितियों में बुद्धिमान कार्यों का मार्गदर्शन करने के लिए सामान्य सिद्धांतों का निर्माण करती है।

कुछ मायनों में, "गेम थ्योरी" नाम दुर्भाग्यपूर्ण है, क्योंकि यह बताता है कि गेम थ्योरी केवल पार्लर गेम में होने वाले सामाजिक रूप से महत्वहीन मुठभेड़ों से संबंधित है, लेकिन फिर भी सिद्धांत का बहुत व्यापक अर्थ है।

निम्नलिखित आर्थिक स्थिति गेम थ्योरी के अनुप्रयोग का अंदाजा दे सकती है। मान लीजिए कि कई उद्यमी हैं, जिनमें से प्रत्येक अधिकतम लाभ प्राप्त करने का प्रयास करता है, जबकि इस लाभ को निर्धारित करने वाले चर पर केवल सीमित शक्ति होती है। एक उद्यमी के पास उन चरों पर कोई शक्ति नहीं होती है जिन्हें दूसरा उद्यमी नियंत्रित करता है, लेकिन जो पहले की आय को बहुत प्रभावित कर सकते हैं। इस स्थिति को एक खेल के रूप में मानने से निम्नलिखित आपत्ति उत्पन्न हो सकती है। गेम मॉडल मानता है कि प्रत्येक उद्यमी क्षेत्र से एक विकल्प चुनता है संभावित चुनावऔर इन एकल विकल्पों से लाभ निर्धारित होता है। जाहिर है, वास्तविकता में ऐसा लगभग नहीं हो सकता है, क्योंकि इस मामले में उद्योग में जटिल प्रबंधन तंत्र की आवश्यकता नहीं होगी। इन निर्णयों में बस कई निर्णय और संशोधन होते हैं जो आर्थिक प्रणाली में अन्य प्रतिभागियों (खिलाड़ियों) द्वारा चुने गए विकल्पों पर निर्भर करते हैं। लेकिन सिद्धांत रूप में कोई यह कल्पना कर सकता है कि कोई प्रशासक प्रत्येक समस्या के उत्पन्न होने पर उसे हल करने के बजाय सभी संभावित आकस्मिकताओं का अनुमान लगाता है और प्रत्येक मामले में की जाने वाली कार्रवाई का विवरण देता है।

परिभाषा के अनुसार, एक सैन्य संघर्ष, हितों का टकराव है जिसमें किसी भी पक्ष का परिणाम निर्धारित करने वाले चर पर पूर्ण नियंत्रण नहीं होता है, जो लड़ाई की एक श्रृंखला द्वारा तय किया जाता है। आप परिणाम को आसानी से जीत या हार मान सकते हैं और उन्हें संख्यात्मक मान 1 और 0 निर्दिष्ट कर सकते हैं।

सबसे सरल संघर्ष स्थितियों में से एक, जिसे गेम थ्योरी में लिखा और हल किया जा सकता है, एक द्वंद्व है, जो क्रमशः दो खिलाड़ियों 1 और 2 के बीच का संघर्ष है। पीऔर क्यूशॉट्स. प्रत्येक खिलाड़ी के लिए एक फ़ंक्शन होता है जो खिलाड़ी के शॉट की संभावना को दर्शाता है मैंएक समय में टीऐसा प्रहार करेगा जो घातक होगा।

परिणामस्वरूप, खेल सिद्धांत हितों के टकराव के एक निश्चित वर्ग के निम्नलिखित सूत्रीकरण पर आता है: वहाँ हैं एनखिलाड़ियों को, और प्रत्येक को सौ विशिष्ट सेटों में से एक विकल्प चुनने की आवश्यकता होती है, और विकल्प चुनते समय, खिलाड़ी को अन्य खिलाड़ियों की पसंद के बारे में कोई जानकारी नहीं होती है। खिलाड़ी के संभावित पसंद क्षेत्र में "हुकुम का इक्का बजाना", "कारों के बजाय टैंक का उत्पादन करना", या अधिक सामान्यतः, एक रणनीति जो सभी संभावित परिस्थितियों में की जाने वाली सभी कार्रवाइयों को परिभाषित करती है, जैसे तत्व शामिल हो सकते हैं। प्रत्येक खिलाड़ी को एक कार्य का सामना करना पड़ता है: उसे क्या विकल्प चुनना चाहिए ताकि परिणाम पर उसका निजी प्रभाव उसे सबसे बड़ी संभावित जीत दिला सके?

खेल सिद्धांत में गणितीय मॉडल और समस्याओं का औपचारिकीकरण

जैसा कि हम पहले ही नोट कर चुके हैं, खेल संघर्ष की स्थिति का एक गणितीय मॉडल है और निम्नलिखित घटकों की आवश्यकता है:

  1. इच्छुक पार्टियाँ;
  2. प्रत्येक पक्ष पर संभावित कार्रवाई;
  3. पार्टियों के हित.

खेल में रुचि रखने वाले पक्षों को खिलाड़ी कहा जाता है , उनमें से प्रत्येक कम से कम दो कार्रवाई कर सकता है (यदि खिलाड़ी के पास अपने निपटान में केवल एक ही कार्रवाई है, तो वह वास्तव में खेल में भाग नहीं लेता है, क्योंकि यह पहले से ज्ञात है कि वह क्या करेगा)। खेल के परिणाम को जीत कहा जाता है .

वास्तविक संघर्ष की स्थिति हमेशा नहीं होती है, लेकिन खेल (गेम थ्योरी की अवधारणा में) हमेशा उसी के अनुसार आगे बढ़ता है निश्चित नियम , जो सटीक रूप से निर्धारित करता है:

  1. खिलाड़ियों के कार्यों के लिए विकल्प;
  2. प्रत्येक खिलाड़ी के पास अपने साथी के व्यवहार के बारे में कितनी जानकारी है;
  3. कार्यों के प्रत्येक सेट से मिलने वाला प्रतिफल।

औपचारिक खेलों के उदाहरणों में फुटबॉल, कार्ड खेल, शतरंज।

लेकिन अर्थशास्त्र में, खिलाड़ी के व्यवहार का एक मॉडल उभरता है, उदाहरण के लिए, जब कई कंपनियां बाजार में अधिक लाभप्रद स्थान लेने का प्रयास करती हैं, तो कई व्यक्ति कुछ अच्छे (संसाधन, वित्त) को आपस में बांटने की कोशिश करते हैं ताकि हर किसी को जितना संभव हो सके उतना मिल सके। . अर्थव्यवस्था में संघर्ष की स्थितियों में खिलाड़ी, जिन्हें एक खेल के रूप में तैयार किया जा सकता है, कंपनियां, बैंक, व्यक्ति और अन्य आर्थिक एजेंट हैं। बदले में, युद्ध की स्थिति में, गेम मॉडल का उपयोग किया जाता है, उदाहरण के लिए, दुश्मन को हराने या हमले से बचाने के लिए सबसे अच्छा हथियार (मौजूदा या संभावित में से) चुनने में।

खेल की विशेषता परिणाम की अनिश्चितता है . अनिश्चितता के कारणों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

  1. संयोजक (शतरंज की तरह);
  2. यादृच्छिक कारकों का प्रभाव (जैसे खेल "हेड्स या टेल्स", पासा, कार्ड गेम में);
  3. रणनीतिक (खिलाड़ी को नहीं पता कि दुश्मन क्या कार्रवाई करेगा)।

खिलाड़ी की रणनीति नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक कदम पर उसके कार्यों को निर्धारित करता है।

गेम थ्योरी का उद्देश्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है। ऐसी रणनीति निर्धारित करने का अर्थ है खेल को हल करना। रणनीति की इष्टतमता यह तब प्राप्त होता है जब एक खिलाड़ी को अधिकतम जीत हासिल करनी चाहिए, जबकि दूसरा अपनी रणनीति पर कायम रहता है। और यदि पहला खिलाड़ी अपनी रणनीति पर अड़ा रहता है तो दूसरे खिलाड़ी को कम से कम नुकसान होना चाहिए।

खेलों का वर्गीकरण

  1. खिलाड़ियों की संख्या के आधार पर वर्गीकरण (दो या दो से अधिक व्यक्तियों का खेल). दो-व्यक्ति गेम सभी गेम थ्योरी में एक केंद्रीय स्थान रखते हैं। दो-व्यक्ति खेलों के लिए गेम थ्योरी की मूल अवधारणा संतुलन के बहुत महत्वपूर्ण विचार का सामान्यीकरण है जो स्वाभाविक रूप से दो-व्यक्ति खेलों में प्रकट होता है। जहाँ तक खेलों का सवाल है एनव्यक्तियों, तो खेल सिद्धांत का एक हिस्सा उन खेलों के लिए समर्पित है जिनमें खिलाड़ियों के बीच सहयोग निषिद्ध है। गेम थ्योरी के दूसरे भाग में एनयह माना जाता है कि व्यक्ति पारस्परिक लाभ के लिए सहयोग करने में सक्षम हैं (इस पैराग्राफ में बाद में असहयोगी और देखें)। सहकारी खेलओह)।
  2. खिलाड़ियों की संख्या और उनकी रणनीतियों के आधार पर वर्गीकरण (रणनीतियों की संख्या कम से कम दो है, अनंत हो सकती है)।
  3. जानकारी की मात्रा के आधार पर वर्गीकरण पिछली चालों के सापेक्ष: खेल के साथ पूरी जानकारीऔर अधूरी जानकारी. मान लीजिए खिलाड़ी 1 - खरीदार और खिलाड़ी 2 - विक्रेता हैं। यदि खिलाड़ी 1 को खिलाड़ी 2 के कार्यों के बारे में पूरी जानकारी नहीं है, तो खिलाड़ी 1 उन दो विकल्पों के बीच अंतर नहीं कर सकता है जिनके बीच उसे चुनाव करना होगा। उदाहरण के लिए, किसी उत्पाद के दो प्रकारों के बीच चयन करना और यह न जानना कि, कुछ विशेषताओं के अनुसार, उत्पाद क्या है बदतर उत्पाद बी, खिलाड़ी 1 को विकल्पों के बीच अंतर दिखाई नहीं दे सकता है।
  4. जीत के विभाजन के सिद्धांतों के अनुसार वर्गीकरण : एक तरफ सहयोगात्मक, गठबंधन और दूसरी तरफ असहयोगी, गैर-गठबंधन। में असहयोगी खेल , या अन्यथा - असहयोगी खेल , खिलाड़ी यह जाने बिना कि दूसरा खिलाड़ी कौन सी रणनीति चुनेगा, एक साथ रणनीतियाँ चुनते हैं। खिलाड़ियों के बीच संचार असंभव है. में सहकारी खेल , या अन्यथा - गठबंधन का खेल , खिलाड़ी गठबंधन बना सकते हैं और अपनी जीत बढ़ाने के लिए सामूहिक कार्रवाई कर सकते हैं।
  5. परिमित दो-व्यक्ति शून्य-राशि खेल या एक विरोधी खेल है रणनीति खेलपूरी जानकारी के साथ, जिसमें विरोधी हितों वाली पार्टियाँ शामिल हैं। विरोधी खेल हैं मैट्रिक्स खेल .

गेम थ्योरी का एक उत्कृष्ट उदाहरण कैदी की दुविधा है।

दोनों संदिग्धों को हिरासत में ले लिया गया और एक दूसरे से अलग कर दिया गया। जिला अटॉर्नी आश्वस्त है कि उन्होंने ऐसा किया है गंभीर अपराध, लेकिन अदालत में उन पर आरोप लगाने के लिए पर्याप्त सबूत नहीं हैं। वह प्रत्येक कैदी से कहता है कि उसके पास दो विकल्प हैं: पुलिस जो अपराध मानती है उसे कबूल कर ले या अपराध कबूल न कर ले। यदि दोनों कबूल नहीं करते हैं, तो डीए उन पर कुछ छोटे अपराध का आरोप लगाएगा, जैसे छोटी चोरी या हथियार का अवैध कब्ज़ा, और उन दोनों को एक छोटी सजा मिलेगी। यदि वे दोनों कबूल करते हैं, तो उन पर मुकदमा चलाया जाएगा, लेकिन वह कड़ी सजा की मांग नहीं करेंगे। यदि एक कबूल करता है और दूसरा नहीं करता है, तो जिसने कबूल किया है उसे एक साथी के प्रत्यर्पण के लिए उसकी सजा कम कर दी जाएगी, जबकि जो कायम रहेगा उसे "पूरी तरह" मिलेगा।

यदि इस रणनीतिक कार्य को निष्कर्ष के रूप में तैयार किया जाता है, तो यह निम्नलिखित तक सीमित हो जाता है:

इस प्रकार, यदि दोनों कैदी कबूल नहीं करते हैं, तो उन्हें प्रत्येक को 1 वर्ष की सजा मिलेगी। यदि दोनों कबूल करते हैं, तो प्रत्येक को 8 वर्ष की सजा मिलेगी। और यदि एक कबूल करता है, और दूसरा नहीं कबूल करता है, तो जिसने कबूल किया है उसे तीन महीने की जेल होगी, और जो कबूल नहीं करेगा उसे 10 साल मिलेंगे। उपरोक्त मैट्रिक्स कैदी की दुविधा को सही ढंग से दर्शाता है: हर किसी को इस सवाल का सामना करना पड़ता है कि कबूल करना है या नहीं। जिला अटॉर्नी कैदियों को जो गेम ऑफर करता है वह है असहयोगी खेल या अन्यथा - असहयोगी खेल . यदि दोनों कैदियों को सहयोग करने का अवसर मिले (अर्थात्) खेल सहकारी होगा वरना गठबंधन का खेल ), तो दोनों कबूल नहीं करेंगे और प्रत्येक को एक वर्ष की जेल होगी।

गेम थ्योरी के गणितीय उपकरणों का उपयोग करने के उदाहरण

अब हम खेलों के सामान्य वर्गों के उदाहरणों के समाधान पर विचार करने के लिए आगे बढ़ते हैं, जिसके लिए खेल सिद्धांत में अनुसंधान और समाधान विधियां हैं।

दो व्यक्तियों के असहयोगी (गैर-सहकारी) खेल की औपचारिकता का एक उदाहरण

पिछले पैराग्राफ में, हमने पहले ही एक गैर-सहकारी (गैर-सहकारी) गेम (कैदी की दुविधा) का एक उदाहरण देखा था। आइए अपने कौशल को मजबूत करें। आर्थर कॉनन डॉयल द्वारा लिखित "द एडवेंचर्स ऑफ शेरलॉक होम्स" से प्रेरित एक क्लासिक कथानक भी इसके लिए उपयुक्त है। बेशक, कोई आपत्ति कर सकता है: उदाहरण जीवन से नहीं है, बल्कि साहित्य से है, लेकिन कॉनन डॉयल ने खुद को विज्ञान कथा लेखक के रूप में स्थापित नहीं किया है! क्लासिक इसलिए भी क्योंकि यह कार्य ऑस्कर मॉर्गनस्टर्न द्वारा पूरा किया गया था, जैसा कि हम पहले ही स्थापित कर चुके हैं, गेम थ्योरी के संस्थापकों में से एक।

उदाहरण 1।"द एडवेंचर्स ऑफ शेरलॉक होम्स" के एक अंश का संक्षिप्त सारांश दिया जाएगा। गेम थ्योरी की प्रसिद्ध अवधारणाओं के अनुसार, संघर्ष की स्थिति का एक मॉडल बनाएं और गेम को औपचारिक रूप से लिखें।

शेरलॉक होम्स का इरादा प्रोफेसर मोरियार्टी से बचने के लिए महाद्वीप (यूरोपीय) तक पहुंचने के लक्ष्य के साथ लंदन से डोवर तक यात्रा करने का है, जो उसका पीछा कर रहा है। ट्रेन में चढ़ने के बाद, उन्होंने स्टेशन के प्लेटफार्म पर प्रोफेसर मोरियार्टी को देखा। शर्लक होम्स स्वीकार करते हैं कि मोरियार्टी एक विशेष ट्रेन चुन सकते हैं और उससे आगे निकल सकते हैं। शर्लक होम्स के पास दो विकल्प हैं: डोवर की यात्रा जारी रखें या कैंटरबरी स्टेशन पर उतरें, जो उसके मार्ग पर एकमात्र मध्यवर्ती स्टेशन है। हम स्वीकार करते हैं कि उसका प्रतिद्वंद्वी होम्स की क्षमताओं को निर्धारित करने के लिए पर्याप्त बुद्धिमान है, इसलिए उसके पास वही दो विकल्प हैं। दोनों विरोधियों को ट्रेन से उतरने के लिए एक स्टेशन चुनना होगा, बिना यह जाने कि उनमें से प्रत्येक क्या निर्णय लेगा। यदि, निर्णय लेने के परिणामस्वरूप, दोनों एक ही स्टेशन पर पहुँचते हैं, तो हम निश्चित रूप से मान सकते हैं कि शर्लक होम्स को प्रोफेसर मोरियार्टी द्वारा मार दिया जाएगा। यदि शर्लक होम्स सुरक्षित रूप से डोवर पहुँच जाता है, तो वह बच जाएगा।

समाधान। कॉनन डॉयल के नायकों को हम खेल में भागीदार अर्थात खिलाड़ी मान सकते हैं। हर खिलाड़ी के लिए उपलब्ध मैं (मैं=1,2) दो शुद्ध रणनीतियाँ:

  • डोवर पर उतरें (रणनीति एसi1 ( मैं=1,2) );
  • किसी मध्यवर्ती स्टेशन पर उतरें (रणनीति) एसi2 ( मैं=1,2) )

दोनों खिलाड़ियों में से प्रत्येक कौन सी रणनीति चुनता है, इसके आधार पर जोड़ी के रूप में रणनीतियों का एक विशेष संयोजन बनाया जाएगा एस = (एस1 , एस 2 ) .

प्रत्येक संयोजन को एक घटना से जोड़ा जा सकता है - प्रोफेसर मोरियार्टी द्वारा शर्लक होम्स की हत्या के प्रयास का परिणाम। हम संभावित घटनाओं के साथ इस गेम का एक मैट्रिक्स बनाते हैं।

प्रत्येक घटना के अंतर्गत प्रोफेसर मोरियार्टी के अधिग्रहण को दर्शाने वाला एक सूचकांक है, और इसकी गणना होम्स की मुक्ति के आधार पर की जाती है। दोनों नायक एक ही समय में रणनीति चुनते हैं, बिना यह जाने कि दुश्मन क्या चुनेगा। इस प्रकार, खेल असहयोगी है क्योंकि, सबसे पहले, खिलाड़ी अलग-अलग ट्रेनों में हैं, और दूसरे, उनके विरोधी हित हैं।

सहकारी (गठबंधन) खेल की औपचारिकता और समाधान का एक उदाहरण एनव्यक्तियों

इस बिंदु पर, व्यावहारिक भाग, यानी, एक उदाहरण समस्या को हल करने की प्रक्रिया, एक सैद्धांतिक भाग से पहले होगी, जिसमें हम सहकारी (गैर-सहकारी) खेलों को हल करने के लिए गेम सिद्धांत की अवधारणाओं से परिचित होंगे। इस कार्य के लिए, गेम थ्योरी सुझाव देती है:

  • विशिष्ट कार्य (सीधे शब्दों में कहें तो, यह खिलाड़ियों को एक गठबंधन में एकजुट करने के लाभ की भयावहता को दर्शाता है);
  • योगात्मकता की अवधारणा (मात्राओं की संपत्ति, जिसमें यह तथ्य शामिल है कि संपूर्ण वस्तु के अनुरूप मात्रा का मूल्य वस्तु के विभाजन के एक निश्चित वर्ग में उसके भागों के अनुरूप मात्राओं के मूल्यों के योग के बराबर है भागों में) और विशेषता फ़ंक्शन की सुपरएडिटिविटी (संपूर्ण वस्तु के अनुरूप मात्रा का मान उसके भागों के अनुरूप मात्राओं के मानों के योग से अधिक है)।

विशेषता फ़ंक्शन की सुपरएडिटिविटी से पता चलता है कि गठबंधन में शामिल होना खिलाड़ियों के लिए फायदेमंद है, क्योंकि इस मामले में गठबंधन के भुगतान का मूल्य खिलाड़ियों की संख्या के साथ बढ़ता है।

खेल को औपचारिक बनाने के लिए, हमें उपरोक्त अवधारणाओं के लिए औपचारिक नोटेशन पेश करने की आवश्यकता है।

खेल के लिए एनआइए हम इसके सभी खिलाड़ियों के सेट को इस प्रकार निरूपित करें एन= (1,2,...,n) समुच्चय का कोई गैर-रिक्त उपसमुच्चय एनआइए इसे इस रूप में निरूपित करें टी(स्वयं सहित एनऔर सभी उपसमुच्चय एक तत्व से बने हैं)। साइट पर एक पाठ है " सेट और सेट पर संचालन", जो लिंक पर क्लिक करने पर एक नई विंडो में खुलती है।

चारित्रिक फलन को इस प्रकार दर्शाया गया है वीऔर इसकी परिभाषा के क्षेत्र में सेट के संभावित उपसमुच्चय शामिल हैं एन. वी(टी) - एक विशेष उपसमुच्चय के लिए विशेषता फ़ंक्शन का मूल्य, उदाहरण के लिए, एक गठबंधन द्वारा प्राप्त आय, संभवतः एक खिलाड़ी से मिलकर। यह महत्वपूर्ण है क्योंकि गेम थ्योरी के लिए सभी असंबद्ध गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जाँच करना आवश्यक है।

दो गैर-रिक्त उपसमुच्चय गठबंधनों के लिए टी1 और टी2 सहकारी (गठबंधन) खेल के विशिष्ट कार्य की संवेदनशीलता इस प्रकार लिखी गई है:

और सुपरएडिटिविटी इस प्रकार है:

उदाहरण 2.तीन संगीत विद्यालय के छात्र विभिन्न क्लबों में अंशकालिक काम करते हैं; वे अपनी आय क्लब के आगंतुकों से प्राप्त करते हैं। सहकारी खेलों को हल करने के लिए गेम थ्योरी की अवधारणाओं का उपयोग करके निर्धारित करें कि क्या उनके लिए सेना में शामिल होना लाभदायक है (यदि हां, तो किन परिस्थितियों में)। एननिम्नलिखित प्रारंभिक डेटा वाले व्यक्ति।

औसतन, प्रति शाम उनका राजस्व था:

  • वायलिन वादक के पास 600 इकाइयाँ हैं;
  • गिटारवादक के पास 700 इकाइयाँ हैं;
  • गायक के पास 900 इकाइयाँ हैं।

राजस्व बढ़ाने के प्रयास में, छात्रों ने कई महीनों के दौरान विभिन्न समूह बनाए। परिणामों से पता चला कि टीम बनाकर, वे प्रति शाम अपना राजस्व इस प्रकार बढ़ा सकते हैं:

  • वायलिन वादक + गिटारवादक ने 1500 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गायक ने 1800 इकाइयाँ अर्जित कीं;
  • गिटारवादक + गायक ने 1900 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गिटारवादक + गायक ने 3000 इकाइयाँ अर्जित कीं।

समाधान। इस उदाहरण में, खेल में खिलाड़ियों की संख्या एन= 3, इसलिए, खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के 2³ = 8 संभावित उपसमुच्चय शामिल हैं। आइए सभी संभावित गठबंधनों की सूची बनाएं टी:

  • एक तत्व के गठबंधन, जिनमें से प्रत्येक में एक खिलाड़ी होता है - एक संगीतकार: टी{1} , टी{2} , टी{3} ;
  • दो तत्वों का गठबंधन: टी{1,2} , टी{1,3} , टी{2,3} ;
  • तीन तत्वों का गठबंधन: टी{1,2,3} .

हम प्रत्येक खिलाड़ी को एक क्रमांक निर्दिष्ट करेंगे:

  • वायलिन वादक - प्रथम वादक;
  • गिटारवादक - दूसरा खिलाड़ी;
  • गायक - तीसरा खिलाड़ी।

समस्या डेटा के आधार पर, हम गेम के विशिष्ट कार्य का निर्धारण करते हैं वी:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; विशेषता फ़ंक्शन के ये मान क्रमशः पहले, दूसरे और तीसरे खिलाड़ियों के भुगतान के आधार पर निर्धारित किए जाते हैं, जब वे गठबंधन में एकजुट नहीं होते हैं;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; विशेषता फ़ंक्शन के ये मूल्य गठबंधन में एकजुट खिलाड़ियों की प्रत्येक जोड़ी के राजस्व से निर्धारित होते हैं;

v(T(1,2,3)) = 3000 ; विशेषता फ़ंक्शन का यह मान उस स्थिति में औसत राजस्व द्वारा निर्धारित किया जाता है जब खिलाड़ी तीन में एकजुट होते हैं।

इस प्रकार, हमने खिलाड़ियों के सभी संभावित गठबंधनों को सूचीबद्ध किया है; जैसा कि होना चाहिए, उनमें से आठ हैं, क्योंकि खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के ठीक आठ संभावित उपसमूह शामिल हैं। गेम थ्योरी की यही आवश्यकता है, क्योंकि हमें सभी असंयुक्त गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जांच करने की आवश्यकता है।

इस उदाहरण में सुपरएडिटिविटी शर्तें कैसे संतुष्ट हैं? आइए निर्धारित करें कि खिलाड़ी असंयुक्त गठबंधन कैसे बनाते हैं टी1 और टी2 . यदि कुछ खिलाड़ी किसी गठबंधन का हिस्सा हैं टी1 , तो अन्य सभी खिलाड़ी गठबंधन का हिस्सा हैं टी2 और परिभाषा के अनुसार, यह गठबंधन खिलाड़ियों के पूरे सेट और सेट के अंतर के रूप में बनता है टी1 . तो अगर टी1 - एक खिलाड़ी का गठबंधन, फिर गठबंधन में टी2 गठबंधन में दूसरे और तीसरे खिलाड़ी होंगे टी1 पहले और तीसरे खिलाड़ी होंगे, फिर गठबंधन होगा टी2 इसमें केवल दूसरा खिलाड़ी शामिल होगा, इत्यादि।

सामग्री 1 सामान्य जानकारी 2 1.1 खेल. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 चालें। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 रणनीतियाँ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 मैट्रिक्स गेम। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ट्रेल प्वाइंट. शुद्ध रणनीतियाँ 7 2.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 मिश्रित रणनीतियाँ 9 3.1 गेम 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 उदाहरण. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 ज्यामितीय व्याख्या। . . . . . . . . . . . . . . . . . . . 12 3.2 गेम्स 2×एन और एम×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 उदाहरण 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. खेल सिद्धांत से सामान्य जानकारी 1.1. गेम्स गेम थ्योरी संघर्ष स्थितियों का एक गणितीय सिद्धांत है, अर्थात। ऐसी स्थितियाँ जिनमें अलग-अलग लक्ष्य हासिल करने वाले दो या दो से अधिक दलों के हित टकराते हैं। एक गेम कुछ नियमों द्वारा नियंत्रित एक संघर्ष की स्थिति है, जिसमें यह दर्शाया जाना चाहिए: प्रतिभागियों के कार्यों के लिए संभावित विकल्प या भुगतान (जीतना, हारना) जिसके लिए चालों का एक सेट जानकारी की मात्रा की ओर जाता है; प्रत्येक पक्ष के बारे में दूसरे के व्यवहार के बारे में। युगल खेल एक ऐसा खेल है जिसमें केवल दो पक्ष (दो खिलाड़ी) भाग लेते हैं। शून्य-राशि युग्मित खेल एक युग्मित खेल है जिसमें भुगतान का योग शून्य होता है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। भुगतान फ़ंक्शन के मूल्य के प्रति प्रत्येक खिलाड़ी के रवैये के आधार पर, युग्मित खेलों को उप-विभाजित किया जाता है: शून्य-राशि युग्मित खेल (विरोधी) - एक युग्मित खेल जिसमें भुगतान की राशि शून्य के बराबर होती है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। एक गैर-प्रतिद्वंद्वी खेल एक युग्मित खेल है जिसमें खिलाड़ी अलग-अलग, लेकिन सीधे विपरीत नहीं, लक्ष्यों का पीछा करते हैं। 2 1.2. चालें चालें - खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक का चयन, चालें दो प्रकार की होती हैं: व्यक्तिगत चाल - + सचेत विकल्पखेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक + इस विकल्प का कार्यान्वयन यादृच्छिक चाल - एक यादृच्छिक चाल कई संभावनाओं में से एक विकल्प है, जो खिलाड़ी के निर्णय से नहीं, बल्कि कुछ यादृच्छिक चयन तंत्र द्वारा किया जाता है। नीचे हम शून्य-राशि युग्मित खेलों पर विचार करते हैं जिनमें केवल व्यक्तिगत चालें होती हैं। प्रत्येक पक्ष के पास दूसरे के व्यवहार के बारे में जानकारी का अभाव है। 3 1.3. रणनीतियाँ एक खिलाड़ी की रणनीति नियमों का एक समूह है जो खेल के दौरान उत्पन्न होने वाली स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्यों की पसंद निर्धारित करती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को सीमित और अनंत में विभाजित किया गया है। अंतहीन खेल- एक खेल जिसमें कम से कम एक खिलाड़ी के पास अनंत संख्या में रणनीतियाँ होती हैं। परिमित खेल वह खेल है जिसमें प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ होती हैं। किसी भी खिलाड़ी के लिए लगातार चालों की संख्या खेल के विभाजन को एकल-चाल और बहु-चाल, या स्थितीय में निर्धारित करती है। + वन-टर्न गेम में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर गेम का परिणाम निर्धारित करता है। + एक बहु-चाल, या स्थितीय, खेल समय के साथ विकसित होता है, जो क्रमिक चरणों की एक श्रृंखला का प्रतिनिधित्व करता है, जिनमें से प्रत्येक खिलाड़ी की चाल और स्थिति में संबंधित परिवर्तन के बाद होता है। एक-मोड़ वाले खेल में, प्रत्येक खिलाड़ी केवल एक ही विकल्प चुनता है संभावित विकल्पऔर फिर खेल का परिणाम निर्धारित करता है। एक खिलाड़ी की इष्टतम रणनीति एक ऐसी रणनीति है, जो खेल को कई बार दोहराए जाने पर, इस खिलाड़ी को अधिकतम संभव औसत जीत (या, वही, न्यूनतम संभव औसत हानि) प्रदान करती है। गेम थ्योरी में, सभी सिफारिशें खिलाड़ियों के उचित व्यवहार की धारणा के आधार पर की जाती हैं। खिलाड़ियों की ग़लतियाँ और गलतियाँ, हर संघर्ष की स्थिति में अपरिहार्य, साथ ही उत्साह और जोखिम के तत्वों को गेम थ्योरी में ध्यान में नहीं रखा जाता है। 4 1.4. मैट्रिक्स गेम एक मैट्रिक्स गेम एक एक-चाल वाला परिमित शून्य-योग गेम है। एक मैट्रिक्स गेम एक संघर्ष की स्थिति का एक गेम-सैद्धांतिक मॉडल है जिसमें प्रतिद्वंद्वी, बिल्कुल विपरीत लक्ष्यों को प्राप्त करने के लिए, एक परिमित से एक विकल्प (चाल) बनाते हैं। संख्या संभावित तरीकेक्रियाएँ। क्रिया के चुने हुए तरीकों (रणनीतियों) के अनुसार, प्राप्त परिणाम निर्धारित किया जाता है। आइए एक उदाहरण देखें. मान लीजिए कि दो खिलाड़ी A और B हैं, जिनमें से एक अपनी संभावित रणनीतियों A1, A2, ...Am में से i-th रणनीति चुन सकता है, और दूसरा चुन सकता है jth रणनीति उनकी संभावित रणनीतियों B1, B2, ...Bm से। परिणामस्वरूप, पहला खिलाड़ी aij मान जीतता है, और दूसरा खिलाड़ी यह मान खो देता है। संख्याओं aij से, हम एक मैट्रिक्स बनाते हैं   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   । . . .  am1 am2 · · amn मैट्रिक्स A = (aij), i = 1, m, j = 1, n को पेऑफ मैट्रिक्स या m × n गेम मैट्रिक्स कहा जाता है। इस मैट्रिक्स में, पंक्तियाँ हमेशा जीतने वाले (अधिकतम करने वाले) खिलाड़ी A की रणनीतियों के लिए होती हैं, यानी वह खिलाड़ी जो अपनी जीत को अधिकतम करने का प्रयास करता है। हारने वाले खिलाड़ी बी की रणनीतियों के लिए कॉलम आवंटित किए जाते हैं, यानी वह खिलाड़ी जो दक्षता मानदंड को कम करने का प्रयास करता है। किसी खेल का सामान्यीकरण एक स्थितिगत खेल को मैट्रिक्स खेल में बदलने की प्रक्रिया है संघर्ष की स्थिति जिसमें प्रतिद्वंद्वी इस स्थिति के विकास के प्रत्येक चरण में कार्रवाई के संभावित तरीकों की एक सीमित संख्या में से क्रमिक रूप से एक विकल्प (चाल) करते हैं। खेल का समाधान दोनों खिलाड़ियों की इष्टतम रणनीतियों का पता लगाना और खेल की कीमत निर्धारित करना है। खेल की कीमत खिलाड़ियों का अपेक्षित लाभ (हानि) है। खेल का समाधान या तो शुद्ध रणनीतियों में पाया जा सकता है - जब खिलाड़ी को एक ही रणनीति का पालन करना होगा, या मिश्रित में, जब खिलाड़ी को कुछ संभावनाओं के साथ दो या अधिक शुद्ध रणनीतियों का उपयोग करना होगा। इस मामले में उत्तरार्द्ध को सक्रिय कहा जाता है। 5 एक खिलाड़ी की मिश्रित रणनीति एक वेक्टर है, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की आवृत्ति को दर्शाता है। खेल की अधिकतम या कम कीमत - संख्या α = अधिकतम न्यूनतम aij i j अधिकतम रणनीति (लाइन) - वह रणनीति जिसे खिलाड़ी ने अपनी न्यूनतम जीत को अधिकतम करने के लिए चुना है। जाहिर है, सबसे सतर्क मैक्सिमम रणनीति चुनते समय, खिलाड़ी ए खुद को (प्रतिद्वंद्वी के व्यवहार की परवाह किए बिना) कम से कम α की गारंटीकृत अदायगी प्रदान करता है। खेल की अधिकतम या ऊपरी कीमत - संख्या β = न्यूनतम अधिकतम aij j i मिनिमैक्स रणनीति (कॉलम) - वह रणनीति जिसे खिलाड़ी ने अपने अधिकतम नुकसान को कम करने के लिए चुना है। जाहिर है, सबसे सतर्क मिनिमैक्स रणनीति चुनते समय, खिलाड़ी बी, किसी भी परिस्थिति में, खिलाड़ी ए को β से अधिक जीतने की अनुमति नहीं देता है। गेम की निचली कीमत हमेशा गेम की ऊपरी कीमत से अधिक नहीं होती है α = अधिकतम न्यूनतम aij 6 मिनट अधिकतम aij = β i j j i प्रमेय 1 (मैट्रिक्स गेम के सिद्धांत का मुख्य प्रमेय)। प्रत्येक परिमित खेल में कम से कम एक समाधान होता है, संभवतः मिश्रित रणनीतियों के दायरे में। 6 2. सैडल पॉइंट वाले खेल। शुद्ध रणनीतियों में समाधान सैडल पॉइंट वाला गेम एक ऐसा गेम है जिसके लिए α = अधिकतम न्यूनतम aij = न्यूनतम अधिकतम aij = β i j j i सैडल पॉइंट वाले गेम के लिए, समाधान ढूंढने में मैक्सिमम और मिनिमैक्स रणनीतियों को चुनना शामिल है जो इष्टतम हैं।, शुद्ध खेल की लागत - खेल की निचली और ऊपरी कीमतों का कुल मूल्य α=β=ν 2.1. उदाहरण उदाहरण 1 मैट्रिक्स द्वारा दी गई खेल की शुद्ध रणनीतियों में समाधान खोजें   8 4 7 ए= 6 5 9  7 7 8 समाधान: खेल की ऊपरी और निचली कीमत निर्धारित करें। ऐसा करने के लिए, हम aij की न्यूनतम संख्या ज्ञात करते हैं मैं-वीं पंक्ति αi = न्यूनतम aij j और jth कॉलम में अधिकतम संख्या aij βj = अधिकतम aij i हम एक अतिरिक्त कॉलम के रूप में दाईं ओर भुगतान मैट्रिक्स के आगे संख्या αi (पंक्ति न्यूनतम) लिखते हैं। हम मैट्रिक्स के नीचे संख्याओं βi (कॉलम मैक्सिमा) को एक अतिरिक्त रेखा के रूप में लिखते हैं: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 संख्याओं की अधिकतम संख्या ज्ञात करें αi α = अधिकतम αi = 7 i और संख्याओं का न्यूनतम βj β = न्यूनतम βj = 7 j α = β - खेल में एक सैडल पॉइंट होता है। खिलाड़ी के लिए इष्टतम रणनीति रणनीति A3 है, और खिलाड़ी B के लिए रणनीति B2 है, शुद्ध खेल मूल्य ν = 7 उदाहरण 2 भुगतान मैट्रिक्स दिया गया है:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 शुद्ध रणनीतियों में खेल का समाधान खोजें। समाधान: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. गेम में छह सैडल पॉइंट हैं। इष्टतम रणनीतियाँ होंगी: A1 और B3 या B4 A3 और B3 या B4 A4 और B3 या B4 8 3. मिश्रित रणनीतियों में खेल का समाधान जब α = β। ऐसे मामले में जब, अपनी रणनीति चुनते समय, दोनों खिलाड़ियों को दूसरे की पसंद के बारे में कोई जानकारी नहीं होती है, खेल में मिश्रित रणनीतियों में समाधान होता है। SA = (p1, p2, ..., pm) - खिलाड़ी A की मिश्रित रणनीति, जिसमें रणनीतियों A1, A2, ..., Am को संभावनाओं के साथ लागू किया जाता है ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - खिलाड़ी B की मिश्रित रणनीति, जिसमें रणनीतियों B1, B2, ..., Bm को संभावनाओं के साथ लागू किया जाता है ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 यदि: SA∗ खिलाड़ी A की इष्टतम रणनीति है, SB∗ खिलाड़ी B की इष्टतम रणनीति है, तो खेल की लागत है ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 निम्नलिखित प्रमेय इस प्रश्न का उत्तर देता है कि खेल 2 × 2, 2 × n, m × का समाधान कैसे खोजा जाए 2 प्रमेय 2 (खेल 2 × 2, 2 × एन, एम × 2 के लिए समाधान कैसे खोजें)। यदि खिलाड़ियों में से कोई एक इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत ν के बराबर होता है, इस संभावना की परवाह किए बिना कि दूसरा खिलाड़ी इष्टतम रणनीति (शुद्ध रणनीतियों सहित) में शामिल रणनीतियों का उपयोग करेगा। 9 3.1. गेम 2 × 2 मैट्रिक्स के साथ 2 × 2 गेम पर विचार करें: () ए11 ए21 ए21 ए22 मान लें कि गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है। आइए इष्टतम रणनीतियाँ SA∗ और SB∗ खोजें। सबसे पहले, हम रणनीति SA∗ = (p∗1 , p∗2) को परिभाषित करते हैं। प्रमेय के अनुसार, यदि पार्टी ए रणनीति ν का पालन करती है, तो पार्टी बी की कार्रवाई की परवाह किए बिना, भुगतान ν खेलने की लागत के बराबर रहेगा। नतीजतन, यदि पक्ष A इष्टतम रणनीति SA∗ = (p∗1 , p∗2) का पालन करता है, तो पक्ष B अपने भुगतान को बदले बिना अपनी किसी भी रणनीति को लागू कर सकता है। फिर, जब खिलाड़ी B शुद्ध रणनीति B1 या B2 का उपयोग करता है, तो खिलाड़ी को खेल की लागत के बराबर औसत भुगतान प्राप्त होगा: a11 p∗1 + a21 p∗2 = ν ← रणनीति B1 a12 p∗1 + a22 p∗ के लिए 2 = ν ← रणनीति बी2 के लिए ध्यान दें कि p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 गेम की कीमत: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 खिलाड़ी B की इष्टतम रणनीति इसी प्रकार पाई जाती है: SB∗ = (q1∗ , q2∗)। इस बात को ध्यान में रखते हुए कि q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. उदाहरण उदाहरण 3 मैट्रिक्स के साथ खेल का समाधान खोजें () −1 1 ए= 1 −1 10 समाधान: खेल में कोई सैडल पॉइंट नहीं है, क्योंकि α= -1, β = 1, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = p∗2 = 0.5 और q1∗ = q2∗ = 0.5, ν = 0 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) ) उदाहरण 4 मैट्रिक्स के साथ गेम का समाधान ढूंढें () 2 5 ए = 6 4 समाधान: गेम में कोई सैडल पॉइंट नहीं है, क्योंकि α= 4, β = 5, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = 0.4, p∗2 = 0.6 और q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.4, 0.6) SB∗ = ( 0.2, 0.8) 11 3.1.2. ज्यामितीय व्याख्या 2 × 2 गेम को एक सरल ज्यामितीय व्याख्या दी जा सकती है। आइए हम भुज अक्ष का एक खंड लें, जिसके प्रत्येक बिंदु को हम किसी मिश्रित रणनीति S = (p1, p2) = (p1, 1 − p1) से जोड़ते हैं और रणनीति A1 की संभावना p1 इससे दूरी के बराबर होगी अनुभाग के दाएँ छोर पर बिंदु SA, और प्रायिकता p2, रणनीति A2 - बाएँ छोर की दूरी। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ विशेष रूप से, अनुभाग का बायां छोर (भुजा = 0 वाला बिंदु) मेल खाता है रणनीति A1 के लिए, खंड का दाहिना छोर (x = 1) - रणनीति A2 खंड के अंत में, x-अक्ष के दो लंबवत बहाल किए जाते हैं: अक्ष I - I - रणनीति A1 के लिए भुगतान स्थगित कर दिया जाता है II - II - रणनीति A2 के लिए भुगतान स्थगित कर दिया गया है, खिलाड़ी B को रणनीति B1 लागू करने दें; यह अक्षों I - I और II - II पर क्रमशः a11 और a21 कोटि वाले बिंदु देता है। हम इन बिंदुओं से होकर एक सीधी रेखा B1 - B1' खींचते हैं। किसी भी मिश्रित रणनीति SA = (p1, p2) के लिए, खिलाड़ी का भुगतान सीधी रेखा B1 - B1' पर बिंदु N द्वारा निर्धारित किया जाता है, जो खंड को p2: p1 के अनुपात में विभाजित करने वाले x-अक्ष पर बिंदु SA के अनुरूप होता है। जाहिर है, सीधी रेखा B2 - B2', जो रणनीति B2 के लिए भुगतान निर्धारित करती है, बिल्कुल उसी तरह से बनाई जा सकती है। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ इष्टतम रणनीति SA∗ खोजना आवश्यक है, अर्थात। जैसे कि खिलाड़ी ए का न्यूनतम भुगतान (खिलाड़ी बी द्वारा उसके लिए सबसे खराब व्यवहार दिया गया) अधिकतम में बदल जाएगा। ऐसा करने के लिए, रणनीतियों बी1, बी2, यानी के लिए खिलाड़ी ए के भुगतान के लिए निचली सीमा का निर्माण करें। टूटी हुई रेखा B1 N B2′ ;. इस सीमा पर खिलाड़ी ए की किसी भी मिश्रित रणनीति के लिए न्यूनतम भुगतान, बिंदु एन होगा, जिस पर यह भुगतान अधिकतम तक पहुंचता है और खेल का निर्णय और कीमत निर्धारित करता है। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P बिंदु N की कोटि खेल ν की लागत से अधिक कुछ नहीं है, इसका भुज ∗2 के बराबर है, और खंड के दाहिने छोर की दूरी ∗1 के बराबर है, अर्थात। बिंदु SA∗ से खंड के अंत तक की दूरी खिलाड़ी A की इष्टतम मिश्रित रणनीति की रणनीतियों A2 और A1 की संभावनाओं ∗2 और ∗1 के बराबर है। इस मामले में, खेल का समाधान किसके द्वारा निर्धारित किया गया था? रणनीतियों B1 और B2 का प्रतिच्छेदन बिंदु। नीचे एक मामला है जहां इष्टतम रणनीतिखिलाड़ी की रणनीति शुद्ध A2 है। यहां रणनीति A2 (किसी भी शत्रु रणनीति के लिए) रणनीति A1, 13 .y .y .I .I I .I I. I .B2′ से अधिक लाभदायक है। 1′ बी .बी1′ बी . 2 .बी2′ बी . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .मैं . ।एक्स। 2∗ पी . ए∗ एस = ए2 . 2∗ पी . A∗ S = A2 दाईं ओर दिखाया गया वह मामला है जब खिलाड़ी B के पास स्पष्ट रूप से लाभहीन रणनीति है। ज्यामितीय व्याख्या से खेल की कम कीमत α और ऊपरी कीमत β .y .I .I I .B2 की कल्पना करना भी संभव हो जाता है। .B1′ .N .B1 .B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P उसी ग्राफ़ पर, हम खिलाड़ी B की इष्टतम रणनीतियों की ज्यामितीय व्याख्या भी दे सकते हैं। यह सत्यापित करना आसान है कि इष्टतम मिश्रित रणनीति SB∗ = (q1∗ , q2∗) की रणनीति B1 का हिस्सा q1∗ खंड KB2 की लंबाई और खंड KB1 की लंबाई के योग के अनुपात के बराबर है। और I - I अक्ष पर KB2: .y .I .I I .B2 .B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2। ए∗ एस . 1∗ P 14 KB2 q1∗ = KB2 + KB1 या LB2′ q1∗ = LB2′ + LB1′ इष्टतम रणनीति SB∗ = (q1∗ , q2∗) दूसरे तरीके से पाई जा सकती है, यदि हम खिलाड़ियों B और B की अदला-बदली करते हैं, और जीत की निचली सीमा के अधिकतम के बजाय, ऊपरी सीमा के न्यूनतम पर विचार करें। .य .मैं .मैं मैं .ए2 .ए′1 .एन .ए1 .ए′2 .मैं मैं .मैं . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n और m × 2 गेम 2 × n और m × 2 गेम का समाधान निम्नलिखित प्रमेय पर आधारित है। प्रमेय 3. किसी के लिए परम खेल m × n एक ऐसा समाधान है जिसमें प्रत्येक पक्ष की सक्रिय रणनीतियों की संख्या m और n की सबसे छोटी संख्या से अधिक नहीं होती है। इस प्रमेय के अनुसार, 2 × n गेम में हमेशा एक समाधान होता है जिसमें प्रत्येक खिलाड़ी के पास अधिकतम दो सक्रिय रणनीतियाँ होती हैं। एक बार जब आपको ये रणनीतियाँ मिल जाती हैं, तो 2×n गेम 2×2 गेम में बदल जाता है, जिसे प्राथमिक तरीके से हल किया जा सकता है। सक्रिय रणनीतियों को ढूँढना ग्राफ़िक रूप से किया जा सकता है: 1) एक ग्राफ़िकल व्याख्या का निर्माण किया जाता है; 2) जीत की निचली सीमा निर्धारित की जाती है; 3) दूसरे खिलाड़ी की दो रणनीतियों को भुगतान की निचली सीमा पर पहचाना जाता है, जो अधिकतम कोटि वाले बिंदु पर प्रतिच्छेद करने वाली दो रेखाओं के अनुरूप होती हैं (यदि इस बिंदु पर दो से अधिक रेखाएं प्रतिच्छेद करती हैं, तो कोई भी जोड़ी ली जाती है) - ये रणनीतियाँ खिलाड़ी बी की सक्रिय रणनीतियों का प्रतिनिधित्व करते हैं। इस प्रकार, गेम 2 × एन को गेम 2 × 2 में घटा दिया जाता है। गेम एम × 2 को भी हल किया जा सकता है, इस अंतर के साथ कि निचला नहीं, बल्कि भुगतान की ऊपरी सीमा है निर्मित, और उस पर अधिकतम नहीं, बल्कि न्यूनतम मांगा जाता है। उदाहरण 5 खेल का समाधान खोजें () 7 9 8 ए= 10 6 9 समाधान: ज्यामितीय विधि का उपयोग करके, हम सक्रिय रणनीतियों का चयन करते हैं। सीधी रेखाएँ B1 - B1', B2 - B2' और B3 - B3' रणनीतियाँ B1, B2, B3 के अनुरूप हैं। टूटी हुई रेखा B1 N B2 खिलाड़ी की जीत की निचली सीमा है। गेम का एक समाधान है S∗A = (23, 31); एस∗बी = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ बी बी . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . ।एक्स। 2∗ पी . ए∗ एस . 1∗ पी 17 इंडेक्स गेम, 2 चाल, 3 2 × 2, 10 व्यक्तिगत, 3 2 × 2, 9 यादृच्छिक, 3 ज्यामिति, 12 नेट गेम मूल्य, 7 उदाहरण, 10 2 × एन, 9, 16 मीटर × 2, 9 , 16 अनंत, 4 सामान्य रूप में, 5 परिमित, 4 बहु-चाल, 4 एक-चाल, 4 मैट्रिक्स, 5 युग्मित, 2 शून्य-योग, 2 विरोधी, 2 गैर-विरोधी, 2 समाधान, 5 मिश्रित रणनीतियों में, 5 , शुद्ध रणनीतियों में 9, सैडल प्वाइंट के साथ 5, 7 मूल्य, 5 ऊपरी, 6 निचला, 6 शुद्ध, 7 मैक्सिमम, 6 गेम मैट्रिक्स, 5 पेऑफ, 5 मिनिमैक्स, 6 गेम सामान्यीकरण, 5 रणनीति, 4 मैक्सिमम, 6 मिनिमैक्स, 6 इष्टतम, 4 मिश्रित, 5 खेल सिद्धांत, 2 18

लोकप्रिय अमेरिकी ब्लॉग क्रैक्ड से।

गेम थ्योरी सबसे अच्छा कदम उठाने के तरीकों का अध्ययन करने के बारे में है और परिणामस्वरूप, अन्य खिलाड़ियों से कुछ काटकर जितना संभव हो उतना जीतने वाली पाई प्राप्त करें। यह आपको कई कारकों का विश्लेषण करना और तार्किक रूप से संतुलित निष्कर्ष निकालना सिखाता है। मेरा मानना ​​है कि इसका अध्ययन अंकों के बाद और वर्णमाला से पहले किया जाना चाहिए। सिर्फ इसलिए कि बहुत से लोग अंतर्ज्ञान, गुप्त भविष्यवाणियों, सितारों के स्थान और इसी तरह के आधार पर महत्वपूर्ण निर्णय लेते हैं। मैंने गेम थ्योरी का गहन अध्ययन किया है, और अब मैं आपको इसकी मूल बातों के बारे में बताना चाहता हूं। शायद यह आपके जीवन में कुछ सामान्य ज्ञान जोड़ देगा।

1. कैदी की दुविधा

भागने के लिए चोरी की कार का उचित उपयोग करने में विफल रहने के बाद बर्टो और रॉबर्ट को बैंक डकैती के आरोप में गिरफ्तार किया गया था। पुलिस यह साबित नहीं कर सकती कि उन्होंने ही बैंक लूटा था, लेकिन उन्होंने उन्हें चोरी की कार में रंगे हाथ पकड़ लिया था। उन्हें अलग-अलग कमरों में ले जाया गया और प्रत्येक को एक सौदे की पेशकश की गई: एक साथी को सौंपने और उसे 10 साल के लिए जेल भेजने और खुद रिहा होने का। परन्तु यदि वे दोनों एक दूसरे के साथ विश्वासघात करें, तो प्रत्येक को सात वर्ष की सज़ा मिलेगी। अगर किसी ने कुछ नहीं कहा तो दोनों को सिर्फ कार चोरी के आरोप में 2 साल के लिए जेल जाना पड़ेगा।

इससे पता चलता है कि यदि बर्टो चुप रहता है, लेकिन रॉबर्ट उसे अंदर कर देता है, तो बर्टो 10 साल के लिए जेल चला जाता है, और रॉबर्ट मुक्त हो जाता है।

प्रत्येक कैदी एक खिलाड़ी है, और प्रत्येक के लाभ को एक "सूत्र" के रूप में व्यक्त किया जा सकता है (उन दोनों को क्या मिलेगा, दूसरे को क्या मिलेगा)। उदाहरण के लिए, यदि मैं तुम्हें मारता हूं, तो मेरी जीत का पैटर्न इस तरह दिखेगा (मुझे कड़ी जीत मिलती है, तुम्हें बहुत दर्द होता है)। चूँकि प्रत्येक कैदी के पास दो विकल्प होते हैं, हम परिणामों को एक तालिका में प्रस्तुत कर सकते हैं।

व्यावहारिक अनुप्रयोग: समाजोपथों की पहचान करना

यहां हम गेम थ्योरी का मुख्य अनुप्रयोग देखते हैं: उन समाजोपथों की पहचान करना जो केवल अपने बारे में सोचते हैं।सच्चा गेम सिद्धांत एक शक्तिशाली विश्लेषणात्मक उपकरण है, और शौकियापन अक्सर एक लाल झंडे के रूप में कार्य करता है जो किसी ऐसे व्यक्ति को चिह्नित करता है जिसके पास सम्मान की कोई भावना नहीं है। जो लोग सहज गणना करते हैं उनका मानना ​​है कि कुछ बदसूरत करना बेहतर है क्योंकि इसके परिणामस्वरूप कम जेल की सजा होगी चाहे दूसरा खिलाड़ी कुछ भी करे। तकनीकी रूप से यह सही है, लेकिन केवल तभी जब आप अदूरदर्शी व्यक्ति हों और संख्याएँ अधिक बता रहे हों मानव जीवन. यही कारण है कि गेम थ्योरी वित्त में इतनी लोकप्रिय है।

कैदी की दुविधा के साथ असली समस्या यह है कि वह डेटा को नजरअंदाज कर देता है।उदाहरण के लिए, यह आपके दोस्तों, रिश्तेदारों या यहां तक ​​कि उस व्यक्ति के लेनदारों से मिलने की संभावना पर विचार नहीं करता है जिसे आपने 10 साल के लिए जेल भेजा था।

सबसे बुरी बात यह है कि कैदी की दुविधा में शामिल हर कोई ऐसा व्यवहार करता है मानो उसने इसके बारे में कभी सुना ही न हो।

और सबसे अच्छा कदम है चुप रहना और दो साल बाद किसी अच्छे दोस्त के साथ मिलकर उसी पैसे का इस्तेमाल करना।

2. प्रमुख रणनीति

यह एक ऐसी स्थिति है जिसमें आपके प्रतिद्वंद्वी के कार्यों की परवाह किए बिना आपके कार्य सबसे अधिक प्रतिफल देते हैं।चाहे कुछ भी हो, आपने सब कुछ ठीक किया। यही कारण है कि कैदी की दुविधा वाले कई लोग मानते हैं कि विश्वासघात से "सर्वोत्तम" परिणाम मिलता है, चाहे दूसरा व्यक्ति कुछ भी करे, और इस पद्धति में निहित वास्तविकता की अज्ञानता इसे बहुत आसान बनाती है।

हमारे द्वारा खेले जाने वाले अधिकांश खेलों में सख्ती से प्रभावी रणनीतियाँ नहीं होती हैं क्योंकि अन्यथा वे भयानक होंगे। सोचिए अगर आप हमेशा एक ही काम करते। रॉक-पेपर-कैंची के खेल में कोई प्रभावी रणनीति नहीं है। लेकिन अगर आप ऐसे व्यक्ति के साथ खेल रहे थे जिसके पास ओवन मिट्स थे और वह केवल पत्थर या कागज दिखा सकता था, तो आपके पास एक प्रमुख रणनीति होगी: कागज। आपका पेपर उसके पत्थर को लपेट देगा या परिणाम ड्रा में होगा, और आप हार नहीं सकते क्योंकि आपका प्रतिद्वंद्वी कैंची नहीं दिखा सकता है। अब जब आपके पास एक प्रभावी रणनीति है, तो आप कुछ अलग करने की कोशिश करने में मूर्ख होंगे।

3. लिंगों की लड़ाई

खेल तब अधिक दिलचस्प होते हैं जब उनमें सख्ती से प्रभावी रणनीति न हो। उदाहरण के लिए, लिंगों की लड़ाई. अंजलि और बोरिसलाव डेट पर जाते हैं, लेकिन बैले और बॉक्सिंग के बीच चयन नहीं कर पाते। अंजलि को मुक्केबाजी पसंद है क्योंकि उसे दर्शकों की चीखती भीड़ की खुशी के लिए खून बहते हुए देखना अच्छा लगता है, जो सोचते हैं कि वे सिर्फ इसलिए सभ्य हैं क्योंकि उन्होंने किसी का सिर फोड़ने के लिए भुगतान किया है।

बोरिसलाव बैले देखना चाहता है क्योंकि वह समझता है कि बैलेरिना किस दौर से गुजरती हैं बड़ी राशिचोटें और सबसे कठिन प्रशिक्षण, यह जानते हुए कि एक चोट सब कुछ खत्म कर सकती है। बैले नर्तक पृथ्वी पर सबसे महान एथलीट हैं। एक बैलेरीना आपके सिर पर लात मार सकती है, लेकिन वह ऐसा कभी नहीं करेगी, क्योंकि उसके पैर की कीमत आपके चेहरे से कहीं अधिक है।

उनमें से प्रत्येक अपने पसंदीदा कार्यक्रम में जाना चाहता है, लेकिन वे अकेले इसका आनंद नहीं लेना चाहते हैं, इसलिए हमें उनकी जीत के लिए योजना मिलती है: सबसे बड़ा मूल्य वह करना है जो उन्हें पसंद है, सबसे छोटा मूल्य- बस किसी अन्य व्यक्ति के साथ रहना, और शून्य - अकेले रहना।

कुछ लोग जिद्दी स्वभाव का सुझाव देते हैं: यदि आप वही करते हैं जो आप चाहते हैं, चाहे कुछ भी हो, दूसरे व्यक्ति को आपकी पसंद के अनुरूप होना होगा या सब कुछ खोना होगा। जैसा कि मैंने पहले ही कहा, सरलीकृत खेल सिद्धांत मूर्खों की पहचान करने में बहुत अच्छा है।

व्यावहारिक अनुप्रयोग: तेज़ कोनों से बचें

बेशक, इस रणनीति की अपनी महत्वपूर्ण कमियां भी हैं। सबसे पहले, यदि आप अपनी डेटिंग को "लिंगों की लड़ाई" के रूप में मानते हैं, तो यह काम नहीं करेगा। ब्रेकअप करें ताकि आप में से प्रत्येक को कोई ऐसा व्यक्ति मिल सके जिसे वे पसंद करते हों। और दूसरी समस्या यह है कि इस स्थिति में प्रतिभागी स्वयं को लेकर इतने अनिश्चित होते हैं कि वे ऐसा नहीं कर पाते हैं।

हर किसी के लिए वास्तव में जीतने की रणनीति वही करना है जो वे चाहते हैं।और उसके बाद, या अगले दिन, जब वे खाली हों, एक साथ किसी कैफे में जाएँ। या बॉक्सिंग और बैले के बीच तब तक बदलाव करें जब तक कि मनोरंजन जगत में क्रांति न आ जाए और बॉक्सिंग बैले का आविष्कार न हो जाए।

4. नैश संतुलन

नैश संतुलन चालों का एक सेट है जहां तथ्य के बाद कोई भी कुछ अलग नहीं करना चाहता है।और यदि हम इसे कार्यान्वित कर सकते हैं, तो गेम थ्योरी ग्रह पर संपूर्ण दार्शनिक, धार्मिक और वित्तीय प्रणाली को प्रतिस्थापित कर देगी, क्योंकि "टूट न जाने की इच्छा" मानवता के लिए आग से भी अधिक शक्तिशाली प्रेरक शक्ति बन गई है।

आइए जल्दी से $100 बाँट लें। आप और मैं तय करते हैं कि हमें सैकड़ों में से कितने की आवश्यकता है और साथ ही मात्रा की घोषणा भी करते हैं। यदि हमारा कुल योग सौ से कम है, तो हर किसी को वह मिलता है जो वे चाहते हैं। यदि कुल सौ से अधिक है, तो जिसने सबसे कम राशि मांगी उसे वह राशि मिल जाती है जो वह चाहता था, और लालची व्यक्ति को वह मिल जाता है जो बच जाता है। यदि हम समान राशि मांगते हैं, तो प्रत्येक को $50 मिलते हैं। आप कितना पूछेंगे? आप पैसे का बंटवारा कैसे करेंगे? केवल एक ही विजयी चाल है।

$51 की आवश्यकता होने पर आपको अधिकतम राशि मिलेगी, चाहे आपका प्रतिद्वंद्वी कुछ भी चुने। यदि वह और अधिक मांगता है, तो आपको $51 प्राप्त होंगे। यदि वह $50 या $51 मांगता है, तो आपको $50 प्राप्त होंगे। और यदि वह $50 से कम मांगता है, तो आपको $51 प्राप्त होंगे। किसी भी तरह से, ऐसा कोई अन्य विकल्प नहीं है जो आपको इससे अधिक पैसा दिला सके। नैश संतुलन - एक ऐसी स्थिति जिसमें हम दोनों $51 चुनते हैं।

व्यावहारिक अनुप्रयोग: पहले सोचें

यह गेम थ्योरी का संपूर्ण बिंदु है। आपको जीतना नहीं है, अन्य खिलाड़ियों को नुकसान तो बिल्कुल नहीं पहुंचाना है, लेकिन आपको अपने लिए सर्वश्रेष्ठ कदम उठाना है, भले ही आपके आस-पास के लोग आपके लिए क्या सोच रहे हों। और यह और भी अच्छा है अगर यह कदम अन्य खिलाड़ियों के लिए फायदेमंद हो। यह उस प्रकार का गणित है जो समाज को बदल सकता है।

इस विचार का एक दिलचस्प बदलाव शराब पीना है, जिसे समय पर निर्भर नैश संतुलन कहा जा सकता है। जब आप पर्याप्त मात्रा में शराब पीते हैं, तो आप दूसरे लोगों के कार्यों की परवाह नहीं करते, चाहे वे कुछ भी करें, लेकिन अगले दिन आपको वास्तव में कुछ अलग न कर पाने का पछतावा होता है।

5. टॉस खेल

टॉस खिलाड़ी 1 और खिलाड़ी 2 के बीच खेला जाता है। प्रत्येक खिलाड़ी एक साथ हेड या टेल चुनता है। यदि वे सही अनुमान लगाते हैं, तो खिलाड़ी 1 को खिलाड़ी 2 का पैसा मिलता है, यदि नहीं, तो खिलाड़ी 2 को खिलाड़ी 1 का सिक्का मिलता है।

विजेता मैट्रिक्स सरल है...

...इष्टतम रणनीति: पूरी तरह से यादृच्छिक रूप से खेलें।यह आपके विचार से अधिक कठिन है क्योंकि चुनाव पूरी तरह से यादृच्छिक होना चाहिए। यदि आपके पास चित या पट की प्राथमिकता है, तो आपका प्रतिद्वंद्वी इसका उपयोग आपके पैसे लेने के लिए कर सकता है।

निःसंदेह, यहां वास्तविक समस्या यह है कि यह बहुत बेहतर होगा यदि वे एक-दूसरे पर एक पैसा भी फेंकें। परिणामस्वरूप, उनका मुनाफा समान होगा, और परिणामी आघात इन दुर्भाग्यपूर्ण लोगों को भयानक बोरियत के अलावा कुछ और महसूस करने में मदद कर सकता है। आख़िर ये सबसे ख़राब खेलसदैव विद्यमान. और यह पेनल्टी शूटआउट के लिए आदर्श मॉडल है।

व्यावहारिक अनुप्रयोग: जुर्माना

फ़ुटबॉल, हॉकी और कई अन्य खेलों में, अतिरिक्त समय पेनल्टी शूटआउट है। और वे अधिक दिलचस्प होंगे यदि वे इस पर आधारित हों कि पूर्ण रूप में खिलाड़ी कितनी बार कार्टव्हील कर सकते हैं, क्योंकि यह कम से कम उनकी शारीरिक क्षमता का संकेतक होगा और देखने में मजेदार होगा। गोलकीपर किसी गेंद या पक की गति को उसके आरंभ में ही स्पष्ट रूप से निर्धारित नहीं कर सकते, क्योंकि, दुर्भाग्य से, रोबोट अभी भी हमारी खेल प्रतियोगिताओं में भाग नहीं लेते हैं। गोलकीपर को बायीं या दायीं दिशा में से किसी एक को चुनना होगा और आशा करनी होगी कि उसकी पसंद गोल मारने वाले प्रतिद्वंद्वी की पसंद से मेल खाती हो। इसमें सिक्कों के खेल के साथ कुछ समानता है।

हालाँकि, ध्यान दें कि यह हेड और टेल के खेल की समानता का एक आदर्श उदाहरण नहीं है, क्योंकि सही दिशा के साथ भी, गोलकीपर गेंद को नहीं पकड़ सकता है, और हमलावर गोल को हिट नहीं कर सकता है।

तो गेम थ्योरी के अनुसार हमारा निष्कर्ष क्या है? बॉल गेम को "मल्टी-बॉल" तरीके से समाप्त किया जाना चाहिए, जहां हर मिनट एक-पर-एक खिलाड़ियों को एक अतिरिक्त बॉल/पक दिया जाता है जब तक कि एक पक्ष एक निश्चित परिणाम प्राप्त नहीं कर लेता, जो खिलाड़ियों के वास्तविक कौशल का संकेत है, और कोई शानदार आकस्मिक संयोग नहीं.

दिन के अंत में, गेम को अधिक स्मार्ट बनाने के लिए गेम थ्योरी का उपयोग किया जाना चाहिए। यानी यह बेहतर है.