गेम थ्योरी मैट्रिक्स 4 2 समाधान। हमारी सेवा का उपयोग करके मिश्रित रणनीतियों में गेम थ्योरी समस्या को हल करने का एक उदाहरण

गेम थ्योरी मैट्रिक्स 4 2 समाधान। हमारी सेवा का उपयोग करके मिश्रित रणनीतियों में गेम थ्योरी समस्या को हल करने का एक उदाहरण

16.07.2019 प्रलेखन

गेम थ्योरी परिस्थितियों में इष्टतम व्यवहार का एक गणितीय सिद्धांत है संघर्ष की स्थिति. इसके अध्ययन का विषय संघर्ष का औपचारिक मॉडल या तथाकथित "गेम" है। गेम थ्योरी का मुख्य कार्य प्रतिभागियों की इष्टतम व्यवहार रणनीतियों को निर्धारित करना है। खेल सिद्धांत के अनुप्रयोग का क्षेत्र मुख्य रूप से लक्ष्यों में अंतर और संघर्ष में प्रतिभागियों के बीच निर्णय की एक निश्चित स्वतंत्रता की उपस्थिति से उत्पन्न प्रबंधन के जटिल व्यवहार संबंधी पहलुओं पर केंद्रित है।

एक संघर्ष की स्थिति या "संघर्ष" को एक प्रणाली के तत्वों के बीच कई लक्ष्यों की उपस्थिति और इन लक्ष्यों को प्राप्त करने की दिशा में हितों और कार्रवाई के तरीकों या रणनीतियों में संबंधित अंतर के रूप में परिभाषित किया गया है। संघर्षों को विरोधी में विभाजित किया जाता है, जब दो व्यक्ति विरोधी हितों का पीछा करते हैं, और गैर-विरोधी में, जब हित अलग-अलग होते हुए भी विपरीत नहीं होते हैं। बाद के मामले में, संघर्ष दो व्यक्तियों के बीच संघर्ष के रूप में नहीं, बल्कि सिस्टम में लक्ष्यों की असंगति या संसाधनों के उपयोग की भिन्न (विपरीत) प्रकृति के रूप में, अनिश्चित कारकों की भागीदारी के साथ व्यक्त किए जाते हैं। प्रकृति” खेल में, प्रतिस्पर्धा वाली स्थितियों आदि में।

संचालन अनुसंधान समस्याओं में, जैसा कि ऊपर बताया गया है, हम हमेशा इष्टतम समाधान की तलाश में रहते हैं। एक निश्चित लक्ष्य को प्राप्त करने के उद्देश्य से कार्यों के एक सेट के रूप में हमारा "ऑपरेशन" वास्तविक परिस्थितियों के संबंध में कुछ सर्वोत्तम अर्थों में सैद्धांतिक अनुकूलन विधियों के आधार पर किया जाता है और इन स्थितियों के साथ "संघर्ष" के रूप में माना जा सकता है, जो कार्य करते हैं एक शत्रु"। इस सेटिंग में, हम अपनी सफलता भी "दुश्मन" की क्षति की कीमत पर प्राप्त करते हैं।

हालाँकि, ऑपरेशन अनुसंधान केवल उन मामलों में ऐसी समस्याओं को हल करने का कार्य करता है, जहां ऑपरेशन के दौरान "दुश्मन" की कार्रवाई का तरीका नहीं बदलता है और कुछ हद तक हमें ज्ञात होता है। रणनीति का चुनाव आमतौर पर गारंटीकृत परिणाम के सिद्धांत पर आधारित होता है: दुश्मन चाहे जो भी निर्णय ले, हमें कुछ लाभ की गारंटी होनी चाहिए। हालाँकि, ऐसी संघर्ष की स्थिति शोध का विषय नहीं है और इसे एक पृष्ठभूमि के रूप में माना जाता है जिसके विरुद्ध पार्टियों की कार्रवाई होती है। ऑपरेशन अनुसंधान केवल एक पक्ष की स्थिति लेता है।

गणितीय खेल सिद्धांत भी रणनीति की पसंद का अध्ययन करता है, भले ही हम एक वास्तविक प्रतिद्वंद्वी के बारे में बात कर रहे हों या दूसरा पक्ष प्रकृति द्वारा दर्शाया गया हो, लेकिन यहां दोनों पक्ष समान भागीदार के रूप में कार्य करते हैं। गेम थ्योरी उनके टकराव की गतिशीलता में दोनों पक्षों के व्यवहार के उद्देश्यों को ध्यान में रखते हुए, संघर्ष के आंतरिक सार का अध्ययन करती है।

खेल सिद्धांत में माने जाने वाले औपचारिक खेल बहुत विविध हैं। संचालन अनुसंधान के समान, इष्टतम रणनीतियाँ खोजने के लिए विभिन्न तरीके विकसित किए गए हैं। हालाँकि, इस मामले में, विधि और वास्तविक स्थिति के बीच संबंध बहुत करीब है, अनिवार्य रूप से निर्धारण। खेल की अमूर्त योजना, एक ओर, स्थिति के मॉडल के समान है, दूसरी ओर, यह एक या किसी अन्य औपचारिक पद्धति के अनुप्रयोग के लिए सामग्री है।

प्रत्येक खेल तीन मुख्य मुद्दों को संबोधित करता है:

इस खेल में प्रत्येक खिलाड़ी का इष्टतम व्यवहार क्या है?

क्या इष्टतमता की यह समझ साकार हो सकती है? क्या कोई उपयुक्त रणनीतियाँ हैं?

यदि इष्टतम रणनीतियाँ मौजूद हैं, तो हम उन्हें कैसे पा सकते हैं?

तीनों प्रश्नों के सकारात्मक समाधान के परिणामस्वरूप, समस्या को हल करने और संबंधित मॉडल के निर्माण का मार्ग निर्धारित होता है।

गेम थ्योरी एक बहुत ही युवा अनुशासन है और सैद्धांतिक रूप से विकसित तरीकों और मॉडलों का भंडार संचालन अनुसंधान को बौना बना देता है। यह गेम थ्योरी समस्याओं की महत्वपूर्ण जटिलता में भी परिलक्षित होता है। मॉडलों के संपूर्ण ज्ञात परिसर पर विस्तार से विचार करने का अवसर प्राप्त किए बिना, हम उनमें से केवल कुछ सरलतम मॉडलों का ही उल्लेख करेंगे।

1) शून्य-राशि खेल। खिलाड़ियों की कोई भी रणनीति तब परिणाम की ओर ले जाती है जब एक पक्ष का लाभ दूसरे पक्ष के नुकसान के बराबर होता है। भुगतान मैट्रिक्स में सभी सकारात्मक तत्व हैं, और रणनीतियों के सभी संभावित संयोजनों के लिए, प्रत्येक पक्ष को इष्टतम विकल्प की सिफारिश की जा सकती है। इस प्रकार का खेल विरोधी है.

2) गैर-शून्य योग खेल। सामान्य फ़ॉर्मखेल. यदि पार्टियों के बीच कोई संबंध नहीं है और पार्टियां गठबंधन नहीं बना सकती हैं, तो खेल विरोधी है, अन्यथा यह गैर-विरोधी हितों वाला गठबंधन खेल है। ऐसे खेलों का विश्लेषण अधिकांश मामलों में कठिन होता है, विशेषकर के लिए जटिल प्रणालियाँऔर रणनीतियाँ चुनने की सिफ़ारिशें कई कारकों पर निर्भर करती हैं।

एसीएस स्थितियों में एक महत्वपूर्ण प्रकार गठबंधन या सहकारी खेल हैं। इस तरह के खेल में प्रतिभागियों को कुछ संविदात्मक दायित्वों को पूरा करने की आवश्यकता होती है (जीत का हिस्सा भागीदारों को हस्तांतरित करना, जानकारी का आदान-प्रदान करना, आदि)। इससे उस स्थिति में ऐसे गठबंधन की स्थिरता पर सवाल उठता है जब लाभप्रद स्थिति में एक पक्ष समझौते का उल्लंघन करने की कोशिश करता है। इससे संभावित अलगाववादियों को दंडित करने के लिए एक तीसरी नियंत्रण संस्था शुरू करने का विकल्प सामने आता है। इसके लिए ऐसी लागतों की आवश्यकता होती है जो गठबंधन के लाभ को कम कर दें। जाहिर है, खेल बहुत अधिक जटिल हो जाएगा, लेकिन ऐसे कार्यों का व्यावहारिक मूल्य संदेह से परे है।

खेल सिद्धांत - संघर्ष स्थितियों (हितों के टकराव) को हल करने के लिए गणितीय तरीकों का एक सेट। गेम थ्योरी में गेम कहा जाता है संघर्ष की स्थिति का गणितीय मॉडल। खेल सिद्धांत में विशेष रुचि का विषय अनिश्चितता की स्थिति में खेल प्रतिभागियों की निर्णय लेने की रणनीतियों का अध्ययन है। अनिश्चितता इस तथ्य से उत्पन्न होती है कि दो या दो से अधिक पार्टियाँ विरोधी लक्ष्यों का पीछा करती हैं, और प्रत्येक पार्टी की किसी भी कार्रवाई के परिणाम साझेदार की चाल पर निर्भर करते हैं। साथ ही, प्रत्येक पक्ष इष्टतम निर्णय लेने का प्रयास करता है जो निर्धारित लक्ष्यों को अधिकतम सीमा तक साकार करता है।

गेम थ्योरी को अर्थशास्त्र में सबसे अधिक लगातार लागू किया जाता है, जहां संघर्ष की स्थिति उत्पन्न होती है, उदाहरण के लिए, आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंक और ग्राहक के बीच संबंधों में। गेम थ्योरी का अनुप्रयोग राजनीति, समाजशास्त्र, जीव विज्ञान और सैन्य कला में भी पाया जा सकता है।

गेम थ्योरी के इतिहास से

गेम थ्योरी का इतिहास एक स्वतंत्र अनुशासन के रूप में 1944 में शुरुआत हुई, जब जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने "द थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर" पुस्तक प्रकाशित की। हालाँकि गेम थ्योरी के उदाहरण पहले भी सामने आ चुके हैं: मृत पति की संपत्ति को उसकी पत्नियों के बीच बांटने पर बेबीलोनियाई तल्मूड का ग्रंथ, 18वीं सदी में कार्ड गेम, 20वीं सदी की शुरुआत में शतरंज के सिद्धांत का विकास सदी, 1928 वर्ष में उसी जॉन वॉन न्यूमैन के मिनिमैक्स प्रमेय का प्रमाण, जिसके बिना कोई खेल सिद्धांत नहीं होता।

20वीं सदी के 50 के दशक में मेल्विन ड्रेशर और मेरिल फ्लड से रैंड कॉर्पोरेशनकैदी की दुविधा को प्रयोगात्मक रूप से लागू करने वाले पहले व्यक्ति जॉन नैश ने दो-व्यक्ति खेलों में संतुलन की स्थिति पर अपने कार्यों में नैश संतुलन की अवधारणा विकसित की।

रेइनहार्ड साल्टेन ने 1965 में "द ट्रीटमेंट ऑफ ओलिगोपॉली इन गेम थ्योरी ऑन डिमांड" ("स्पीलथियोरेटिस बेहैंडलुंग ईन्स ओलिगोमोडेल्स मिट नचफ्रागेट्राघेइट") पुस्तक प्रकाशित की, जिसके साथ अर्थशास्त्र में गेम थ्योरी के अनुप्रयोग को एक नई प्रेरणा शक्ति मिली। गेम थ्योरी के विकास में एक कदम आगे जॉन मेनार्ड स्मिथ के काम, "इवोल्यूशनरी स्टेबल स्ट्रैटेजी" (1974) से जुड़ा है। कैदी की दुविधा को रॉबर्ट एक्सेलरोड की 1984 की पुस्तक द इवोल्यूशन ऑफ कोऑपरेशन में लोकप्रिय बनाया गया था। 1994 में, जॉन नैश, जॉन हरसैनी और रेनहार्ड सेल्टेन को गेम थ्योरी में उनके योगदान के लिए नोबेल पुरस्कार से सम्मानित किया गया था।

जीवन और व्यवसाय में गेम थ्योरी

आइए हम संघर्ष की स्थिति (हितों के टकराव) के सार पर अधिक विस्तार से ध्यान दें, जैसा कि जीवन और व्यवसाय में विभिन्न स्थितियों के आगे के मॉडलिंग के लिए गेम थ्योरी में समझा जाता है। मान लीजिए कि एक व्यक्ति ऐसी स्थिति में है जो कई संभावित परिणामों में से एक की ओर ले जाता है, और इन परिणामों के संबंध में व्यक्ति की कुछ व्यक्तिगत प्राथमिकताएँ होती हैं। हालाँकि, वह कुछ हद तक उन चरों को नियंत्रित कर सकता है जो परिणाम निर्धारित करते हैं, लेकिन उसके पास उन पर पूर्ण शक्ति नहीं है। कभी-कभी नियंत्रण कई व्यक्तियों के हाथों में होता है, जिनकी, उनकी तरह, संभावित परिणामों के संबंध में कुछ प्राथमिकताएँ होती हैं, लेकिन सामान्य तौर पर इन व्यक्तियों के हित सुसंगत नहीं होते हैं। अन्य मामलों में, अंतिम परिणाम संयोग (जिसे कानूनी विज्ञान में कभी-कभी कहा जाता है) दोनों पर निर्भर हो सकता है प्राकृतिक आपदाएं), और अन्य व्यक्तियों से। गेम थ्योरी ऐसी स्थितियों के अवलोकन को व्यवस्थित करती है और ऐसी स्थितियों में बुद्धिमान कार्यों का मार्गदर्शन करने के लिए सामान्य सिद्धांतों का निर्माण करती है।

कुछ मायनों में, "गेम थ्योरी" नाम दुर्भाग्यपूर्ण है, क्योंकि यह बताता है कि गेम थ्योरी केवल पार्लर गेम में होने वाले सामाजिक रूप से महत्वहीन मुठभेड़ों से संबंधित है, लेकिन फिर भी सिद्धांत का बहुत व्यापक अर्थ है।

निम्नलिखित आर्थिक स्थिति गेम थ्योरी के अनुप्रयोग का अंदाजा दे सकती है। मान लीजिए कि कई उद्यमी हैं, जिनमें से प्रत्येक अधिकतम लाभ प्राप्त करने का प्रयास करता है, जबकि इस लाभ को निर्धारित करने वाले चर पर केवल सीमित शक्ति होती है। एक उद्यमी के पास उन चरों पर कोई शक्ति नहीं होती है जिन्हें दूसरा उद्यमी नियंत्रित करता है, लेकिन जो पहले की आय को बहुत प्रभावित कर सकते हैं। इस स्थिति को एक खेल के रूप में मानने से निम्नलिखित आपत्ति उत्पन्न हो सकती है। गेम मॉडल मानता है कि प्रत्येक उद्यमी क्षेत्र से एक विकल्प चुनता है संभावित चुनावऔर इन एकल विकल्पों से लाभ निर्धारित होता है। जाहिर है, वास्तविकता में ऐसा लगभग नहीं हो सकता है, क्योंकि इस मामले में उद्योग में जटिल प्रबंधन तंत्र की आवश्यकता नहीं होगी। इन निर्णयों में बस कई निर्णय और संशोधन होते हैं जो आर्थिक प्रणाली में अन्य प्रतिभागियों (खिलाड़ियों) द्वारा चुने गए विकल्पों पर निर्भर करते हैं। लेकिन सिद्धांत रूप में कोई यह कल्पना कर सकता है कि कोई प्रशासक प्रत्येक समस्या के उत्पन्न होने पर उसे हल करने के बजाय सभी संभावित आकस्मिकताओं का अनुमान लगाता है और प्रत्येक मामले में की जाने वाली कार्रवाई का विवरण देता है।

परिभाषा के अनुसार, एक सैन्य संघर्ष, हितों का टकराव है जिसमें किसी भी पक्ष का परिणाम निर्धारित करने वाले चर पर पूर्ण नियंत्रण नहीं होता है, जो लड़ाई की एक श्रृंखला द्वारा तय किया जाता है। आप परिणाम को आसानी से जीत या हार मान सकते हैं और उन्हें संख्यात्मक मान 1 और 0 निर्दिष्ट कर सकते हैं।

सबसे सरल संघर्ष स्थितियों में से एक, जिसे गेम थ्योरी में लिखा और हल किया जा सकता है, एक द्वंद्व है, जो क्रमशः दो खिलाड़ियों 1 और 2 के बीच का संघर्ष है। पीऔर क्यूशॉट्स. प्रत्येक खिलाड़ी के लिए एक फ़ंक्शन होता है जो खिलाड़ी के शॉट की संभावना को दर्शाता है मैंएक समय में टीऐसा प्रहार करेगा जो घातक होगा।

परिणामस्वरूप, खेल सिद्धांत हितों के टकराव के एक निश्चित वर्ग के निम्नलिखित सूत्रीकरण पर आता है: वहाँ हैं एनखिलाड़ियों को, और प्रत्येक को सौ विशिष्ट सेटों में से एक विकल्प चुनने की आवश्यकता होती है, और विकल्प चुनते समय, खिलाड़ी को अन्य खिलाड़ियों की पसंद के बारे में कोई जानकारी नहीं होती है। खिलाड़ी के संभावित पसंद क्षेत्र में "हुकुम का इक्का बजाना", "कारों के बजाय टैंक का उत्पादन करना", या अधिक सामान्यतः, एक रणनीति जो सभी संभावित परिस्थितियों में की जाने वाली सभी कार्रवाइयों को परिभाषित करती है, जैसे तत्व शामिल हो सकते हैं। प्रत्येक खिलाड़ी को एक कार्य का सामना करना पड़ता है: उसे क्या विकल्प चुनना चाहिए ताकि परिणाम पर उसका निजी प्रभाव उसे सबसे बड़ी संभावित जीत दिला सके?

खेल सिद्धांत में गणितीय मॉडल और समस्याओं का औपचारिकीकरण

जैसा कि हम पहले ही नोट कर चुके हैं, खेल संघर्ष की स्थिति का एक गणितीय मॉडल है और निम्नलिखित घटकों की आवश्यकता है:

इच्छुक पार्टियाँ;
प्रत्येक पक्ष पर संभावित कार्रवाई;
पार्टियों के हित.

खेल में रुचि रखने वाले पक्षों को खिलाड़ी कहा जाता है , उनमें से प्रत्येक कम से कम दो कार्रवाई कर सकता है (यदि खिलाड़ी के पास अपने निपटान में केवल एक ही कार्रवाई है, तो वह वास्तव में खेल में भाग नहीं लेता है, क्योंकि यह पहले से ज्ञात है कि वह क्या करेगा)। खेल के परिणाम को जीत कहा जाता है .

वास्तविक संघर्ष की स्थिति हमेशा नहीं होती है, लेकिन खेल (गेम थ्योरी की अवधारणा में) हमेशा उसी के अनुसार आगे बढ़ता है निश्चित नियम , जो सटीक रूप से निर्धारित करता है:

खिलाड़ियों के कार्यों के लिए विकल्प;
प्रत्येक खिलाड़ी के पास अपने साथी के व्यवहार के बारे में कितनी जानकारी है;
कार्यों के प्रत्येक सेट से मिलने वाला प्रतिफल।

औपचारिक खेलों के उदाहरणों में फुटबॉल, कार्ड खेल, शतरंज।

लेकिन अर्थशास्त्र में, खिलाड़ी के व्यवहार का एक मॉडल उभरता है, उदाहरण के लिए, जब कई कंपनियां बाजार में अधिक लाभप्रद स्थान लेने का प्रयास करती हैं, तो कई व्यक्ति कुछ अच्छे (संसाधन, वित्त) को आपस में बांटने की कोशिश करते हैं ताकि हर किसी को जितना संभव हो सके उतना मिल सके। . अर्थव्यवस्था में संघर्ष की स्थितियों में खिलाड़ी, जिन्हें एक खेल के रूप में तैयार किया जा सकता है, कंपनियां, बैंक, व्यक्ति और अन्य आर्थिक एजेंट हैं। बदले में, युद्ध की स्थिति में, गेम मॉडल का उपयोग किया जाता है, उदाहरण के लिए, दुश्मन को हराने या हमले से बचाने के लिए सबसे अच्छा हथियार (मौजूदा या संभावित में से) चुनने में।

खेल की विशेषता परिणाम की अनिश्चितता है . अनिश्चितता के कारणों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

संयोजक (शतरंज की तरह);
यादृच्छिक कारकों का प्रभाव (जैसे खेल "हेड्स या टेल्स", पासा, कार्ड गेम में);
रणनीतिक (खिलाड़ी को नहीं पता कि दुश्मन क्या कार्रवाई करेगा)।

खिलाड़ी की रणनीति नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक कदम पर उसके कार्यों को निर्धारित करता है।

गेम थ्योरी का उद्देश्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है। ऐसी रणनीति निर्धारित करने का अर्थ है खेल को हल करना। रणनीति की इष्टतमता यह तब प्राप्त होता है जब एक खिलाड़ी को अधिकतम जीत हासिल करनी चाहिए, जबकि दूसरा अपनी रणनीति पर कायम रहता है। और यदि पहला खिलाड़ी अपनी रणनीति पर अड़ा रहता है तो दूसरे खिलाड़ी को कम से कम नुकसान होना चाहिए।

खेलों का वर्गीकरण

खिलाड़ियों की संख्या के आधार पर वर्गीकरण (दो या दो से अधिक व्यक्तियों का खेल). दो-व्यक्ति गेम सभी गेम थ्योरी में एक केंद्रीय स्थान रखते हैं। दो-व्यक्ति खेलों के लिए गेम थ्योरी की मूल अवधारणा संतुलन के बहुत महत्वपूर्ण विचार का सामान्यीकरण है जो स्वाभाविक रूप से दो-व्यक्ति खेलों में प्रकट होता है। जहाँ तक खेलों का सवाल है एनव्यक्तियों, तो खेल सिद्धांत का एक हिस्सा उन खेलों के लिए समर्पित है जिनमें खिलाड़ियों के बीच सहयोग निषिद्ध है। गेम थ्योरी के दूसरे भाग में एनयह माना जाता है कि व्यक्ति पारस्परिक लाभ के लिए सहयोग करने में सक्षम हैं (इस पैराग्राफ में बाद में असहयोगी और देखें)। सहकारी खेलओह)।
खिलाड़ियों की संख्या और उनकी रणनीतियों के आधार पर वर्गीकरण (रणनीतियों की संख्या कम से कम दो है, अनंत हो सकती है)।
जानकारी की मात्रा के आधार पर वर्गीकरण पिछली चालों के सापेक्ष: खेल के साथ पूरी जानकारीऔर अधूरी जानकारी. मान लीजिए खिलाड़ी 1 - खरीदार और खिलाड़ी 2 - विक्रेता हैं। यदि खिलाड़ी 1 को खिलाड़ी 2 के कार्यों के बारे में पूरी जानकारी नहीं है, तो खिलाड़ी 1 उन दो विकल्पों के बीच अंतर नहीं कर सकता है जिनके बीच उसे चुनाव करना होगा। उदाहरण के लिए, किसी उत्पाद के दो प्रकारों के बीच चयन करना और यह न जानना कि, कुछ विशेषताओं के अनुसार, उत्पाद क्या है एबदतर उत्पाद बी, खिलाड़ी 1 को विकल्पों के बीच अंतर दिखाई नहीं दे सकता है।
जीत के विभाजन के सिद्धांतों के अनुसार वर्गीकरण : एक तरफ सहयोगात्मक, गठबंधन और दूसरी तरफ असहयोगी, गैर-गठबंधन। में असहयोगी खेल , या अन्यथा - असहयोगी खेल , खिलाड़ी यह जाने बिना कि दूसरा खिलाड़ी कौन सी रणनीति चुनेगा, एक साथ रणनीतियाँ चुनते हैं। खिलाड़ियों के बीच संचार असंभव है. में सहकारी खेल , या अन्यथा - गठबंधन का खेल , खिलाड़ी गठबंधन बना सकते हैं और अपनी जीत बढ़ाने के लिए सामूहिक कार्रवाई कर सकते हैं।
परिमित दो-व्यक्ति शून्य-राशि खेल या विरोधी खेल संपूर्ण जानकारी वाला एक रणनीतिक खेल है, जिसमें विरोधी हितों वाले पक्ष शामिल होते हैं। विरोधी खेल हैं मैट्रिक्स खेल .

गेम थ्योरी का एक उत्कृष्ट उदाहरण कैदी की दुविधा है।

दोनों संदिग्धों को हिरासत में ले लिया गया और एक दूसरे से अलग कर दिया गया। जिला अटॉर्नी आश्वस्त है कि उन्होंने ऐसा किया है गंभीर अपराध, लेकिन अदालत में उन पर आरोप लगाने के लिए पर्याप्त सबूत नहीं हैं। वह प्रत्येक कैदी से कहता है कि उसके पास दो विकल्प हैं: पुलिस जो अपराध मानती है उसे कबूल कर ले या अपराध कबूल न कर ले। यदि दोनों कबूल नहीं करते हैं, तो डीए उन पर कुछ छोटे अपराध का आरोप लगाएगा, जैसे छोटी चोरी या हथियार का अवैध कब्ज़ा, और उन दोनों को एक छोटी सी सजा मिलेगी। यदि वे दोनों कबूल करते हैं, तो उन पर मुकदमा चलाया जाएगा, लेकिन वह कड़ी सजा की मांग नहीं करेंगे। यदि एक कबूल करता है और दूसरा नहीं करता है, तो जिसने कबूल किया है उसे एक साथी के प्रत्यर्पण के लिए उसकी सजा कम कर दी जाएगी, जबकि जो कायम रहेगा उसे "पूरी तरह" मिलेगा।

यदि इस रणनीतिक कार्य को निष्कर्ष के रूप में तैयार किया जाता है, तो यह निम्नलिखित तक सीमित हो जाता है:

इस प्रकार, यदि दोनों कैदी कबूल नहीं करते हैं, तो उन्हें प्रत्येक को 1 वर्ष की सजा मिलेगी। यदि दोनों कबूल करते हैं, तो प्रत्येक को 8 वर्ष की सजा मिलेगी। और यदि एक कबूल करता है, और दूसरा नहीं कबूल करता है, तो जिसने कबूल किया है उसे तीन महीने की जेल होगी, और जो कबूल नहीं करेगा उसे 10 साल मिलेंगे। उपरोक्त मैट्रिक्स कैदी की दुविधा को सही ढंग से दर्शाता है: हर किसी को इस सवाल का सामना करना पड़ता है कि कबूल करना है या नहीं। जिला अटॉर्नी कैदियों को जो गेम ऑफर करता है वह है असहयोगी खेल या अन्यथा - असहयोगी खेल . यदि दोनों कैदियों को सहयोग करने का अवसर मिले (अर्थात्) खेल सहकारी होगा वरना गठबंधन का खेल ), तो दोनों कबूल नहीं करेंगे और प्रत्येक को एक वर्ष की जेल होगी।

गेम थ्योरी के गणितीय उपकरणों का उपयोग करने के उदाहरण

अब हम खेलों के सामान्य वर्गों के उदाहरणों के समाधान पर विचार करने के लिए आगे बढ़ते हैं, जिसके लिए खेल सिद्धांत में अनुसंधान और समाधान विधियां हैं।

दो व्यक्तियों के असहयोगी (गैर-सहकारी) खेल की औपचारिकता का एक उदाहरण

पिछले पैराग्राफ में, हमने पहले ही एक गैर-सहकारी (गैर-सहकारी) गेम (कैदी की दुविधा) का एक उदाहरण देखा था। आइए अपने कौशल को मजबूत करें। आर्थर कॉनन डॉयल द्वारा लिखित "द एडवेंचर्स ऑफ शेरलॉक होम्स" से प्रेरित एक क्लासिक कथानक भी इसके लिए उपयुक्त है। बेशक, कोई आपत्ति कर सकता है: उदाहरण जीवन से नहीं है, बल्कि साहित्य से है, लेकिन कॉनन डॉयल ने खुद को विज्ञान कथा लेखक के रूप में स्थापित नहीं किया है! क्लासिक इसलिए भी क्योंकि यह कार्य ऑस्कर मॉर्गनस्टर्न द्वारा पूरा किया गया था, जैसा कि हम पहले ही स्थापित कर चुके हैं, गेम थ्योरी के संस्थापकों में से एक।

उदाहरण 1।"द एडवेंचर्स ऑफ शेरलॉक होम्स" के एक अंश का संक्षिप्त सारांश दिया जाएगा। गेम थ्योरी की प्रसिद्ध अवधारणाओं के अनुसार, संघर्ष की स्थिति का एक मॉडल बनाएं और गेम को औपचारिक रूप से लिखें।

शर्लक होम्स अपने पीछा कर रहे प्रोफेसर मोरियार्टी से बचने के लिए महाद्वीप (यूरोपीय) तक पहुंचने के लक्ष्य के साथ लंदन से डोवर तक यात्रा करने का इरादा रखता है। ट्रेन में चढ़ने के बाद, उन्होंने स्टेशन के प्लेटफार्म पर प्रोफेसर मोरियार्टी को देखा। शर्लक होम्स स्वीकार करते हैं कि मोरियार्टी एक विशेष ट्रेन चुन सकते हैं और उससे आगे निकल सकते हैं। शर्लक होम्स के पास दो विकल्प हैं: डोवर की यात्रा जारी रखें या कैंटरबरी स्टेशन पर उतरें, जो उसके मार्ग पर एकमात्र मध्यवर्ती स्टेशन है। हम स्वीकार करते हैं कि उसका प्रतिद्वंद्वी होम्स की क्षमताओं को निर्धारित करने के लिए पर्याप्त बुद्धिमान है, इसलिए उसके पास वही दो विकल्प हैं। दोनों विरोधियों को ट्रेन से उतरने के लिए एक स्टेशन चुनना होगा, बिना यह जाने कि उनमें से प्रत्येक क्या निर्णय लेगा। यदि, निर्णय लेने के परिणामस्वरूप, दोनों एक ही स्टेशन पर पहुँचते हैं, तो हम निश्चित रूप से मान सकते हैं कि शर्लक होम्स को प्रोफेसर मोरियार्टी द्वारा मार दिया जाएगा। यदि शर्लक होम्स सुरक्षित रूप से डोवर पहुँच जाता है, तो वह बच जाएगा।

समाधान। कॉनन डॉयल के नायकों को हम खेल में भागीदार अर्थात खिलाड़ी मान सकते हैं। हर खिलाड़ी के लिए उपलब्ध मैं (मैं=1,2) दो शुद्ध रणनीतियाँ:

डोवर पर उतरें (रणनीति एसi1 ( मैं=1,2) );
किसी मध्यवर्ती स्टेशन पर उतरें (रणनीति) एसi2 ( मैं=1,2) )

दोनों खिलाड़ियों में से प्रत्येक कौन सी रणनीति चुनता है, इसके आधार पर जोड़ी के रूप में रणनीतियों का एक विशेष संयोजन बनाया जाएगा एस = (एस1 , एस 2 ) .

प्रत्येक संयोजन को एक घटना से जोड़ा जा सकता है - प्रोफेसर मोरियार्टी द्वारा शर्लक होम्स की हत्या के प्रयास का परिणाम। हम संभावित घटनाओं के साथ इस गेम का एक मैट्रिक्स बनाते हैं।

प्रत्येक घटना के अंतर्गत प्रोफेसर मोरियार्टी के अधिग्रहण को दर्शाने वाला एक सूचकांक है, और इसकी गणना होम्स की मुक्ति के आधार पर की जाती है। दोनों नायक एक ही समय में रणनीति चुनते हैं, बिना यह जाने कि दुश्मन क्या चुनेगा। इस प्रकार, खेल असहयोगी है क्योंकि, सबसे पहले, खिलाड़ी अलग-अलग ट्रेनों में हैं, और दूसरे, उनके विरोधी हित हैं।

सहकारी (गठबंधन) खेल की औपचारिकता और समाधान का एक उदाहरण एनव्यक्तियों

इस बिंदु पर, व्यावहारिक भाग, यानी, एक उदाहरण समस्या को हल करने की प्रक्रिया, एक सैद्धांतिक भाग से पहले होगी, जिसमें हम सहकारी (गैर-सहकारी) खेलों को हल करने के लिए गेम सिद्धांत की अवधारणाओं से परिचित होंगे। इस कार्य के लिए, गेम थ्योरी सुझाव देती है:

विशिष्ट कार्य (सीधे शब्दों में कहें तो, यह खिलाड़ियों को एक गठबंधन में एकजुट करने के लाभ की भयावहता को दर्शाता है);
योगात्मकता की अवधारणा (मात्राओं की संपत्ति, जिसमें यह तथ्य शामिल है कि संपूर्ण वस्तु के अनुरूप मात्रा का मूल्य वस्तु के विभाजन के एक निश्चित वर्ग में उसके भागों के अनुरूप मात्राओं के मूल्यों के योग के बराबर है भागों में) और विशेषता फ़ंक्शन की सुपरएडिटिविटी (संपूर्ण वस्तु के अनुरूप मात्रा का मान उसके भागों के अनुरूप मात्राओं के मानों के योग से अधिक है)।

विशेषता फ़ंक्शन की सुपरएडिटिविटी से पता चलता है कि गठबंधन में शामिल होना खिलाड़ियों के लिए फायदेमंद है, क्योंकि इस मामले में गठबंधन के भुगतान का मूल्य खिलाड़ियों की संख्या के साथ बढ़ता है।

खेल को औपचारिक बनाने के लिए, हमें उपरोक्त अवधारणाओं के लिए औपचारिक नोटेशन पेश करने की आवश्यकता है।

खेल के लिए एनआइए हम इसके सभी खिलाड़ियों के सेट को इस प्रकार निरूपित करें एन= (1,2,...,n) समुच्चय का कोई गैर-रिक्त उपसमुच्चय एनआइए इसे इस रूप में निरूपित करें टी(स्वयं सहित एनऔर सभी उपसमुच्चय एक तत्व से बने हैं)। साइट पर एक पाठ है " सेट और सेट पर संचालन", जो लिंक पर क्लिक करने पर एक नई विंडो में खुलती है।

चारित्रिक फलन को इस प्रकार दर्शाया गया है वीऔर इसकी परिभाषा के क्षेत्र में सेट के संभावित उपसमुच्चय शामिल हैं एन. वी(टी) - एक विशेष उपसमुच्चय के लिए विशेषता फ़ंक्शन का मूल्य, उदाहरण के लिए, एक गठबंधन द्वारा प्राप्त आय, संभवतः एक खिलाड़ी से युक्त आय। यह महत्वपूर्ण है क्योंकि गेम थ्योरी के लिए सभी असंबद्ध गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जाँच करना आवश्यक है।

दो गैर-रिक्त उपसमुच्चय गठबंधनों के लिए टी1 और टी2 सहकारी (गठबंधन) खेल के विशिष्ट कार्य की संवेदनशीलता इस प्रकार लिखी गई है:

और सुपरएडिटिविटी इस प्रकार है:

उदाहरण 2.तीन संगीत विद्यालय के छात्र विभिन्न क्लबों में अंशकालिक काम करते हैं; उन्हें क्लब के आगंतुकों से अपनी आय प्राप्त होती है। सहकारी खेलों को हल करने के लिए गेम थ्योरी की अवधारणाओं का उपयोग करके निर्धारित करें कि क्या उनके लिए बलों में शामिल होना लाभदायक है (यदि हां, तो किन परिस्थितियों में)। एननिम्नलिखित प्रारंभिक डेटा वाले व्यक्ति।

औसतन, प्रति शाम उनका राजस्व था:

वायलिन वादक के पास 600 इकाइयाँ हैं;
गिटारवादक के पास 700 इकाइयाँ हैं;
गायक के पास 900 इकाइयाँ हैं।

राजस्व बढ़ाने के प्रयास में, छात्रों ने कई महीनों के दौरान विभिन्न समूह बनाए। परिणामों से पता चला कि टीम बनाकर, वे अपना शाम का राजस्व बढ़ा सकते हैं:

वायलिन वादक + गिटारवादक ने 1500 इकाइयाँ अर्जित कीं;
वायलिन वादक + गायक ने 1800 इकाइयाँ अर्जित कीं;
गिटारवादक + गायक ने 1900 इकाइयाँ अर्जित कीं;
वायलिन वादक + गिटारवादक + गायक ने 3000 इकाइयाँ अर्जित कीं।

समाधान। इस उदाहरण में, खेल में खिलाड़ियों की संख्या एन= 3, इसलिए, खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के 2³ = 8 संभावित उपसमुच्चय शामिल हैं। आइए सभी संभावित गठबंधनों की सूची बनाएं टी:

एक तत्व के गठबंधन, जिनमें से प्रत्येक में एक खिलाड़ी होता है - एक संगीतकार: टी{1} , टी{2} , टी{3} ;
दो तत्वों का गठबंधन: टी{1,2} , टी{1,3} , टी{2,3} ;
तीन तत्वों का गठबंधन: टी{1,2,3} .

हम प्रत्येक खिलाड़ी को एक क्रमांक निर्दिष्ट करेंगे:

वायलिन वादक - प्रथम वादक;
गिटारवादक - दूसरा खिलाड़ी;
गायक - तीसरा खिलाड़ी।

समस्या डेटा के आधार पर, हम गेम के विशिष्ट कार्य का निर्धारण करते हैं वी:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; विशेषता फ़ंक्शन के ये मूल्य क्रमशः पहले, दूसरे और तीसरे खिलाड़ियों के भुगतान के आधार पर निर्धारित किए जाते हैं, जब वे गठबंधन में एकजुट नहीं होते हैं;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; विशेषता फ़ंक्शन के ये मूल्य गठबंधन में एकजुट खिलाड़ियों की प्रत्येक जोड़ी के राजस्व से निर्धारित होते हैं;

v(T(1,2,3)) = 3000 ; विशेषता फ़ंक्शन का यह मान उस स्थिति में औसत राजस्व द्वारा निर्धारित किया जाता है जब खिलाड़ी तीन में एकजुट होते हैं।

इस प्रकार, हमने खिलाड़ियों के सभी संभावित गठबंधनों को सूचीबद्ध किया है; जैसा कि होना चाहिए, उनमें से आठ हैं, क्योंकि खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के ठीक आठ संभावित उपसमूह शामिल हैं। गेम थ्योरी की यही आवश्यकता है, क्योंकि हमें सभी असंयुक्त गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जांच करने की आवश्यकता है।

इस उदाहरण में सुपरएडिटिविटी की शर्तें कैसे संतुष्ट हैं? आइए निर्धारित करें कि खिलाड़ी असंयुक्त गठबंधन कैसे बनाते हैं टी1 और टी2 . यदि कुछ खिलाड़ी किसी गठबंधन का हिस्सा हैं टी1 , तो अन्य सभी खिलाड़ी गठबंधन का हिस्सा हैं टी2 और परिभाषा के अनुसार, यह गठबंधन खिलाड़ियों के पूरे सेट और सेट के अंतर के रूप में बनता है टी1 . तो अगर टी1 - एक खिलाड़ी का गठबंधन, फिर गठबंधन में टी2 गठबंधन में दूसरे और तीसरे खिलाड़ी होंगे टी1 पहले और तीसरे खिलाड़ी होंगे, फिर गठबंधन होगा टी2 इसमें केवल दूसरा खिलाड़ी शामिल होगा, इत्यादि।

मिश्रित खिलाड़ी रणनीति. खिलाड़ियों की मिश्रित रणनीति का पता लगाएं।

गेम थ्योरी में गेम सर्किट की मॉडलिंग करना। उद्यम में मौसमी उत्पादों पी 1, पी 2, पी 3 के उत्पादन की मात्रा की स्वतंत्र रूप से योजना बनाने की क्षमता है।

ग्राफ़िकल विधि का उपयोग करके मैट्रिक्स गेम को हल करना

रैखिक प्रोग्रामिंग विधियों का उपयोग करके मैट्रिक्स गेम को हल करना

मैट्रिक्स खेल. सिंप्लेक्स विधि का उपयोग करना. हम गेम की कम कीमत a = max(a i) = 2 द्वारा निर्धारित गारंटीकृत भुगतान पाते हैं, जो अधिकतम शुद्ध रणनीति A 1 को इंगित करता है।
रैखिक प्रोग्रामिंग पद्धति का उपयोग करके मैट्रिक्स गेम को हल करने का एक उदाहरण। रैखिक प्रोग्रामिंग का उपयोग करके मैट्रिक्स गेम को हल करें।

एक ग्राफिकल प्रतिनिधित्व दें, सामान्य रूप में कम करें और निम्नलिखित भुगतान फ़ंक्शन के साथ स्थितीय गेम का सटीक समाधान ढूंढें:
खिलाड़ी A पहली चाल चलता है: वह दो संख्याओं के सेट में से संख्या x चुनता है।
दूसरी चाल खिलाड़ी बी द्वारा बनाई जाती है: पहली चाल में खिलाड़ी ए की पसंद के बारे में न जानते हुए, वह दो संख्याओं के सेट में से संख्या y चुनता है।
तीसरी चाल खिलाड़ी A द्वारा बनाई जाती है: वह दो संख्याओं के सेट से संख्या z चुनता है, दूसरी चाल में खिलाड़ी B द्वारा चुने गए y के मान को जानता है, लेकिन पहली चाल में x की अपनी पसंद को याद नहीं रखता है।

प्रकृति के साथ खेल

सांख्यिकीय खेल
एक कृषि उद्यम कुछ उत्पाद बेच सकता है:
ए1) सफाई के तुरंत बाद;
ए2) सर्दियों के महीनों में;
A3) वसंत के महीनों में।
लाभ एक निश्चित अवधि में विक्रय मूल्य, भंडारण लागत और संभावित नुकसान पर निर्भर करता है। कार्यान्वयन की पूरी अवधि के दौरान आय और लागत (एस 1, एस 2 और एस 3) के विभिन्न राज्यों-अनुपातों के लिए गणना की गई लाभ की राशि, एक मैट्रिक्स (मिलियन रूबल) के रूप में प्रस्तुत की जाती है।
कंपनी कपड़े और सूट बनाती है, जिनकी बिक्री मौसम की स्थिति पर निर्भर करती है। अप्रैल-मई के दौरान कंपनी की प्रति यूनिट उत्पादन लागत होगी...
कच्चे माल के भंडार की समस्या का समाधान। उद्यम में एक निश्चित अवधि में, कच्चे माल की खपत, उसकी गुणवत्ता के आधार पर, 1, 2, 3 और 4 होती है।
अत्यधिक निराशावाद, अत्यधिक आशावाद और आशावाद-निराशावाद की रणनीतियाँ

बिमैट्रिक्स गेम्स

गेम थ्योरी में निर्णय वृक्ष (किसी समस्या को हल करने का एक उदाहरण)।

गेम थ्योरी (मैट्रिक्स गेम को हल करना), ईएमएम (लीनियर प्रोग्रामिंग, गेम थ्योरी) पर विशिष्ट समस्याओं पर समाधानों का संग्रह भी देखें।

शहर में तीन टेलीविजन कंपनियां काम कर रही हैं: एबीसी, सीएसऔर एनबीसी. ये कंपनियाँ अपना शाम का समाचार कार्यक्रम 6:30 या 7:00 बजे शुरू कर सकती हैं। 60% टीवी दर्शक शाम के समाचार 6.30 बजे देखना पसंद करते हैं, और 40% दर्शक शाम के समाचार 7.00 बजे देखना पसंद करते हैं। कंपनी का सबसे लोकप्रिय शाम का समाचार कार्यक्रम एबीसी, सबसे कम लोकप्रिय कंपनी द्वारा तैयार की गई खबरें हैं एनबीसी. शाम के समाचार कार्यक्रमों के टेलीविजन दर्शकों की हिस्सेदारी तालिका में प्रस्तुत की गई है (एनबीसी, सीबीएस, एबीसी)

एबीसी: 6.30
एनसूरज		पूर्वोत्तरएस



एबीसी: 7.00
एन.बी.साथ		पूर्वोत्तरएस

समाचार कार्यक्रमों के समय के लिए इष्टतम कंपनी रणनीतियाँ खोजें

समाधान संकेत: खेल में रणनीति का बोलबाला है

लोकप्रिय अमेरिकी ब्लॉग क्रैक्ड से।

गेम थ्योरी सबसे अच्छा कदम उठाने के तरीकों का अध्ययन करने के बारे में है और परिणामस्वरूप, अन्य खिलाड़ियों से कुछ काटकर जितना संभव हो उतना जीतने वाली पाई प्राप्त करें। यह आपको कई कारकों का विश्लेषण करना और तार्किक रूप से संतुलित निष्कर्ष निकालना सिखाता है। मेरा मानना है कि इसका अध्ययन अंकों के बाद और वर्णमाला से पहले किया जाना चाहिए। सिर्फ इसलिए कि बहुत से लोग अंतर्ज्ञान, गुप्त भविष्यवाणियों, सितारों के स्थान और इसी तरह के आधार पर महत्वपूर्ण निर्णय लेते हैं। मैंने गेम थ्योरी का गहन अध्ययन किया है, और अब मैं आपको इसकी मूल बातों के बारे में बताना चाहता हूं। शायद यह आपके जीवन में कुछ सामान्य ज्ञान जोड़ देगा।

1. कैदी की दुविधा

भागने के लिए चोरी की कार का उचित उपयोग करने में विफल रहने के बाद बर्टो और रॉबर्ट को बैंक डकैती के आरोप में गिरफ्तार किया गया था। पुलिस यह साबित नहीं कर सकती कि उन्होंने ही बैंक लूटा था, लेकिन उन्होंने उन्हें चोरी की कार में रंगे हाथ पकड़ लिया था। उन्हें अलग-अलग कमरों में ले जाया गया और प्रत्येक को एक सौदे की पेशकश की गई: एक साथी को सौंपने और उसे 10 साल के लिए जेल भेजने और खुद रिहा होने का। परन्तु यदि वे दोनों एक दूसरे के साथ विश्वासघात करें, तो प्रत्येक को सात वर्ष की सज़ा मिलेगी। अगर किसी ने कुछ नहीं कहा तो दोनों को सिर्फ कार चोरी के आरोप में 2 साल के लिए जेल जाना पड़ेगा।

इससे पता चलता है कि यदि बर्टो चुप रहता है, लेकिन रॉबर्ट उसे अंदर कर देता है, तो बर्टो 10 साल के लिए जेल चला जाता है, और रॉबर्ट मुक्त हो जाता है।

प्रत्येक कैदी एक खिलाड़ी है, और प्रत्येक के लाभ को एक "सूत्र" के रूप में व्यक्त किया जा सकता है (उन दोनों को क्या मिलेगा, दूसरे को क्या मिलेगा)। उदाहरण के लिए, यदि मैं तुम्हें मारता हूं, तो मेरी जीत का पैटर्न इस तरह दिखेगा (मुझे कड़ी जीत मिलती है, तुम्हें बहुत दर्द होता है)। चूँकि प्रत्येक कैदी के पास दो विकल्प होते हैं, हम परिणामों को एक तालिका में प्रस्तुत कर सकते हैं।

व्यावहारिक अनुप्रयोग: समाजोपथों की पहचान करना

यहां हम गेम थ्योरी का मुख्य अनुप्रयोग देखते हैं: उन समाजोपथों की पहचान करना जो केवल अपने बारे में सोचते हैं।सच्चा गेम सिद्धांत एक शक्तिशाली विश्लेषणात्मक उपकरण है, और शौकियापन अक्सर एक लाल झंडे के रूप में कार्य करता है जो किसी ऐसे व्यक्ति को चिह्नित करता है जिसके पास सम्मान की कोई भावना नहीं है। जो लोग सहज गणना करते हैं उनका मानना है कि कुछ बदसूरत करना बेहतर है क्योंकि इससे जेल की सजा कम होगी चाहे दूसरा खिलाड़ी कुछ भी करे। तकनीकी रूप से यह सही है, लेकिन केवल तभी जब आप अदूरदर्शी व्यक्ति हों और संख्याएँ अधिक बता रहे हों मानव जीवन. यही कारण है कि गेम थ्योरी वित्त में इतनी लोकप्रिय है।

कैदी की दुविधा के साथ असली समस्या यह है कि वह डेटा को नजरअंदाज कर देता है।उदाहरण के लिए, यह आपके दोस्तों, रिश्तेदारों या यहां तक कि उस व्यक्ति के लेनदारों से मिलने की संभावना पर विचार नहीं करता है जिसे आपने 10 साल के लिए जेल भेजा था।

सबसे बुरी बात यह है कि कैदी की दुविधा में शामिल हर कोई ऐसा व्यवहार करता है मानो उसने इसके बारे में कभी सुना ही न हो।

और सबसे अच्छा कदम है चुप रहना और दो साल बाद किसी अच्छे दोस्त के साथ मिलकर उसी पैसे का इस्तेमाल करना।

2. प्रमुख रणनीति

यह एक ऐसी स्थिति है जिसमें आपके प्रतिद्वंद्वी के कार्यों की परवाह किए बिना, आपके कार्य सबसे अधिक प्रतिफल देते हैं।चाहे कुछ भी हो, आपने सब कुछ ठीक किया। यही कारण है कि कैदी की दुविधा वाले कई लोग मानते हैं कि विश्वासघात से "सर्वोत्तम" परिणाम मिलता है, चाहे दूसरा व्यक्ति कुछ भी करे, और इस पद्धति में निहित वास्तविकता की अज्ञानता इसे बहुत आसान बनाती है।

हमारे द्वारा खेले जाने वाले अधिकांश खेलों में सख्ती से प्रभावी रणनीतियाँ नहीं होती हैं क्योंकि अन्यथा वे भयानक होंगे। सोचिए अगर आप हमेशा एक ही काम करते। रॉक-पेपर-कैंची के खेल में कोई प्रभावी रणनीति नहीं है। लेकिन यदि आप किसी ऐसे व्यक्ति के साथ खेल रहे थे जिसके पास ओवन मिट्स थे और वह केवल पत्थर या कागज दिखा सकता था, तो आपके पास एक प्रमुख रणनीति होगी: कागज। आपका पेपर उसके पत्थर को लपेट देगा या परिणाम ड्रॉ में होगा, और आप हार नहीं सकते क्योंकि आपका प्रतिद्वंद्वी कैंची नहीं दिखा सकता है। अब जब आपके पास एक प्रभावी रणनीति है, तो आप कुछ अलग करने की कोशिश करने में मूर्ख होंगे।

3. लिंगों की लड़ाई

खेल तब अधिक दिलचस्प होते हैं जब उनमें सख्ती से प्रभावी रणनीति न हो। उदाहरण के लिए, लिंगों की लड़ाई. अंजलि और बोरिसलाव डेट पर जाते हैं, लेकिन बैले और बॉक्सिंग के बीच चयन नहीं कर पाते। अंजलि को मुक्केबाजी पसंद है क्योंकि उसे दर्शकों की चीखती भीड़ की खुशी के लिए खून बहते हुए देखना अच्छा लगता है, जो सोचते हैं कि वे सिर्फ इसलिए सभ्य हैं क्योंकि उन्होंने किसी का सिर फोड़ने के लिए भुगतान किया है।

बोरिसलाव बैले देखना चाहता है क्योंकि वह समझता है कि बैलेरिना किस दौर से गुजरती हैं बड़ी राशिचोटें और सबसे कठिन प्रशिक्षण, यह जानते हुए कि एक चोट सब कुछ खत्म कर सकती है। बैले नर्तक पृथ्वी पर सबसे महान एथलीट हैं। एक बैलेरीना आपके सिर पर लात मार सकती है, लेकिन वह ऐसा कभी नहीं करेगी, क्योंकि उसके पैर की कीमत आपके चेहरे से कहीं अधिक है।

उनमें से प्रत्येक अपने पसंदीदा कार्यक्रम में जाना चाहता है, लेकिन वे अकेले इसका आनंद नहीं लेना चाहते हैं, इसलिए हमें उनकी जीत के लिए योजना मिलती है: सबसे बड़ा मूल्य वह करना है जो उन्हें पसंद है, सबसे छोटा मूल्य- बस किसी अन्य व्यक्ति के साथ रहना, और शून्य - अकेले रहना।

कुछ लोग जिद्दी स्वभाव का सुझाव देते हैं: यदि आप वही करते हैं जो आप चाहते हैं, चाहे कुछ भी हो, दूसरे व्यक्ति को आपकी पसंद के अनुरूप होना होगा या सब कुछ खोना होगा। जैसा कि मैंने पहले ही कहा, सरलीकृत खेल सिद्धांत मूर्खों की पहचान करने में बहुत अच्छा है।

व्यावहारिक अनुप्रयोग: तेज़ कोनों से बचें

बेशक, इस रणनीति की अपनी महत्वपूर्ण कमियां भी हैं। सबसे पहले, यदि आप अपनी डेटिंग को "लिंगों की लड़ाई" के रूप में मानते हैं, तो यह काम नहीं करेगा। ब्रेकअप करें ताकि आप में से प्रत्येक को कोई ऐसा व्यक्ति मिल सके जिसे वे पसंद करते हों। और दूसरी समस्या यह है कि इस स्थिति में प्रतिभागी स्वयं को लेकर इतने अनिश्चित होते हैं कि वे ऐसा नहीं कर पाते हैं।

हर किसी के लिए वास्तव में जीतने की रणनीति वही करना है जो वे चाहते हैं।और उसके बाद, या अगले दिन, जब वे खाली हों, एक साथ किसी कैफे में जाएँ। या बॉक्सिंग और बैले के बीच तब तक बदलाव करें जब तक कि मनोरंजन जगत में क्रांति न आ जाए और बॉक्सिंग बैले का आविष्कार न हो जाए।

4. नैश संतुलन

नैश संतुलन चालों का एक सेट है जहां तथ्य के बाद कोई भी कुछ अलग नहीं करना चाहता है।और यदि हम इसे कार्यान्वित कर सकते हैं, तो गेम थ्योरी ग्रह पर संपूर्ण दार्शनिक, धार्मिक और वित्तीय प्रणाली को प्रतिस्थापित कर देगी, क्योंकि "टूट न जाने की इच्छा" मानवता के लिए आग से भी अधिक शक्तिशाली प्रेरक शक्ति बन गई है।

आइए जल्दी से $100 बाँट लें। आप और मैं तय करते हैं कि हमें सैकड़ों में से कितने की आवश्यकता है और साथ ही मात्रा की घोषणा भी करते हैं। यदि हमारा कुल योग सौ से कम है, तो हर किसी को वह मिलता है जो वे चाहते हैं। यदि कुल सौ से अधिक है, तो जिसने सबसे कम राशि मांगी उसे वह राशि मिल जाती है जो वह चाहता था, और लालची व्यक्ति को वह मिल जाता है जो बच जाता है। यदि हम समान राशि मांगते हैं, तो प्रत्येक को $50 मिलते हैं। आप कितना पूछेंगे? आप पैसे का बंटवारा कैसे करेंगे? केवल एक ही विजयी चाल है।

$51 की आवश्यकता होने पर आपको अधिकतम राशि मिलेगी, चाहे आपका प्रतिद्वंद्वी कुछ भी चुने। यदि वह और अधिक मांगता है, तो आपको $51 प्राप्त होंगे। यदि वह $50 या $51 मांगता है, तो आपको $50 प्राप्त होंगे। और यदि वह $50 से कम मांगता है, तो आपको $51 प्राप्त होंगे। किसी भी तरह से, ऐसा कोई अन्य विकल्प नहीं है जो आपको इससे अधिक पैसा दिला सके। नैश संतुलन - एक ऐसी स्थिति जिसमें हम दोनों $51 चुनते हैं।

व्यावहारिक अनुप्रयोग: पहले सोचें

यह गेम थ्योरी का संपूर्ण बिंदु है। आपको जीतना नहीं है, अन्य खिलाड़ियों को नुकसान तो बिल्कुल नहीं पहुंचाना है, लेकिन आपको अपने लिए सर्वश्रेष्ठ कदम उठाना है, भले ही आपके आस-पास के लोग आपके लिए क्या सोच रहे हों। और यह और भी अच्छा है अगर यह कदम अन्य खिलाड़ियों के लिए फायदेमंद हो। यह उस प्रकार का गणित है जो समाज को बदल सकता है।

इस विचार का एक दिलचस्प बदलाव शराब पीना है, जिसे समय पर निर्भर नैश संतुलन कहा जा सकता है। जब आप पर्याप्त मात्रा में शराब पीते हैं, तो आप दूसरे लोगों के कार्यों की परवाह नहीं करते, चाहे वे कुछ भी करें, लेकिन अगले दिन आपको वास्तव में कुछ अलग न कर पाने का पछतावा होता है।

5. टॉस खेल

टॉस खिलाड़ी 1 और खिलाड़ी 2 के बीच खेला जाता है। प्रत्येक खिलाड़ी एक साथ हेड या टेल चुनता है। यदि वे सही अनुमान लगाते हैं, तो खिलाड़ी 1 को खिलाड़ी 2 का पैसा मिलता है, यदि नहीं, तो खिलाड़ी 2 को खिलाड़ी 1 का सिक्का मिलता है।

विजेता मैट्रिक्स सरल है...

...इष्टतम रणनीति: पूरी तरह से यादृच्छिक रूप से खेलें।यह आपके विचार से अधिक कठिन है क्योंकि चुनाव पूरी तरह से यादृच्छिक होना चाहिए। यदि आपके पास चित या पट की प्राथमिकता है, तो आपका प्रतिद्वंद्वी इसका उपयोग आपके पैसे लेने के लिए कर सकता है।

निःसंदेह, यहां वास्तविक समस्या यह है कि यह बहुत बेहतर होगा यदि वे एक-दूसरे पर एक पैसा भी फेंकें। परिणामस्वरूप, उनका मुनाफा समान होगा, और परिणामी आघात इन दुर्भाग्यपूर्ण लोगों को भयानक बोरियत के अलावा कुछ और महसूस करने में मदद कर सकता है। आख़िर ये सबसे ख़राब खेलसदैव विद्यमान. और यह पेनल्टी शूटआउट के लिए आदर्श मॉडल है।

व्यावहारिक अनुप्रयोग: जुर्माना

फ़ुटबॉल, हॉकी और कई अन्य खेलों में, अतिरिक्त समय पेनल्टी शूटआउट है। और वे अधिक दिलचस्प होंगे यदि वे इस पर आधारित हों कि पूर्ण रूप में खिलाड़ी कितनी बार कार्टव्हील कर सकते हैं, क्योंकि यह कम से कम उनकी शारीरिक क्षमता का संकेतक होगा और देखने में मजेदार होगा। गोलकीपर किसी गेंद या पक की गति को उसके आरंभ में ही स्पष्ट रूप से निर्धारित नहीं कर सकते, क्योंकि, दुर्भाग्य से, रोबोट अभी भी हमारी खेल प्रतियोगिताओं में भाग नहीं लेते हैं। गोलकीपर को बाएँ या दाएँ दिशा का चयन करना चाहिए और आशा करनी चाहिए कि उसकी पसंद प्रतिद्वंद्वी की पसंद से मेल खाती है जो गोल पर शूटिंग कर रहा है। इसमें सिक्कों के खेल के साथ कुछ समानता है।

हालाँकि, ध्यान दें कि यह हेड और टेल के खेल की समानता का एक आदर्श उदाहरण नहीं है, क्योंकि सही दिशा में भी, गोलकीपर गेंद को नहीं पकड़ सकता है, और हमलावर गोल को हिट नहीं कर सकता है।

तो गेम थ्योरी के अनुसार हमारा निष्कर्ष क्या है? बॉल गेम को "मल्टी-बॉल" तरीके से समाप्त किया जाना चाहिए, जहां हर मिनट एक-पर-एक खिलाड़ियों को एक अतिरिक्त बॉल/पक दिया जाता है जब तक कि एक पक्ष एक निश्चित परिणाम प्राप्त नहीं कर लेता, जो खिलाड़ियों के वास्तविक कौशल का संकेत है, और कोई शानदार आकस्मिक संयोग नहीं.

दिन के अंत में, गेम को अधिक स्मार्ट बनाने के लिए गेम थ्योरी का उपयोग किया जाना चाहिए। यानी यह बेहतर है.

डारिया ज़ोलोटीख 09.02.2015

क्या आपको पोस्ट पसंद आया?
फ़ैक्ट्रम का समर्थन करें, क्लिक करें:

सामग्री 1 सामान्य जानकारी 2 1.1 खेल. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 चालें। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 रणनीतियाँ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 मैट्रिक्स गेम। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ट्रेल प्वाइंट. शुद्ध रणनीतियाँ 7 2.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 मिश्रित रणनीतियाँ 9 3.1 गेम 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 उदाहरण. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 ज्यामितीय व्याख्या। . . . . . . . . . . . . . . . . . . . 12 3.2 गेम्स 2×एन और एम×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 उदाहरण 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. खेल सिद्धांत से सामान्य जानकारी 1.1. गेम्स गेम थ्योरी संघर्ष स्थितियों का एक गणितीय सिद्धांत है, अर्थात। ऐसी स्थितियाँ जिनमें अलग-अलग लक्ष्य हासिल करने वाले दो या दो से अधिक दलों के हित टकराते हैं। एक गेम कुछ नियमों द्वारा नियंत्रित एक संघर्ष की स्थिति है, जिसमें यह दर्शाया जाना चाहिए: प्रतिभागियों के कार्यों के लिए संभावित विकल्प या भुगतान (जीतना, हारना) जिसके लिए चालों का एक सेट जानकारी की मात्रा की ओर जाता है; प्रत्येक पक्ष के बारे में दूसरे के व्यवहार के बारे में। युगल खेल एक ऐसा खेल है जिसमें केवल दो पक्ष (दो खिलाड़ी) भाग लेते हैं। शून्य-राशि युग्मित खेल एक युग्मित खेल है जिसमें भुगतान का योग शून्य होता है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। भुगतान फ़ंक्शन के मूल्य के प्रति प्रत्येक खिलाड़ी के रवैये के आधार पर, युग्मित खेलों को उप-विभाजित किया जाता है: शून्य-राशि युग्मित खेल (विरोधी) - एक युग्मित खेल जिसमें भुगतान की राशि शून्य के बराबर होती है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। एक गैर-प्रतिद्वंद्वी खेल एक युग्मित खेल है जिसमें खिलाड़ी अलग-अलग, लेकिन सीधे विपरीत नहीं, लक्ष्यों का पीछा करते हैं। 2 1.2. चालें चालें - खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक का चयन, चालें दो प्रकार की होती हैं: व्यक्तिगत चाल - + सचेत विकल्पखेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक + इस विकल्प का कार्यान्वयन यादृच्छिक चाल - एक यादृच्छिक चाल कई संभावनाओं में से एक विकल्प है, जो खिलाड़ी के निर्णय से नहीं, बल्कि कुछ यादृच्छिक चयन तंत्र द्वारा किया जाता है। नीचे हम शून्य-राशि युग्मित खेलों पर विचार करते हैं जिनमें केवल व्यक्तिगत चालें होती हैं। प्रत्येक पक्ष के पास दूसरे के व्यवहार के बारे में जानकारी का अभाव है। 3 1.3. रणनीतियाँ एक खिलाड़ी की रणनीति नियमों का एक समूह है जो खेल के दौरान उत्पन्न होने वाली स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्यों की पसंद निर्धारित करती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को सीमित और अनंत में विभाजित किया गया है। अंतहीन खेल- एक खेल जिसमें कम से कम एक खिलाड़ी के पास अनंत संख्या में रणनीतियाँ होती हैं। परिमित खेल वह खेल है जिसमें प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ होती हैं। किसी भी खिलाड़ी के लिए लगातार चालों की संख्या खेल के विभाजन को एकल-चाल और बहु-चाल, या स्थितीय में निर्धारित करती है। + वन-टर्न गेम में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर गेम का परिणाम निर्धारित करता है। + एक बहु-चाल, या स्थितीय, खेल समय के साथ विकसित होता है, जो क्रमिक चरणों की एक श्रृंखला का प्रतिनिधित्व करता है, जिनमें से प्रत्येक खिलाड़ी के एक कदम और स्थिति में संबंधित परिवर्तन के बाद होता है। एक-मोड़ वाले खेल में, प्रत्येक खिलाड़ी केवल एक ही विकल्प चुनता है संभावित विकल्पऔर फिर खेल का परिणाम निर्धारित करता है। एक खिलाड़ी की इष्टतम रणनीति एक ऐसी रणनीति है, जो खेल को कई बार दोहराए जाने पर, इस खिलाड़ी को अधिकतम संभव औसत जीत (या, वही, न्यूनतम संभव औसत हानि) प्रदान करती है। गेम थ्योरी में, सभी सिफारिशें खिलाड़ियों के उचित व्यवहार की धारणा के आधार पर की जाती हैं। खिलाड़ियों की ग़लतियाँ और गलतियाँ, हर संघर्ष की स्थिति में अपरिहार्य, साथ ही उत्साह और जोखिम के तत्वों को गेम थ्योरी में ध्यान में नहीं रखा जाता है। 4 1.4. मैट्रिक्स गेम एक मैट्रिक्स गेम एक एक-चाल वाला परिमित शून्य-योग गेम है। एक मैट्रिक्स गेम एक संघर्ष की स्थिति का एक गेम-सैद्धांतिक मॉडल है जिसमें प्रतिद्वंद्वी, बिल्कुल विपरीत लक्ष्यों को प्राप्त करने के लिए, एक परिमित से एक विकल्प (चाल) बनाते हैं। संख्या संभावित तरीके क्रियाएँ। क्रिया के चुने हुए तरीकों (रणनीतियों) के अनुसार, प्राप्त परिणाम निर्धारित किया जाता है। आइए एक उदाहरण देखें. मान लीजिए कि दो खिलाड़ी A और B हैं, जिनमें से एक अपनी संभावित रणनीतियों A1, A2, ...Am में से i-th रणनीति चुन सकता है, और दूसरा अपनी संभावित रणनीतियों B1, B2 में से j-th रणनीति चुन सकता है। , .. .बी.एम. परिणामस्वरूप, पहला खिलाड़ी aij मान जीतता है, और दूसरा खिलाड़ी यह मान खो देता है। संख्याओं aij से, हम एक मैट्रिक्स बनाते हैं   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   । . . .  am1 am2 · · amn मैट्रिक्स A = (aij), i = 1, m, j = 1, n को पेऑफ मैट्रिक्स या m × n गेम मैट्रिक्स कहा जाता है। इस मैट्रिक्स में, पंक्तियाँ हमेशा जीतने वाले (अधिकतम करने वाले) खिलाड़ी A की रणनीतियों के लिए होती हैं, यानी वह खिलाड़ी जो अपनी जीत को अधिकतम करने का प्रयास करता है। हारने वाले खिलाड़ी बी की रणनीतियों के लिए कॉलम आवंटित किए जाते हैं, यानी वह खिलाड़ी जो दक्षता मानदंड को कम करने का प्रयास करता है। किसी खेल का सामान्यीकरण एक स्थितिगत खेल को मैट्रिक्स खेल में बदलने की प्रक्रिया है संघर्ष की स्थिति जिसमें प्रतिद्वंद्वी इस स्थिति के विकास के प्रत्येक चरण में कार्रवाई के संभावित तरीकों की एक सीमित संख्या में से क्रमिक रूप से एक विकल्प (चाल) करते हैं। खेल का समाधान दोनों खिलाड़ियों की इष्टतम रणनीतियों का पता लगाना और खेल की कीमत निर्धारित करना है। खेल की कीमत खिलाड़ियों का अपेक्षित लाभ (हानि) है। खेल का समाधान या तो शुद्ध रणनीतियों में पाया जा सकता है - जब खिलाड़ी को एक ही रणनीति का पालन करना होगा, या मिश्रित में, जब खिलाड़ी को कुछ संभावनाओं के साथ दो या अधिक शुद्ध रणनीतियों का उपयोग करना होगा। इस मामले में उत्तरार्द्ध को सक्रिय कहा जाता है। 5 एक खिलाड़ी की मिश्रित रणनीति एक वेक्टर है, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की आवृत्ति को दर्शाता है। खेल की अधिकतम या कम कीमत - संख्या α = अधिकतम न्यूनतम aij i j अधिकतम रणनीति (लाइन) - वह रणनीति जिसे खिलाड़ी ने अपनी न्यूनतम जीत को अधिकतम करने के लिए चुना है। जाहिर है, सबसे सतर्क मैक्सिमम रणनीति चुनते समय, खिलाड़ी ए खुद को (प्रतिद्वंद्वी के व्यवहार की परवाह किए बिना) कम से कम α की गारंटीकृत अदायगी प्रदान करता है। खेल की अधिकतम या ऊपरी कीमत - संख्या β = न्यूनतम अधिकतम aij j i मिनिमैक्स रणनीति (कॉलम) - वह रणनीति जिसे खिलाड़ी ने अपने अधिकतम नुकसान को कम करने के लिए चुना है। जाहिर है, सबसे सतर्क मिनिमैक्स रणनीति चुनते समय, खिलाड़ी बी, किसी भी परिस्थिति में, खिलाड़ी ए को β से अधिक जीतने की अनुमति नहीं देता है। गेम की निचली कीमत हमेशा गेम की ऊपरी कीमत से अधिक नहीं होती है α = अधिकतम न्यूनतम aij 6 मिनट अधिकतम aij = β i j j i प्रमेय 1 (मैट्रिक्स गेम के सिद्धांत का मुख्य प्रमेय)। प्रत्येक परिमित खेल में कम से कम एक समाधान होता है, संभवतः मिश्रित रणनीतियों के दायरे में। 6 2. सैडल पॉइंट वाले खेल। शुद्ध रणनीतियों में समाधान सैडल पॉइंट वाला गेम एक ऐसा गेम है जिसके लिए α = अधिकतम न्यूनतम aij = न्यूनतम अधिकतम aij = β i j j i सैडल पॉइंट वाले गेम के लिए, समाधान ढूंढने में मैक्सिमम और मिनिमैक्स रणनीतियों को चुनना शामिल है जो इष्टतम हैं।, शुद्ध खेल की लागत - खेल की निचली और ऊपरी कीमतों का कुल मूल्य α=β=ν 2.1. उदाहरण उदाहरण 1 मैट्रिक्स द्वारा दी गई खेल की शुद्ध रणनीतियों में समाधान खोजें   8 4 7 ए= 6 5 9  7 7 8 समाधान: खेल की ऊपरी और निचली कीमत निर्धारित करें। ऐसा करने के लिए, हम aij की न्यूनतम संख्या ज्ञात करते हैं मैं-वीं पंक्तिαi = न्यूनतम aij j और jth कॉलम में अधिकतम संख्या aij βj = अधिकतम aij i हम एक अतिरिक्त कॉलम के रूप में दाईं ओर भुगतान मैट्रिक्स के आगे संख्या αi (पंक्ति न्यूनतम) लिखते हैं। हम मैट्रिक्स के नीचे संख्याओं βi (कॉलम मैक्सिमा) को एक अतिरिक्त रेखा के रूप में लिखते हैं: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 संख्याओं की अधिकतम संख्या ज्ञात करें αi α = अधिकतम αi = 7 i और संख्याओं का न्यूनतम βj β = न्यूनतम βj = 7 j α = β - खेल में एक सैडल पॉइंट होता है। खिलाड़ी के लिए इष्टतम रणनीति रणनीति A3 है, और खिलाड़ी B के लिए रणनीति B2 है, नेट कीमतखेल ν = 7 उदाहरण 2 भुगतान मैट्रिक्स को देखते हुए:   2 2 1 1 1 2  0 1 1 1 1 1  ए=  1 1 1 1 1 2   1 2 1 1 2 शुद्ध रणनीतियों में खेल का समाधान खोजें . समाधान: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. गेम में छह सैडल पॉइंट हैं। इष्टतम रणनीतियाँ होंगी: A1 और B3 या B4 A3 और B3 या B4 A4 और B3 या B4 8 3. खेल का समाधान मिश्रित रणनीतियाँ α ̸= β के लिए. ऐसे मामले में, जब अपनी रणनीति चुनते समय, दोनों खिलाड़ियों को दूसरे की पसंद के बारे में कोई जानकारी नहीं होती है, तो खेल में मिश्रित रणनीतियों में समाधान होता है। SA = (p1, p2, ..., pm) - खिलाड़ी A की मिश्रित रणनीति, जिसमें रणनीतियों A1, A2, ..., Am को संभावनाओं के साथ लागू किया जाता है ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - खिलाड़ी B की मिश्रित रणनीति, जिसमें रणनीतियों B1, B2, ..., Bm को संभावनाओं के साथ लागू किया जाता है ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 यदि: SA∗ खिलाड़ी A की इष्टतम रणनीति है, SB∗ खिलाड़ी B की इष्टतम रणनीति है, तो खेल की लागत है ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 निम्नलिखित प्रमेय इस प्रश्न का उत्तर देता है कि खेल 2 × 2, 2 × n, m × का समाधान कैसे खोजा जाए 2 प्रमेय 2 (खेल 2 × 2, 2 × एन, एम × 2 के लिए समाधान कैसे खोजें)। यदि खिलाड़ियों में से कोई एक इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत ν के बराबर होता है, इस संभावना की परवाह किए बिना कि दूसरा खिलाड़ी इष्टतम रणनीति (शुद्ध रणनीतियों सहित) में शामिल रणनीतियों का उपयोग करेगा। 9 3.1. गेम 2 × 2 मैट्रिक्स के साथ 2 × 2 गेम पर विचार करें: () ए11 ए21 ए21 ए22 मान लें कि गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है। आइए इष्टतम रणनीतियाँ SA∗ और SB∗ खोजें। सबसे पहले, हम रणनीति SA∗ = (p∗1 , p∗2) को परिभाषित करते हैं। प्रमेय के अनुसार, यदि पार्टी ए रणनीति ν का पालन करती है, तो पार्टी बी की कार्रवाई की परवाह किए बिना, भुगतान ν खेलने की लागत के बराबर रहेगा। नतीजतन, यदि पक्ष A इष्टतम रणनीति SA∗ = (p∗1 , p∗2) का पालन करता है, तो पक्ष B अपने भुगतान को बदले बिना अपनी किसी भी रणनीति को लागू कर सकता है। फिर, जब खिलाड़ी B शुद्ध रणनीति B1 या B2 का उपयोग करता है, तो खिलाड़ी को खेल की लागत के बराबर औसत भुगतान प्राप्त होगा: a11 p∗1 + a21 p∗2 = ν ← रणनीति B1 a12 p∗1 + a22 p∗ के लिए 2 = ν ← रणनीति बी2 के लिए ध्यान दें कि p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 गेम की कीमत: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 खिलाड़ी B की इष्टतम रणनीति इसी प्रकार पाई जाती है: SB∗ = (q1∗ , q2∗)। इस बात को ध्यान में रखते हुए कि q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. उदाहरण उदाहरण 3 मैट्रिक्स के साथ खेल का समाधान खोजें () −1 1 ए= 1 −1 10 समाधान: खेल में कोई सैडल पॉइंट नहीं है, क्योंकि α= -1, β = 1, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = p∗2 = 0.5 और q1∗ = q2∗ = 0.5, ν = 0 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) ) उदाहरण 4 मैट्रिक्स के साथ गेम का समाधान ढूंढें () 2 5 ए = 6 4 समाधान: गेम में कोई सैडल पॉइंट नहीं है, क्योंकि α = 4, β = 5, α ̸ = β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = 0.4, p∗2 = 0.6 और q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.4, 0.6) SB∗ = ( 0.2, 0.8) 11 3.1.2. ज्यामितीय व्याख्या गेम 2 × 2 को एक सरल ज्यामितीय व्याख्या दी जा सकती है। आइए हम भुज अक्ष का एक खंड लें, जिसके प्रत्येक बिंदु को हम किसी मिश्रित रणनीति S = (p1, p2) = (p1, 1 − p1) से जोड़ते हैं और रणनीति A1 की संभावना p1 इससे दूरी के बराबर होगी अनुभाग के दाएँ छोर पर बिंदु SA, और प्रायिकता p2, रणनीति A2 - बाएँ छोर की दूरी। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ विशेष रूप से, अनुभाग का बायां छोर (भुजा = 0 वाला बिंदु) मेल खाता है रणनीति A1 के लिए, खंड का दाहिना छोर (x = 1) - रणनीति A2 खंड के अंत में, x-अक्ष के दो लंबवत बहाल किए जाते हैं: अक्ष I - I - रणनीति A1 के लिए भुगतान स्थगित कर दिया जाता है II - II - रणनीति A2 के लिए भुगतान स्थगित कर दिया गया है, खिलाड़ी B को रणनीति B1 लागू करने दें; यह अक्षों I - I और II - II पर क्रमशः a11 और a21 कोटि वाले बिंदु देता है। हम इन बिंदुओं से होकर एक सीधी रेखा B1 - B1' खींचते हैं। किसी भी मिश्रित रणनीति SA = (p1, p2) के लिए, खिलाड़ी का भुगतान सीधी रेखा B1 - B1' पर बिंदु N द्वारा निर्धारित किया जाता है, जो खंड को p2: p1 के अनुपात में विभाजित करने वाले x-अक्ष पर बिंदु SA के अनुरूप होता है। जाहिर है, सीधी रेखा B2 − B2′, जो रणनीति B2 के लिए भुगतान निर्धारित करती है, बिल्कुल उसी तरह से बनाई जा सकती है। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ इष्टतम रणनीति SA∗ खोजना आवश्यक है, अर्थात। जैसे कि खिलाड़ी ए का न्यूनतम भुगतान (खिलाड़ी बी द्वारा उसके लिए सबसे खराब व्यवहार दिया गया) अधिकतम में बदल जाएगा। ऐसा करने के लिए, रणनीतियों बी1, बी2, यानी के लिए खिलाड़ी ए के भुगतान के लिए निचली सीमा का निर्माण करें। टूटी हुई रेखा B1 N B2′ ;. इस सीमा पर खिलाड़ी ए की किसी भी मिश्रित रणनीति के लिए न्यूनतम भुगतान, बिंदु एन, स्थित होगा, जिस पर यह भुगतान अधिकतम तक पहुंचता है और खेल का निर्णय और कीमत निर्धारित करता है। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P बिंदु N की कोटि खेल ν की लागत से अधिक कुछ नहीं है, इसका भुज ∗2 के बराबर है, और खंड के दाहिने छोर की दूरी ∗1 के बराबर है, अर्थात। बिंदु SA∗ से खंड के अंत तक की दूरी खिलाड़ी A की इष्टतम मिश्रित रणनीति की रणनीतियों A2 और A1 की संभावनाओं ∗2 और ∗1 के बराबर है। इस मामले में, खेल का समाधान किसके द्वारा निर्धारित किया गया था? रणनीतियों B1 और B2 का प्रतिच्छेदन बिंदु। नीचे एक मामला है जहां इष्टतम रणनीतिखिलाड़ी की रणनीति शुद्ध A2 है। यहां रणनीति A2 (किसी भी शत्रु रणनीति के लिए) रणनीति A1, 13 .y .y .I .I I .I I. I .B2′ से अधिक लाभदायक है। 1′ बी .बी1′ बी . 2 .बी2′ बी . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .मैं . ।एक्स। 2∗ पी . A∗S = A2. 2∗ पी . A∗ S = A2 दाईं ओर दिखाया गया वह मामला है जब खिलाड़ी B के पास स्पष्ट रूप से लाभहीन रणनीति है। ज्यामितीय व्याख्या से खेल की कम कीमत α और ऊपरी कीमत β .y .I .I I .B2 की कल्पना करना भी संभव हो जाता है। .B1′ .N .B1 .B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P उसी ग्राफ़ पर, हम खिलाड़ी B की इष्टतम रणनीतियों की ज्यामितीय व्याख्या भी दे सकते हैं। यह सत्यापित करना आसान है कि इष्टतम मिश्रित रणनीति SB∗ = (q1∗ , q2∗) की रणनीति B1 का हिस्सा q1∗ खंड KB2 की लंबाई और खंड KB1 की लंबाई के योग के अनुपात के बराबर है। और I - I अक्ष पर KB2: .y .I .I I .B2 .B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2। ए∗ एस . 1∗ P 14 KB2 q1∗ = KB2 + KB1 या LB2′ q1∗ = LB2′ + LB1′ इष्टतम रणनीति SB∗ = (q1∗ , q2∗) दूसरे तरीके से पाई जा सकती है, यदि हम खिलाड़ियों B और B की अदला-बदली करते हैं, और जीत की निचली सीमा के अधिकतम के बजाय, ऊपरी सीमा के न्यूनतम पर विचार करें। .य .मैं .मैं मैं .ए2 .ए′1 .एन .ए1 .ए′2 .मैं मैं .मैं . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n और m × 2 गेम 2 × n और m × 2 गेम का समाधान निम्नलिखित प्रमेय पर आधारित है। प्रमेय 3. किसी के लिए परम खेल m × n एक ऐसा समाधान है जिसमें प्रत्येक पक्ष की सक्रिय रणनीतियों की संख्या m और n की सबसे छोटी संख्या से अधिक नहीं होती है। इस प्रमेय के अनुसार, 2 × n गेम में हमेशा एक समाधान होता है जिसमें प्रत्येक खिलाड़ी के पास अधिकतम दो सक्रिय रणनीतियाँ होती हैं। एक बार जब आपको ये रणनीतियाँ मिल जाती हैं, तो 2×n गेम 2×2 गेम में बदल जाता है, जिसे प्राथमिक तरीके से हल किया जा सकता है। सक्रिय रणनीतियों की खोज रेखांकन द्वारा की जा सकती है: 1) एक चित्रमय व्याख्या का निर्माण किया जाता है; 2) जीत की निचली सीमा निर्धारित की जाती है; 3) दूसरे खिलाड़ी की दो रणनीतियों को भुगतान की निचली सीमा पर पहचाना जाता है, जो अधिकतम कोटि वाले बिंदु पर प्रतिच्छेद करने वाली दो रेखाओं के अनुरूप होती हैं (यदि इस बिंदु पर दो से अधिक रेखाएं प्रतिच्छेद करती हैं, तो कोई भी जोड़ी ली जाती है) - ये रणनीतियाँ खिलाड़ी बी की सक्रिय रणनीतियों का प्रतिनिधित्व करते हैं। इस प्रकार, गेम 2 × एन को गेम 2 × 2 में घटा दिया जाता है। गेम एम × 2 को भी हल किया जा सकता है, इस अंतर के साथ कि निचला नहीं, बल्कि भुगतान की ऊपरी सीमा है निर्मित, और उस पर अधिकतम नहीं, बल्कि न्यूनतम मांगा जाता है। उदाहरण 5 खेल का समाधान खोजें () 7 9 8 ए= 10 6 9 समाधान: ज्यामितीय विधि का उपयोग करके, हम सक्रिय रणनीतियों का चयन करते हैं। सीधी रेखाएँ B1 - B1', B2 - B2' और B3 - B3' रणनीतियाँ B1, B2, B3 के अनुरूप हैं। टूटी हुई रेखा B1 N B2 खिलाड़ी की जीत की निचली सीमा है। गेम का एक समाधान है S∗A = (23, 31); एस∗बी = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ बी बी . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . ।एक्स। 2∗ पी . ए∗ एस . 1∗ पी 17 इंडेक्स गेम, 2 चाल, 3 2 × 2, 10 व्यक्तिगत, 3 2 × 2, 9 यादृच्छिक, 3 ज्यामिति, 12 नेट गेम मूल्य, 7 उदाहरण, 10 2 × एन, 9, 16 मीटर × 2, 9 , 16 अनंत, 4 सामान्य रूप में, 5 परिमित, 4 बहु-चाल, 4 एक-चाल, 4 मैट्रिक्स, 5 युग्मित, 2 शून्य-योग, 2 विरोधी, 2 गैर-विरोधी, 2 समाधान, 5 मिश्रित रणनीतियों में, 5 , शुद्ध रणनीतियों में 9, सैडल प्वाइंट के साथ 5, 7 मूल्य, 5 ऊपरी, 6 निचला, 6 शुद्ध, 7 मैक्सिमम, 6 गेम मैट्रिक्स, 5 पेऑफ, 5 मिनिमैक्स, 6 गेम सामान्यीकरण, 5 रणनीति, 4 मैक्सिमम, 6 मिनिमैक्स, 6 इष्टतम, 4 मिश्रित, 5 खेल सिद्धांत, 2 18