गेम थ्योरी मैट्रिक्स गेम उदाहरण। मैट्रिक्स गेम की समस्या को स्वयं हल करें, और फिर समाधान देखें

खेल सिद्धांतसंचालन अनुसंधान की एक शाखा के रूप में, यह विभिन्न हितों वाले कई दलों की अनिश्चितता या संघर्ष की स्थितियों में इष्टतम निर्णय लेने के लिए गणितीय मॉडल का सिद्धांत है। गेम थ्योरी गेमिंग स्थितियों में इष्टतम रणनीतियों का अध्ययन करती है। इनमें वैज्ञानिक और आर्थिक प्रयोगों की प्रणाली, सांख्यिकीय नियंत्रण के संगठन और औद्योगिक उद्यमों और अन्य उद्योगों के बीच आर्थिक संबंधों के लिए सबसे लाभप्रद उत्पादन समाधानों के चयन से संबंधित स्थितियां शामिल हैं। संघर्ष स्थितियों को गणितीय रूप से औपचारिक रूप देते हुए, उन्हें दो, तीन आदि के खेल के रूप में दर्शाया जा सकता है। खिलाड़ी, जिनमें से प्रत्येक दूसरे की कीमत पर अपने लाभ, अपनी जीत को अधिकतम करने का लक्ष्य रखता है।

"गेम थ्योरी" खंड को तीन द्वारा दर्शाया गया है ऑनलाइन कैलकुलेटर:

  1. खिलाड़ियों की इष्टतम रणनीतियाँ। ऐसी समस्याओं में, एक भुगतान मैट्रिक्स निर्दिष्ट किया जाता है। खिलाड़ियों की शुद्ध या मिश्रित रणनीतियों को ढूंढना आवश्यक है और, खेल की कीमत. हल करने के लिए, आपको मैट्रिक्स का आयाम और समाधान विधि निर्दिष्ट करनी होगी। सेवा दो-खिलाड़ियों के खेल को हल करने के लिए निम्नलिखित विधियों को लागू करती है:
    1. मिनीमैक्स. यदि आपको खिलाड़ियों की शुद्ध रणनीति का पता लगाना है या गेम के सैडल पॉइंट के बारे में किसी प्रश्न का उत्तर देना है, तो इस समाधान पद्धति को चुनें।
    2. सिम्प्लेक्स विधि. रैखिक प्रोग्रामिंग विधियों का उपयोग करके मिश्रित रणनीति गेम को हल करने के लिए उपयोग किया जाता है।
    3. ग्राफ़िक विधि. मिश्रित रणनीति गेम को हल करने के लिए उपयोग किया जाता है। यदि कोई काठी बिंदु है, तो समाधान रुक जाता है। उदाहरण: पेऑफ मैट्रिक्स को देखते हुए, गेम को हल करने की ग्राफिकल पद्धति का उपयोग करके खिलाड़ियों की इष्टतम मिश्रित रणनीतियों और गेम की कीमत का पता लगाएं।
    4. ब्राउन-रॉबिन्सन पुनरावृत्त विधि. पुनरावृत्तीय विधि का उपयोग तब किया जाता है जब ग्राफिकल विधि लागू नहीं होती है और जब बीजगणितीय और मैट्रिक्स तरीके. यह विधि खेल की कीमत का अनुमानित मूल्य देती है, और सही मूल्य सटीकता की किसी भी वांछित डिग्री के साथ प्राप्त किया जा सकता है। यह विधि इष्टतम रणनीतियों को खोजने के लिए पर्याप्त नहीं है, लेकिन यह आपको गतिशीलता को ट्रैक करने की अनुमति देती है बारी आधारित खेलऔर प्रत्येक चरण पर प्रत्येक खिलाड़ी के लिए खेल की कीमत निर्धारित करें।
    उदाहरण के लिए, कार्य ऐसा लग सकता है जैसे "पेऑफ मैट्रिक्स द्वारा दिए गए खेल के लिए खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें".
    सभी विधियाँ प्रमुख पंक्तियों और स्तंभों की जाँच का उपयोग करती हैं।
  2. बिमैट्रिक्स गेम। आमतौर पर, ऐसे खेल में, पहले और दूसरे खिलाड़ियों के भुगतान के समान आकार के दो मैट्रिक्स निर्दिष्ट किए जाते हैं। इन मैट्रिक्स की पंक्तियाँ पहले खिलाड़ी की रणनीतियों के अनुरूप होती हैं, और मैट्रिक्स के कॉलम दूसरे खिलाड़ी की रणनीतियों के अनुरूप होते हैं। इस मामले में, पहला मैट्रिक्स पहले खिलाड़ी की जीत का प्रतिनिधित्व करता है, और दूसरा मैट्रिक्स दूसरे की जीत का प्रतिनिधित्व करता है।
  3. प्रकृति के साथ खेल. इसका उपयोग तब किया जाता है जब मैक्सिमैक्स, बेयस, लाप्लास, वाल्ड, सैवेज, हर्विट्ज़ के मानदंडों के अनुसार प्रबंधन निर्णय का चयन करना आवश्यक होता है।
    बेयस मानदंड के लिए, घटित होने वाली घटनाओं की संभावनाओं को दर्ज करना भी आवश्यक होगा। यदि वे निर्दिष्ट नहीं हैं, तो डिफ़ॉल्ट मान छोड़ दें (समकक्ष घटनाएँ होंगी)।
    हर्विट्ज़ मानदंड के लिए, आशावाद के स्तर को इंगित करें। यदि यह पैरामीटर शर्तों में निर्दिष्ट नहीं है, तो आप मान 0, 0.5 और 1 का उपयोग कर सकते हैं।

कई समस्याओं के लिए कंप्यूटर का उपयोग करके समाधान खोजने की आवश्यकता होती है। उपरोक्त सेवाएँ और कार्य उपकरण में से एक हैं।

खेल सिद्धांत - संघर्ष स्थितियों (हितों के टकराव) को हल करने के लिए गणितीय तरीकों का एक सेट। गेम थ्योरी में गेम कहा जाता है गणित का मॉडल संघर्ष की स्थिति. खेल सिद्धांत में विशेष रुचि का विषय अनिश्चितता की स्थिति में खेल प्रतिभागियों की निर्णय लेने की रणनीतियों का अध्ययन है। अनिश्चितता इस तथ्य से उत्पन्न होती है कि दो या दो से अधिक पार्टियाँ विरोधी लक्ष्यों का पीछा करती हैं, और प्रत्येक पार्टी की किसी भी कार्रवाई के परिणाम साझेदार की चाल पर निर्भर करते हैं। साथ ही, प्रत्येक पक्ष इष्टतम निर्णय लेने का प्रयास करता है जो निर्धारित लक्ष्यों को अधिकतम सीमा तक साकार करता है।

गेम थ्योरी को अर्थशास्त्र में सबसे अधिक लगातार लागू किया जाता है, जहां संघर्ष की स्थिति उत्पन्न होती है, उदाहरण के लिए, आपूर्तिकर्ता और उपभोक्ता, खरीदार और विक्रेता, बैंक और ग्राहक के बीच संबंधों में। गेम थ्योरी का अनुप्रयोग राजनीति, समाजशास्त्र, जीव विज्ञान और सैन्य कला में भी पाया जा सकता है।

गेम थ्योरी के इतिहास से

गेम थ्योरी का इतिहास एक स्वतंत्र अनुशासन के रूप में 1944 में शुरुआत हुई, जब जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न ने "द थ्योरी ऑफ गेम्स एंड इकोनॉमिक बिहेवियर" पुस्तक प्रकाशित की। हालाँकि गेम थ्योरी के उदाहरण पहले भी सामने आ चुके हैं: मृत पति की संपत्ति को उसकी पत्नियों के बीच बांटने पर बेबीलोनियाई तल्मूड का ग्रंथ, 18वीं सदी में कार्ड गेम, 20वीं सदी की शुरुआत में शतरंज के सिद्धांत का विकास सदी, 1928 वर्ष में उसी जॉन वॉन न्यूमैन के मिनिमैक्स प्रमेय का प्रमाण, जिसके बिना कोई खेल सिद्धांत नहीं होता।

20वीं सदी के 50 के दशक में मेल्विन ड्रेशर और मेरिल फ्लड से रैंड कॉर्पोरेशनकैदी की दुविधा को प्रयोगात्मक रूप से लागू करने वाले पहले व्यक्ति जॉन नैश ने दो-व्यक्ति खेलों में संतुलन की स्थिति पर अपने कार्यों में नैश संतुलन की अवधारणा विकसित की।

रेइनहार्ड साल्टेन ने 1965 में "द ट्रीटमेंट ऑफ ओलिगोपॉली इन गेम थ्योरी ऑन डिमांड" ("स्पीलथियोरेटिस बेहैंडलुंग ईन्स ओलिगोमोडेल्स मिट नचफ्रागेट्राघेइट") पुस्तक प्रकाशित की, जिसके साथ अर्थशास्त्र में गेम थ्योरी के अनुप्रयोग को एक नई प्रेरणा शक्ति मिली। गेम थ्योरी के विकास में एक कदम आगे जॉन मेनार्ड स्मिथ के काम, "इवोल्यूशनरी स्टेबल स्ट्रैटेजी" (1974) से जुड़ा है। कैदी की दुविधा को रॉबर्ट एक्सेलरोड की 1984 की पुस्तक द इवोल्यूशन ऑफ कोऑपरेशन में लोकप्रिय बनाया गया था। 1994 में, जॉन नैश, जॉन हरसैनी और रेनहार्ड सेल्टेन को गेम थ्योरी में उनके योगदान के लिए नोबेल पुरस्कार से सम्मानित किया गया था।

जीवन और व्यवसाय में गेम थ्योरी

आइए हम संघर्ष की स्थिति (हितों के टकराव) के सार पर अधिक विस्तार से ध्यान दें, जैसा कि जीवन और व्यवसाय में विभिन्न स्थितियों के आगे के मॉडलिंग के लिए गेम थ्योरी में समझा जाता है। मान लीजिए कि एक व्यक्ति ऐसी स्थिति में है जो कई संभावित परिणामों में से एक की ओर ले जाता है, और इन परिणामों के संबंध में व्यक्ति की कुछ व्यक्तिगत प्राथमिकताएँ होती हैं। हालाँकि, वह कुछ हद तक उन चरों को नियंत्रित कर सकता है जो परिणाम निर्धारित करते हैं, लेकिन उसके पास उन पर पूर्ण शक्ति नहीं है। कभी-कभी नियंत्रण कई व्यक्तियों के हाथों में होता है, जिनकी, उनकी तरह, संभावित परिणामों के संबंध में कुछ प्राथमिकताएँ होती हैं, लेकिन सामान्य तौर पर इन व्यक्तियों के हित सुसंगत नहीं होते हैं। अन्य मामलों में, अंतिम परिणाम संयोग (जिसे कानूनी विज्ञान में कभी-कभी कहा जाता है) दोनों पर निर्भर हो सकता है प्राकृतिक आपदाएं), और अन्य व्यक्तियों से। गेम थ्योरी ऐसी स्थितियों के अवलोकन को व्यवस्थित करती है और ऐसी स्थितियों में बुद्धिमान कार्यों का मार्गदर्शन करने के लिए सामान्य सिद्धांतों का निर्माण करती है।

कुछ मायनों में, "गेम थ्योरी" नाम दुर्भाग्यपूर्ण है, क्योंकि यह बताता है कि गेम थ्योरी केवल पार्लर गेम में होने वाले सामाजिक रूप से महत्वहीन मुठभेड़ों से संबंधित है, लेकिन फिर भी सिद्धांत का बहुत व्यापक अर्थ है।

निम्नलिखित आर्थिक स्थिति गेम थ्योरी के अनुप्रयोग का अंदाजा दे सकती है। मान लीजिए कि कई उद्यमी हैं, जिनमें से प्रत्येक अधिकतम लाभ प्राप्त करने का प्रयास करता है, जबकि इस लाभ को निर्धारित करने वाले चर पर केवल सीमित शक्ति होती है। एक उद्यमी के पास उन चरों पर कोई शक्ति नहीं होती है जिन्हें दूसरा उद्यमी नियंत्रित करता है, लेकिन जो पहले की आय को बहुत प्रभावित कर सकते हैं। इस स्थिति को एक खेल के रूप में मानने से निम्नलिखित आपत्ति उत्पन्न हो सकती है। गेम मॉडल मानता है कि प्रत्येक उद्यमी क्षेत्र से एक विकल्प चुनता है संभावित चुनावऔर इन एकल विकल्पों से लाभ निर्धारित होता है। जाहिर है, वास्तविकता में ऐसा लगभग नहीं हो सकता है, क्योंकि इस मामले में उद्योग में जटिल प्रबंधन तंत्र की आवश्यकता नहीं होगी। इन निर्णयों में बस कई निर्णय और संशोधन होते हैं जो आर्थिक प्रणाली में अन्य प्रतिभागियों (खिलाड़ियों) द्वारा चुने गए विकल्पों पर निर्भर करते हैं। लेकिन सिद्धांत रूप में कोई यह कल्पना कर सकता है कि कोई प्रशासक प्रत्येक समस्या के उत्पन्न होने पर उसे हल करने के बजाय सभी संभावित आकस्मिकताओं का अनुमान लगाता है और प्रत्येक मामले में की जाने वाली कार्रवाई का विवरण देता है।

परिभाषा के अनुसार, एक सैन्य संघर्ष, हितों का टकराव है जिसमें किसी भी पक्ष का परिणाम निर्धारित करने वाले चर पर पूर्ण नियंत्रण नहीं होता है, जो लड़ाई की एक श्रृंखला द्वारा तय किया जाता है। आप परिणाम को आसानी से जीत या हार मान सकते हैं और उन्हें संख्यात्मक मान 1 और 0 निर्दिष्ट कर सकते हैं।

सबसे सरल संघर्ष स्थितियों में से एक, जिसे गेम थ्योरी में लिखा और हल किया जा सकता है, एक द्वंद्व है, जो क्रमशः दो खिलाड़ियों 1 और 2 के बीच का संघर्ष है। पीऔर क्यूशॉट्स. प्रत्येक खिलाड़ी के लिए एक फ़ंक्शन होता है जो खिलाड़ी के शॉट की संभावना को दर्शाता है मैंएक समय में टीऐसा प्रहार करेगा जो घातक होगा।

परिणामस्वरूप, खेल सिद्धांत हितों के टकराव के एक निश्चित वर्ग के निम्नलिखित सूत्रीकरण पर आता है: वहाँ हैं एनखिलाड़ियों को, और प्रत्येक को सौ विशिष्ट सेटों में से एक विकल्प चुनने की आवश्यकता होती है, और विकल्प चुनते समय, खिलाड़ी को अन्य खिलाड़ियों की पसंद के बारे में कोई जानकारी नहीं होती है। खिलाड़ी के संभावित पसंद क्षेत्र में "हुकुम का इक्का बजाना", "कारों के बजाय टैंक का उत्पादन करना", या अधिक सामान्यतः, एक रणनीति जो सभी संभावित परिस्थितियों में की जाने वाली सभी कार्रवाइयों को परिभाषित करती है, जैसे तत्व शामिल हो सकते हैं। प्रत्येक खिलाड़ी को एक कार्य का सामना करना पड़ता है: उसे क्या विकल्प चुनना चाहिए ताकि परिणाम पर उसका निजी प्रभाव उसे सबसे बड़ी संभावित जीत दिला सके?

खेल सिद्धांत में गणितीय मॉडल और समस्याओं का औपचारिकीकरण

जैसा कि हम पहले ही नोट कर चुके हैं, खेल संघर्ष की स्थिति का एक गणितीय मॉडल है और निम्नलिखित घटकों की आवश्यकता है:

  1. इच्छुक पार्टियाँ;
  2. प्रत्येक पक्ष पर संभावित कार्रवाई;
  3. पार्टियों के हित.

खेल में रुचि रखने वाले पक्षों को खिलाड़ी कहा जाता है , उनमें से प्रत्येक कम से कम दो कार्रवाई कर सकता है (यदि खिलाड़ी के पास अपने निपटान में केवल एक ही कार्रवाई है, तो वह वास्तव में खेल में भाग नहीं लेता है, क्योंकि यह पहले से ज्ञात है कि वह क्या करेगा)। खेल के परिणाम को जीत कहा जाता है .

वास्तविक संघर्ष की स्थिति हमेशा नहीं होती है, लेकिन खेल (गेम थ्योरी की अवधारणा में) हमेशा उसी के अनुसार आगे बढ़ता है निश्चित नियम , जो सटीक रूप से निर्धारित करता है:

  1. खिलाड़ियों के कार्यों के लिए विकल्प;
  2. प्रत्येक खिलाड़ी के पास अपने साथी के व्यवहार के बारे में कितनी जानकारी है;
  3. कार्यों के प्रत्येक सेट से मिलने वाला प्रतिफल।

औपचारिक खेलों के उदाहरणों में फुटबॉल, कार्ड खेल, शतरंज।

लेकिन अर्थशास्त्र में, खिलाड़ी के व्यवहार का एक मॉडल उभरता है, उदाहरण के लिए, जब कई कंपनियां बाजार में अधिक लाभप्रद स्थान लेने का प्रयास करती हैं, तो कई व्यक्ति कुछ अच्छे (संसाधन, वित्त) को आपस में बांटने की कोशिश करते हैं ताकि हर किसी को जितना संभव हो सके उतना मिल सके। . अर्थव्यवस्था में संघर्ष की स्थितियों में खिलाड़ी, जिन्हें एक खेल के रूप में तैयार किया जा सकता है, कंपनियां, बैंक, व्यक्ति और अन्य आर्थिक एजेंट हैं। बदले में, युद्ध की स्थिति में, गेम मॉडल का उपयोग किया जाता है, उदाहरण के लिए, दुश्मन को हराने या हमले से बचाने के लिए सबसे अच्छा हथियार (मौजूदा या संभावित में से) चुनने में।

खेल की विशेषता परिणाम की अनिश्चितता है . अनिश्चितता के कारणों को निम्नलिखित समूहों में विभाजित किया जा सकता है:

  1. संयोजक (शतरंज की तरह);
  2. यादृच्छिक कारकों का प्रभाव (जैसे खेल "हेड्स या टेल्स", पासा, कार्ड गेम में);
  3. रणनीतिक (खिलाड़ी को नहीं पता कि दुश्मन क्या कार्रवाई करेगा)।

खिलाड़ी की रणनीति नियमों का एक समूह है जो वर्तमान स्थिति के आधार पर प्रत्येक कदम पर उसके कार्यों को निर्धारित करता है।

गेम थ्योरी का उद्देश्य प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति निर्धारित करना है। ऐसी रणनीति निर्धारित करने का अर्थ है खेल को हल करना। रणनीति की इष्टतमता यह तब प्राप्त होता है जब एक खिलाड़ी को अधिकतम जीत हासिल करनी चाहिए, जबकि दूसरा अपनी रणनीति पर कायम रहता है। और यदि पहला खिलाड़ी अपनी रणनीति पर अड़ा रहता है तो दूसरे खिलाड़ी को कम से कम नुकसान होना चाहिए।

खेलों का वर्गीकरण

  1. खिलाड़ियों की संख्या के आधार पर वर्गीकरण (दो या दो से अधिक व्यक्तियों का खेल). दो-व्यक्ति गेम सभी गेम थ्योरी में एक केंद्रीय स्थान रखते हैं। दो-व्यक्ति खेलों के लिए गेम थ्योरी की मूल अवधारणा संतुलन के बहुत महत्वपूर्ण विचार का सामान्यीकरण है जो स्वाभाविक रूप से दो-व्यक्ति खेलों में प्रकट होता है। जहाँ तक खेलों का सवाल है एनव्यक्तियों, तो खेल सिद्धांत का एक हिस्सा उन खेलों के लिए समर्पित है जिनमें खिलाड़ियों के बीच सहयोग निषिद्ध है। गेम थ्योरी के दूसरे भाग में एनयह माना जाता है कि व्यक्ति पारस्परिक लाभ के लिए सहयोग करने में सक्षम हैं (इस पैराग्राफ में बाद में असहयोगी और देखें)। सहकारी खेलओह)।
  2. खिलाड़ियों की संख्या और उनकी रणनीतियों के आधार पर वर्गीकरण (रणनीतियों की संख्या कम से कम दो है, अनंत हो सकती है)।
  3. जानकारी की मात्रा के आधार पर वर्गीकरण पिछली चालों के सापेक्ष: खेल के साथ पूरी जानकारीऔर अधूरी जानकारी. मान लीजिए खिलाड़ी 1 - खरीदार और खिलाड़ी 2 - विक्रेता हैं। यदि खिलाड़ी 1 को खिलाड़ी 2 के कार्यों के बारे में पूरी जानकारी नहीं है, तो खिलाड़ी 1 उन दो विकल्पों के बीच अंतर नहीं कर सकता है जिनके बीच उसे चुनाव करना होगा। उदाहरण के लिए, किसी उत्पाद के दो प्रकारों के बीच चयन करना और यह न जानना कि, कुछ विशेषताओं के अनुसार, उत्पाद क्या है बदतर उत्पाद बी, खिलाड़ी 1 को विकल्पों के बीच अंतर दिखाई नहीं दे सकता है।
  4. जीत के विभाजन के सिद्धांतों के अनुसार वर्गीकरण : एक तरफ सहयोगात्मक, गठबंधन और दूसरी तरफ असहयोगी, गैर-गठबंधन। में असहयोगी खेल , या अन्यथा - असहयोगी खेल , खिलाड़ी यह जाने बिना कि दूसरा खिलाड़ी कौन सी रणनीति चुनेगा, एक साथ रणनीतियाँ चुनते हैं। खिलाड़ियों के बीच संचार असंभव है. में सहकारी खेल , या अन्यथा - गठबंधन का खेल , खिलाड़ी गठबंधन बना सकते हैं और अपनी जीत बढ़ाने के लिए सामूहिक कार्रवाई कर सकते हैं।
  5. परिमित दो-व्यक्ति शून्य-राशि खेल या एक विरोधी खेल है रणनीति खेलपूरी जानकारी के साथ, जिसमें विरोधी हितों वाली पार्टियाँ शामिल हैं। विरोधी खेल हैं मैट्रिक्स खेल .

गेम थ्योरी का एक उत्कृष्ट उदाहरण कैदी की दुविधा है।

दोनों संदिग्धों को हिरासत में ले लिया गया और एक दूसरे से अलग कर दिया गया। जिला अटॉर्नी आश्वस्त है कि उन्होंने ऐसा किया है गंभीर अपराध, लेकिन अदालत में उन पर आरोप लगाने के लिए पर्याप्त सबूत नहीं हैं। वह प्रत्येक कैदी से कहता है कि उसके पास दो विकल्प हैं: पुलिस जो अपराध मानती है उसे कबूल कर ले या अपराध कबूल न कर ले। यदि दोनों कबूल नहीं करते हैं, तो डीए उन पर कुछ छोटे अपराध का आरोप लगाएगा, जैसे छोटी चोरी या हथियार का अवैध कब्ज़ा, और उन दोनों को एक छोटी सी सजा मिलेगी। यदि वे दोनों कबूल करते हैं, तो उन पर मुकदमा चलाया जाएगा, लेकिन वह कड़ी सजा की मांग नहीं करेंगे। यदि एक कबूल करता है और दूसरा नहीं करता है, तो जिसने कबूल किया है उसे एक साथी के प्रत्यर्पण के लिए उसकी सजा कम कर दी जाएगी, जबकि जो कायम रहेगा उसे "पूरी तरह" मिलेगा।

यदि इस रणनीतिक कार्य को निष्कर्ष के रूप में तैयार किया जाता है, तो यह निम्नलिखित तक सीमित हो जाता है:

इस प्रकार, यदि दोनों कैदी कबूल नहीं करते हैं, तो उन्हें प्रत्येक को 1 वर्ष की सजा मिलेगी। यदि दोनों कबूल करते हैं, तो प्रत्येक को 8 वर्ष की सजा मिलेगी। और यदि एक कबूल करता है, और दूसरा नहीं कबूल करता है, तो जिसने कबूल किया है उसे तीन महीने की जेल होगी, और जो कबूल नहीं करेगा उसे 10 साल मिलेंगे। उपरोक्त मैट्रिक्स कैदी की दुविधा को सही ढंग से दर्शाता है: हर किसी को इस सवाल का सामना करना पड़ता है कि कबूल करना है या नहीं। जिला अटॉर्नी कैदियों को जो गेम ऑफर करता है वह है असहयोगी खेल या अन्यथा - असहयोगी खेल . यदि दोनों कैदियों को सहयोग करने का अवसर मिले (अर्थात्) खेल सहकारी होगा वरना गठबंधन का खेल ), तो दोनों कबूल नहीं करेंगे और प्रत्येक को एक वर्ष की जेल होगी।

गेम थ्योरी के गणितीय उपकरणों का उपयोग करने के उदाहरण

अब हम खेलों के सामान्य वर्गों के उदाहरणों के समाधान पर विचार करने के लिए आगे बढ़ते हैं, जिसके लिए खेल सिद्धांत में अनुसंधान और समाधान विधियां हैं।

दो व्यक्तियों के असहयोगी (गैर-सहकारी) खेल की औपचारिकता का एक उदाहरण

पिछले पैराग्राफ में, हमने पहले ही एक गैर-सहकारी (गैर-सहकारी) गेम (कैदी की दुविधा) का एक उदाहरण देखा था। आइए अपने कौशल को मजबूत करें। आर्थर कॉनन डॉयल द्वारा लिखित "द एडवेंचर्स ऑफ शेरलॉक होम्स" से प्रेरित एक क्लासिक कथानक भी इसके लिए उपयुक्त है। बेशक, कोई आपत्ति कर सकता है: उदाहरण जीवन से नहीं है, बल्कि साहित्य से है, लेकिन कॉनन डॉयल ने खुद को विज्ञान कथा लेखक के रूप में स्थापित नहीं किया है! क्लासिक इसलिए भी क्योंकि यह कार्य ऑस्कर मॉर्गनस्टर्न द्वारा पूरा किया गया था, जैसा कि हम पहले ही स्थापित कर चुके हैं, गेम थ्योरी के संस्थापकों में से एक।

उदाहरण 1।"द एडवेंचर्स ऑफ शेरलॉक होम्स" के एक अंश का संक्षिप्त सारांश दिया जाएगा। गेम थ्योरी की प्रसिद्ध अवधारणाओं के अनुसार, संघर्ष की स्थिति का एक मॉडल बनाएं और गेम को औपचारिक रूप से लिखें।

शर्लक होम्स अपने पीछा कर रहे प्रोफेसर मोरियार्टी से बचने के लिए महाद्वीप (यूरोपीय) तक पहुंचने के लक्ष्य के साथ लंदन से डोवर तक यात्रा करने का इरादा रखता है। ट्रेन में चढ़ने के बाद, उन्होंने स्टेशन के प्लेटफार्म पर प्रोफेसर मोरियार्टी को देखा। शर्लक होम्स स्वीकार करते हैं कि मोरियार्टी एक विशेष ट्रेन चुन सकते हैं और उससे आगे निकल सकते हैं। शर्लक होम्स के पास दो विकल्प हैं: डोवर की यात्रा जारी रखें या कैंटरबरी स्टेशन पर उतरें, जो उसके मार्ग पर एकमात्र मध्यवर्ती स्टेशन है। हम स्वीकार करते हैं कि उसका प्रतिद्वंद्वी होम्स की क्षमताओं को निर्धारित करने के लिए पर्याप्त बुद्धिमान है, इसलिए उसके पास वही दो विकल्प हैं। दोनों विरोधियों को ट्रेन से उतरने के लिए एक स्टेशन चुनना होगा, बिना यह जाने कि उनमें से प्रत्येक क्या निर्णय लेगा। यदि, निर्णय लेने के परिणामस्वरूप, दोनों एक ही स्टेशन पर पहुँचते हैं, तो हम निश्चित रूप से मान सकते हैं कि शर्लक होम्स को प्रोफेसर मोरियार्टी द्वारा मार दिया जाएगा। यदि शर्लक होम्स सुरक्षित रूप से डोवर पहुँच जाता है, तो वह बच जाएगा।

समाधान। कॉनन डॉयल के नायकों को हम खेल में भागीदार अर्थात खिलाड़ी मान सकते हैं। हर खिलाड़ी के लिए उपलब्ध मैं (मैं=1,2) दो शुद्ध रणनीतियाँ:

  • डोवर पर उतरें (रणनीति एसi1 ( मैं=1,2) );
  • किसी मध्यवर्ती स्टेशन पर उतरें (रणनीति) एसi2 ( मैं=1,2) )

दोनों खिलाड़ियों में से प्रत्येक कौन सी रणनीति चुनता है, इसके आधार पर जोड़ी के रूप में रणनीतियों का एक विशेष संयोजन बनाया जाएगा एस = (एस1 , एस 2 ) .

प्रत्येक संयोजन को एक घटना से जोड़ा जा सकता है - प्रोफेसर मोरियार्टी द्वारा शर्लक होम्स की हत्या के प्रयास का परिणाम। हम संभावित घटनाओं के साथ इस गेम का एक मैट्रिक्स बनाते हैं।

प्रत्येक घटना के अंतर्गत प्रोफेसर मोरियार्टी के अधिग्रहण को दर्शाने वाला एक सूचकांक है, और इसकी गणना होम्स की मुक्ति के आधार पर की जाती है। दोनों नायक एक ही समय में रणनीति चुनते हैं, बिना यह जाने कि दुश्मन क्या चुनेगा। इस प्रकार, खेल असहयोगी है क्योंकि, सबसे पहले, खिलाड़ी अलग-अलग ट्रेनों में हैं, और दूसरे, उनके विरोधी हित हैं।

सहकारी (गठबंधन) खेल की औपचारिकता और समाधान का एक उदाहरण एनव्यक्तियों

इस बिंदु पर, व्यावहारिक भाग, यानी, एक उदाहरण समस्या को हल करने की प्रक्रिया, एक सैद्धांतिक भाग से पहले होगी, जिसमें हम सहकारी (गैर-सहकारी) खेलों को हल करने के लिए गेम सिद्धांत की अवधारणाओं से परिचित होंगे। इस कार्य के लिए, गेम थ्योरी सुझाव देती है:

  • विशिष्ट कार्य (सीधे शब्दों में कहें तो, यह खिलाड़ियों को एक गठबंधन में एकजुट करने के लाभ की भयावहता को दर्शाता है);
  • योगात्मकता की अवधारणा (मात्राओं की संपत्ति, जिसमें यह तथ्य शामिल है कि संपूर्ण वस्तु के अनुरूप मात्रा का मूल्य वस्तु के विभाजन के एक निश्चित वर्ग में उसके भागों के अनुरूप मात्राओं के मूल्यों के योग के बराबर है भागों में) और विशेषता फ़ंक्शन की सुपरएडिटिविटी (संपूर्ण वस्तु के अनुरूप मात्रा का मान उसके भागों के अनुरूप मात्राओं के मानों के योग से अधिक है)।

विशेषता फ़ंक्शन की सुपरएडिटिविटी से पता चलता है कि गठबंधन में शामिल होना खिलाड़ियों के लिए फायदेमंद है, क्योंकि इस मामले में गठबंधन के भुगतान का मूल्य खिलाड़ियों की संख्या के साथ बढ़ता है।

खेल को औपचारिक बनाने के लिए, हमें उपरोक्त अवधारणाओं के लिए औपचारिक नोटेशन पेश करने की आवश्यकता है।

खेल के लिए एनआइए हम इसके सभी खिलाड़ियों के सेट को इस प्रकार निरूपित करें एन= (1,2,...,n) समुच्चय का कोई गैर-रिक्त उपसमुच्चय एनआइए इसे इस रूप में निरूपित करें टी(स्वयं सहित एनऔर सभी उपसमुच्चय एक तत्व से बने हैं)। साइट पर एक पाठ है " सेट और सेट पर संचालन", जो लिंक पर क्लिक करने पर एक नई विंडो में खुलती है।

चारित्रिक फलन को इस प्रकार दर्शाया गया है वीऔर इसकी परिभाषा के क्षेत्र में सेट के संभावित उपसमुच्चय शामिल हैं एन. वी(टी) - एक विशेष उपसमुच्चय के लिए विशेषता फ़ंक्शन का मूल्य, उदाहरण के लिए, एक गठबंधन द्वारा प्राप्त आय, संभवतः एक खिलाड़ी से युक्त आय। यह महत्वपूर्ण है क्योंकि गेम थ्योरी के लिए सभी असंबद्ध गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जाँच करना आवश्यक है।

दो गैर-रिक्त उपसमुच्चय गठबंधनों के लिए टी1 और टी2 सहकारी (गठबंधन) खेल के विशिष्ट कार्य की संवेदनशीलता इस प्रकार लिखी गई है:

और सुपरएडिटिविटी इस प्रकार है:

उदाहरण 2.तीन संगीत विद्यालय के छात्र विभिन्न क्लबों में अंशकालिक काम करते हैं; उन्हें क्लब के आगंतुकों से अपनी आय प्राप्त होती है। सहकारी खेलों को हल करने के लिए गेम थ्योरी की अवधारणाओं का उपयोग करके निर्धारित करें कि क्या उनके लिए बलों में शामिल होना लाभदायक है (यदि हां, तो किन परिस्थितियों में)। एननिम्नलिखित प्रारंभिक डेटा वाले व्यक्ति।

औसतन, प्रति शाम उनका राजस्व था:

  • वायलिन वादक के पास 600 इकाइयाँ हैं;
  • गिटारवादक के पास 700 इकाइयाँ हैं;
  • गायक के पास 900 इकाइयाँ हैं।

राजस्व बढ़ाने के प्रयास में, छात्रों ने कई महीनों के दौरान विभिन्न समूह बनाए। परिणामों से पता चला कि टीम बनाकर, वे अपना शाम का राजस्व बढ़ा सकते हैं:

  • वायलिन वादक + गिटारवादक ने 1500 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गायक ने 1800 इकाइयाँ अर्जित कीं;
  • गिटारवादक + गायक ने 1900 इकाइयाँ अर्जित कीं;
  • वायलिन वादक + गिटारवादक + गायक ने 3000 इकाइयाँ अर्जित कीं।

समाधान। इस उदाहरण में, खेल में खिलाड़ियों की संख्या एन= 3, इसलिए, खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के 2³ = 8 संभावित उपसमुच्चय शामिल हैं। आइए सभी संभावित गठबंधनों की सूची बनाएं टी:

  • एक तत्व के गठबंधन, जिनमें से प्रत्येक में एक खिलाड़ी होता है - एक संगीतकार: टी{1} , टी{2} , टी{3} ;
  • दो तत्वों का गठबंधन: टी{1,2} , टी{1,3} , टी{2,3} ;
  • तीन तत्वों का गठबंधन: टी{1,2,3} .

हम प्रत्येक खिलाड़ी को एक क्रमांक निर्दिष्ट करेंगे:

  • वायलिन वादक - प्रथम वादक;
  • गिटारवादक - दूसरा खिलाड़ी;
  • गायक - तीसरा खिलाड़ी।

समस्या डेटा के आधार पर, हम गेम के विशिष्ट कार्य का निर्धारण करते हैं वी:

v(T(1)) = 600 ; v(T(2)) = 700 ; v(T(3)) = 900 ; विशेषता फ़ंक्शन के ये मूल्य क्रमशः पहले, दूसरे और तीसरे खिलाड़ियों के भुगतान के आधार पर निर्धारित किए जाते हैं, जब वे गठबंधन में एकजुट नहीं होते हैं;

v(T(1,2)) = 1500 ; v(T(1,3)) = 1800 ; v(T(2,3)) = 1900 ; विशेषता फ़ंक्शन के ये मूल्य गठबंधन में एकजुट खिलाड़ियों की प्रत्येक जोड़ी के राजस्व से निर्धारित होते हैं;

v(T(1,2,3)) = 3000 ; विशेषता फ़ंक्शन का यह मान उस स्थिति में औसत राजस्व द्वारा निर्धारित किया जाता है जब खिलाड़ी तीन में एकजुट होते हैं।

इस प्रकार, हमने खिलाड़ियों के सभी संभावित गठबंधनों को सूचीबद्ध किया है; जैसा कि होना चाहिए, उनमें से आठ हैं, क्योंकि खेल के विशिष्ट कार्य की परिभाषा के क्षेत्र में सभी खिलाड़ियों के सेट के ठीक आठ संभावित उपसमूह शामिल हैं। गेम थ्योरी की यही आवश्यकता है, क्योंकि हमें सभी असंयुक्त गठबंधनों के विशिष्ट कार्य के मूल्यों के लिए सुपरएडिटिविटी की उपस्थिति की जांच करने की आवश्यकता है।

इस उदाहरण में सुपरएडिटिविटी की शर्तें कैसे संतुष्ट हैं? आइए निर्धारित करें कि खिलाड़ी असंयुक्त गठबंधन कैसे बनाते हैं टी1 और टी2 . यदि कुछ खिलाड़ी किसी गठबंधन का हिस्सा हैं टी1 , तो अन्य सभी खिलाड़ी गठबंधन का हिस्सा हैं टी2 और परिभाषा के अनुसार, यह गठबंधन खिलाड़ियों के पूरे सेट और सेट के अंतर के रूप में बनता है टी1 . तो अगर टी1 - एक खिलाड़ी का गठबंधन, फिर गठबंधन में टी2 गठबंधन में दूसरे और तीसरे खिलाड़ी होंगे टी1 पहले और तीसरे खिलाड़ी होंगे, फिर गठबंधन होगा टी2 इसमें केवल दूसरा खिलाड़ी शामिल होगा, इत्यादि।

यदि कई परस्पर विरोधी पक्ष (व्यक्ति) हैं, जिनमें से प्रत्येक नियमों के दिए गए सेट द्वारा निर्धारित एक निश्चित निर्णय लेता है, और प्रत्येक व्यक्ति प्रत्येक पक्ष के लिए पूर्व निर्धारित भुगतान के साथ संघर्ष की स्थिति की अंतिम स्थिति जानता है, तो एक खेल होने को कहा जाता है।

गेम थ्योरी का कार्य किसी दिए गए खिलाड़ी के लिए व्यवहार की एक पंक्ति चुनना है, जिससे विचलन केवल उसकी जीत को कम कर सकता है।

खेल की कुछ परिभाषाएँ

खेल के परिणामों के मात्रात्मक मूल्यांकन को भुगतान कहा जाता है।

दोगुना हो जाता है (दो व्यक्तियों) को शून्य-राशि खेल कहा जाता है यदि भुगतान का योग शून्य है, अर्थात। यदि एक खिलाड़ी की हानि दूसरे के लाभ के बराबर है।

प्रत्येक संभावित परिस्थिति में खिलाड़ी की पसंद का स्पष्ट विवरण जिसमें उसे व्यक्तिगत कदम उठाना चाहिए, कहलाता है खिलाड़ी की रणनीति .

किसी खिलाड़ी की रणनीति को इष्टतम कहा जाता है, जब खेल को कई बार दोहराया जाता है, तो यह खिलाड़ी को अधिकतम संभव औसत भुगतान प्रदान करता है (या, जो एक ही बात है, न्यूनतम संभव औसत भुगतान)।

खेल एक मैट्रिक्स द्वारा परिभाषित होना एमलाइनें और एनस्तंभों को आयाम का एक परिमित युग्म खेल कहा जाता है एम* एन;

कहाँ मैं=
- एमरणनीति के साथ पहले खिलाड़ी की रणनीति; जे=- n रणनीतियों वाले दूसरे खिलाड़ी की रणनीति; आईजे– पहले खिलाड़ी की जीत मैं-रणनीति जब दूसरे द्वारा उपयोग की जाती है जेवें रणनीति (या, एक ही बात क्या है, इसके दूसरे का नुकसान जे-वीं रणनीति, जब पहली बार उपयोग की गई मैंवां);

ए =  आईजे- गेम का भुगतान मैट्रिक्स।

1.1 शुद्ध रणनीतियों के साथ खेलना

खेल की कम कीमत (पहले खिलाड़ी के लिए)

= अधिकतम (मिन आईजे). (1.2)

मैं जे

शीर्ष खेल मूल्य (दूसरे खिलाड़ी के लिए):

= मिन (अधिकतम आईजे) . (1.3)

जे मैं

अगर = , गेम को सैडल पॉइंट गेम (1.4), या शुद्ध रणनीतियों वाला गेम कहा जाता है। जिसमें वी = = एक मूल्यवान खेल कहा जाता है ( वी- खेल की कीमत)।

उदाहरण। 2-व्यक्ति गेम ए के भुगतान मैट्रिक्स को देखते हुए प्रत्येक खिलाड़ी के लिए इष्टतम रणनीति और गेम की कीमत निर्धारित करें:

(1.4)

अधिकतम 10 9 12 6

मैं

मिन 6

जे

- पहले खिलाड़ी (पंक्ति) की रणनीति।

दूसरे खिलाड़ी की रणनीति (कॉलम)।

- खेल की कीमत.

इस प्रकार, खेल में एक काठी बिंदु है। रणनीति जे = 4 - दूसरे खिलाड़ी के लिए इष्टतम रणनीति मैं=2 - पहले के लिए. हमारे पास शुद्ध रणनीतियों वाला खेल है।

1.2 मिश्रित रणनीतियों वाले खेल

यदि भुगतान मैट्रिक्स में कोई सैडल पॉइंट नहीं है, यानी।
, और खेल में कोई भी एक योजना को अपनी इष्टतम रणनीति के रूप में नहीं चुन सकता है, खिलाड़ी "मिश्रित रणनीतियों" पर स्विच करते हैं। इसके अलावा, प्रत्येक खिलाड़ी खेल के दौरान अपनी प्रत्येक रणनीति का कई बार उपयोग करता है।

एक वेक्टर, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की सापेक्ष आवृत्ति को दर्शाता है, इस खिलाड़ी की मिश्रित रणनीति कहलाती है।

एक्स= (एक्स 1 …एक्स मैं …एक्स एम) - पहले खिलाड़ी की मिश्रित रणनीति।

यू= (पर 1 ...य जे ...य एन)- दूसरे खिलाड़ी की मिश्रित रणनीति।

एक्समैं , य जे- अपनी रणनीतियों का उपयोग करने वाले खिलाड़ियों की सापेक्ष आवृत्तियाँ (संभावनाएं)।

मिश्रित रणनीतियों के उपयोग की शर्तें

. (1.5)

अगर एक्स* = (एक्स 1 * ….एक्समैं*... एक्स एम*) - पहले खिलाड़ी द्वारा चुनी गई इष्टतम रणनीति; वाई* = (पर 1 * …परजे*... पर एन*) दूसरे खिलाड़ी द्वारा चुनी गई इष्टतम रणनीति है, तो संख्या खेल की लागत है।

(1.6)

संख्या के क्रम में वीखेल की कीमत थी, और एक्स* और पर* - इष्टतम रणनीतियाँ, असमानताओं को संतुष्ट करने के लिए यह आवश्यक और पर्याप्त है

(1.7)

यदि कोई खिलाड़ी इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि दूसरा खिलाड़ी किस आवृत्ति के साथ शुद्ध रणनीतियों सहित, इष्टतम में शामिल रणनीतियों का उपयोग करेगा।

गेम थ्योरी समस्याओं को रैखिक प्रोग्रामिंग समस्याओं में कम करना।

उदाहरण. पेऑफ मैट्रिक्स द्वारा परिभाषित गेम का समाधान ढूंढें .

ए = (1.8)

1 2 3

समाधान:

आइए रैखिक प्रोग्रामिंग समस्याओं की एक दोहरी जोड़ी बनाएं।

पहले खिलाड़ी के लिए

(1.9)

पर 1 +पर 2 +पर 3 = 1 (1.10)

अपने आप को परिवर्तनशील से मुक्त करना वी(खेल मूल्य), भावों के बाएँ और दाएँ पक्षों को (1.9), (1.10) में विभाजित करें वी. स्वीकार कर लिया है पर जे /वीएक नये वेरिएबल के लिए जेड मैं, हम पाते हैं नई प्रणालीबाधाएँ (1.11) और उद्देश्य फलन (1.12)

(1.11)

. (1.12)

इसी प्रकार, हमें दूसरे खिलाड़ी के लिए गेम मॉडल मिलता है:

(1.13)

एक्स 1 +एक्स 2 +एक्स 3 = 1 . (1.14)

मॉडल (1.13), (1.14) को बिना किसी चर के एक रूप में कम करना वी, हम पाते हैं

(1.15)

, (1.16)

कहाँ
.

यदि हमें पहले खिलाड़ी की व्यवहार रणनीति निर्धारित करने की आवश्यकता है, अर्थात। उसकी रणनीतियों के उपयोग की सापेक्ष आवृत्ति ( एक्स 1 ….एक्स मैं …एक्स एम), हम दूसरे प्लेयर मॉडल का उपयोग करेंगे, क्योंकि ये चर उसके भुगतान मॉडल (1.13), (1.14) में हैं।

आइए हम (1.15), (1.16) को विहित रूप में घटाएँ

(1.17)

सामग्री 1 सामान्य जानकारी 2 1.1 खेल. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 चालें। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 रणनीतियाँ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 मैट्रिक्स गेम। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ट्रेल प्वाइंट. शुद्ध रणनीतियाँ 7 2.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 मिश्रित रणनीतियाँ 9 3.1 गेम 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 उदाहरण. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 ज्यामितीय व्याख्या। . . . . . . . . . . . . . . . . . . . 12 3.2 गेम्स 2×एन और एम×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 उदाहरण 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. खेल सिद्धांत से सामान्य जानकारी 1.1. गेम्स गेम थ्योरी संघर्ष स्थितियों का एक गणितीय सिद्धांत है, अर्थात। ऐसी स्थितियाँ जिनमें अलग-अलग लक्ष्य हासिल करने वाले दो या दो से अधिक दलों के हित टकराते हैं। एक गेम कुछ नियमों द्वारा नियंत्रित एक संघर्ष की स्थिति है, जिसमें यह दर्शाया जाना चाहिए: प्रतिभागियों के कार्यों के लिए संभावित विकल्प या भुगतान (जीतना, हारना) जिसके लिए चालों का एक सेट जानकारी की मात्रा की ओर जाता है; प्रत्येक पक्ष के बारे में दूसरे के व्यवहार के बारे में। युगल खेल एक ऐसा खेल है जिसमें केवल दो पक्ष (दो खिलाड़ी) भाग लेते हैं। शून्य-राशि युग्मित खेल एक युग्मित खेल है जिसमें भुगतान का योग शून्य होता है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। भुगतान फ़ंक्शन के मूल्य के प्रति प्रत्येक खिलाड़ी के रवैये के आधार पर, युग्मित खेलों को उप-विभाजित किया जाता है: शून्य-राशि युग्मित खेल (विरोधी) - एक युग्मित खेल जिसमें भुगतान की राशि शून्य के बराबर होती है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। एक गैर-प्रतिद्वंद्वी खेल एक युग्मित खेल है जिसमें खिलाड़ी अलग-अलग, लेकिन सीधे विपरीत नहीं, लक्ष्यों का पीछा करते हैं। 2 1.2. चालें चालें - खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक का चयन, चालें दो प्रकार की होती हैं: व्यक्तिगत चाल - + सचेत विकल्पखेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक + इस विकल्प का कार्यान्वयन यादृच्छिक चाल - एक यादृच्छिक चाल कई संभावनाओं में से एक विकल्प है, जो खिलाड़ी के निर्णय से नहीं, बल्कि कुछ यादृच्छिक चयन तंत्र द्वारा किया जाता है। नीचे हम शून्य-राशि युग्मित खेलों पर विचार करते हैं जिनमें केवल व्यक्तिगत चालें होती हैं। प्रत्येक पक्ष के पास दूसरे के व्यवहार के बारे में जानकारी का अभाव है। 3 1.3. रणनीतियाँ एक खिलाड़ी की रणनीति नियमों का एक समूह है जो खेल के दौरान उत्पन्न होने वाली स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्यों की पसंद निर्धारित करती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को सीमित और अनंत में विभाजित किया गया है। अंतहीन खेल- एक खेल जिसमें कम से कम एक खिलाड़ी के पास अनंत संख्या में रणनीतियाँ होती हैं। परिमित खेल वह खेल है जिसमें प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ होती हैं। किसी भी खिलाड़ी के लिए लगातार चालों की संख्या खेल के विभाजन को एकल-चाल और बहु-चाल, या स्थितीय में निर्धारित करती है। + वन-टर्न गेम में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर गेम का परिणाम निर्धारित करता है। + एक बहु-चाल, या स्थितीय, खेल समय के साथ विकसित होता है, जो क्रमिक चरणों की एक श्रृंखला का प्रतिनिधित्व करता है, जिनमें से प्रत्येक खिलाड़ी के एक कदम और स्थिति में संबंधित परिवर्तन के बाद होता है। एक-मोड़ वाले खेल में, प्रत्येक खिलाड़ी केवल एक ही विकल्प चुनता है संभावित विकल्पऔर फिर खेल का परिणाम निर्धारित करता है। एक खिलाड़ी की इष्टतम रणनीति एक ऐसी रणनीति है, जो खेल को कई बार दोहराए जाने पर, इस खिलाड़ी को अधिकतम संभव औसत जीत (या, वही, न्यूनतम संभव औसत हानि) प्रदान करती है। गेम थ्योरी में, सभी सिफारिशें खिलाड़ियों के उचित व्यवहार की धारणा के आधार पर की जाती हैं। खिलाड़ियों की ग़लतियाँ और गलतियाँ, हर संघर्ष की स्थिति में अपरिहार्य, साथ ही उत्साह और जोखिम के तत्वों को गेम थ्योरी में ध्यान में नहीं रखा जाता है। 4 1.4. मैट्रिक्स गेम एक मैट्रिक्स गेम एक एक-चाल वाला परिमित शून्य-योग गेम है। एक मैट्रिक्स गेम एक संघर्ष की स्थिति का एक गेम-सैद्धांतिक मॉडल है जिसमें प्रतिद्वंद्वी, बिल्कुल विपरीत लक्ष्यों को प्राप्त करने के लिए, एक परिमित से एक विकल्प (चाल) बनाते हैं। संख्या संभावित तरीकेक्रियाएँ। क्रिया के चुने हुए तरीकों (रणनीतियों) के अनुसार, प्राप्त परिणाम निर्धारित किया जाता है। आइए एक उदाहरण देखें. मान लीजिए कि दो खिलाड़ी A और B हैं, जिनमें से एक को चुना जा सकता है मैं-वें रणनीति अपनी संभावित रणनीतियों A1, A2, ...Am में से m से, और दूसरा अपनी संभावित रणनीतियों B1, B2, ...Bm में से j-th रणनीति चुनता है। परिणामस्वरूप, पहला खिलाड़ी aij मान जीतता है, और दूसरा खिलाड़ी यह मान खो देता है। संख्याओं aij से, हम एक मैट्रिक्स बनाते हैं   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   । . . .  am1 am2 · · amn मैट्रिक्स A = (aij), i = 1, m, j = 1, n को पेऑफ मैट्रिक्स या m × n गेम मैट्रिक्स कहा जाता है। इस मैट्रिक्स में, पंक्तियाँ हमेशा जीतने वाले (अधिकतम करने वाले) खिलाड़ी A की रणनीतियों के लिए होती हैं, यानी वह खिलाड़ी जो अपनी जीत को अधिकतम करने का प्रयास करता है। हारने वाले खिलाड़ी बी की रणनीतियों के लिए कॉलम आवंटित किए जाते हैं, यानी वह खिलाड़ी जो दक्षता मानदंड को कम करने का प्रयास करता है। किसी खेल का सामान्यीकरण एक स्थितिगत खेल को मैट्रिक्स खेल में बदलने की प्रक्रिया है संघर्ष की स्थिति जिसमें प्रतिद्वंद्वी इस स्थिति के विकास के प्रत्येक चरण में कार्रवाई के संभावित तरीकों की एक सीमित संख्या में से क्रमिक रूप से एक विकल्प (चाल) करते हैं। खेल का समाधान दोनों खिलाड़ियों की इष्टतम रणनीतियों का पता लगाना और खेल की कीमत निर्धारित करना है। खेल की कीमत खिलाड़ियों का अपेक्षित लाभ (हानि) है। खेल का समाधान या तो शुद्ध रणनीतियों में पाया जा सकता है - जब खिलाड़ी को एक ही रणनीति का पालन करना होगा, या मिश्रित में, जब खिलाड़ी को कुछ संभावनाओं के साथ दो या अधिक शुद्ध रणनीतियों का उपयोग करना होगा। इस मामले में उत्तरार्द्ध को सक्रिय कहा जाता है। 5 एक खिलाड़ी की मिश्रित रणनीति एक वेक्टर है, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की आवृत्ति को दर्शाता है। खेल की अधिकतम या कम कीमत - संख्या α = अधिकतम न्यूनतम aij i j अधिकतम रणनीति (लाइन) - वह रणनीति जिसे खिलाड़ी ने अपनी न्यूनतम जीत को अधिकतम करने के लिए चुना है। जाहिर है, सबसे सतर्क मैक्सिमम रणनीति चुनते समय, खिलाड़ी ए खुद को (प्रतिद्वंद्वी के व्यवहार की परवाह किए बिना) कम से कम α की गारंटीकृत अदायगी प्रदान करता है। खेल की अधिकतम या ऊपरी कीमत - संख्या β = न्यूनतम अधिकतम aij j i मिनिमैक्स रणनीति (कॉलम) - वह रणनीति जिसे खिलाड़ी ने अपने अधिकतम नुकसान को कम करने के लिए चुना है। जाहिर है, सबसे सतर्क मिनिमैक्स रणनीति चुनते समय, खिलाड़ी बी, किसी भी परिस्थिति में, खिलाड़ी ए को β से अधिक जीतने की अनुमति नहीं देता है। गेम की निचली कीमत हमेशा गेम की ऊपरी कीमत से अधिक नहीं होती है α = अधिकतम न्यूनतम aij 6 मिनट अधिकतम aij = β i j j i प्रमेय 1 (मैट्रिक्स गेम के सिद्धांत का मुख्य प्रमेय)। प्रत्येक परिमित खेल में कम से कम एक समाधान होता है, संभवतः मिश्रित रणनीतियों के दायरे में। 6 2. सैडल पॉइंट वाले खेल। शुद्ध रणनीतियों में समाधान सैडल पॉइंट वाला गेम एक ऐसा गेम है जिसके लिए α = अधिकतम न्यूनतम aij = न्यूनतम अधिकतम aij = β i j j i सैडल पॉइंट वाले गेम के लिए, समाधान ढूंढने में मैक्सिमम और मिनिमैक्स रणनीतियों को चुनना शामिल है जो इष्टतम हैं।, शुद्ध खेल की लागत - खेल की निचली और ऊपरी कीमतों का कुल मूल्य α=β=ν 2.1. उदाहरण उदाहरण 1 मैट्रिक्स द्वारा दी गई खेल की शुद्ध रणनीतियों में समाधान खोजें   8 4 7 ए= 6 5 9  7 7 8 समाधान: खेल की ऊपरी और निचली कीमत निर्धारित करें। ऐसा करने के लिए, हम aij की न्यूनतम संख्या ज्ञात करते हैं मैं-वीं पंक्ति αi = न्यूनतम aij j और jth कॉलम में अधिकतम संख्या aij βj = अधिकतम aij i हम एक अतिरिक्त कॉलम के रूप में दाईं ओर भुगतान मैट्रिक्स के आगे संख्या αi (पंक्ति न्यूनतम) लिखते हैं। हम मैट्रिक्स के नीचे संख्याओं βi (कॉलम मैक्सिमा) को एक अतिरिक्त रेखा के रूप में लिखते हैं: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 संख्याओं की अधिकतम संख्या ज्ञात करें αi α = अधिकतम αi = 7 i और संख्याओं का न्यूनतम βj β = न्यूनतम βj = 7 j α = β - खेल में एक सैडल पॉइंट होता है। खिलाड़ी के लिए इष्टतम रणनीति रणनीति A3 है, और खिलाड़ी B के लिए रणनीति B2 है, शुद्ध खेल मूल्य ν = 7 उदाहरण 2 भुगतान मैट्रिक्स दिया गया है:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 शुद्ध रणनीतियों में खेल का समाधान खोजें। समाधान: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. गेम में छह सैडल पॉइंट हैं। इष्टतम रणनीतियाँ होंगी: A1 और B3 या B4 A3 और B3 या B4 A4 और B3 या B4 8 3. मिश्रित रणनीतियों में खेल का समाधान जब α = β। ऐसे मामले में, जब अपनी रणनीति चुनते समय, दोनों खिलाड़ियों को दूसरे की पसंद के बारे में कोई जानकारी नहीं होती है, तो खेल में मिश्रित रणनीतियों में समाधान होता है। SA = (p1, p2, ..., pm) - खिलाड़ी A की मिश्रित रणनीति, जिसमें रणनीतियों A1, A2, ..., Am को संभावनाओं के साथ लागू किया जाता है ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - खिलाड़ी B की मिश्रित रणनीति, जिसमें रणनीतियों B1, B2, ..., Bm को संभावनाओं के साथ लागू किया जाता है ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 यदि: SA∗ खिलाड़ी A की इष्टतम रणनीति है, SB∗ खिलाड़ी B की इष्टतम रणनीति है, तो खेल की लागत है ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 निम्नलिखित प्रमेय इस प्रश्न का उत्तर देता है कि खेल 2 × 2, 2 × n, m × का समाधान कैसे खोजा जाए 2 प्रमेय 2 (खेल 2 × 2, 2 × एन, एम × 2 के लिए समाधान कैसे खोजें)। यदि खिलाड़ियों में से कोई एक इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत ν के बराबर होता है, इस संभावना की परवाह किए बिना कि दूसरा खिलाड़ी इष्टतम रणनीति (शुद्ध रणनीतियों सहित) में शामिल रणनीतियों का उपयोग करेगा। 9 3.1. गेम 2 × 2 मैट्रिक्स के साथ 2 × 2 गेम पर विचार करें: () ए11 ए21 ए21 ए22 मान लें कि गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है। आइए इष्टतम रणनीतियाँ SA∗ और SB∗ खोजें। सबसे पहले, हम रणनीति SA∗ = (p∗1 , p∗2) को परिभाषित करते हैं। प्रमेय के अनुसार, यदि पार्टी ए रणनीति ν का पालन करती है, तो पार्टी बी की कार्रवाई की परवाह किए बिना, भुगतान ν खेलने की लागत के बराबर रहेगा। नतीजतन, यदि पक्ष A इष्टतम रणनीति SA∗ = (p∗1 , p∗2) का पालन करता है, तो पक्ष B अपने भुगतान को बदले बिना अपनी किसी भी रणनीति को लागू कर सकता है। फिर, जब खिलाड़ी B शुद्ध रणनीति B1 या B2 का उपयोग करता है, तो खिलाड़ी को खेल की लागत के बराबर औसत भुगतान प्राप्त होगा: a11 p∗1 + a21 p∗2 = ν ← रणनीति B1 a12 p∗1 + a22 p∗ के लिए 2 = ν ← रणनीति बी2 के लिए ध्यान दें कि p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 गेम की कीमत: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 खिलाड़ी B की इष्टतम रणनीति इसी प्रकार पाई जाती है: SB∗ = (q1∗ , q2∗)। इस बात को ध्यान में रखते हुए कि q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. उदाहरण उदाहरण 3 मैट्रिक्स के साथ खेल का समाधान खोजें () −1 1 ए= 1 −1 10 समाधान: खेल में कोई सैडल पॉइंट नहीं है, क्योंकि α= -1, β = 1, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = p∗2 = 0.5 और q1∗ = q2∗ = 0.5, ν = 0 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) ) उदाहरण 4 मैट्रिक्स के साथ गेम का समाधान ढूंढें () 2 5 ए = 6 4 समाधान: गेम में कोई सैडल पॉइंट नहीं है, क्योंकि α = 4, β = 5, α ̸ = β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = 0.4, p∗2 = 0.6 और q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.4, 0.6) SB∗ = ( 0.2, 0.8) 11 3.1.2. ज्यामितीय व्याख्या गेम 2 × 2 को एक सरल ज्यामितीय व्याख्या दी जा सकती है। आइए हम भुज अक्ष का एक खंड लें, जिसके प्रत्येक बिंदु को हम किसी मिश्रित रणनीति S = (p1, p2) = (p1, 1 − p1) से जोड़ते हैं और रणनीति A1 की संभावना p1 इससे दूरी के बराबर होगी अनुभाग के दाएँ छोर पर बिंदु SA, और प्रायिकता p2, रणनीति A2 - बाएँ छोर की दूरी। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ विशेष रूप से, अनुभाग का बायां छोर (भुजा = 0 वाला बिंदु) मेल खाता है रणनीति A1 के लिए, खंड का दाहिना छोर (x = 1) - रणनीति A2 खंड के अंत में, x-अक्ष के दो लंबवत बहाल किए जाते हैं: अक्ष I - I - रणनीति A1 के लिए भुगतान स्थगित कर दिया जाता है II - II - रणनीति A2 के लिए भुगतान स्थगित कर दिया गया है, खिलाड़ी B को रणनीति B1 लागू करने दें; यह अक्षों I - I और II - II पर क्रमशः a11 और a21 कोटि वाले बिंदु देता है। हम इन बिंदुओं से होकर एक सीधी रेखा B1 - B1' खींचते हैं। किसी भी मिश्रित रणनीति SA = (p1, p2) के लिए, खिलाड़ी का भुगतान सीधी रेखा B1 - B1' पर बिंदु N द्वारा निर्धारित किया जाता है, जो खंड को p2: p1 के अनुपात में विभाजित करने वाले x-अक्ष पर बिंदु SA के अनुरूप होता है। जाहिर है, सीधी रेखा B2 − B2′, जो रणनीति B2 के लिए भुगतान निर्धारित करती है, बिल्कुल उसी तरह से बनाई जा सकती है। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ इष्टतम रणनीति SA∗ खोजना आवश्यक है, अर्थात। जैसे कि खिलाड़ी ए का न्यूनतम भुगतान (खिलाड़ी बी द्वारा उसके लिए सबसे खराब व्यवहार दिया गया) अधिकतम में बदल जाएगा। ऐसा करने के लिए, रणनीतियों बी1, बी2, यानी के लिए खिलाड़ी ए के भुगतान के लिए निचली सीमा का निर्माण करें। टूटी हुई रेखा B1 N B2′ ;. इस सीमा पर खिलाड़ी ए की किसी भी मिश्रित रणनीति के लिए न्यूनतम भुगतान, बिंदु एन, स्थित होगा, जिस पर यह भुगतान अधिकतम तक पहुंचता है और खेल का निर्णय और कीमत निर्धारित करता है। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P बिंदु N की कोटि खेल ν की लागत से अधिक कुछ नहीं है, इसका भुज ∗2 के बराबर है, और खंड के दाहिने छोर की दूरी ∗1 के बराबर है, अर्थात। बिंदु SA∗ से खंड के अंत तक की दूरी खिलाड़ी A की इष्टतम मिश्रित रणनीति की रणनीतियों A2 और A1 की संभावनाओं ∗2 और ∗1 के बराबर है। इस मामले में, खेल का समाधान किसके द्वारा निर्धारित किया गया था? रणनीतियों B1 और B2 का प्रतिच्छेदन बिंदु। नीचे एक मामला है जहां इष्टतम रणनीतिखिलाड़ी की रणनीति शुद्ध A2 है। यहां रणनीति A2 (किसी भी शत्रु रणनीति के लिए) रणनीति A1, 13 .y .y .I .I I .I I. I .B2′ से अधिक लाभदायक है। 1′ बी .बी1′ बी . 2 .बी2′ बी . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .मैं . ।एक्स। 2∗ पी . A∗S = A2. 2∗ पी . A∗ S = A2 दाईं ओर दिखाया गया वह मामला है जब खिलाड़ी B के पास स्पष्ट रूप से लाभहीन रणनीति है। ज्यामितीय व्याख्या से खेल की कम कीमत α और ऊपरी कीमत β .y .I .I I .B2 की कल्पना करना भी संभव हो जाता है। .B1′ .N .B1 .B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P उसी ग्राफ़ पर, हम खिलाड़ी B की इष्टतम रणनीतियों की ज्यामितीय व्याख्या भी दे सकते हैं। यह सत्यापित करना आसान है कि इष्टतम मिश्रित रणनीति SB∗ = (q1∗ , q2∗) की रणनीति B1 का हिस्सा q1∗ खंड KB2 की लंबाई और खंड KB1 की लंबाई के योग के अनुपात के बराबर है। और I - I अक्ष पर KB2: .y .I .I I .B2 .B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2। ए∗ एस . 1∗ P 14 KB2 q1∗ = KB2 + KB1 या LB2′ q1∗ = LB2′ + LB1′ इष्टतम रणनीति SB∗ = (q1∗ , q2∗) दूसरे तरीके से पाई जा सकती है, यदि हम खिलाड़ियों B और B की अदला-बदली करते हैं, और जीत की निचली सीमा के अधिकतम के बजाय, ऊपरी सीमा के न्यूनतम पर विचार करें। .य .मैं .मैं मैं .ए2 .ए′1 .एन .ए1 .ए′2 .मैं मैं .मैं . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n और m × 2 गेम 2 × n और m × 2 गेम का समाधान निम्नलिखित प्रमेय पर आधारित है। प्रमेय 3. किसी के लिए परम खेल m × n एक ऐसा समाधान है जिसमें प्रत्येक पक्ष की सक्रिय रणनीतियों की संख्या m और n की सबसे छोटी संख्या से अधिक नहीं होती है। इस प्रमेय के अनुसार, 2 × n गेम में हमेशा एक समाधान होता है जिसमें प्रत्येक खिलाड़ी के पास अधिकतम दो सक्रिय रणनीतियाँ होती हैं। एक बार जब आपको ये रणनीतियाँ मिल जाती हैं, तो 2×n गेम 2×2 गेम में बदल जाता है, जिसे प्राथमिक तरीके से हल किया जा सकता है। सक्रिय रणनीतियों की खोज रेखांकन द्वारा की जा सकती है: 1) एक चित्रमय व्याख्या का निर्माण किया जाता है; 2) जीत की निचली सीमा निर्धारित की जाती है; 3) दूसरे खिलाड़ी की दो रणनीतियों को भुगतान की निचली सीमा पर पहचाना जाता है, जो अधिकतम कोटि वाले बिंदु पर प्रतिच्छेद करने वाली दो रेखाओं के अनुरूप होती हैं (यदि इस बिंदु पर दो से अधिक रेखाएं प्रतिच्छेद करती हैं, तो कोई भी जोड़ी ली जाती है) - ये रणनीतियाँ खिलाड़ी बी की सक्रिय रणनीतियों का प्रतिनिधित्व करते हैं। इस प्रकार, गेम 2 × एन को गेम 2 × 2 में घटा दिया जाता है। गेम एम × 2 को भी हल किया जा सकता है, इस अंतर के साथ कि निचला नहीं, बल्कि भुगतान की ऊपरी सीमा है निर्मित, और उस पर अधिकतम नहीं, बल्कि न्यूनतम मांगा जाता है। उदाहरण 5 खेल का समाधान खोजें () 7 9 8 ए= 10 6 9 समाधान: ज्यामितीय विधि का उपयोग करके, हम सक्रिय रणनीतियों का चयन करते हैं। सीधी रेखाएँ B1 - B1', B2 - B2' और B3 - B3' रणनीतियाँ B1, B2, B3 के अनुरूप हैं। टूटी हुई रेखा B1 N B2 खिलाड़ी की जीत की निचली सीमा है। गेम का एक समाधान है S∗A = (23, 31); एस∗बी = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ बी बी . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . ।एक्स। 2∗ पी . ए∗ एस . 1∗ पी 17 इंडेक्स गेम, 2 चाल, 3 2 × 2, 10 व्यक्तिगत, 3 2 × 2, 9 यादृच्छिक, 3 ज्यामिति, 12 नेट गेम मूल्य, 7 उदाहरण, 10 2 × एन, 9, 16 मीटर × 2, 9 , 16 अनंत, 4 सामान्य रूप में, 5 परिमित, 4 बहु-चाल, 4 एक-चाल, 4 मैट्रिक्स, 5 युग्मित, 2 शून्य-योग, 2 विरोधी, 2 गैर-विरोधी, 2 समाधान, 5 मिश्रित रणनीतियों में, 5 , शुद्ध रणनीतियों में 9, सैडल प्वाइंट के साथ 5, 7 मूल्य, 5 ऊपरी, 6 निचला, 6 शुद्ध, 7 मैक्सिमम, 6 गेम मैट्रिक्स, 5 पेऑफ, 5 मिनिमैक्स, 6 गेम सामान्यीकरण, 5 रणनीति, 4 मैक्सिमम, 6 मिनिमैक्स, 6 इष्टतम, 4 मिश्रित, 5 खेल सिद्धांत, 2 18

लोकप्रिय अमेरिकी ब्लॉग क्रैक्ड से।

गेम थ्योरी सबसे अच्छा कदम उठाने के तरीकों का अध्ययन करने के बारे में है और परिणामस्वरूप, अन्य खिलाड़ियों से कुछ काटकर जितना संभव हो उतना जीतने वाली पाई प्राप्त करें। यह आपको कई कारकों का विश्लेषण करना और तार्किक रूप से संतुलित निष्कर्ष निकालना सिखाता है। मेरा मानना ​​है कि इसका अध्ययन अंकों के बाद और वर्णमाला से पहले किया जाना चाहिए। सिर्फ इसलिए कि बहुत से लोग अंतर्ज्ञान, गुप्त भविष्यवाणियों, सितारों के स्थान और इसी तरह के आधार पर महत्वपूर्ण निर्णय लेते हैं। मैंने गेम थ्योरी का गहन अध्ययन किया है, और अब मैं आपको इसकी मूल बातों के बारे में बताना चाहता हूं। शायद यह आपके जीवन में कुछ सामान्य ज्ञान जोड़ देगा।

1. कैदी की दुविधा

भागने के लिए चोरी की कार का उचित उपयोग करने में विफल रहने के बाद बर्टो और रॉबर्ट को बैंक डकैती के आरोप में गिरफ्तार किया गया था। पुलिस यह साबित नहीं कर सकती कि उन्होंने ही बैंक लूटा था, लेकिन उन्होंने उन्हें चोरी की कार में रंगे हाथ पकड़ लिया था। उन्हें अलग-अलग कमरों में ले जाया गया और प्रत्येक को एक सौदे की पेशकश की गई: एक साथी को सौंपने और उसे 10 साल के लिए जेल भेजने और खुद रिहा होने का। परन्तु यदि वे दोनों एक दूसरे के साथ विश्वासघात करें, तो प्रत्येक को सात वर्ष की सज़ा मिलेगी। अगर किसी ने कुछ नहीं कहा तो दोनों को सिर्फ कार चोरी के आरोप में 2 साल के लिए जेल जाना पड़ेगा।

इससे पता चलता है कि यदि बर्टो चुप रहता है, लेकिन रॉबर्ट उसे अंदर कर देता है, तो बर्टो 10 साल के लिए जेल चला जाता है, और रॉबर्ट मुक्त हो जाता है।

प्रत्येक कैदी एक खिलाड़ी है, और प्रत्येक के लाभ को एक "सूत्र" के रूप में व्यक्त किया जा सकता है (उन दोनों को क्या मिलेगा, दूसरे को क्या मिलेगा)। उदाहरण के लिए, यदि मैं तुम्हें मारता हूं, तो मेरी जीत का पैटर्न इस तरह दिखेगा (मुझे कड़ी जीत मिलती है, तुम्हें बहुत दर्द होता है)। चूँकि प्रत्येक कैदी के पास दो विकल्प होते हैं, हम परिणामों को एक तालिका में प्रस्तुत कर सकते हैं।

व्यावहारिक अनुप्रयोग: समाजोपथों की पहचान करना

यहां हम गेम थ्योरी का मुख्य अनुप्रयोग देखते हैं: उन समाजोपथों की पहचान करना जो केवल अपने बारे में सोचते हैं।सच्चा गेम सिद्धांत एक शक्तिशाली विश्लेषणात्मक उपकरण है, और शौकियापन अक्सर एक लाल झंडे के रूप में कार्य करता है जो किसी ऐसे व्यक्ति को चिह्नित करता है जिसके पास सम्मान की कोई भावना नहीं है। जो लोग सहज गणना करते हैं उनका मानना ​​है कि कुछ बदसूरत करना बेहतर है क्योंकि इससे जेल की सजा कम होगी चाहे दूसरा खिलाड़ी कुछ भी करे। तकनीकी रूप से यह सही है, लेकिन केवल तभी जब आप अदूरदर्शी व्यक्ति हों और संख्याएँ अधिक बता रहे हों मानव जीवन. यही कारण है कि गेम थ्योरी वित्त में इतनी लोकप्रिय है।

कैदी की दुविधा के साथ असली समस्या यह है कि वह डेटा को नजरअंदाज कर देता है।उदाहरण के लिए, यह आपके दोस्तों, रिश्तेदारों या यहां तक ​​कि उस व्यक्ति के लेनदारों से मिलने की संभावना पर विचार नहीं करता है जिसे आपने 10 साल के लिए जेल भेजा था।

सबसे बुरी बात यह है कि कैदी की दुविधा में शामिल हर कोई ऐसा व्यवहार करता है मानो उसने इसके बारे में कभी सुना ही न हो।

और सबसे अच्छा कदम है चुप रहना और दो साल बाद किसी अच्छे दोस्त के साथ मिलकर उसी पैसे का इस्तेमाल करना।

2. प्रमुख रणनीति

यह एक ऐसी स्थिति है जिसमें आपके प्रतिद्वंद्वी के कार्यों की परवाह किए बिना, आपके कार्य सबसे अधिक प्रतिफल देते हैं।चाहे कुछ भी हो, आपने सब कुछ ठीक किया। यही कारण है कि कैदी की दुविधा वाले कई लोग मानते हैं कि विश्वासघात से "सर्वोत्तम" परिणाम मिलता है, चाहे दूसरा व्यक्ति कुछ भी करे, और इस पद्धति में निहित वास्तविकता की अज्ञानता इसे बहुत आसान बनाती है।

हमारे द्वारा खेले जाने वाले अधिकांश खेलों में सख्ती से प्रभावी रणनीतियाँ नहीं होती हैं क्योंकि अन्यथा वे भयानक होंगे। सोचिए अगर आप हमेशा एक ही काम करते। रॉक-पेपर-कैंची के खेल में कोई प्रभावी रणनीति नहीं है। लेकिन यदि आप किसी ऐसे व्यक्ति के साथ खेल रहे थे जिसके पास ओवन मिट्स थे और वह केवल पत्थर या कागज दिखा सकता था, तो आपके पास एक प्रमुख रणनीति होगी: कागज। आपका पेपर उसके पत्थर को लपेट देगा या परिणाम ड्रॉ में होगा, और आप हार नहीं सकते क्योंकि आपका प्रतिद्वंद्वी कैंची नहीं दिखा सकता है। अब जब आपके पास एक प्रभावी रणनीति है, तो आप कुछ अलग करने की कोशिश करने में मूर्ख होंगे।

3. लिंगों की लड़ाई

खेल तब अधिक दिलचस्प होते हैं जब उनमें सख्ती से प्रभावी रणनीति न हो। उदाहरण के लिए, लिंगों की लड़ाई. अंजलि और बोरिसलाव डेट पर जाते हैं, लेकिन बैले और बॉक्सिंग के बीच चयन नहीं कर पाते। अंजलि को मुक्केबाजी पसंद है क्योंकि उसे दर्शकों की चीखती भीड़ की खुशी के लिए खून बहते हुए देखना अच्छा लगता है, जो सोचते हैं कि वे सिर्फ इसलिए सभ्य हैं क्योंकि उन्होंने किसी का सिर फोड़ने के लिए भुगतान किया है।

बोरिसलाव बैले देखना चाहता है क्योंकि वह समझता है कि बैलेरिना किस दौर से गुजरती हैं बड़ी राशिचोटें और सबसे कठिन प्रशिक्षण, यह जानते हुए कि एक चोट सब कुछ खत्म कर सकती है। बैले नर्तक पृथ्वी पर सबसे महान एथलीट हैं। एक बैलेरीना आपके सिर पर लात मार सकती है, लेकिन वह ऐसा कभी नहीं करेगी, क्योंकि उसके पैर की कीमत आपके चेहरे से कहीं अधिक है।

उनमें से प्रत्येक अपने पसंदीदा कार्यक्रम में जाना चाहता है, लेकिन वे अकेले इसका आनंद नहीं लेना चाहते हैं, इसलिए हमें उनकी जीत के लिए योजना मिलती है: सबसे बड़ा मूल्य वह करना है जो उन्हें पसंद है, सबसे छोटा मूल्य- बस किसी अन्य व्यक्ति के साथ रहना, और शून्य - अकेले रहना।

कुछ लोग जिद्दी स्वभाव का सुझाव देते हैं: यदि आप वही करते हैं जो आप चाहते हैं, चाहे कुछ भी हो, दूसरे व्यक्ति को आपकी पसंद के अनुरूप होना होगा या सब कुछ खोना होगा। जैसा कि मैंने पहले ही कहा, सरलीकृत खेल सिद्धांत मूर्खों की पहचान करने में बहुत अच्छा है।

व्यावहारिक अनुप्रयोग: तेज़ कोनों से बचें

बेशक, इस रणनीति की अपनी महत्वपूर्ण कमियां भी हैं। सबसे पहले, यदि आप अपनी डेटिंग को "लिंगों की लड़ाई" के रूप में मानते हैं, तो यह काम नहीं करेगा। ब्रेकअप करें ताकि आप में से प्रत्येक को कोई ऐसा व्यक्ति मिल सके जिसे वे पसंद करते हों। और दूसरी समस्या यह है कि इस स्थिति में प्रतिभागी स्वयं को लेकर इतने अनिश्चित होते हैं कि वे ऐसा नहीं कर पाते हैं।

हर किसी के लिए वास्तव में जीतने की रणनीति वही करना है जो वे चाहते हैं।और उसके बाद, या अगले दिन, जब वे खाली हों, एक साथ किसी कैफे में जाएँ। या बॉक्सिंग और बैले के बीच तब तक बदलाव करें जब तक कि मनोरंजन जगत में क्रांति न आ जाए और बॉक्सिंग बैले का आविष्कार न हो जाए।

4. नैश संतुलन

नैश संतुलन चालों का एक सेट है जहां तथ्य के बाद कोई भी कुछ अलग नहीं करना चाहता है।और यदि हम इसे कार्यान्वित कर सकते हैं, तो गेम थ्योरी ग्रह पर संपूर्ण दार्शनिक, धार्मिक और वित्तीय प्रणाली को प्रतिस्थापित कर देगी, क्योंकि "टूट न जाने की इच्छा" मानवता के लिए आग से भी अधिक शक्तिशाली प्रेरक शक्ति बन गई है।

आइए जल्दी से $100 बाँट लें। आप और मैं तय करते हैं कि हमें सैकड़ों में से कितने की आवश्यकता है और साथ ही मात्रा की घोषणा भी करते हैं। यदि हमारा कुल योग सौ से कम है, तो हर किसी को वह मिलता है जो वे चाहते हैं। यदि कुल सौ से अधिक है, तो जिसने सबसे कम राशि मांगी उसे वह राशि मिल जाती है जो वह चाहता था, और लालची व्यक्ति को वह मिल जाता है जो बच जाता है। यदि हम समान राशि मांगते हैं, तो प्रत्येक को $50 मिलते हैं। आप कितना पूछेंगे? आप पैसे का बंटवारा कैसे करेंगे? केवल एक ही विजयी चाल है।

$51 की आवश्यकता होने पर आपको अधिकतम राशि मिलेगी, चाहे आपका प्रतिद्वंद्वी कुछ भी चुने। यदि वह और अधिक मांगता है, तो आपको $51 प्राप्त होंगे। यदि वह $50 या $51 मांगता है, तो आपको $50 प्राप्त होंगे। और यदि वह $50 से कम मांगता है, तो आपको $51 प्राप्त होंगे। किसी भी तरह से, ऐसा कोई अन्य विकल्प नहीं है जो आपको इससे अधिक पैसा दिला सके। नैश संतुलन - एक ऐसी स्थिति जिसमें हम दोनों $51 चुनते हैं।

व्यावहारिक अनुप्रयोग: पहले सोचें

यह गेम थ्योरी का संपूर्ण बिंदु है। आपको जीतना नहीं है, अन्य खिलाड़ियों को नुकसान तो बिल्कुल नहीं पहुंचाना है, लेकिन आपको अपने लिए सर्वश्रेष्ठ कदम उठाना है, भले ही आपके आस-पास के लोग आपके लिए क्या सोच रहे हों। और यह और भी अच्छा है अगर यह कदम अन्य खिलाड़ियों के लिए फायदेमंद हो। यह उस प्रकार का गणित है जो समाज को बदल सकता है।

इस विचार का एक दिलचस्प बदलाव शराब पीना है, जिसे समय पर निर्भर नैश संतुलन कहा जा सकता है। जब आप पर्याप्त मात्रा में शराब पीते हैं, तो आप दूसरे लोगों के कार्यों की परवाह नहीं करते, चाहे वे कुछ भी करें, लेकिन अगले दिन आपको वास्तव में कुछ अलग न कर पाने का पछतावा होता है।

5. टॉस खेल

टॉस खिलाड़ी 1 और खिलाड़ी 2 के बीच खेला जाता है। प्रत्येक खिलाड़ी एक साथ हेड या टेल चुनता है। यदि वे सही अनुमान लगाते हैं, तो खिलाड़ी 1 को खिलाड़ी 2 का पैसा मिलता है, यदि नहीं, तो खिलाड़ी 2 को खिलाड़ी 1 का सिक्का मिलता है।

विजेता मैट्रिक्स सरल है...

...इष्टतम रणनीति: पूरी तरह से यादृच्छिक रूप से खेलें।यह आपके विचार से अधिक कठिन है क्योंकि चुनाव पूरी तरह से यादृच्छिक होना चाहिए। यदि आपके पास चित या पट की प्राथमिकता है, तो आपका प्रतिद्वंद्वी इसका उपयोग आपके पैसे लेने के लिए कर सकता है।

निःसंदेह, यहां वास्तविक समस्या यह है कि यह बहुत बेहतर होगा यदि वे एक-दूसरे पर एक पैसा भी फेंकें। परिणामस्वरूप, उनका मुनाफा समान होगा, और परिणामी आघात इन दुर्भाग्यपूर्ण लोगों को भयानक बोरियत के अलावा कुछ और महसूस करने में मदद कर सकता है। आख़िर ये सबसे ख़राब खेलसदैव विद्यमान. और यह पेनल्टी शूटआउट के लिए आदर्श मॉडल है।

व्यावहारिक अनुप्रयोग: जुर्माना

फ़ुटबॉल, हॉकी और कई अन्य खेलों में, अतिरिक्त समय पेनल्टी शूटआउट है। और वे अधिक दिलचस्प होंगे यदि वे इस पर आधारित हों कि पूर्ण रूप में खिलाड़ी कितनी बार कार्टव्हील कर सकते हैं, क्योंकि यह कम से कम उनकी शारीरिक क्षमता का संकेतक होगा और देखने में मजेदार होगा। गोलकीपर किसी गेंद या पक की गति को उसके आरंभ में ही स्पष्ट रूप से निर्धारित नहीं कर सकते, क्योंकि, दुर्भाग्य से, रोबोट अभी भी हमारी खेल प्रतियोगिताओं में भाग नहीं लेते हैं। गोलकीपर को बाएँ या दाएँ दिशा का चयन करना चाहिए और आशा करनी चाहिए कि उसकी पसंद प्रतिद्वंद्वी की पसंद से मेल खाती है जो गोल पर शूटिंग कर रहा है। इसमें सिक्कों के खेल के साथ कुछ समानता है।

हालाँकि, ध्यान दें कि यह हेड और टेल के खेल की समानता का एक आदर्श उदाहरण नहीं है, क्योंकि सही दिशा में भी, गोलकीपर गेंद को नहीं पकड़ सकता है, और हमलावर गोल को हिट नहीं कर सकता है।

तो गेम थ्योरी के अनुसार हमारा निष्कर्ष क्या है? बॉल गेम को "मल्टी-बॉल" तरीके से समाप्त किया जाना चाहिए, जहां हर मिनट एक-पर-एक खिलाड़ियों को एक अतिरिक्त बॉल/पक दिया जाता है जब तक कि एक पक्ष एक निश्चित परिणाम प्राप्त नहीं कर लेता, जो खिलाड़ियों के वास्तविक कौशल का संकेत है, और कोई शानदार आकस्मिक संयोग नहीं.

दिन के अंत में, गेम को अधिक स्मार्ट बनाने के लिए गेम थ्योरी का उपयोग किया जाना चाहिए। यानी यह बेहतर है.