रैखिक प्रोग्रामिंग विधियों का उपयोग करके एक रणनीतिक गेम को हल करना। मैट्रिक्स गेम को रैखिक प्रोग्रामिंग समस्याओं में परिवर्तित करके हल करना

खेल के भुगतान मैट्रिक्स का आकार जितना बड़ा होगा, विश्लेषण उतना ही जटिल होगा। इसलिए कोई भी निर्णय लेने से पहले मैट्रिक्स खेलसबसे पहले, खिलाड़ियों की प्रभुत्व वाली रणनीतियों (यदि कोई हो) को बाहर करने की सलाह दी जाती है, जिससे भुगतान मैट्रिक्स का आयाम कम हो जाता है। लेकिन भले ही प्रभुत्व वाली रणनीतियों को बाहर रखा जाए, फिर भी प्रत्येक खिलाड़ी के पास दो से अधिक शुद्ध रणनीतियाँ हो सकती हैं (डब्ल्यू, पी> 2), जब ग्राफ़िक-विश्लेषणात्मक विधि लागू नहीं की जा सकती।

एक अपेक्षाकृत सरल विधि विकसित की गई है, जिसमें समस्या को मैट्रिक्स गेम को कम करना शामिल है रैखिक प्रोग्रामिंग, जिसे, बदले में, प्रसिद्ध तरीकों (उदाहरण के लिए, सिंप्लेक्स विधि) या कई कंप्यूटर मॉडलिंग टूल का उपयोग करके हल किया जा सकता है (उदाहरण के लिए, "समाधान खोज" मॉड्यूल का उपयोग करके) एमएस एक्सेल).

जैसा कि सबसे पहले जे. वॉन न्यूमैन ने दिखाया था, जो न केवल गेम थ्योरी के निर्माता हैं, बल्कि रैखिक प्रोग्रामिंग के सिद्धांत के डेवलपर्स में से एक हैं, कोई भी खेल ख़त्मदो व्यक्तियों के शून्य योग को एक रैखिक प्रोग्रामिंग समस्या के रूप में दर्शाया जा सकता है। इस पद्धति को किसी भी मैट्रिक्स गेम पर लागू किया जा सकता है, जिसमें सरल गेम भी शामिल हैं, जिसके समाधान पर पिछले पैराग्राफ में चर्चा की गई थी।

मैट्रिक्स गेम को रैखिक प्रोग्रामिंग समस्या में बदलने की विधि पर विचार करने के लिए, मैट्रिक्स गेम की एक अन्य संपत्ति से परिचित होना आवश्यक है, जिसे कहा जाता है एफ़िन नियम.मैट्रिक्स गेम ए और बी में इष्टतम रणनीतियाँ, भुगतान मैट्रिक्स के तत्व समानता से संबंधित हैं

कहाँ एक्स> 0, और p कोई वास्तविक संख्या है, समान संतुलन स्थितियाँ हैं (या तो शुद्ध या मिश्रित रणनीतियों में), और खेलों की कीमतें निम्नलिखित शर्त को पूरा करती हैं: वीबी = एक्सवीए+ आर.

यह नियम है व्यवहारिक महत्वचूंकि मैट्रिक्स गेम को हल करने के लिए कई एल्गोरिदम इस धारणा पर आधारित हैं कि भुगतान मैट्रिक्स के सभी तत्व सकारात्मक हैं, जो बदले में, गेम की सकारात्मक कीमत की गारंटी देता है। ऐसे मामले में जब मैट्रिक्स में गैर-सकारात्मक तत्व होते हैं, तो आप मैट्रिक्स के सभी तत्वों में मैट्रिक्स के नकारात्मक तत्वों के अधिकतम निरपेक्ष मान से अधिक कोई भी संख्या जोड़ सकते हैं।

हम मानते हैं कि भुगतान मैट्रिक्स वाले गेम की कीमत एक टीएक्सपीसकारात्मक (और > 0). यदि यह मामला नहीं है, तो एफ़िन नियम के अनुसार एक संख्या पी का चयन करना हमेशा संभव होता है जैसे कि इसे भुगतान मैट्रिक्स के सभी तत्वों में जोड़ने से सकारात्मक तत्वों वाला एक मैट्रिक्स मिलता है और इसलिए, कीमत के लिए सकारात्मक मूल्य सुनिश्चित होता है गेम का। इस मामले में, दोनों खिलाड़ियों की इष्टतम मिश्रित रणनीतियाँ नहीं बदलती हैं।

एक इष्टतम मिश्रित रणनीति की परिभाषा से यह पता चलता है कि पहला खिलाड़ी, अपनी इष्टतम मिश्रित रणनीति का पालन करते हुए, दूसरे खिलाड़ी (शुद्ध लोगों सहित) की किसी भी रणनीति के लिए ओ से कम नहीं जीतेगा, और दूसरा खिलाड़ी, अपनी इष्टतम का पालन करते हुए। मिश्रित रणनीति, किसी भी रणनीति के लिए पहले खिलाड़ी (स्वच्छ लोगों सहित) से अधिक नहीं खोएगा। इससे यह पता चलता है कि मिश्रित रणनीतियाँ एक्स = = (x v x t), y = (y v ..., पर n) क्रमशः पहले और दूसरे खिलाड़ी, और खेल की कीमत o को संबंधों को संतुष्ट करना चाहिए


आइए हम इन प्रणालियों में सभी समीकरणों और असमानताओं को और से विभाजित करें (यह किया जा सकता है, क्योंकि धारणा ओ > 0 से) और अंकन प्रस्तुत करें:

फिर हमें मिलता है


चूँकि पहला खिलाड़ी मूल्यों को चुनकर खेल की लागत को अधिकतम करना चाहता है एक्स [यतो पारस्परिक मान 1/o को चुनकर न्यूनतम किया जाना चाहिए आर जीइस प्रकार, पहली समस्या का समाधान ऐसे गैर-नकारात्मक मानों को खोजने पर निर्भर करता है आर।, 2=1,..., वहजिस पर

चूंकि दूसरा खिलाड़ी ऐसे मूल्यों को खोजना चाहता है य)और इसलिए क्यूताकि खेल की लागत न्यूनतम हो, तो दूसरी समस्या का समाधान ऐसे गैर-नकारात्मक मूल्यों को खोजने में कम हो जाता है क्यू जे जे = 1, ..., पी वाईजिस पर

इस प्रकार, दोहरी रैखिक प्रोग्रामिंग (एलपी) समस्याएं प्राप्त की गई हैं, जिन्हें हल किया जा सकता है, उदाहरण के लिए, सिंप्लेक्स विधि का उपयोग करके।

इन समस्याओं को हल करने के बाद, हम मान प्राप्त करते हैं पी®, मैं = 1,टी क्यू® वाई जे = 1,..., पी।

फिर खेल की कीमत ओ का मूल्य शर्त से निर्धारित किया जाता है

इष्टतम मिश्रित रणनीतियाँ, अर्थात्। और r/?, सूत्रों द्वारा प्राप्त किये जाते हैं

उदाहरण 4.7. खेल के एक प्रकार "फाइट फॉर मार्केट्स" पर विचार करें। दो प्रतिस्पर्धी कंपनियाँ A और B तीन नवीन तकनीकी परियोजनाओं को वित्तपोषित करने का निर्णय लेती हैं। प्रत्येक कंपनी 100 डीएसएन निवेश कर सकती है। इकाइयां कंपनी बी एक ऐसे बाज़ार पर कब्ज़ा करने की कोशिश कर रही है जिसमें कंपनी ए परंपरागत रूप से अग्रणी रही है। समान परियोजनाओं के विकास और विकास के मामले में, कंपनी ए लाभ कमाएगी, जबकि कंपनी बी को नुकसान होगा। यदि निवेश विभिन्न परियोजनाओं के लिए निर्देशित किया जाता है, तो कंपनी ए को बाजार पुनर्वितरण से जुड़े नुकसान का सामना करना पड़ेगा, और उद्यम बी का लाभ उद्यम ए के नुकसान के अनुरूप होगा। यह खोजना आवश्यक है इष्टतम रणनीतियाँउद्यम। विभिन्न रणनीतिक परिस्थितियों में उद्यम ए का लाभ तालिका में प्रस्तुत किया गया है:

एंटरप्राइज़ बी की रणनीतियाँ

उद्यम रणनीतियाँ ए

समाधान में एमएस एक्सेल

आइए प्रोग्राम का उपयोग करके समस्या का समाधान करें एमएस एक्सेल.मेज पर एमएस एक्सेलगेम के भुगतान मैट्रिक्स के तत्वों को पेश किया गया है और, MIN() और MAX() फ़ंक्शंस का उपयोग करके, न्यूनतम और अधिकतम मानक्रमशः पंक्तियों और स्तंभों द्वारा, फिर समान फ़ंक्शन का उपयोग करके मैक्सिमम और मिनिमैक्स पाए जाते हैं (तालिका 4.2)। चूंकि ये मान मेल नहीं खाते हैं, इसलिए गेम में कोई सैडल पॉइंट नहीं है, यानी। इसे शुद्ध रणनीतियों से हल नहीं किया जा सकता। गेम का मूल्य मान (-5; 10) की सीमा में होना चाहिए।

तालिका 4.2

खेल में सैडल पॉइंट की जाँच करना

किसी गेम को रैखिक प्रोग्रामिंग समस्या में परिवर्तित करके हल करने के लिए एल्गोरिदम का उपयोग करने के लिए, हम एक एफ़िन नियम लागू करते हैं। MIN() फ़ंक्शन का उपयोग करके, हम भुगतान मैट्रिक्स के तत्वों का न्यूनतम मूल्य (-20) पाते हैं। इस संख्या के मापांक को ABS(MHH(...)) के रूप में परिभाषित किया गया है। मापदंडों के साथ एक एफ़िन परिवर्तन का उपयोग करना एक्स = 1 और पी = 20 हमें एक नया भुगतान मैट्रिक्स मिलता है (तालिका 4.3)।

तालिका 4.3

खेल को एक रैखिक प्रोग्रामिंग समस्या में बदलना

भुगतान मैट्रिक्स के दाईं ओर, आवश्यक चर मनमाने ढंग से दर्शाए गए हैं आर।(इस स्तर पर कोई भी मान निर्दिष्ट किया जा सकता है)। भुगतान मैट्रिक्स के अंतर्गत कक्षों में, मान SUMPRODUCT() फ़ंक्शन का उपयोग करके निर्धारित किए जाते हैं

जिसका उपयोग एलआई समस्या की बाधाओं में किया जाएगा। ये मान यादृच्छिक रूप से चयनित के लिए हैं पी टीतालिका में दिए गए हैं। 4.3.

"ऑब्जेक्टिव फ़ंक्शन" के रूप में निर्दिष्ट सेल में, ऑब्जेक्टिव फ़ंक्शन के लिए अभिव्यक्ति के अनुरूप सूत्र SUM(...) दर्ज करें

"गेम प्राइस" निर्दिष्ट सेल में, उद्देश्य फ़ंक्शन के मूल्य के माध्यम से गेम की कीमत निर्धारित करने के लिए एक सूत्र दर्ज करें:

के रूप में चिह्नित कक्षों में एक्स यहचरों को विपरीत रूप से बदलने और पहले खिलाड़ी की मिश्रित रणनीति के आवश्यक तत्वों को खोजने के लिए सूत्र पेश किए जाते हैं एक्स मैं= यू प.ज.

पहली रैखिक प्रोग्रामिंग समस्या का निरूपण: मान ज्ञात करें

न ही मैं आरयून्यूनतम कार्य प्रदान करना YjPi * शर्तों के तहत पिप ^ ए आई जे पी आई > 1,

रैखिक प्रोग्रामिंग समस्या का समाधान प्रोग्राम के "समाधान खोज" मॉड्यूल का उपयोग करके किया जाता है एमएस एक्सेल(इस मॉड्यूल के उपयोग पर अध्याय 2 में पहले ही चर्चा की जा चुकी है)। "लक्ष्य सेल सेट करें" फ़ील्ड लक्ष्य फ़ंक्शन के मान वाले सेल का पता निर्दिष्ट करता है; "इसके बराबर: न्यूनतम मूल्य" मोड का चयन करें। "चेंजिंग सेल" फ़ील्ड में, वांछित चर की एक सरणी इंगित की गई है आर जी"जोड़ें" बटन पर क्लिक करके और कार्य बाधाओं के अनुरूप एक सरणी का चयन करके, संबंधित स्थिति "बाधाएं" फ़ील्ड में सेट की जाती है। "पैरामीटर" बटन पर क्लिक करके, आप "समाधान खोज पैरामीटर" संवाद बॉक्स पर जाते हैं, जिसमें आप "रैखिक मॉडल" और "गैर-नकारात्मक मान" पैरामीटर का चयन करते हैं; अन्य मापदंडों के मान अपरिवर्तित रहते हैं। "समाधान खोज विकल्प" विंडो बंद करने के बाद (का उपयोग करके)। ठीक है)"समाधान खोजें" विंडो में "रन" बटन पर क्लिक करके, एलपी समस्या के समाधान की खोज की पुनरावृत्तीय प्रक्रिया शुरू की जाती है।

इस प्रक्रिया के अंत में, "समाधान खोज परिणाम" विंडो दिखाई देती है। यदि समस्या की सभी स्थितियाँ सही ढंग से तैयार की गई थीं, सभी डेटा, सूत्र और पैरामीटर सही ढंग से दर्ज किए गए थे, तो विंडो "समाधान मिला" बताएगी। सभी प्रतिबंध और इष्टतमता स्थितियाँ पूरी की गई हैं।'' इस स्थिति में, समाधान को सहेजने के लिए आपको क्लिक करना होगा ठीक है।गणना परिणाम तालिका में प्रस्तुत किए गए हैं। 4.4.

एलपी समस्या दूसरे प्लेयर के लिए भी इसी तरह हल की गई है (तालिका 4.5)। कृपया ध्यान दें कि इसमें इस मामले मेंतकनीकी सुविधा के लिए, आवश्यक चर की सरणी को एक पंक्ति में व्यवस्थित किया जाता है (चूंकि दूसरे खिलाड़ी की रणनीतियाँ भुगतान मैट्रिक्स के कॉलम के अनुरूप होती हैं), और प्रतिबंध वाले कक्षों को एक कॉलम में व्यवस्थित किया जाता है। समस्या को अधिकतम तक हल किया गया है और निम्नानुसार तैयार किया गया है: मान खोजें क्यू जेटी

अधिकतम कार्यक्षमता प्रदान करना? मैं)* अधिकतम पी आर आई शर्तें ^ ए मैं) क्यू-क्यू) > 0.

तालिका 4.4

पहले खिलाड़ी के लिए एलपी समस्या को हल करने के परिणाम

दूसरे खिलाड़ी के लिए एलपी समस्या को हल करने के परिणाम

तालिका 4.5

एफ़िन नियम के प्रारंभिक अनुप्रयोग के मामले में, खेल की कीमत का सही मूल्य संख्या पी घटाकर प्राप्त किया जाता है, जिसका उपयोग भुगतान मैट्रिक्स के तत्वों को जांचने के लिए किया गया था। खेल का अंतिम समाधान:

परिणाम बताते हैं कि कंपनी ए की इष्टतम रणनीति 29, 60 और 11% के अनुपात में निवेश के लिए इच्छित धन का वितरण है, अर्थात। 29, 60 और 11 दिन. इकाइयां इस स्थिति में, कंपनी A लाभ कमाएगी कम नहीं 0.5 डेन. इकाइयां कंपनी ए को न्यूनतम लाभ मूल्य (0.5 मौद्रिक इकाइयाँ) प्राप्त होगी, बशर्ते कि कंपनी बी अपनी इष्टतम परियोजना निवेश रणनीति, अर्थात् 39, 25, 36%, यानी का पालन करती हो। 39, 25 और 36 डेन के लिए परियोजनाओं में निवेश करें। इकाइयां क्रमश। यदि कंपनी बी इस रणनीति से भटकती है (एक अलग निवेश पैटर्न का पालन करती है), तो कंपनी ए का मुनाफा बढ़ जाएगा।

समाधान के विश्लेषण से पता चलता है कि कंपनी बी के लिए यह गेम लाभहीन है (अपेक्षित हानि लगभग 0.5 मौद्रिक इकाई है)। हालाँकि, अगर कंपनी बी इस नुकसान को अपने लक्ष्य को प्राप्त करने की तुलना में अपेक्षाकृत महत्वहीन मानती है - कंपनी ए द्वारा पारंपरिक रूप से नियंत्रित बाजार में प्रवेश करना, तो, अपनी इष्टतम निवेश आवंटन रणनीति का पालन करते हुए, कंपनी बी 0.5 डेन से अधिक नहीं खोएगी। इकाइयां यदि कंपनी A अतार्किक व्यवहार करती है तो कंपनी B का घाटा कम हो जाएगा।

इस प्रकार, किसी भी मैट्रिक्स गेम को गेम को दो रैखिक प्रोग्रामिंग समस्याओं में कम करके हल किया जा सकता है। हालाँकि, इसके लिए बड़ी मात्रा में गणना की आवश्यकता होती है, जो शुद्ध खिलाड़ी रणनीतियों की संख्या के साथ बढ़ती है। इसलिए, सबसे पहले, प्रभुत्व वाली रणनीतियों को खत्म करने की विधि का उपयोग करते हुए, यदि संभव हो तो, आपको शुद्ध खिलाड़ी रणनीतियों की संख्या कम करनी चाहिए। अपवाद कमज़ोरप्रभुत्व वाली रणनीतियों से कुछ समाधानों का नुकसान हो सकता है। काश दृढ़ता सेहावी रणनीतियों, तो खेल समाधान का सेट नहीं बदलेगा। फिर आपको सभी मामलों में सैडल प्वाइंट की उपस्थिति की जांच करनी चाहिए, यानी। शर्त की पूर्ति जाँच मिनट ए- = मिनट मा हा...

यदि यह कायम रहता है, तो खिलाड़ियों के पास शुद्ध इष्टतम रणनीतियाँ होती हैं, और समाधान स्वचालित रूप से प्राप्त हो जाता है। अन्यथा, इष्टतम रणनीतियाँ मिश्रित हो जाएंगी। सरल मैट्रिक्स गेम के लिए, जहां कम से कम एक खिलाड़ी के पास केवल दो रणनीतियाँ हैं, अनुभाग 4.2 में चर्चा की गई ग्राफिक-विश्लेषणात्मक समाधान पद्धति का उपयोग किया जा सकता है। अधिक जानकारी के लिए चुनौतीपूर्ण खेलगेम को एक रैखिक प्रोग्रामिंग समस्या में बदलने के लिए एक विधि और इस समस्या को हल करने के लिए उपयुक्त टूल का उपयोग करना आवश्यक है।

इस खंड को समाप्त करने के लिए, हम ध्यान दें कि यदि गेम को मैन्युअल रूप से हल किया जाता है, तो प्रभुत्व वाली रणनीतियों को हटाकर भुगतान मैट्रिक्स को सरल बनाना महत्वपूर्ण है। यदि इष्टतम रणनीतियों को खोजने के लिए कंप्यूटर का उपयोग किया जाता है, तो प्रभुत्व वाली रणनीतियों की खोज में खर्च किया गया प्रयास और समय बर्बाद हो सकता है, क्योंकि मूल और सरलीकृत मैट्रिक्स का संख्यात्मक विश्लेषण एक ही एल्गोरिदम का उपयोग करके किया जाता है, और गणना समय में अंतर महत्वहीन है .

    हम जाँचते हैं कि भुगतान मैट्रिक्स में सैडल पॉइंट है या नहीं। यदि हां, तो हम खेल का समाधान शुद्ध रणनीतियों में लिखते हैं, यदि नहीं, तो हम मैट्रिक्स का विश्लेषण करना जारी रखते हैं।

    यदि कोई हो, तो हम प्रभुत्व वाली पंक्तियों और प्रमुख स्तंभों को हटा देते हैं। उनके स्थान पर, खिलाड़ियों की इष्टतम रणनीतियों में, संबंधित घटक शून्य के बराबर होंगे।

एच. हम मैट्रिक्स गेम को प्रसिद्ध तरीकों में से एक का उपयोग करके हल करते हैं: रैखिक प्रोग्रामिंग विधियां, अनुमानित विधि या ग्राफिक रूप से (यदि कम से कम एक खिलाड़ी के पास केवल दो शुद्ध रणनीतियां हैं)।

किसी भी मैट्रिक्स गेम को सममित दोहरी रैखिक प्रोग्रामिंग समस्याओं की एक जोड़ी में कम किया जा सकता है, जिसका अर्थ है कि सिंप्लेक्स विधि का उपयोग इष्टतम खिलाड़ी रणनीतियों और गेम की कीमतों को खोजने के लिए किया जा सकता है।

कस्टम समाधान का एक उदाहरण.

उदाहरण। पेऑफ मैट्रिक्स द्वारा दिए गए गेम का समाधान ढूंढें

सबसे पहले, आइए जांचें कि मैट्रिक्स में सैडल पॉइंट है या नहीं। पहली पंक्ति का सबसे छोटा तत्व -3 नहीं है तीसरे स्तंभ में सबसे बड़ा; दूसरी पंक्ति का सबसे छोटा तत्व -1 पहले कॉलम का सबसे बड़ा तत्व नहीं है; अंततः, तीसरी पंक्ति का सबसे छोटा तत्व 2 भी तीसरे स्तंभ में सबसे बड़ा है। नतीजतन, मैट्रिक्स में एक सैडल पॉइंट (3, 3) होता है, जहां तत्व स्थित होता है zz = 2. इसका मतलब है कि गेम का समाधान शुद्ध रणनीतियों में है, अर्थात्:

- पहले खिलाड़ी की इष्टतम रणनीति;

- दूसरे खिलाड़ी की इष्टतम रणनीति;

वी= 2 - खेल की कीमत.

उदाहरण। पेऑफ मैट्रिक्स द्वारा दिए गए गेम का समाधान ढूंढें

.

मैट्रिक्स में कोई सैडल पॉइंट नहीं है, इसलिए गेम में मिश्रित रणनीतियों में समाधान है।

आइए देखें कि क्या मैट्रिक्स में पंक्तियों और प्रमुख स्तंभों का प्रभुत्व है। चूँकि पहली पंक्ति के सभी तत्व तीसरी पंक्ति के संबंधित तत्वों से बड़े नहीं हैं, पहली पंक्ति हावी है और उसे हटाया जा सकता है। आप तीसरे कॉलम को भी हटा सकते हैं जो दूसरे के साथ-साथ पांचवें पर भी हावी है वह स्तंभ जो पहले तीन स्तंभों पर हावी है। परिणामस्वरूप, हमें मैट्रिक्स मिलता है

मैट्रिक्स के सभी तत्वों को जोड़कर ए",उदाहरण के लिए, संख्या c = 3, हमें मैट्रिक्स मिलता है

.

जिसके सभी तत्व गैर-नकारात्मक हैं, और दूसरी पंक्ति के तत्व पूर्णतः सकारात्मक हैं।

आइए सममित दोहरी समस्याओं की एक जोड़ी बनाएं, ताकि मूल समस्या एक मानक अधिकतमीकरण समस्या हो, इस समस्या के गुणांक का मैट्रिक्स भुगतान मैट्रिक्स के साथ मेल खाता है ए",· और वस्तुनिष्ठ फलन में अज्ञात के लिए गुणांक और असमानताओं के मुक्त पद एक के बराबर होंगे।

आइए सिंप्लेक्स विधि का उपयोग करके समस्या 1 को हल करें। यह एक सामान्य कार्य के रूप में दिया गया है। आइए अतिरिक्त अज्ञात का उपयोग करके इसे मुख्य तक कम करें एक्स 4 ≥0, एक्स 5 ≥0. परिणामस्वरूप, हमें निम्नलिखित समस्या प्राप्त होती है।

एक्स जे ≥ 0 (जे = 1,…,5),

एफ(एक्स) = एक्स 1 + एक्स 2 + x 3 → तह.

समस्या विहित है और, इसमें सिंप्लेक्स विधि एल्गोरिदम लागू करके, हम फॉर्म की सिंप्लेक्स तालिकाएँ प्राप्त करते हैं

बुनियादी चर और सूचकांक पंक्ति के कॉलम से हम दोहरी समस्याओं की एक जोड़ी के लिए इष्टतम योजनाएं लिखते हैं, अर्थात्:

एफ(एक्स*)= जी(वाई*)=

दोहरी समस्याओं के समाधान से हमें खेल की कीमत और मैट्रिक्स के साथ खेल में खिलाड़ियों की इष्टतम रणनीतियाँ प्राप्त होती हैं ए":

वी"= = ;

=v" = = ;

= वी" = =

मैट्रिक्स खेल ए"समान इष्टतम रणनीतियाँ होंगी और , मैट्रिक्स गेम के समान ए",और खेल की कीमत

वी"= वी"- सी = - 3 = .

और अंत में, मैट्रिक्स ए के साथ मूल गेम में इष्टतम रणनीतियाँ हैं

पी*= और क्यू*=

और खेल की कीमत वी= वी"= .

इष्टतम रणनीतियाँ आर*और क्यू* हमने इष्टतम रणनीतियों से प्राप्त किया और , हटाई गई पंक्तियों और स्तंभों के स्थान पर शून्य जोड़ना।

आप रणनीति इष्टतमता मानदंड का उपयोग करके गेम समाधान की शुद्धता की जांच कर सकते हैं। ऐसा करने के लिए, हमें पाई गई इष्टतम रणनीतियों के घटकों को असमानताओं M(P i , Q*) ≤ v≤ M(P*, Q j) में प्रतिस्थापित करना चाहिए। आर*और क्यू*,शुद्ध रणनीतियों के घटक आरमैं (i = 1, 2, 3) और क्यू जे (जे = 1, 2, 3, 4, 5)

और खेल की कीमत वी= .

ध्यान दें कि गेम थ्योरी समस्या को केवल दोहरी एलपी समस्याओं की एक जोड़ी तक ही सीमित किया जाना चाहिए सभी तत्व भुगतान मैट्रिक्स की कम से कम एक पंक्ति पूर्णतः सकारात्मक . इस मामले में, दोनों समस्याओं में इष्टतम योजनाएँ होंगी, जिनसे खिलाड़ियों की इष्टतम रणनीतियाँ प्राप्त की जा सकेंगी। अन्यथा, मूल समस्या में वस्तुनिष्ठ कार्य असीमित हो सकता है, और दोहरी समस्या में एक भी योजना नहीं होगी। इसलिए, निम्नलिखित उदाहरण में, यदि हम मैट्रिक्स वाले गेम में दोहरी समस्याओं की एक जोड़ी बनाते हैं

,

फिर समस्या 1 में उद्देश्य फ़ंक्शन योजनाओं के सेट पर ऊपर से सीमित नहीं होगा, और समस्या 2 में कोई योजना नहीं होगी, हालांकि, जैसा कि हमने ऊपर देखा, मैट्रिक्स के साथ खेल ए"एक समाधान है.

पहले खिलाड़ी (खिलाड़ी) की इष्टतम मिश्रित रणनीति ) का स्वरूप है

,

दूसरे खिलाड़ी (खिलाड़ी) की इष्टतम मिश्रित रणनीति बी) का रूप है:

.

चूंकि इस मैट्रिक्स गेम को स्पष्ट रूप से लाभहीन रणनीतियों को हटाकर सरल बनाया गया था और इसका अंतिम समाधान इस प्रकार है:



गेम को ग्राफ़िक तरीके से हल करना.

ग्राफिकल पद्धति उन खेलों पर लागू होती है जिनमें कम से कम एक खिलाड़ी के पास केवल दो रणनीतियाँ होती हैं।

उदाहरण 1।

खेल का कोई काठी बिंदु नहीं है. मिश्रित रणनीतियों के क्षेत्र में इष्टतम समाधान खोजा जाना चाहिए। आइए हम दूसरे खिलाड़ी की रणनीतियों के अनुरूप विमान पर खंड बनाएं।

खिलाड़ी ए के लिए भुगतान की निचली सीमा टूटी हुई रेखा है में 3 एचएफ 4 ,. रणनीतियाँ में 3 , और में 4 खिलाड़ी बी की सक्रिय रणनीतियाँ हैं। उनके प्रतिच्छेदन का बिंदु कोखिलाड़ियों की इष्टतम रणनीतियाँ और खेल की कीमत निर्धारित करता है। दूसरे खिलाड़ी के लिए रणनीतियों का उपयोग करना लाभदायक नहीं है में 1 और में 2 , पर 1 =य 2 = 0. गेम का समाधान (2x2) मैट्रिक्स वाले गेम के समाधान तक कम हो गया है।

एक्स 1 = 2/5, एक्स 2 = 3/5; 3 = 3/5, पर 4 = 2/5; वी = 11/5.

उत्तर।

एक्स (2/5, 3/5) और वाई (0, 0.3/5, 2/5), खेल की कीमत है वी = 11/5.

    यदि प्रायिकता 2/5 वाला पहला खिलाड़ी पहली रणनीति का उपयोग करेगा और 3/5 प्रायिकता वाला दूसरा, तो पर्याप्त के साथ बड़ी मात्राइस मैट्रिक्स के साथ खेल में, उसकी जीत औसतन कम से कम 11/5 होगी;

    यदि दूसरा खिलाड़ी 3/5 की संभावना के साथ तीसरी रणनीति का उपयोग करता है, तो चौथा 2/5 की संभावना के साथ और पहली और दूसरी रणनीतियों का उपयोग नहीं करता है, तो किसी दिए गए मैट्रिक्स के साथ पर्याप्त बड़ी संख्या में गेम के साथ उसका नुकसान होता है। औसत 11/5 से अधिक नहीं होगा.

उदाहरण 2. मैट्रिक्स द्वारा दिए गए गेम का समाधान ढूंढें

खेल का कोई काठी बिंदु नहीं है. मिश्रित रणनीतियों के क्षेत्र में इष्टतम समाधान खोजा जाना चाहिए। आइए हम पहले खिलाड़ी की रणनीतियों के अनुरूप विमान पर खंड बनाएं।

खिलाड़ी बी के लिए नुकसान की ऊपरी सीमा टूटी हुई रेखा है 1 सीए 4 . रणनीतियाँ 1 और 2 खिलाड़ी ए की सक्रिय रणनीतियाँ हैं। उनके प्रतिच्छेदन का बिंदु कोखिलाड़ियों की इष्टतम रणनीतियाँ और खेल की कीमत निर्धारित करता है। पहले खिलाड़ी के लिए रणनीतियाँ लागू करना लाभदायक नहीं है 3 और 4 , इसलिए, उनके उपयोग की संभावना शून्य है, अर्थात। एक्स 2 = एक्स 3 = 0. खेल का समाधान मैट्रिक्स (2x2) के साथ खेल के समाधान तक कम हो जाता है

सूत्र (1)-(3) का उपयोग करके हम इष्टतम रणनीतियाँ और खेल की कीमत पाते हैं:

एक्स 1 = 7/8, एक्स 4 = 1/8; पर 1 = 3/8, पर 2 = 5/8; वी = 27/8.

उत्तर।इष्टतम मिश्रित खिलाड़ी रणनीतियाँ

एक्स (7/8, 0, 0, 1/8) और वाई (3/8, 5/8), खेल की कीमत है वी = 27/8.

इस उत्तर का अर्थ निम्नलिखित है:

    यदि 7/8 की संभावना वाला पहला खिलाड़ी पहली रणनीति का उपयोग करता है, 1/8 की संभावना के साथ चौथी रणनीति का उपयोग करता है और दूसरी और तीसरी रणनीति का उपयोग नहीं करता है, तो किसी दिए गए मैट्रिक्स के साथ पर्याप्त बड़ी संख्या में खेलों के साथ उसकी जीत होती है औसत कम से कम 27/8 होगा;

    यदि दूसरा खिलाड़ी पहली रणनीति का उपयोग 3/8 की संभावना के साथ करता है और दूसरा 5/8 की संभावना के साथ, तो इस मैट्रिक्स के साथ पर्याप्त बड़ी संख्या में खेलों के साथ उसका औसत नुकसान 27/8 से अधिक नहीं होगा।

विषय का अध्ययन करने में कंप्यूटर प्रौद्योगिकी का उपयोग: "विरोधी खेल।"

मैट्रिक्स गेम को ग्राफ़िक रूप से हल करने के लिए, Microsoft Word और Microsoft Excel का उपयोग किया जाता है, और रैखिक प्रोग्रामिंग विधियों का उपयोग करके मैट्रिक्स गेम को हल करने के लिए, Microsoft Excel के "समाधान खोजें" विकल्प का उपयोग किया जाता है। गणना के लिए MATLAB प्रोग्राम का उपयोग करना भी संभव है, जो एल्गोरिदम विकसित करने, डेटा के विज़ुअलाइज़ेशन और विश्लेषण और संख्यात्मक गणना के लिए एक उच्च स्तरीय तकनीकी कंप्यूटिंग भाषा और इंटरैक्टिव वातावरण है।

स्वतंत्र कार्य के लिए कार्यों के विकल्प।

भुगतान मैट्रिक्स द्वारा दी गई गेम की इष्टतम रणनीतियाँ और कीमत ज्ञात करें एक।

योजना।

6.1. मैट्रिक्स गेम और लीनियर प्रोग्रामिंग के बीच संबंध।

6.2. रैखिक प्रोग्रामिंग का उपयोग करके मैट्रिक्स गेम को हल करने के लिए एल्गोरिदम।

मैट्रिक्स गेम और लीनियर प्रोग्रामिंग के बीच संबंध

गेम थ्योरी रैखिक प्रोग्रामिंग से निकटता से संबंधित है, क्योंकि प्रत्येक परिमित दो-व्यक्ति शून्य-योग गेम को रैखिक प्रोग्रामिंग समस्या के रूप में दर्शाया जा सकता है। जी. डेंजिग बताते हैं कि गेम थ्योरी के निर्माता, जे. वॉन न्यूमैन, जिन्होंने पहली बार रैखिक प्रोग्रामिंग (1947) में सिंप्लेक्स विधि की शुरुआत की, ने इस संबंध को स्थापित किया और रैखिक प्रोग्रामिंग में द्वैत की अवधारणा को और अधिक प्रमाणित और विकसित किया।

मान लीजिए कि हमें दो व्यक्तियों का खेल दिया गया है, जो पेऑफ मैट्रिक्स द्वारा निर्दिष्ट है। फिर पहले खिलाड़ी की इष्टतम मिश्रित रणनीति परिस्थितियों द्वारा निर्धारित की जाती है

, . (6.1)

इस समस्या को एक रैखिक प्रोग्रामिंग समस्या के रूप में तैयार किया जा सकता है। होने देना

फिर पहले खिलाड़ी के लिए समस्या का गणितीय मॉडल संकलित किया जा सकता है। दूसरे खिलाड़ी की शुद्ध रणनीतियों के आधार पर, खेल का उद्देश्य कार्य है:

(6.2)

प्रतिबंधों के तहत

दूसरे खिलाड़ी के लिए समस्या इस प्रकार लिखी गई है

, .

मध्यवर्ती अनुपात:

तब समस्या विकराल रूप ले लेगी

(6.3)

प्रतिबंधों के तहत

.

दूसरे खिलाड़ी (6.3) की समस्या पहले खिलाड़ी (6.2) की समस्या से दोहरी है। दूसरे खिलाड़ी के लिए समस्या को हल किया जा सकता है, उदाहरण के लिए, मानक सिम्प्लेक्स विधि का उपयोग करके, और पहले खिलाड़ी के लिए - दोहरी सिम्प्लेक्स विधि का उपयोग करके। विधि का चुनाव इस बात से निर्धारित होता है कि किस समस्या पर कम प्रतिबंध हैं, जो बदले में प्रत्येक खिलाड़ी की शुद्ध रणनीतियों की संख्या पर निर्भर करता है।

समस्या (6.2) के गणितीय मॉडल को सभी को विभाजित करके सरल बनाया जा सकता है ( एन+1) पर प्रतिबंध वी. के साथ यह संभव है वीसं0. कब वी= 0, पेऑफ मैट्रिक्स के सभी तत्वों में कोई भी सकारात्मक संख्या जोड़ने की अनुशंसा की जाती है, जो संशोधित गेम के सकारात्मक मूल्य की गारंटी देता है। खेल का वास्तविक मूल्य इस सकारात्मक संख्या को संशोधित मूल्य से घटाकर प्राप्त किया जाता है। अगर वी < 0, то надо сменить знаки неравенств.



विश्वास वी> 0, प्रतिबंधों की प्रणाली लिखी जा सकती है:

विश्वास एक्स मैं = एक्स मैं / वीऔर अगर वी® अधिकतम, फिर 1/ वी® मिनट, हमें प्रपत्र की एक रैखिक प्रोग्रामिंग समस्या प्राप्त होती है

प्रतिबंधों के तहत

.

इसी प्रकार, पहले खिलाड़ी की शुद्ध रणनीतियों के आधार पर या दोहरी समस्याओं की रचना के नियमों के अनुसार, पहले खिलाड़ी के गणितीय मॉडल को प्रारंभिक मानकर, दूसरे खिलाड़ी के गणितीय मॉडल को फॉर्म में लिखा जाता है

प्रतिबंधों के तहत

,

कहाँ एस(वाई)अधिकतम = एल(एक्स)मिन = 1/वी, यज = य ज/एन.

मिश्रित रणनीतियों के साथ गेम को हल करने के उपरोक्त उदाहरण मैट्रिक्स गेम के सैद्धांतिक सिद्धांतों और 2x2 मैट्रिक्स के साथ भी मैन्युअल गणना की श्रमसाध्यता को स्पष्ट रूप से दर्शाते हैं। गणनाओं को स्वचालित करने के लिए, आप सॉफ़्टवेयर उत्पादों का उपयोग कर सकते हैं जिनकी गणना पद्धति रैखिक समीकरणों की एक प्रणाली को हल करने पर आधारित है http://www.uchimatchast.ru/.

किसी भी परिमित दो-व्यक्ति शून्य-राशि गेम को एक रैखिक प्रोग्रामिंग समस्या के रूप में दर्शाया जा सकता है। इस मामले में, शुद्ध और मिश्रित दोनों रणनीतियों से समस्या का समाधान संभव है। शुद्ध रणनीतियों के मामले में, किसी एक रणनीति की संभावना एक के बराबर होगी, और शेष रणनीतियों की संभावना, स्वाभाविक रूप से, शून्य के बराबर होगी।

खिलाड़ी ए की रणनीतियों की इष्टतम संभावनाएं निम्नलिखित मैक्सिमम समस्या को हल करके निर्धारित की जा सकती हैं।

आइए हम मैट्रिक्स गेम की समस्या तैयार करें। दो प्रतिस्पर्धी कंपनियाँ A और B उत्पाद बनाती हैं। बिक्री बढ़ाने के लिए उत्पाद को विभिन्न पैकेजिंग में आपूर्ति की जाती है। कंपनी A कार्डबोर्ड A 1, सिलोफ़न A 2, प्लास्टिक A 3 का उपयोग करती है। कंपनी बी समान पैकेजिंग सामग्री का उपयोग करती है। हालाँकि, कंपनियों ने उपयोग किया विभिन्न प्रकारपैकेजिंग डिजाइन। कंपनी ए ने उत्पाद पैकेजिंग और प्रतिस्पर्धी बी की व्यवहार रणनीति के आधार पर ग्राहकों की आमद में वृद्धि/कमी दर्ज की। ये आंकड़े तालिका में प्रस्तुत किए गए हैं।

में 1

में 2

में 3

न्यूनतम पंक्तियाँ

अधिकतम कॉलम

समस्या का समाधान प्रत्येक खिलाड़ी के लिए सबसे खराब से सर्वोत्तम परिणाम प्राप्त करने पर आधारित है, जिसे एक निश्चित व्यवहार रणनीति द्वारा प्राप्त किया जा सकता है। प्रस्तुत तालिका से यह पता चलता है कि इस समस्या को शुद्ध रणनीतियों के आधार पर हल नहीं किया जा सकता है (इसमें कोई समस्या नहीं है)। समस्या का समाधान -2 और 2 के बीच है। इस मामले में, मिश्रित रणनीतियाँ हैं, और चूंकि खिलाड़ी ए के लिए रणनीतियों की संख्या तीन है, इसलिए इस समस्या को बीजगणितीय विधि का उपयोग करके रैखिक प्रोग्रामिंग (एलपी) का उपयोग करके हल किया जा सकता है। यह ध्यान दिया जाना चाहिए कि इस समस्या को ग्राफिक रूप से हल नहीं किया जा सकता है, क्योंकि प्रत्येक खिलाड़ी के लिए रणनीतियों की संख्या दो से अधिक है।

तालिका में प्रस्तुत आंकड़ों के अनुसार, खिलाड़ी ए के लिए एलपी समस्या निम्नानुसार लिखी गई है

अधिकतम:
(ग्राहकों की अधिकतम संख्या) निम्नलिखित प्रतिबंधों के अधीन:


5.3.3.1 सिंप्लेक्स विधि का उपयोग करके एलपी समस्या का समाधान

आइए हम प्रतिबंधों की प्रणाली को विहित रूप में लाएँ, इसके लिए अतिरिक्त चरों को जोड़कर असमानताओं को समानता में बदलना आवश्यक है; यदि रूपांतरित असमानता में एक चिह्न ≥ है, तो समानता में संक्रमण होने पर इसके सभी गुणांकों और मुक्त पदों के चिह्न विपरीत में बदल जाते हैं। तब सिस्टम को इस प्रकार लिखा जाएगा:

हम प्रारंभिक सिम्प्लेक्स तालिका के निर्माण के लिए आगे बढ़ते हैं। उद्देश्य फ़ंक्शन के गुणांक तालिका की पंक्ति F में दर्ज किए गए हैं। चूँकि हमें उद्देश्य फलन की अधिकतम सीमा ज्ञात करने की आवश्यकता है, विपरीत चिह्न वाले गुणांक तालिका में दर्ज किए गए हैं

कार्य डेटा से हम प्रारंभिक सिम्प्लेक्स तालिका बनाते हैं।

स्वतंत्र सदस्य

चूँकि मुक्त पदों के कॉलम में कोई नकारात्मक तत्व नहीं हैं, इसलिए एक व्यवहार्य समाधान ढूंढ लिया गया है। रेखा M में नकारात्मक तत्व हैं, जिसका अर्थ है कि परिणामी समाधान इष्टतम नहीं है। आइए प्रमुख कॉलम को परिभाषित करें। ऐसा करने के लिए, हम पंक्ति एम में अधिकतम निरपेक्ष मान वाला नकारात्मक तत्व पाएंगे - यह -1 है। अग्रणी पंक्ति वह होगी जिसके लिए मुक्त पद का अग्रणी कॉलम के संबंधित तत्व से अनुपात न्यूनतम है . अग्रणी पंक्ति R 1 है और अग्रणी तत्व 1 है।

स्वतंत्र सदस्य

हमारे द्वारा संकलित तालिका में मुक्त पदों के कॉलम में नकारात्मक तत्व हैं, हम उनमें से मापांक में अधिकतम पाते हैं - यह तत्व है: -3, यह अग्रणी पंक्ति - एक्स 11 सेट करता है। इस पंक्ति में हम मापांक में अधिकतम नकारात्मक तत्व भी पाते हैं: -5 यह कॉलम X 5 में स्थित है, जो अग्रणी कॉलम होगा। अग्रणी पंक्ति में चर को आधार से बाहर रखा गया है, और अग्रणी कॉलम के अनुरूप चर को आधार में शामिल किया गया है। आइए सिंप्लेक्स तालिका की पुनर्गणना करें:

स्वतंत्र सदस्य

हमारे द्वारा संकलित तालिका में मुक्त पदों के कॉलम में नकारात्मक तत्व हैं, हम उनमें से मापांक में अधिकतम पाते हैं - यह तत्व है: -4,4, यह अग्रणी पंक्ति - एक्स 10 सेट करता है। इस पंक्ति में हम मापांक में अधिकतम नकारात्मक तत्व भी पाते हैं: -7.6 यह कॉलम X 4 में स्थित है, जो अग्रणी कॉलम होगा। अग्रणी पंक्ति में चर को आधार से बाहर रखा गया है, और अग्रणी कॉलम के अनुरूप चर को आधार में शामिल किया गया है। आइए सिंप्लेक्स तालिका की पुनर्गणना करें:

स्वतंत्र सदस्य

हमारे द्वारा संकलित तालिका में मुक्त पदों के कॉलम में नकारात्मक तत्व हैं, हम उनमें से मापांक में अधिकतम पाते हैं - यह तत्व है: -2.11, यह अग्रणी पंक्ति - एक्स 9 सेट करता है। इस पंक्ति में हम मापांक में अधिकतम नकारात्मक तत्व भी पाते हैं: - 2.82 यह कॉलम एक्स 2 में स्थित है, जो अग्रणी कॉलम होगा। अग्रणी पंक्ति में चर को आधार से बाहर रखा गया है, और अग्रणी कॉलम के अनुरूप चर को आधार में शामिल किया गया है। आइए सिंप्लेक्स तालिका की पुनर्गणना करें:

स्वतंत्र सदस्य

चूँकि पंक्ति F में कोई नकारात्मक तत्व नहीं हैं, इसलिए इष्टतम समाधान F = -0.75 पाया गया, जिसमें समान चर मान थे: X 2 = 0.75, X 4 = 0.4, X 5 = 0.29, X 3 = 0, 3।

तालिका में प्रस्तुत आंकड़ों के अनुसार, खिलाड़ी बी के लिए एलपी समस्या इस प्रकार लिखी गई है:

अधिकतम:
(ग्राहकों की न्यूनतम संख्या) निम्नलिखित प्रतिबंधों के अधीन:


आइए हम प्रतिबंधों की प्रणाली को विहित रूप में लाएँ, इसके लिए अतिरिक्त चरों को जोड़कर असमानताओं को समानता में बदलना आवश्यक है;

यदि रूपांतरित असमानता में एक चिह्न ≥ है, तो समानता में संक्रमण होने पर इसके सभी गुणांकों और मुक्त पदों के चिह्न विपरीत में बदल जाते हैं।

तब सिस्टम को इस प्रकार लिखा जाएगा:

हम प्रारंभिक सिम्प्लेक्स तालिका के निर्माण के लिए आगे बढ़ते हैं। उद्देश्य फ़ंक्शन के गुणांक तालिका की पंक्ति F में दर्ज किए गए हैं।

चूंकि शर्तों के मूल सेट में समानताएं थीं, इसलिए हमने कृत्रिम चर आर पेश किए। इसका मतलब है कि हमें सिंप्लेक्स तालिका में एक अतिरिक्त पंक्ति एम जोड़ने की जरूरत है, जिसके तत्वों की गणना समानता शर्तों के संबंधित तत्वों के योग के रूप में की जाती है। (वे जिनमें विहित रूप में परिवर्तित होने के बाद कृत्रिम चर R होते हैं) विपरीत चिह्न के साथ लिए जाते हैं।

कार्य डेटा से हम प्रारंभिक सिम्प्लेक्स तालिका बनाते हैं।

स्वतंत्र सदस्य

चूँकि मुक्त पदों के कॉलम में कोई नकारात्मक तत्व नहीं हैं, इसलिए एक व्यवहार्य समाधान ढूंढ लिया गया है। रेखा M में नकारात्मक तत्व हैं, जिसका अर्थ है कि परिणामी समाधान इष्टतम नहीं है। आइए प्रमुख कॉलम को परिभाषित करें। ऐसा करने के लिए, हम पंक्ति M में निरपेक्ष मान में अधिकतम नकारात्मक तत्व पाते हैं - यह -1 है। अग्रणी पंक्ति वह होगी जिसके लिए मुक्त पद का अग्रणी कॉलम के संबंधित तत्व से अनुपात न्यूनतम है। अग्रणी पंक्ति R 1 है और अग्रणी तत्व 1 है।

स्वतंत्र सदस्य

हमारे द्वारा संकलित तालिका में मुक्त पदों के कॉलम में नकारात्मक तत्व हैं, हम उनमें से मापांक में अधिकतम पाते हैं - यह तत्व है: -3, यह अग्रणी पंक्ति - एक्स 9 सेट करता है। इस पंक्ति में हम मापांक में अधिकतम नकारात्मक तत्व भी पाते हैं: -6 यह कॉलम X 5 में स्थित है, जो अग्रणी कॉलम होगा। अग्रणी पंक्ति में चर को आधार से बाहर रखा गया है, और अग्रणी कॉलम के अनुरूप चर को आधार में शामिल किया गया है। आइए सिंप्लेक्स तालिका की पुनर्गणना करें:

स्वतंत्र सदस्य

स्ट्रिंग एम में कोई नकारात्मक तत्व नहीं हैं। आइए रेखा F पर विचार करें जिसमें नकारात्मक तत्व हैं, इसका मतलब है कि परिणामी समाधान इष्टतम नहीं है। आइए प्रमुख कॉलम को परिभाषित करें। ऐसा करने के लिए, हम पंक्ति F में मापांक में अधिकतम नकारात्मक तत्व पाते हैं - यह -1 है। अग्रणी पंक्ति वह होगी जिसके लिए मुक्त पद का अग्रणी कॉलम के संबंधित तत्व से सकारात्मक अनुपात न्यूनतम है। अग्रणी पंक्ति X 11 है और प्रमुख तत्व है: 1.83.

स्वतंत्र सदस्य

स्ट्रिंग एम में कोई नकारात्मक तत्व नहीं हैं। आइए रेखा F पर विचार करें जिसमें नकारात्मक तत्व हैं, इसका मतलब है कि परिणामी समाधान इष्टतम नहीं है। आइए प्रमुख कॉलम को परिभाषित करें। ऐसा करने के लिए, हम पंक्ति F में निरपेक्ष मान में अधिकतम नकारात्मक तत्व पाते हैं - यह -3.92 है। अग्रणी पंक्ति वह होगी जिसके लिए मुक्त पद का अग्रणी कॉलम के संबंधित तत्व से सकारात्मक अनुपात न्यूनतम है। अग्रणी पंक्ति X 10 है और अग्रणी तत्व है: 9.75.

स्वतंत्र सदस्य

चूँकि स्ट्रिंग F में कोई नकारात्मक तत्व नहीं हैं, इसलिए इष्टतम समाधान मिल गया है। चूँकि मूल समस्या न्यूनतम ज्ञात करने की थी, इसलिए इष्टतम समाधान स्ट्रिंग F का मुक्त पद है, जिसे विपरीत चिह्न के साथ लिया गया है। चरों के मान बराबर होने पर इष्टतम समाधान F=-0.75 पाया गया: X 5 =0.53, X 4 =0.12, X 2 =0.75, X 3 =0.35।

गणना से पता चला. खिलाड़ी A और खिलाड़ी B दोनों की ओर से खेल का मूल्य समान है और -0.75 के बराबर है।

एक शून्य-राशि खेल जिसमें प्रत्येक खिलाड़ी के पास रणनीतियों का एक सीमित सेट होता है। मैट्रिक्स गेम के नियम भुगतान मैट्रिक्स द्वारा निर्धारित किए जाते हैं, जिसके तत्व पहले खिलाड़ी की जीत हैं, जो दूसरे खिलाड़ी की हार भी हैं।

मैट्रिक्स खेल एक विरोधी खेल है. पहले खिलाड़ी को खेल की कीमत के बराबर अधिकतम गारंटीकृत (दूसरे खिलाड़ी के व्यवहार से स्वतंत्र) जीत मिलती है, उसी तरह, दूसरे खिलाड़ी को न्यूनतम गारंटीकृत हानि प्राप्त होती है;

अंतर्गत रणनीति इसे नियमों (सिद्धांतों) के एक समूह के रूप में समझा जाता है जो वर्तमान स्थिति के आधार पर खिलाड़ी के प्रत्येक व्यक्तिगत कदम के लिए कार्रवाई का विकल्प निर्धारित करता है।

अब सब कुछ क्रम में और विस्तार से।

भुगतान मैट्रिक्स, शुद्ध रणनीतियाँ, खेल की कीमत

में मैट्रिक्स खेल इसके नियम निर्धारित हैं भुगतान मैट्रिक्स .

एक ऐसे खेल पर विचार करें जिसमें दो प्रतिभागी हों: पहला खिलाड़ी और दूसरा खिलाड़ी। पहले खिलाड़ी को अपने अधिकार में रहने दें एमशुद्ध रणनीतियाँ, और दूसरे खिलाड़ी के निपटान में - एनशुद्ध रणनीतियाँ. चूँकि खेल पर विचार किया जा रहा है तो स्वाभाविक है कि इस खेल में जीत भी होगी और हार भी होगी।

में भुगतान मैट्रिक्स तत्व खिलाड़ियों की जीत और हार को व्यक्त करने वाली संख्याएँ हैं। जीत और हार को अंकों, धनराशि या अन्य इकाइयों में व्यक्त किया जा सकता है।

आइए एक भुगतान मैट्रिक्स बनाएं:

यदि पहला खिलाड़ी चुनता है मैं-वीं शुद्ध रणनीति, और दूसरा खिलाड़ी - जेशुद्ध रणनीति, तो पहले खिलाड़ी का भुगतान होगा आईजेइकाइयाँ, और दूसरे खिलाड़ी का नुकसान भी है आईजेइकाइयाँ।

क्योंकि आईजे + (- आईजे) = 0, तो वर्णित गेम एक शून्य-योग मैट्रिक्स गेम है।

मैट्रिक्स गेम का सबसे सरल उदाहरण सिक्का उछालना है। खेल के नियम इस प्रकार हैं. पहले और दूसरे खिलाड़ी एक सिक्का फेंकते हैं और नतीजा या तो हेड या टेल होता है। यदि "हेड्स" और "हेड्स" या "टेल्स" या "टेल्स" एक ही समय में फेंके जाते हैं, तो पहला खिलाड़ी एक यूनिट जीतेगा, और अन्य मामलों में वह एक यूनिट खो देगा (दूसरा खिलाड़ी एक यूनिट जीतेगा) . वही दो रणनीतियाँ दूसरे खिलाड़ी के पास हैं। संबंधित भुगतान मैट्रिक्स इस प्रकार होगा:

गेम थ्योरी का कार्य पहले खिलाड़ी की रणनीति का चयन करना है, जो उसे अधिकतम औसत जीत की गारंटी देगी, साथ ही दूसरे खिलाड़ी की रणनीति का चयन करना है, जो उसे अधिकतम औसत हानि की गारंटी देगी।

आप मैट्रिक्स गेम में रणनीति कैसे चुनते हैं?

आइए भुगतान मैट्रिक्स को फिर से देखें:

सबसे पहले, आइए पहले खिलाड़ी के लिए जीत की राशि निर्धारित करें यदि वह उपयोग करता है मैंवें शुद्ध रणनीति. यदि पहला खिलाड़ी उपयोग करता है मैंशुद्ध रणनीति, तो यह मान लेना तर्कसंगत है कि दूसरा खिलाड़ी ऐसी शुद्ध रणनीति का उपयोग करेगा जिसके कारण पहले खिलाड़ी का भुगतान न्यूनतम होगा। बदले में, पहला खिलाड़ी ऐसी शुद्ध रणनीति का उपयोग करेगा जो उसे अधिकतम जीत प्रदान करेगी। इन शर्तों के आधार पर, पहले खिलाड़ी की जीत, जिसे हम निरूपित करते हैं वी1 , बुलाया अधिकतम जीत या खेल की कम कीमत .

पर इन मानों के लिए, पहले खिलाड़ी को निम्नानुसार आगे बढ़ना चाहिए। प्रत्येक पंक्ति से न्यूनतम तत्व का मान लिखें और उनमें से अधिकतम एक का चयन करें। इस प्रकार, पहले खिलाड़ी की जीत न्यूनतम में से अधिकतम होगी। इसलिए नाम - मैक्सिमम विनिंग। इस तत्व की पंक्ति संख्या उस शुद्ध रणनीति की संख्या होगी जिसे पहला खिलाड़ी चुनता है।

आइए अब दूसरे खिलाड़ी के लिए नुकसान की मात्रा निर्धारित करें यदि वह उपयोग करता है जेवें रणनीति. इस मामले में, पहला खिलाड़ी अपनी शुद्ध रणनीति का उपयोग करता है जिसमें दूसरे खिलाड़ी का नुकसान अधिकतम होगा। दूसरे खिलाड़ी को शुद्ध रणनीति चुननी होगी जिसमें उसका नुकसान न्यूनतम हो। दूसरे खिलाड़ी की हार, जिसे हम इस रूप में दर्शाते हैं वी2 , बुलाया न्यूनतम हानि या खेल की शीर्ष कीमत .

पर खेल की लागत पर समस्याओं का समाधान करना और रणनीति का निर्धारण करना दूसरे खिलाड़ी के लिए ये मान निर्धारित करने के लिए, निम्नानुसार आगे बढ़ें। प्रत्येक कॉलम से अधिकतम तत्व का मान लिखें और उनमें से न्यूनतम का चयन करें। इस प्रकार, दूसरे खिलाड़ी की हानि अधिकतम में से न्यूनतम होगी। इसलिए नाम - मिनिमैक्स जीत। इस तत्व की कॉलम संख्या दूसरे खिलाड़ी द्वारा चुनी गई शुद्ध रणनीति की संख्या होगी। यदि दूसरा खिलाड़ी "मिनीमैक्स" का उपयोग करता है, तो पहले खिलाड़ी द्वारा चुनी गई रणनीति की परवाह किए बिना, उसे इससे अधिक की हानि नहीं होगी वी2 इकाइयाँ।

उदाहरण 1।

.

पंक्तियों के सबसे छोटे तत्वों में से सबसे बड़ा 2 है, यह खेल की कम कीमत है, पहली पंक्ति इसके अनुरूप है, इसलिए, पहले खिलाड़ी की अधिकतम रणनीति पहली है। कॉलम के सबसे बड़े तत्वों में से सबसे छोटा 5 है, यह गेम की ऊपरी कीमत है, दूसरा कॉलम इसके अनुरूप है, इसलिए, दूसरे खिलाड़ी की न्यूनतम रणनीति दूसरी है।

अब जब हमने गेम की निचली और ऊपरी कीमत, मैक्सिमम और मिनिमैक्स रणनीतियों का पता लगाना सीख लिया है, तो यह सीखने का समय है कि इन अवधारणाओं को औपचारिक रूप से कैसे परिभाषित किया जाए।

तो, पहले खिलाड़ी की जीत की गारंटी है:

पहले खिलाड़ी को एक शुद्ध रणनीति चुननी होगी जो उसे न्यूनतम जीत में से अधिकतम प्रदान करेगी। यह लाभ (अधिकतम) इस प्रकार दर्शाया गया है:

.

पहला खिलाड़ी अपनी शुद्ध रणनीति का उपयोग करता है ताकि दूसरे खिलाड़ी का नुकसान अधिकतम हो। इस हानि को इस प्रकार दर्शाया गया है:

दूसरे खिलाड़ी को अपनी शुद्ध रणनीति चुननी होगी ताकि उसका नुकसान कम से कम हो। यह हानि (मिनीमैक्स) इस प्रकार दर्शाई गई है:

.

उसी शृंखला से एक और उदाहरण.

उदाहरण 2.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

पहले खिलाड़ी की अधिकतम रणनीति, दूसरे खिलाड़ी की न्यूनतम रणनीति, खेल की निचली और ऊपरी कीमत निर्धारित करें।

समाधान। भुगतान मैट्रिक्स के दाईं ओर हम इसकी पंक्तियों में सबसे छोटे तत्वों को लिखते हैं और उनमें से अधिकतम को चिह्नित करते हैं, और मैट्रिक्स के नीचे - सबसे बड़े तत्वकॉलम में और उनमें से सबसे छोटे का चयन करें:

पंक्तियों के सबसे छोटे तत्वों में से सबसे बड़ा 3 है, यह खेल की कम कीमत है, दूसरी पंक्ति इसके अनुरूप है, इसलिए, पहले खिलाड़ी की अधिकतम रणनीति दूसरी है। कॉलम के सबसे बड़े तत्वों में से सबसे छोटा 5 है, यह गेम की ऊपरी कीमत है, पहला कॉलम इसके अनुरूप है, इसलिए, दूसरे खिलाड़ी की मिनिमैक्स रणनीति पहली है।

मैट्रिक्स गेम में सैडल पॉइंट

यदि गेम की ऊपरी और निचली कीमतें समान हैं, तो मैट्रिक्स गेम को सैडल पॉइंट माना जाता है। इसका विपरीत भी सत्य है: यदि मैट्रिक्स गेम में सैडल पॉइंट है, तो मैट्रिक्स गेम की ऊपरी और निचली कीमतें समान हैं। संबंधित तत्व पंक्ति में सबसे छोटा और कॉलम में सबसे बड़ा दोनों है और खेल की कीमत के बराबर है।

इस प्रकार, यदि, तो पहले खिलाड़ी की इष्टतम शुद्ध रणनीति है, और दूसरे खिलाड़ी की इष्टतम शुद्ध रणनीति है। अर्थात्, रणनीतियों की एक ही जोड़ी का उपयोग करके समान निचले और ऊपरी खेल की कीमतें हासिल की जाती हैं।

इस मामले में मैट्रिक्स गेम का समाधान शुद्ध रणनीतियों में है .

उदाहरण 3.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

समाधान। भुगतान मैट्रिक्स के दाईं ओर, हम इसकी पंक्तियों में सबसे छोटे तत्वों को लिखेंगे और उनमें से अधिकतम को नोट करेंगे, और मैट्रिक्स के नीचे - कॉलम में सबसे बड़े तत्वों को लिखेंगे और उनमें से न्यूनतम का चयन करेंगे:

खेल की कम कीमत खेल की ऊपरी कीमत से मेल खाती है। इस प्रकार, गेम की कीमत 5 है। खेल की लागत सैडल पॉइंट के मूल्य के बराबर है। पहले खिलाड़ी की मैक्सिन रणनीति दूसरी शुद्ध रणनीति है, और दूसरे खिलाड़ी की मिनिमैक्स रणनीति तीसरी शुद्ध रणनीति है। इस मैट्रिक्स गेम का समाधान शुद्ध रणनीतियों में है।

मैट्रिक्स गेम की समस्या को स्वयं हल करें, और फिर समाधान देखें

उदाहरण 4.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

गेम की निचली और ऊपरी कीमत ज्ञात करें। क्या इस मैट्रिक्स गेम में सैडल पॉइंट है?

इष्टतम मिश्रित रणनीति के साथ मैट्रिक्स गेम

ज्यादातर मामलों में, मैट्रिक्स गेम में सैडल पॉइंट नहीं होता है, इसलिए संबंधित मैट्रिक्स गेम में शुद्ध रणनीतियों में कोई समाधान नहीं होता है।

लेकिन इष्टतम मिश्रित रणनीतियों में इसका समाधान है। उन्हें ढूंढने के लिए, आपको यह मान लेना होगा कि खेल को पर्याप्त संख्या में दोहराया गया है ताकि अनुभव के आधार पर आप अनुमान लगा सकें कि कौन सी रणनीति अधिक बेहतर है। इसलिए, निर्णय संभाव्यता और औसत (गणितीय अपेक्षा) की अवधारणा से जुड़ा है। अंतिम समाधान में सैडल पॉइंट का एक एनालॉग (यानी, गेम की निचली और ऊपरी कीमतों की समानता) और उनके अनुरूप रणनीतियों का एक एनालॉग दोनों मौजूद हैं।

इसलिए, पहले खिलाड़ी को अधिकतम औसत जीत प्राप्त करने के लिए और दूसरे खिलाड़ी को न्यूनतम औसत हानि प्राप्त करने के लिए, शुद्ध रणनीतियाँएक निश्चित संभावना के साथ प्रयोग किया जाना चाहिए।

यदि पहला खिलाड़ी संभावनाओं के साथ शुद्ध रणनीतियों का उपयोग करता है , फिर वेक्टर इसे मिश्रित प्रथम खिलाड़ी रणनीति कहा जाता है। दूसरे शब्दों में, यह शुद्ध रणनीतियों का "मिश्रण" है। इस स्थिति में, इन संभावनाओं का योग एक के बराबर है:

.

यदि दूसरा खिलाड़ी संभावनाओं के साथ शुद्ध रणनीतियों का उपयोग करता है , फिर वेक्टर इसे दूसरे खिलाड़ी की मिश्रित रणनीति कहा जाता है। इस स्थिति में, इन संभावनाओं का योग एक के बराबर है:

.

यदि पहला खिलाड़ी मिश्रित रणनीति का उपयोग करता है पी, और दूसरा खिलाड़ी - एक मिश्रित रणनीति क्यू, तो यह समझ में आता है अपेक्षित मूल्य पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार)। इसे खोजने के लिए, आपको पहले खिलाड़ी की मिश्रित रणनीति वेक्टर (जो एक-पंक्ति मैट्रिक्स होगा), भुगतान मैट्रिक्स और दूसरे खिलाड़ी की मिश्रित रणनीति वेक्टर (जो एक-स्तंभ मैट्रिक्स होगा) को गुणा करना होगा:

.

उदाहरण 5.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार) की गणितीय अपेक्षा निर्धारित करें, यदि पहले खिलाड़ी की मिश्रित रणनीति है, और दूसरे खिलाड़ी की मिश्रित रणनीति है।

समाधान। पहले खिलाड़ी की जीत (दूसरे खिलाड़ी की हार) की गणितीय अपेक्षा के सूत्र के अनुसार, यह पहले खिलाड़ी की मिश्रित रणनीति वेक्टर, भुगतान मैट्रिक्स और दूसरे खिलाड़ी की मिश्रित रणनीति वेक्टर के उत्पाद के बराबर है:

पहले खिलाड़ी को ऐसी मिश्रित रणनीति कहा जाता है जो खेल को पर्याप्त संख्या में दोहराए जाने पर उसे अधिकतम औसत भुगतान प्रदान करेगी।

इष्टतम मिश्रित रणनीति दूसरे खिलाड़ी को ऐसी मिश्रित रणनीति कहा जाता है जो खेल को पर्याप्त संख्या में दोहराए जाने पर उसे न्यूनतम औसत हानि प्रदान करेगी।

शुद्ध रणनीतियों के मामले में मैक्सिमम और मिनिमैक्स के अंकन के अनुरूप, इष्टतम मिश्रित रणनीतियों को निम्नानुसार दर्शाया जाता है (और गणितीय अपेक्षा से जुड़े होते हैं, यानी, पहले खिलाड़ी की जीत और दूसरे खिलाड़ी की हार का औसत):

,

.

इस मामले में, समारोह के लिए वहाँ एक काठी बिंदु है , जिसका अर्थ है समानता।

इष्टतम मिश्रित रणनीतियों और एक काठी बिंदु को खोजने के लिए, अर्थात, मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करें , आपको मैट्रिक्स गेम को एक रैखिक प्रोग्रामिंग समस्या, यानी अनुकूलन समस्या में कम करने और संबंधित रैखिक प्रोग्रामिंग समस्या को हल करने की आवश्यकता है।

एक मैट्रिक्स गेम को एक रैखिक प्रोग्रामिंग समस्या में कम करना

मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करने के लिए, आपको एक सीधी रेखा बनाने की आवश्यकता है रैखिक प्रोग्रामिंग समस्याऔर दोहरा कार्य. दोहरी समस्या में, विस्तारित मैट्रिक्स, जो बाधाओं की प्रणाली में चर के गुणांक, मुक्त शर्तों और उद्देश्य फ़ंक्शन में चर के गुणांक को संग्रहीत करता है, को स्थानांतरित किया जाता है। इस मामले में, मूल समस्या का न्यूनतम लक्ष्य फ़ंक्शन दोहरी समस्या में अधिकतम से मेल खाता है।

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या में लक्ष्य फ़ंक्शन:

.

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या में बाधाओं की प्रणाली:

दोहरी समस्या में लक्ष्य कार्य है:

.

दोहरी समस्या में बाधाओं की प्रणाली:

प्रत्यक्ष रैखिक प्रोग्रामिंग समस्या के लिए इष्टतम योजना को दर्शाया गया है

,

और दोहरी समस्या के लिए इष्टतम योजना को दर्शाया गया है

हम संबंधित इष्टतम योजनाओं के लिए रैखिक रूपों को और द्वारा निरूपित करते हैं,

और उन्हें इष्टतम योजनाओं के संगत निर्देशांक के योग के रूप में पाया जाना चाहिए।

पिछले पैराग्राफ की परिभाषाओं और इष्टतम योजनाओं के निर्देशांक के अनुसार, पहले और दूसरे खिलाड़ियों की निम्नलिखित मिश्रित रणनीतियाँ मान्य हैं:

.

सैद्धांतिक गणितज्ञों ने इसे सिद्ध कर दिया है खेल की कीमत इष्टतम योजनाओं के रैखिक रूपों के माध्यम से निम्नलिखित तरीके से व्यक्त किया गया है:

,

अर्थात्, यह इष्टतम योजनाओं के निर्देशांकों के योग का व्युत्क्रम है।

हम, व्यवसायी, केवल मिश्रित रणनीतियों में मैट्रिक्स गेम को हल करने के लिए इस सूत्र का उपयोग कर सकते हैं। पसंद इष्टतम मिश्रित रणनीतियाँ खोजने के लिए सूत्र क्रमशः प्रथम और द्वितीय खिलाड़ी:

जिसमें दूसरे कारक सदिश हैं। इष्टतम मिश्रित रणनीतियाँ भी हैं, जैसा कि हम पहले ही पिछले पैराग्राफ में परिभाषित कर चुके हैं, वैक्टर। इसलिए, संख्या (खेल मूल्य) को एक वेक्टर (इष्टतम योजनाओं के निर्देशांक के साथ) से गुणा करने पर हमें एक वेक्टर भी प्राप्त होता है।

उदाहरण 6.पेऑफ मैट्रिक्स के साथ एक मैट्रिक्स गेम दिया गया है

.

गेम की कीमत ज्ञात करें वीऔर इष्टतम मिश्रित रणनीतियाँ और।

समाधान। हम इस मैट्रिक्स गेम के अनुरूप एक रैखिक प्रोग्रामिंग समस्या बनाते हैं:

हमें प्रत्यक्ष समस्या का समाधान मिलता है:

.

हम पाए गए निर्देशांकों के योग के रूप में इष्टतम योजनाओं का रैखिक रूप पाते हैं।