अर्थव्यवस्था

नैश संतुलन। अर्थशास्त्रियों के लिए गेम थ्योरी (जॉन नैश)

विषयसूची:

नैश संतुलन। अर्थशास्त्रियों के लिए गेम थ्योरी (जॉन नैश)
नैश संतुलन। अर्थशास्त्रियों के लिए गेम थ्योरी (जॉन नैश)
Anonim

1930 के दशक में, जॉन वॉन न्यूमैन और ऑस्कर मॉर्गनस्टर्न गणित के एक नए दिलचस्प क्षेत्र के संस्थापक बने, जिसे "गेम थ्योरी" कहा जाता था। 1950 के दशक में, युवा गणितज्ञ जॉन नैश इस क्षेत्र में रुचि रखने लगे। संतुलन का सिद्धांत उनके शोध प्रबंध का विषय बन गया, जिसे उन्होंने 21 साल की उम्र में लिखा था। इस प्रकार नैश इक्विलिब्रियम नामक खेलों के लिए एक नई रणनीति का जन्म हुआ, जिसने 1994 में कई साल बाद नोबेल पुरस्कार अर्जित किया।

Image

थीसिस लिखने और सार्वभौमिक स्वीकृति के बीच लंबा अंतराल गणितज्ञ के लिए एक परीक्षण था। बिना मान्यता के प्रतिभा के कारण गंभीर मानसिक उल्लंघनों का सामना करना पड़ा, लेकिन जॉन नैश अपने उत्कृष्ट तार्किक दिमाग के कारण इस समस्या को हल करने में सक्षम थे। "नैश संतुलन" के उनके सिद्धांत को नोबेल पुरस्कार से सम्मानित किया गया था, और फिल्म "सुंदर दिमाग" ("माइंड गेम्स") में उनका फिल्म अनुकूलन था।

खेल थ्योरी संक्षेप में

चूंकि नैश संतुलन का सिद्धांत बातचीत के संदर्भ में लोगों के व्यवहार की व्याख्या करता है, इसलिए यह खेल सिद्धांत की मूल अवधारणाओं पर विचार करने के लायक है।

गेम सिद्धांत प्रतिभागियों के एजेंटों (एजेंटों) के खेल के प्रकार के अनुसार एक-दूसरे के साथ बातचीत की शर्तों के तहत अध्ययन करता है, जब परिणाम कई लोगों के निर्णय और व्यवहार पर निर्भर करता है। प्रतिभागी दूसरों के व्यवहार के बारे में अपने पूर्वानुमान द्वारा निर्देशित निर्णय लेता है, जिसे खेल की रणनीति कहा जाता है।

एक प्रभावी रणनीति भी है जिसमें प्रतिभागी को अन्य प्रतिभागियों के किसी भी व्यवहार के लिए इष्टतम परिणाम मिलता है। यह खिलाड़ी की सर्वश्रेष्ठ जीत की रणनीति है।

कैदी की दुविधा और वैज्ञानिक ब्रेकथ्रू

कैदी की दुविधा एक खेल के साथ एक मामला है जब प्रतिभागियों को तर्कसंगत निर्णय लेने के लिए मजबूर किया जाता है, जो विकल्प के टकराव के संदर्भ में एक सामान्य लक्ष्य तक पहुंचते हैं। सवाल यह है कि वह इनमें से कौन सा विकल्प चुनेगा, अपने व्यक्तिगत और सामान्य हित को पहचानने के साथ-साथ दोनों को प्राप्त करने में असमर्थता। खिलाड़ियों को कठोर गेमिंग परिस्थितियों में संलग्न होना प्रतीत होता है, जो कभी-कभी उन्हें बहुत उत्पादक रूप से सोचने लगता है।

Image

इस दुविधा को अमेरिकी गणितज्ञ जॉन नैश ने खोजा था। उन्होंने जो संतुलन लाया, वह अपनी तरह का क्रांतिकारी बन गया। विशेष रूप से स्पष्ट रूप से, इस नए विचार ने अर्थशास्त्रियों की राय को प्रभावित किया कि कैसे बाजार के खिलाड़ी विकल्प बनाते हैं, अन्य लोगों के हितों को ध्यान में रखते हुए, करीबी बातचीत और हितों के प्रतिच्छेदन के साथ।

विशिष्ट उदाहरणों के साथ गेम थ्योरी का अध्ययन करना सबसे अच्छा है, क्योंकि यह गणितीय अनुशासन खुद एक सूखा सैद्धांतिक नहीं है।

कैदी दुविधा उदाहरण

उदाहरण के लिए, दो लोग लूट लिए गए, पुलिस के हाथों गिर गए और अलग-अलग कक्षों में पूछताछ की जा रही है। उसी समय, पुलिस अधिकारी प्रत्येक भागीदार को अनुकूल परिस्थितियों की पेशकश करते हैं जिसके तहत वह अपने साथी के खिलाफ गवाही देता है। अपराधियों में से प्रत्येक के पास रणनीतियों का निम्नलिखित सेट है, जिस पर वह विचार करेगा:

  1. दोनों एक साथ गवाही देते हैं और 2.5 साल की जेल पाते हैं।

  2. दोनों एक ही समय में चुप हैं और प्रत्येक को 1 वर्ष प्राप्त होता है, क्योंकि इस मामले में उनके अपराध का सबूत छोटा होगा।

  3. एक सबूत देता है और आज़ादी पाता है, जबकि दूसरा चुप रहता है और उसे 5 साल की जेल हो जाती है।

जाहिर है, मामले का परिणाम दोनों प्रतिभागियों के निर्णय पर निर्भर करता है, लेकिन वे एक समझौते पर नहीं आ सकते क्योंकि वे विभिन्न कोशिकाओं में बैठे हैं। एक सामान्य हित के संघर्ष में उनके व्यक्तिगत हितों का संघर्ष भी स्पष्ट रूप से दिखाई देता है। प्रत्येक कैदी के पास कार्रवाई के लिए दो विकल्प और परिणामों के लिए 4 विकल्प हैं।

इंजेक्शन श्रृंखला

इसलिए, आपराधिक ए निम्नलिखित विकल्पों पर विचार कर रहा है:

  1. मैं चुप हूं और मेरा साथी चुप है - हम दोनों को 1 साल की जेल होगी।

  2. मैं अपने साथी को देता हूं और वह मुझे देता है - हम दोनों को 2.5 साल की जेल होती है।

  3. मैं चुप हूं, और मेरा साथी मुझे सौंप रहा है - मैं 5 साल जेल में रहूंगा, और वह मुक्त हो जाएगा।

  4. मैं अपने साथी को किराए पर लेता हूं, और वह चुप है - मुझे स्वतंत्रता मिलती है, और वह 5 साल जेल में है।

हम स्पष्टता के लिए संभावित समाधानों और परिणामों का एक मैट्रिक्स देते हैं।

कैदी की दुविधा के संभावित परिणामों की तालिका।

Image

सवाल यह है कि प्रत्येक प्रतिभागी क्या चुनेंगे?

"मौन, आप बोल नहीं सकते" या "मौन आप बोल नहीं सकते"

प्रतिभागी की पसंद को समझने के लिए, आपको उसके विचारों की श्रृंखला से गुजरना होगा। अपराधी ए के तर्क के बाद: यदि मैं चुप रहता हूं और अपने साथी को चुप रखता हूं, तो हमें न्यूनतम अवधि (1 वर्ष) प्राप्त होगी, लेकिन मुझे पता नहीं चलेगा कि वह कैसे व्यवहार करेगा। अगर वह मेरे खिलाफ गवाही देता है, तो मेरे लिए गवाही देना बेहतर है, अन्यथा मैं 5 साल तक बैठ सकता हूं। मैं 5 साल के बजाय 2.5 साल बैठूंगा। यदि वह कुछ नहीं कहता है, तो मुझे और अधिक गवाही देने की आवश्यकता है, क्योंकि इस तरह मुझे स्वतंत्रता मिलेगी। सदस्य B भी उसी तरह से बहस करता है।

Image

यह समझना आसान है कि अपराधियों में से प्रत्येक के लिए प्रमुख रणनीति गवाही देना है। इस खेल का इष्टतम बिंदु तब होता है जब दोनों अपराधी सबूत देते हैं और अपने "पुरस्कार" प्राप्त करते हैं - 2.5 साल की जेल। नैश के गेम सिद्धांत इसे संतुलन कहते हैं।

नैश ऑप्टिमल ऑप्टिमल सॉल्यूशन

नाशीव के विचार की क्रांति यह है कि यदि हम व्यक्तिगत प्रतिभागी और उसके व्यक्तिगत हित पर विचार करते हैं तो ऐसा संतुलन इष्टतम नहीं है। आखिरकार, सबसे अच्छा विकल्प चुप रहना और मुक्त होना है।

नैश संतुलन हितों के अभिसरण का एक बिंदु है, जहां प्रत्येक प्रतिभागी एक विकल्प चुनता है जो उसके लिए इष्टतम है यदि अन्य प्रतिभागी एक विशिष्ट रणनीति चुनते हैं।

विकल्प को ध्यान में रखते हुए जब दोनों अपराधी चुप हैं और प्रत्येक को केवल 1 वर्ष प्राप्त होता है, हम इसे पारेटो-इष्टतम विकल्प कह सकते हैं। हालांकि, यह तभी संभव है जब अपराधी पहले से सहमत हो सकते हैं। लेकिन यह भी इस परिणाम की गारंटी नहीं देगा, क्योंकि अनुनय से पीछे हटने और दंड से बचने का प्रलोभन महान है। एक-दूसरे पर पूर्ण विश्वास की कमी और मान्यता के साथ विकल्प चुनने के लिए 5 साल पुराना होने का खतरा। इस तथ्य पर विचार करने के लिए कि प्रतिभागी चुप्पी के साथ विकल्प का पालन करेंगे, संगीत कार्यक्रम में अभिनय करना, केवल तर्कहीन है। अगर नैश संतुलन का अध्ययन किया जाए तो ऐसा निष्कर्ष निकाला जा सकता है। उदाहरण केवल यही सिद्ध करते हैं।

स्वार्थी या तर्कसंगत

नैश संतुलन के सिद्धांत ने पहले से मौजूद सिद्धांतों का खंडन करते हुए आश्चर्यजनक निष्कर्ष निकाले हैं। उदाहरण के लिए, एडम स्मिथ ने प्रत्येक प्रतिभागियों के व्यवहार को बिल्कुल स्वार्थी माना, जिसने प्रणाली को संतुलन में लाया। इस सिद्धांत को "बाजार का अदृश्य हाथ" कहा जाता था।

Image

जॉन नैश ने देखा कि यदि सभी प्रतिभागी अपने हित साधने के लिए काम करते हैं, तो इससे कभी भी एक इष्टतम समूह परिणाम नहीं आएगा। यह मानते हुए कि तर्कसंगत सोच प्रत्येक प्रतिभागी में अंतर्निहित है, नैश संतुलन रणनीति की पेशकश की संभावना अधिक है।

विशुद्ध रूप से पुरुष प्रयोग

एक ज्वलंत उदाहरण "गोरा विरोधाभास" खेल है, जो कि अनुचित लगता है, यह एक विशद चित्रण है जिसमें दिखाया गया है कि नैश गेम थ्योरी कैसे काम करती है।

इस गेम में आपको यह कल्पना करने की आवश्यकता है कि मुक्त लोगों की कंपनी बार में आई। आगे लड़कियों की एक कंपनी है, जिनमें से एक दूसरों के लिए बेहतर है, एक गोरा कहते हैं। कैसे लोग अपने लिए सबसे अच्छी प्रेमिका पाने के लिए व्यवहार करते हैं?

Image

तो, लोगों के तर्क: यदि हर कोई गोरा से परिचित होना शुरू कर देता है, तो सबसे अधिक संभावना है कि वह किसी से नहीं मिलेगा, फिर उसके दोस्त मिलना नहीं चाहेंगे। कोई भी दूसरा कमबैक नहीं करना चाहता है। लेकिन अगर लड़के गोरी से बचने के लिए चुनते हैं, तो लड़कों में से प्रत्येक के लिए लड़कियों के बीच एक अच्छी प्रेमिका खोजने की संभावना अधिक है।

नैश संतुलन की स्थिति लोगों के लिए इष्टतम नहीं है, क्योंकि, केवल अपने स्वार्थों का पीछा करते हुए, हर कोई गोरा चुनता है। यह स्पष्ट है कि समूह के हितों के पतन के लिए केवल स्वार्थी हितों का पीछा करना ही महत्वपूर्ण होगा। नैश संतुलन का मतलब होगा कि प्रत्येक व्यक्ति अपने निजी हितों में कार्य करता है, जो पूरे समूह के हितों के संपर्क में हैं। यह व्यक्तिगत रूप से सभी के लिए एक इष्टतम विकल्प नहीं है, लेकिन समग्र सफलता रणनीति के आधार पर सभी के लिए इष्टतम है।

हमारा पूरा जीवन एक खेल है

वास्तविक परिस्थितियों में निर्णय लेना एक खेल के समान है जब आप अन्य प्रतिभागियों से एक निश्चित तर्कसंगत व्यवहार की अपेक्षा करते हैं। व्यापार में, काम में, एक टीम में, एक कंपनी में और यहां तक ​​कि विपरीत लिंग के साथ संबंधों में भी। बड़े लेन-देन से लेकर सामान्य जीवन स्थितियों तक, सब कुछ एक कानून या दूसरे का पालन करता है।

Image

बेशक, अपराधियों और बार के साथ माना जाने वाला खेल की स्थिति नैश के संतुलन को प्रदर्शित करने वाले उत्कृष्ट चित्र हैं। ऐसे दुविधाओं के उदाहरण बहुत बार वास्तविक बाजार में उत्पन्न होते हैं, और यह विशेष रूप से दो एकाधिकारवादियों के साथ काम करता है जो बाजार को नियंत्रित करते हैं।

मिश्रित रणनीति

अक्सर हम एक बार में नहीं बल्कि कई खेलों में शामिल होते हैं। एक गेम के लिए विकल्पों में से एक को चुनना, एक तर्कसंगत रणनीति द्वारा निर्देशित, लेकिन आप दूसरे गेम में आते हैं। कई तर्कसंगत फैसलों के बाद, आप पा सकते हैं कि आपका परिणाम आपको शोभा नहीं देता। क्या करें?

दो प्रकार की रणनीति पर विचार करें:

  • एक शुद्ध रणनीति एक प्रतिभागी का व्यवहार है जो अन्य प्रतिभागियों के संभावित व्यवहार के बारे में सोचने से आता है।

  • एक मिश्रित रणनीति या एक यादृच्छिक रणनीति शुद्ध रणनीतियों का विकल्प यादृच्छिक रूप से या एक निश्चित संभावना के साथ शुद्ध रणनीति का विकल्प है। इस रणनीति को यादृच्छिक भी कहा जाता है।

Image

इस व्यवहार को ध्यान में रखते हुए, हमें नैश संतुलन पर एक नया रूप मिलता है। यदि पहले कहा गया था कि खिलाड़ी एक बार एक रणनीति चुनता है, तो एक और व्यवहार की कल्पना की जा सकती है। हम इस विकल्प को स्वीकार कर सकते हैं कि खिलाड़ी एक निश्चित संभावना के साथ यादृच्छिक रूप से एक रणनीति चुनते हैं। ऐसे खेल जिनमें नैश इक्विलिब्रिया को शुद्ध रणनीतियों में नहीं पाया जा सकता है, उन्हें हमेशा मिश्रित रूप में रखना चाहिए।

मिश्रित रणनीतियों में नैश संतुलन को मिश्रित संतुलन कहा जाता है। यह एक ऐसा संतुलन है, जहां प्रत्येक प्रतिभागी अपनी रणनीतियों को चुनने के लिए इष्टतम आवृत्ति चुनता है, बशर्ते कि अन्य प्रतिभागी दी गई आवृत्ति के साथ अपनी रणनीतियों का चयन करें।