The complete cooperation and the complete defection are two typical strategies considered in evolutionary games in many previous works. However, in real life, strategies of individuals are full of variety rather than only two complete ones. In this work, the diversity of strategies is introduced into the weak prisoners' dilemma game, which is measured by the diversity of the cooperation tendency. A higher diversity means more cooperation tendencies are provided. The complete cooperation strategy is the full cooperation tendency and the complete defection strategy is without any cooperation tendency. Agents with other cooperation tendencies behave as partial cooperators and as partial defectors simultaneously. The numerical simulation shows that increasing the diversity of the cooperation tendency promotes the cooperation level, not only the number of cooperators but also the average tendency over the whole population, until the diversity reaches its saturated value. Furthermore, our work points out maintaining cooperation is based on the cooperation efficiency approximating to the reward of cooperators and that the cooperation efficiency oscillates and quickly decreases to zero when cooperator clusters cannot resist the invasion of defectors. When the effect of the noise for the Femi update mechanism is considered, a higher diversity of strategies not only improves the cooperation level of the whole population but also supports the survival of more rational agents.
- पेपर ID: 2406.12647
- शीर्षक: Evolution of cooperation with the diversity of cooperation tendencies
- लेखक: Linya Huang, Wenchen Han
- वर्गीकरण: physics.soc-ph (सामाजिक भौतिकी)
- प्रकाशन तिथि: 18 जून 2024 (arXiv प्रीप्रिंट)
- पेपर लिंक: https://arxiv.org/abs/2406.12647
परंपरागत विकासवादी खेल सिद्धांत में आमतौर पर केवल पूर्ण सहयोग और पूर्ण विश्वासघात की दो रणनीतियों पर विचार किया जाता है, लेकिन वास्तविकता में व्यक्तियों की रणनीतियां अधिक विविध होती हैं। यह अनुसंधान कमजोर कैदी की दुविधा खेल में रणनीति विविधता को प्रस्तुत करता है, जिसे सहयोग प्रवृत्तियों की विविधता के माध्यम से मापा जाता है। उच्च विविधता का अर्थ है अधिक सहयोग प्रवृत्ति विकल्प प्रदान करना। पूर्ण सहयोग रणनीति पूर्ण सहयोग प्रवृत्ति के अनुरूप है, पूर्ण विश्वासघात रणनीति शून्य सहयोग प्रवृत्ति के अनुरूप है, जबकि अन्य सहयोग प्रवृत्तियों वाले एजेंट आंशिक सहयोगकर्ता और आंशिक विश्वासघाती दोनों के रूप में कार्य करते हैं। संख्यात्मक सिमुलेशन दर्शाता है कि सहयोग प्रवृत्तियों की विविधता बढ़ाने से सहयोग स्तर को बढ़ावा मिलता है, न केवल सहयोगकर्ताओं की संख्या बढ़ती है, बल्कि पूरी आबादी की औसत प्रवृत्ति भी बढ़ती है, जब तक विविधता संतृप्ति मान तक नहीं पहुंच जाती। अनुसंधान यह भी दर्शाता है कि सहयोग का रखरखाव सहयोग दक्षता के आधार पर होता है जो सहयोगकर्ताओं के पुरस्कार के करीब होती है, जब सहयोगकर्ता समूह विश्वासघातियों के आक्रमण का प्रतिरोध नहीं कर सकते, तो सहयोग दक्षता दोलन करती है और तेजी से शून्य तक गिरती है।
- परंपरागत खेल सिद्धांत की सीमाएं: शास्त्रीय विकासवादी खेल सिद्धांत आमतौर पर केवल पूर्ण सहयोग और पूर्ण विश्वासघात की दो चरम रणनीतियों पर विचार करता है, लेकिन वास्तविक दुनिया में व्यक्तियों के व्यवहार की रणनीतियां निरंतरता और विविधता प्रदर्शित करती हैं।
- कैदी की दुविधा का वास्तविक महत्व: कैदी की दुविधा सहयोग के विकास का अध्ययन करने के लिए एक शास्त्रीय मॉडल है, जिसका स्थिर संतुलन पारस्परिक विश्वासघात है, जिससे सहयोगकर्ता विलुप्त हो जाते हैं, लेकिन वास्तविकता में सहयोग व्यवहार व्यापक रूप से मौजूद है।
- सहयोग प्रचार तंत्र: मौजूदा अनुसंधान ने सहयोग को बढ़ावा देने के पांच मुख्य तंत्रों की पहचान की है: रिश्तेदारी चयन, प्रत्यक्ष पारस्परिकता, अप्रत्यक्ष पारस्परिकता, नेटवर्क पारस्परिकता और समूह चयन, लेकिन रणनीति विविधता के प्रभाव पर अनुसंधान अपर्याप्त है।
- रणनीति विषमता का महत्व: वास्तविक दुनिया में व्यक्ति पूरी तरह से तर्कसंगत नहीं होते, विभिन्न स्तरों की सहयोग प्रवृत्तियां मौजूद होती हैं
- आंशिक सहयोग रणनीति: व्यक्तियों में सहयोग और विश्वासघात दोनों की विशेषताएं हो सकती हैं, जिन्हें अधिक विस्तृत मॉडलिंग की आवश्यकता है
- नेटवर्क प्रभाव: स्थानिक नेटवर्क पर रणनीति विविधता के सहयोग विकास पर प्रभाव तंत्र का अध्ययन
- सहयोग प्रवृत्ति विविधता की अवधारणा प्रस्तुत करना: कमजोर कैदी की दुविधा में निरंतर सहयोग प्रवृत्ति पैरामीटर प्रस्तुत करना, एजेंटों को आंशिक सहयोग रणनीति अपनाने की अनुमति देना
- नए मूल्यांकन संकेतक प्रणाली की स्थापना: सहयोगकर्ता अनुपात (fC), औसत सहयोग प्रवृत्ति (fS) और सहयोग दक्षता (eC) जैसे संकेतक प्रस्तावित करना
- सहयोग प्रचार तंत्र का खुलासा: यह खोज करना कि रणनीति विविधता सहयोग दक्षता दोलन को कम करके सहयोग रखरखाव को बढ़ावा देती है
- सैद्धांतिक अंतर्दृष्टि: यह साबित करना कि सहयोग रखरखाव की कुंजी सहयोग दक्षता का सहयोगकर्ता पुरस्कार मान 1 के करीब होना है
- शोर प्रभाव विश्लेषण: विभिन्न रणनीति विविधता स्तरों के तहत निर्णय शोर के सहयोग विकास पर प्रभाव का अध्ययन
L×L जाली नेटवर्क पर, विभिन्न सहयोग प्रवृत्ति विविधता वाले एजेंट समूह में, कमजोर कैदी की दुविधा खेल के सहयोग विकास की गतिशीलता का अध्ययन।
इनपुट:
- नेटवर्क संरचना (100×100 जाली)
- सहयोग प्रवृत्ति विविधता पैरामीटर m
- विश्वासघात प्रलोभन पैरामीटर b∈[1,2)
- निर्णय शोर पैरामीटर κ
आउटपुट:
- सहयोगकर्ता अनुपात fC
- औसत सहयोग प्रवृत्ति fS
- सहयोग दक्षता eC
- पुरस्कार मैट्रिक्स: दोनों पक्षों का सहयोग 1 का पुरस्कार प्राप्त करता है, दोनों पक्षों का विश्वासघात 0 का दंड प्राप्त करता है, विश्वासघाती को सहयोगकर्ता का सामना करने पर b का प्रलोभन मिलता है, सहयोगकर्ता को विश्वासघाती का सामना करने पर 0 मिलता है
- नेटवर्क संरचना: 100×100 जाली नेटवर्क, आवधिक सीमा शर्तें, प्रत्येक नोड की डिग्री k=4
सहयोग प्रवृत्ति सेट को इस प्रकार परिभाषित किया गया है:
S={0,m1,m2,…,1}
जहां m विविधता पैरामीटर है, एजेंट i की सहयोग प्रवृत्ति si है, जो दर्शाता है कि यह एजेंट si भाग सहयोगकर्ता है, (1-si) भाग विश्वासघाती है।
एजेंट i और एजेंट j के बीच पुरस्कार:
Πi,j=si⋅sj+(1−si)⋅sj⋅b
कुल पुरस्कार:
Πi=∑j∈NiΠi,j
Fermi अपडेट नियम का उपयोग, एजेंट i पड़ोसी j की रणनीति सीखने की संभावना:
W(sj←si)=1+exp[(Πi−Πj)/κ]1
जहां κ शोर पैरामीटर है, जो एजेंट की तर्कसंगतता की डिग्री को दर्शाता है।
- निरंतर रणनीति स्पेस: परंपरागत बाइनरी रणनीति के विपरीत, निरंतर सहयोग प्रवृत्ति पैरामीटर प्रस्तुत करना
- मूल पुरस्कार मैट्रिक्स बनाए रखना: परंपरागत कैदी की दुविधा की पुरस्कार संरचना को संशोधित करने की आवश्यकता नहीं
- बहु-आयामी मूल्यांकन प्रणाली: सहयोगकर्ताओं की संख्या और सहयोग की तीव्रता दोनों पर विचार करना
- सहयोग दक्षता अवधारणा: सहयोग दक्षता eC = ⟨Π⟩/(4fS) को मुख्य विश्लेषण उपकरण के रूप में परिभाषित करना
- नेटवर्क स्केल: N = 10,000 एजेंट, 100×100 जाली
- विविधता पैरामीटर: m ∈ {1, 2, 4, 8, 10, 50, 100}
- विश्वासघात प्रलोभन: b ∈ 1.00, 1.14
- शोर पैरामीटर: κ = 0.1 (तर्कसंगत एजेंट), κ ∈ 0, 0.3 (शोर विश्लेषण)
- समय चरण: 50,000 चरण संक्रमण + 1,000 चरण सांख्यिकीय अवधि
- दोहराव संख्या: 50 यादृच्छिक प्रारंभिक शर्तें
- सहयोगकर्ता अनुपात:
fC=N∣{j∣sj>0}∣
- औसत सहयोग प्रवृत्ति:
fS=N∑jsj
- सहयोग दक्षता:
eC=4fS⟨Π⟩
- सहयोगकर्ता औसत प्रवृत्ति: fS/fC
- जब m=1 (परंपरागत बाइनरी रणनीति), b>1.02 पर सभी एजेंट विश्वासघात चुनते हैं
- जब m≥2, सहयोगकर्ता उच्च विश्वासघात प्रलोभन (b≈1.13) के तहत जीवित रह सकते हैं
- उच्च विविधता m समूह को उच्च समग्र सहयोग स्तर तक पहुंचने में समर्थन करता है
- एजेंट "संतृप्ति सहयोग प्रवृत्ति" के करीब रणनीति चुनने के लिए प्रवृत्त होते हैं
- मध्यम प्रलोभन स्तर पर, आंशिक सहयोग रणनीति (जैसे s=0.5, s=0.75) प्रमुख बन जाती है
- विविधता बढ़ने पर, सहयोगकर्ता औसत प्रवृत्ति fS/fC अभिसरण की ओर प्रवृत्त होती है
- सहयोग रखरखाव की कुंजी सहयोग दक्षता eC का 1 के करीब होना है (सहयोगकर्ता पुरस्कार)
- जब सहयोगकर्ता समूह विश्वासघातियों के आक्रमण का प्रतिरोध नहीं कर सकते, तो eC तीव्र दोलन करता है और तेजी से 0 तक गिरता है
- रणनीति विविधता eC दोलन को कम करके सहयोग स्थिरता को बढ़ावा देती है
- उच्च रणनीति विविधता सहयोग अस्तित्व के शोर सीमा को बढ़ाती है
- m=1 पर, b=1.04 के तहत सहयोगकर्ता पूरी तरह विलुप्त हो जाते हैं, तर्कसंगतता की परवाह किए बिना
- m=8 पर, b=1.42 के उच्च प्रलोभन के तहत भी, सहयोगकर्ता जीवित रह सकते हैं
- जीवित सहयोगकर्ताओं को समान सहयोग प्रवृत्तियों में अंतर करने के लिए उच्च तर्कसंगतता की आवश्यकता होती है
स्नैपशॉट विश्लेषण (चित्र 2) के माध्यम से विभिन्न पैरामीटरों के तहत रणनीति वितरण पैटर्न का खुलासा:
- कम प्रलोभन (b=1.01): पूर्ण सहयोग s=1 को प्राथमिकता
- मध्यम प्रलोभन (b=1.02-1.03): मिश्रित रणनीति या आंशिक सहयोग प्रमुख
- उच्च प्रलोभन (b=1.07): केवल कम सहयोग प्रवृत्ति रणनीति जीवित रह सकती है
- संतृप्ति प्रभाव: इष्टतम सहयोग प्रवृत्ति स्तर मौजूद है, उस स्तर से अधिक विविधता बढ़ाने का प्रभाव सीमित है
- गतिशील संतुलन: 1 के पास सहयोग दक्षता का स्थिरता सहयोग रखरखाव के लिए आवश्यक शर्त है
- तर्कसंगतता आवश्यकता: रणनीति विविधता में वृद्धि एजेंटों की तर्कसंगतता की डिग्री पर उच्च मांग रखती है
- शास्त्रीय पांच तंत्र: रिश्तेदारी चयन, प्रत्यक्ष पारस्परिकता, अप्रत्यक्ष पारस्परिकता, नेटवर्क पारस्परिकता, समूह चयन
- प्रणालीगत तंत्र: प्रतिष्ठा, पुरस्कार-दंड, एजेंट विषमता
- निवेश विषमता: Yuan आदि ने व्यक्तिगत निवेश को स्थानीय सहयोग स्तर से जोड़ा
- कनेक्टिविटी विषमता: Cao आदि ने निवेश को व्यक्तिगत कनेक्टिविटी अनुपात से जोड़ा
- प्रतिष्ठा विषमता: Yan आदि ने विषम प्रतिष्ठा विकास तंत्र प्रस्तावित किया
- अर्ध-सहयोग रणनीति: Chen आदि ने अपूर्ण परोपकार की अनुमति देने वाली अर्ध-सहयोग रणनीति परिभाषित की
- मूल कैदी की दुविधा पुरस्कार संरचना को अपरिवर्तित रखना
- असतत तीसरी रणनीति के बजाय निरंतर रणनीति स्पेस प्रस्तुत करना
- व्यवस्थित सैद्धांतिक विश्लेषण ढांचा प्रदान करना
- रणनीति विविधता सहयोग को महत्वपूर्ण रूप से बढ़ावा देती है: सहयोग प्रवृत्ति विविधता बढ़ाने से सहयोग स्तर में सुधार होता है, जिससे सहयोग उच्च विश्वासघात प्रलोभन के तहत बना रहता है
- सहयोग दक्षता मुख्य तंत्र है: सहयोग रखरखाव सहयोग दक्षता के 1 के करीब होने पर निर्भर करता है, विविधता दक्षता दोलन को कम करके कार्य करती है
- संतृप्ति सीमा मौजूद है: सहयोग प्रचार प्रभाव एक निश्चित विविधता स्तर के बाद संतृप्ति की ओर प्रवृत्त होता है
- तर्कसंगतता डिग्री आवश्यकता: उच्च विविधता के लिए एजेंटों को रणनीतियों को प्रभावी ढंग से अलग करने के लिए उच्च तर्कसंगतता की आवश्यकता होती है
- नेटवर्क संरचना सीमा: केवल नियमित जाली नेटवर्क पर विचार किया गया, अन्य नेटवर्क टोपोलॉजी के प्रभाव की खोज नहीं की गई
- एकल अपडेट तंत्र: केवल Fermi अपडेट नियम का उपयोग किया गया, अन्य सीखने के तंत्र अलग परिणाम दे सकते हैं
- पैरामीटर सीमा: कमजोर कैदी की दुविधा की पैरामीटर सीमा अपेक्षाकृत सीमित है
- सैद्धांतिक विश्लेषण अपर्याप्त: कठोर गणितीय सिद्धांत व्युत्पत्ति की कमी है
- नेटवर्क टोपोलॉजी विस्तार: स्केल-मुक्त नेटवर्क, छोटी दुनिया नेटवर्क आदि जटिल नेटवर्क पर प्रभाव का अध्ययन
- बहु-स्तरीय नेटवर्क: बहुविध संबंध नेटवर्क में सहयोग विकास पर विचार
- अनुकूली नेटवर्क: नेटवर्क संरचना को रणनीति विकास के साथ गतिशील रूप से समायोजित करने की अनुमति देना
- सैद्धांतिक मॉडलिंग: महत्वपूर्ण बिंदु और चरण परिवर्तन व्यवहार की भविष्यवाणी के लिए विश्लेषणात्मक सिद्धांत विकसित करना
- अवधारणा नवाचार: सहयोग प्रवृत्ति विविधता की अवधारणा नवीन है, रणनीति विषमता अनुसंधान के लिए नया दृष्टिकोण प्रदान करती है
- विधि सरलता: मूल खेल संरचना को बनाए रखते हुए निरंतर रणनीति स्पेस प्रस्तुत करना, डिजाइन चतुर है
- व्यापक विश्लेषण: कई आयामों (सहयोगकर्ता अनुपात, औसत प्रवृत्ति, सहयोग दक्षता) से सहयोग विकास का व्यवस्थित विश्लेषण
- तंत्र खुलासा: सहयोग दक्षता गतिशीलता के माध्यम से सहयोग रखरखाव के गहरे तंत्र का खुलासा
- पर्याप्त प्रयोग: व्यापक पैरामीटर स्कैनिंग, विश्वसनीय सांख्यिकीय विश्लेषण
- सैद्धांतिक गहराई: कठोर गणितीय सिद्धांत विश्लेषण की कमी, मुख्य रूप से संख्यात्मक सिमुलेशन पर निर्भर
- मॉडल सरलीकरण: नेटवर्क संरचना और अपडेट तंत्र अपेक्षाकृत सरल, वास्तविक प्रणालियों से बड़ा अंतर
- तंत्र व्याख्या: रणनीति विविधता सहयोग दक्षता दोलन को कम करने में क्यों मदद करती है, इसके तंत्र की व्याख्या पर्याप्त नहीं है
- सार्वभौमिकता: निष्कर्षों की सार्वभौमिकता को अधिक खेल प्रकारों और नेटवर्क संरचनाओं पर सत्यापित करने की आवश्यकता है
- सैद्धांतिक योगदान: विकासवादी खेल सिद्धांत में रणनीति विषमता अनुसंधान के लिए नया मॉडलिंग ढांचा प्रदान करता है
- अनुप्रयोग मूल्य: वास्तविक समाज में सहयोग व्यवहार को समझने के लिए मार्गदर्शन प्रदान करता है
- विधि प्रेरणा: सहयोग प्रवृत्ति का निरंतरीकरण विधि अन्य खेल मॉडलों में सामान्यीकृत की जा सकती है
- अंतः-विषय महत्व: समाजशास्त्र, अर्थशास्त्र, जीव विज्ञान आदि क्षेत्रों में सहयोग अनुसंधान के लिए संदर्भ मूल्य
- सामाजिक सहयोग: सामाजिक समूहों में विभिन्न सहयोग स्तरों वाले व्यक्तियों के पारस्परिक प्रभाव का विश्लेषण
- आर्थिक व्यवहार: बाजार में उद्यमों की आंशिक सहयोग रणनीति का अध्ययन
- पारिस्थितिकी तंत्र: जैविक समूहों में सहयोग-प्रतिस्पर्धा संबंधों का मॉडलिंग
- ऑनलाइन समुदाय: नेटवर्क समुदायों में उपयोगकर्ता भागीदारी और योगदान व्यवहार का विश्लेषण
पेपर ने 51 संबंधित संदर्भों का हवाला दिया है, जो खेल सिद्धांत की मूल बातें, सहयोग विकास तंत्र, नेटवर्क विज्ञान आदि कई क्षेत्रों के महत्वपूर्ण कार्यों को कवर करते हैं, जो अनुसंधान के लिए एक मजबूत सैद्धांतिक आधार प्रदान करते हैं। विशेष रूप से ध्यान देने योग्य हैं Nowak के सहयोग विकास के पांच नियमों पर शास्त्रीय कार्य, साथ ही रणनीति विषमता पर हाल के अग्रणी अनुसंधान।