The complete cooperation and the complete defection are two typical strategies considered in evolutionary games in many previous works. However, in real life, strategies of individuals are full of variety rather than only two complete ones. In this work, the diversity of strategies is introduced into the weak prisoners' dilemma game, which is measured by the diversity of the cooperation tendency. A higher diversity means more cooperation tendencies are provided. The complete cooperation strategy is the full cooperation tendency and the complete defection strategy is without any cooperation tendency. Agents with other cooperation tendencies behave as partial cooperators and as partial defectors simultaneously. The numerical simulation shows that increasing the diversity of the cooperation tendency promotes the cooperation level, not only the number of cooperators but also the average tendency over the whole population, until the diversity reaches its saturated value. Furthermore, our work points out maintaining cooperation is based on the cooperation efficiency approximating to the reward of cooperators and that the cooperation efficiency oscillates and quickly decreases to zero when cooperator clusters cannot resist the invasion of defectors. When the effect of the noise for the Femi update mechanism is considered, a higher diversity of strategies not only improves the cooperation level of the whole population but also supports the survival of more rational agents.
- 논문 ID: 2406.12647
- 제목: Evolution of cooperation with the diversity of cooperation tendencies
- 저자: Linya Huang, Wenchen Han
- 분류: physics.soc-ph (사회물리학)
- 발표 시간: 2024년 6월 18일 (arXiv 사전인쇄본)
- 논문 링크: https://arxiv.org/abs/2406.12647
전통적인 진화 게임 이론에서는 일반적으로 완전 협력과 완전 배신 두 가지 전략만 고려하지만, 현실에서 개인의 전략은 훨씬 더 다양합니다. 본 연구는 약한 죄수의 딜레마 게임에 전략 다양성을 도입하며, 협력 경향의 다양성으로 측정합니다. 높은 다양성은 더 많은 협력 경향 선택지를 제공함을 의미합니다. 완전 협력 전략은 최대 협력 경향에 해당하고, 완전 배신 전략은 영 협력 경향에 해당하며, 다른 협력 경향을 가진 에이전트는 부분 협력자이면서 동시에 부분 배신자로 행동합니다. 수치 시뮬레이션은 협력 경향의 다양성을 증가시키면 협력 수준을 촉진할 수 있으며, 협력자 수를 증가시킬 뿐만 아니라 전체 집단의 평균 경향을 향상시킴을 보여줍니다. 이는 다양성이 포화값에 도달할 때까지 지속됩니다. 연구는 또한 협력 유지가 협력 효율이 협력자의 보상에 가까울 때 기반을 두고 있으며, 협력자 집단이 배신자의 침입을 저항할 수 없을 때 협력 효율이 진동하고 빠르게 영으로 감소함을 지적합니다.
- 전통 게임 이론의 한계: 고전적인 진화 게임 이론은 일반적으로 완전 협력과 완전 배신 두 가지 극단적 전략만 고려하지만, 현실 세계에서 개인의 행동 전략은 연속성과 다양성을 가집니다.
- 죄수의 딜레마의 현실적 의의: 죄수의 딜레마는 협력 진화 연구의 고전적 모델로서, 그 안정적 균형은 상호 배신이며 협력자의 멸종을 초래하지만, 현실에서는 협력 행동이 광범위하게 존재합니다.
- 협력 촉진 메커니즘: 기존 연구는 다섯 가지 주요 협력 촉진 메커니즘을 확인했습니다: 친족 선택, 직접 상호성, 간접 상호성, 네트워크 상호성 및 집단 선택이지만, 전략 다양성의 영향에 대한 연구는 부족합니다.
- 전략 이질성의 중요성: 현실 세계에서 개인은 완전히 이성적이지 않으며 다양한 정도의 협력 경향을 가집니다
- 부분 협력 전략: 개인은 협력과 배신의 특성을 동시에 가질 수 있으며, 더 세밀한 모델링이 필요합니다
- 네트워크 효과: 공간 네트워크에서 전략 다양성이 협력 진화에 미치는 영향 메커니즘 연구
- 협력 경향 다양성 개념 도입: 약한 죄수의 딜레마에 연속적인 협력 경향 매개변수를 도입하여 에이전트가 부분 협력 전략을 채택할 수 있도록 함
- 새로운 평가 지표 체계 수립: 협력자 비율(fC), 평균 협력 경향(fS) 및 협력 효율(eC) 등의 지표 제안
- 협력 촉진 메커니즘 규명: 전략 다양성이 협력 효율 진동을 완화하여 협력 유지를 촉진함을 발견
- 이론적 통찰: 협력 유지의 핵심이 협력 효율이 협력자 보상값 1에 가까워야 함을 증명
- 노이즈 효과 분석: 다양한 전략 다양성 수준에서 의사결정 노이즈가 협력 진화에 미치는 영향 연구
L×L 격자 네트워크에서 다양한 협력 경향 다양성을 가진 에이전트 집단 내 약한 죄수의 딜레마 게임의 협력 진화 동역학을 연구합니다.
입력:
- 네트워크 구조(100×100 격자)
- 협력 경향 다양성 매개변수 m
- 배신 유혹 매개변수 b∈[1,2)
- 의사결정 노이즈 매개변수 κ
출력:
- 협력자 비율 fC
- 평균 협력 경향 fS
- 협력 효율 eC
- 보상 행렬: 양측 협력 시 보상 1 획득, 양측 배신 시 처벌 0, 배신자가 협력자를 상대할 때 유혹 b 획득, 협력자가 배신자를 상대할 때 0 획득
- 네트워크 구조: 100×100 격자 네트워크, 주기적 경계 조건, 각 노드의 차수 k=4
협력 경향 집합은 다음과 같이 정의됩니다:
S={0,m1,m2,…,1}
여기서 m은 다양성 매개변수이고, 에이전트 i의 협력 경향 si는 해당 에이전트의 si 부분이 협력자이고 (1-si) 부분이 배신자임을 나타냅니다.
에이전트 i와 에이전트 j의 보상은:
Πi,j=si⋅sj+(1−si)⋅sj⋅b
총 보상은:
Πi=∑j∈NiΠi,j
Fermi 업데이트 규칙을 채택하며, 에이전트 i가 이웃 j의 전략을 학습할 확률은:
W(sj←si)=1+exp[(Πi−Πj)/κ]1
여기서 κ는 노이즈 매개변수로 에이전트의 이성 정도를 나타냅니다.
- 연속 전략 공간: 전통적인 이진 전략과 달리 연속적인 협력 경향 매개변수 도입
- 원래 보상 행렬 유지: 전통적인 죄수의 딜레마 보상 구조 수정 불필요
- 다차원 평가 체계: 협력자 수와 협력 강도를 동시에 고려
- 협력 효율 개념: 협력 효율 eC = ⟨Π⟩/(4fS)를 핵심 분석 도구로 정의
- 네트워크 규모: N = 10,000개 에이전트, 100×100 격자
- 다양성 매개변수: m ∈ {1, 2, 4, 8, 10, 50, 100}
- 배신 유혹: b ∈ 1.00, 1.14
- 노이즈 매개변수: κ = 0.1 (이성적 에이전트), κ ∈ 0, 0.3 (노이즈 분석)
- 시간 단계: 50,000 단계 전환 기간 + 1,000 단계 통계 기간
- 반복 횟수: 50회 무작위 초기 조건
- 협력자 비율:
fC=N∣{j∣sj>0}∣
- 평균 협력 경향:
fS=N∑jsj
- 협력 효율:
eC=4fS⟨Π⟩
- 협력자 평균 경향: fS/fC
- m=1일 때(전통적 이진 전략), b>1.02일 때 모든 에이전트가 배신 선택
- m≥2일 때, 협력자가 더 높은 배신 유혹 하에서 생존 가능(b≈1.13)
- 더 높은 다양성 m은 집단이 더 높은 전체 협력 수준에 도달하도록 지원
- 에이전트는 "포화 협력 경향"에 가까운 전략을 선택하는 경향
- 중간 정도의 유혹 수준에서 부분 협력 전략(예: s=0.5, s=0.75)이 주도적
- 다양성 증가 시 협력자 평균 경향 fS/fC는 수렴 경향
- 협력 유지의 핵심은 협력 효율 eC가 1(협력자 보상)에 가까워야 함
- 협력자 집단이 배신자의 침입을 저항할 수 없을 때, eC는 격렬하게 진동하고 빠르게 0으로 감소
- 전략 다양성은 eC 진동을 완화하여 협력 안정성을 촉진
- 더 높은 전략 다양성은 협력 생존의 노이즈 범위 확대
- m=1일 때, b=1.04에서 협력자 완전 멸종, 이성 정도와 무관
- m=8일 때, b=1.42의 높은 유혹 하에서도 협력자 생존 가능
- 생존하는 협력자는 유사한 협력 경향을 구분하기 위해 더 높은 이성 정도 필요
스냅샷 분석(그림 2)을 통해 다양한 매개변수 하의 전략 분포 패턴 규명:
- 낮은 유혹(b=1.01): 완전 협력 s=1 선호
- 중간 유혹(b=1.02-1.03): 혼합 전략 또는 부분 협력 주도
- 높은 유혹(b=1.07): 낮은 협력 경향 전략만 생존 가능
- 포화 효과: 최적 협력 경향 수준이 존재하며, 그 이상으로 다양성 증가 효과는 제한적
- 동적 균형: 1 근처의 협력 효율 안정성은 협력 유지의 필요 조건
- 이성 요구: 전략 다양성 증가는 에이전트 이성 정도에 더 높은 요구
- 고전적 5가지 메커니즘: 친족 선택, 직접 상호성, 간접 상호성, 네트워크 상호성, 집단 선택
- 체계적 메커니즘: 평판, 보상과 처벌, 에이전트 이질성
- 투자 이질성: Yuan 등이 개인 투자를 지역 협력 수준과 연결
- 연결도 이질성: Cao 등이 투자를 개인 연결도 비율과 연결
- 평판 이질성: Yan 등이 이질적 평판 진화 메커니즘 제안
- 준협력 전략: Chen 등이 불완전한 이타성을 허용하는 준협력 전략 정의
- 원래 죄수의 딜레마 보상 구조 유지
- 이산 제3 전략이 아닌 연속 전략 공간 도입
- 체계적인 이론 분석 프레임워크 제공
- 전략 다양성이 협력을 현저히 촉진: 협력 경향 다양성 증가는 협력 수준을 높이고 더 높은 배신 유혹 하에서 협력 유지 가능
- 협력 효율이 핵심 메커니즘: 협력 유지는 협력 효율이 1에 가까워야 하며, 다양성은 효율 진동 완화를 통해 작용
- 포화 임계값 존재: 협력 촉진 효과는 특정 다양성 수준 도달 후 포화 경향
- 이성 정도 요구: 더 높은 다양성은 에이전트가 전략을 효과적으로 구분하기 위해 더 높은 이성 정도 필요
- 네트워크 구조 제한: 규칙적 격자 네트워크만 고려하며 다른 네트워크 위상의 영향 미탐색
- 업데이트 메커니즘 단일: Fermi 업데이트 규칙만 사용하며 다른 학습 메커니즘은 다른 결과 가능
- 매개변수 범위: 약한 죄수의 딜레마 매개변수 범위 상대적으로 제한적
- 이론 분석 부족: 엄격한 수학적 이론 유도 부족
- 네트워크 위상 확장: 무척도 네트워크, 소세계 네트워크 등 복잡 네트워크에서의 효과 연구
- 다층 네트워크: 다중 관계 네트워크에서의 협력 진화 고려
- 적응형 네트워크: 네트워크 구조가 전략 진화에 따라 동적으로 조정되도록 허용
- 이론 모델링: 임계점과 상전이 행동을 예측하는 해석적 이론 개발
- 개념 혁신: 협력 경향 다양성 개념이 새로우며 전략 이질성 연구에 새로운 관점 제공
- 방법 간결: 원래 게임 구조 유지하면서 연속 전략 공간 도입, 설계가 정교함
- 분석 포괄: 협력자 비율, 평균 경향, 협력 효율 등 다양한 차원에서 협력 진화 체계적 분석
- 메커니즘 규명: 협력 효율 동적 진화를 통해 협력 유지의 심층 메커니즘 규명
- 실험 충분: 매개변수 스캔 포괄적이며 통계 분석 신뢰성 높음
- 이론 깊이: 엄격한 수학적 이론 분석 부족, 주로 수치 시뮬레이션에 의존
- 모델 단순화: 네트워크 구조와 업데이트 메커니즘 상대적으로 단순하며 현실 시스템과 차이 존재
- 메커니즘 설명: 전략 다양성이 협력 효율 진동을 완화할 수 있는 이유에 대한 메커니즘 설명 부족
- 보편성: 결론의 보편성은 더 많은 게임 유형과 네트워크 구조에서 검증 필요
- 이론 기여: 진화 게임 이론의 전략 이질성 연구에 새로운 모델링 프레임워크 제공
- 응용 가치: 현실 사회의 협력 행동 이해에 지도적 의미 보유
- 방법 영감: 협력 경향의 연속화 처리 방법을 다른 게임 모델로 확대 가능
- 학제간 의의: 사회학, 경제학, 생물학 등 분야의 협력 연구에 참고 가치
- 사회 협력: 사회 집단 내 다양한 협력 정도를 가진 개인의 상호작용 분석
- 경제 행동: 시장에서 기업의 부분 협력 전략 연구
- 생태계: 생물 집단의 협력-경쟁 관계 모델링
- 온라인 커뮤니티: 네트워크 커뮤니티의 사용자 참여 및 기여 행동 분석
논문은 51편의 관련 문헌을 인용하며, 게임 이론 기초, 협력 진화 메커니즘, 네트워크 과학 등 다양한 분야의 중요한 연구를 포함하여 연구에 견고한 이론적 기초를 제공합니다. 특히 주목할 만한 것은 협력 진화의 5가지 규칙에 관한 Nowak의 고전 연구와 최근 전략 이질성에 관한 최첨단 연구입니다.