局部极值动力学下空间迭代囚徒困境游戏中合作的演变
为了解释合作的发展,对空间迭代囚徒困境游戏进行了广泛的研究。 考虑到较大的策略空间大小和无限的交互时间,采用通用的“最佳模仿”更新规则是不现实的,该规则假设人类玩家具有比一次射击游戏更强的识别邻居策略的能力。 本文提出了一种新颖的局部极值动态系统,该系统中的每个玩家只需要识别邻居的收益,并在邻居获得最低收益时随机改变其策略即可。 在此更新规则下,针对不同大小的邻域(以其相应的半径r为特征),探讨了合作的演变。 结果表明,当r = 1时,系统陷入棋盘状状态,其中一半玩家始终使用类似于AllD的策略,另一半则不断更改其策略。 当r = 2时,系统首先进入类似AllD的状态,然后从该状态逃逸,最后演变为类似TFT的状态。 当r较大时,系统将锁定在具有与r = 1相似的低平均适应度的情况下。 活跃参与者的数量和形成集群的能力共同区分了不同r值的进化过程。 目前的发现进一步提供了对生物和社会系统中合作和集体行为演变的一些见解。
下载地址
用户评论