囚徒困境策略模拟器

囚徒困境是博弈论中的经典问题,两名参与者面临选择合作还是背叛的决策。通过此模拟器,您可以测试不同的策略并观察长期结果。

策略配置

玩家 A 策略

玩家 B 策略

回合数

策略说明

  • 始终合作:不管对方选择什么,始终选择合作。
  • 始终背叛:不管对方选择什么,始终选择背叛。
  • 以牙还牙:第一回合选择合作,之后模仿对方上一回合的选择。
  • 记仇者:一直选择合作,直到对方背叛后永远选择背叛。
  • 随机策略:随机选择合作或背叛。

收益矩阵

玩家 A / 玩家 B 合作 背叛
合作 A: 3 / B: 3 A: 0 / B: 5
背叛 A: 5 / B: 0 A: 1 / B: 1

计分说明:

  • R
    双方合作奖励 (3分):双方选择合作,各获得中等奖励。
  • T
    背叛者的收益 (5分):当一方背叛而对方合作时,背叛者获得最高分。
  • S
    受害者的损失 (0分):当一方选择合作而对方背叛时,合作者得0分。
  • P
    双方背叛惩罚 (1分):双方都选择背叛时,均获得较低分数。

注:在经典囚徒困境中,得分必须满足 T > R > P > S 且 2R > T + S,这确保了博弈的困境特性。

关于囚徒困境

囚徒困境是博弈论中的一个基本问题,展示了为什么两个完全理性的个体可能不会合作,即使合作对双方都有利。

经典的囚徒困境描述了这样一个情景:两名共犯被警方分开关押,警方缺乏足够证据,因此向两名囚犯提供了以下选择:

  • 如果两人都保持沉默(合作),则各被判处1年徒刑;
  • 如果一人招供(背叛)而另一人保持沉默(合作),招供者免于惩罚,而保持沉默者被判3年徒刑;
  • 如果两人都招供(背叛),则各被判处2年徒刑。

在本模拟器中,我们使用了不同的得分矩阵,但原理相同:

  • 双方合作:各得3分
  • 一方背叛,一方合作:背叛方得5分,合作方得0分
  • 双方背叛:各得1分

囚徒困境在多次重复游戏中变得更加复杂和有趣,不同的策略可能会产生截然不同的结果。这也是为什么在多回合中,"以牙还牙"的策略往往表现良好。