囚徒困境策略模拟器

策略配置

玩家 A 策略

玩家 B 策略

回合数

20回合 50回合 100回合自定义

策略说明

始终合作：不管对方选择什么，始终选择合作。
始终背叛：不管对方选择什么，始终选择背叛。
以牙还牙：第一回合选择合作，之后模仿对方上一回合的选择。
记仇者：一直选择合作，直到对方背叛后永远选择背叛。
随机策略：随机选择合作或背叛。

收益矩阵

玩家 A / 玩家 B	合作	背叛
合作	A: 3 / B: 3	A: 0 / B: 5
背叛	A: 5 / B: 0	A: 1 / B: 1

计分说明：

R

双方合作奖励 (3分)：双方选择合作，各获得中等奖励。
T

背叛者的收益 (5分)：当一方背叛而对方合作时，背叛者获得最高分。
S

受害者的损失 (0分)：当一方选择合作而对方背叛时，合作者得0分。
P

双方背叛惩罚 (1分)：双方都选择背叛时，均获得较低分数。

注：在经典囚徒困境中，得分必须满足 T > R > P > S 且 2R > T + S，这确保了博弈的困境特性。

模拟结果

总分

玩家 A: 0 (-)

玩家 B: 0 (-)

胜者: -

当前回合

玩家 A (-)

玩家 B (-)

回合: 0 / 0

选择比例

玩家 A

合作: 0%

背叛: 0%

玩家 B

合作: 0%

背叛: 0%

关于囚徒困境

囚徒困境是博弈论中的一个基本问题，展示了为什么两个完全理性的个体可能不会合作，即使合作对双方都有利。

经典的囚徒困境描述了这样一个情景：两名共犯被警方分开关押，警方缺乏足够证据，因此向两名囚犯提供了以下选择：

如果两人都保持沉默（合作），则各被判处1年徒刑；
如果一人招供（背叛）而另一人保持沉默（合作），招供者免于惩罚，而保持沉默者被判3年徒刑；
如果两人都招供（背叛），则各被判处2年徒刑。

在本模拟器中，我们使用了不同的得分矩阵，但原理相同：

双方合作：各得3分
一方背叛，一方合作：背叛方得5分，合作方得0分
双方背叛：各得1分

囚徒困境在多次重复游戏中变得更加复杂和有趣，不同的策略可能会产生截然不同的结果。这也是为什么在多回合中，"以牙还牙"的策略往往表现良好。