91download.com supports a wide range of platforms, including YouTube, Facebook, Twitter, TikTok, Instagram, Dailymotion, Reddit, Bilibili, Douyin, Xiaohongshu and Zhihu, etc. Click the download button below to parse and download the current video
在游戏理论中,有一个著名的难题,它无处不在,从国家间的冲突到室友间的洗碗争执,甚至有的游戏节目也是基于这个概念。解决这个问题的最佳策略,关乎生死、战争与和平、繁荣与毁灭。今天,我们就来聊聊这个难题——囚徒困境。
1949年9月3日,一架美国气象监测飞机在日本上空收集空气样本,发现其中含有放射性物质。这一发现,让美国海军迅速从全球各地的船只和基地收集雨水样本进行测试。检测结果让他们惊讶:他们发现了铈-141和钇-91这两种同位素。但这两个同位素的半衰期只有一至两个月,所以它们必然是最近产生的。而唯一可能的生产地,就是苏联的核爆炸。
这一发现,让美国人陷入了恐慌。他们的军事优势,通过曼哈顿计划取得,正在迅速消失。有人认为,最好的策略是趁苏联还没有完全掌握核武器,先发制人发动核打击。这就是囚徒困境的诞生。
让我们来玩一个游戏。一个银行家拿着一箱子金币,邀请你和另一个玩家参与游戏。你们每个人都有两个选择:合作或背叛。如果你们都选择合作,你们每人将得到三枚金币。如果一个人合作,另一个人背叛,那么背叛者将得到五枚金币,合作者则什么都得不到。如果你们都选择背叛,那么你们每人只能得到一枚金币。游戏的目的是尽可能多地获得金币。
如果你选择合作,而你的对手也选择合作,那么你可以得到三枚金币,或者选择背叛,得到五枚金币。如果你选择背叛,而你的对手选择合作,那么你将一无所获。所以,无论你的对手做什么,你最好的选择都是背叛。如果你的对手也是理性的,他们也会得出同样的结论,也会选择背叛。结果,当你们都做出理性的选择时,你们最终都会陷入次优的局面,每人只能得到一枚金币,而不是本可以得到的三枚。
在冷战时期,美国和苏联都面临这个问题。他们各自发展了庞大的核武库,足以相互毁灭多次。但由于双方都有核武器,谁都不敢使用。结果,两国在核武器上的花费高达10万亿美元。如果他们能合作,不再发展这种技术,那么双方都会更好。但由于他们都选择了自己的最佳利益,最终都陷入了更糟糕的局面。
囚徒困境不仅在政治和军事上有应用,它在自然界也广泛存在。比如,生活在非洲 woodland和savannah之间的羚羊,容易感染疾病,甚至死亡。因此,它们需要互相清理身上的跳蚤。但它们无法清洁自己身上的所有部位,因此需要另一只羚羊的帮助。然而,帮助别人清理跳蚤是有成本的,它消耗唾液、电解质、时间和注意力,这些都是宝贵的资源。所以,对于另一只羚羊来说,最好的选择是不提供帮助。但问题是,它自己也需要别人的帮助。
在单次互动中,理性的选择是背叛。但现实生活中,许多问题并不是一次性的囚徒困境。比如,羚羊每天都会遇到彼此,每天都面临是否互相清理跳蚤的选择。这种重复的互动,改变了问题。因为你如果今天背叛了,明天你的对手就会知道,并会在未来的互动中使用这一点对付你。所以,什么是重复囚徒困境中的最佳策略呢?
1980年,政治学家Robert Axelrod举办了一场计算机锦标赛,邀请了世界上一些顶尖的游戏理论专家提交计算机程序,这些程序将相互对战。其中,一个名为“Tit for Tat”的程序,以其简单和有效性脱颖而出。它首先选择合作,然后复制对手上一次的动作。如果对手背叛,它会立即反击。但最重要的是,它不会怀恨在心,如果对手在下一次选择合作,它会再次选择合作。
Tit for Tat的策略是“友好”、“宽容”、“报复”和“清晰”。它首先选择合作,然后根据对手的行为来决定自己的行为。如果对手背叛,它会立即反击,但它不会怀恨在心,也不会因为之前的背叛而影响当前的选择。这种策略,在Axelrod的锦标赛中表现最佳。
在现实生活中,合作和竞争是并存的。从1950年到1986年,美国和苏联在核武器问题上难以合作,双方都在不断研发新的核武器。但从1980年代后期开始,他们开始逐步减少核武库,因为他们学会了如何解决冲突。他们没有一次性解决所有核武器问题,而是每年减少一定数量的核武器,并检查对方是否也做到了这一点,然后重复这个过程。
囚徒困境教会我们,即使在竞争激烈的环境中,合作也是一种可行的策略。在重复的互动中,通过建立信任和
Share on Twitter Share on Facebook