我最近也在研究囚徒困境博弈,收集了一些资料,给你分享一下:
囚徒困境案例:
1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。 若二人都互相检举(相关术语称互相“背叛”),则二人同样判监5年。
在上面的例子中,我们注意到了一个并非最优的结果,就是两人都选择坦白的策略以及因此被判5年的结果,这个结果被称为“纳什均衡”,也叫非合作均衡。博奕论中最基本的概念就是“纳什均衡”,一谈到博奕论,人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。
再给你看个纳什均衡的案例:
你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?
详细参考:
http://baike.baidu.com/view/28460.htmP.S.百度真聪明推荐了我这个问题,正好让我也复习一下。
参考资料:http://baike.baidu.com/view/28460.htm