什么是静态博弈的一般性思想

如题所述

第1个回答  2013-12-02
完全信息静态博弈2007-06-02 11:42 一、完全信息静态博弈:纳什均衡
纳什均衡是著名博弈论专家纳什(John Nash)对博弈论的重要贡献之一。纳什在19

世纪50年1951年的两篇重要论文中,在一般意义上给定了非合作博弈及其均衡解,并证明了解的存在性。正是纳什的这一贡献奠定了非合作博弈论的理论基础。纳什所定义的均衡称之谓“纳什均衡”。

(一)占优策略均衡

占优策略(dominant strategies)是指这样一种特殊的博弈:某一参与人的策略可能并不依赖于其他参与人的策略选择。换句话说,无论其他参与人如何选择自己的策略,该参与人的最优策略选择是惟一的。

以博弈论中最为著名的囚犯困境(prisoner’s dilemma)为例,说明占优策略均衡原理。两个合伙作案的犯罪嫌疑人被警方抓获。警方怀疑他们作案,但警方手中并没有掌握他们作案的确凿证据。因而,对两个犯罪嫌疑人犯罪事实的认定及相应的量刑完全取决于他们自己的供认。假定警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。同时,警方明确地分别告知两名犯罪嫌疑人,他们面临着以下几种后果可以用表10-2表示。该表又称为“收益矩阵或得益矩阵”。从表10-2中可以看出,每个犯罪嫌疑人都有两种可供选择的策略:供认或不供认。而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择,

表10-2 囚 犯 困 境 的 收 益 矩 阵

囚犯B

供认 不供认

囚犯A 供认

不供认
-8,-8 -1,-10

-10,-1 -2,-2

在博弈中,如果所有参与人都有占优策略存在,可以证明,博弈将在所有参与人的占优策略的基础上达到均衡,这种均衡称为占优策略均衡。上面提到的囚犯困境中的“A供认,B供认”就是占优策略均衡解。

囚犯困境的问题是博弈论中的一个基本的、典型的事例,类似问题在许多情况下都会出现,如寡头竞争、军备竞赛、团队生产中的劳动供给、公共产品的供给等等。同时,囚犯困境反映了一个深刻问题,这就是个人理性与团体理性的冲突。例如,微观经济学的基本观点之一,是通过市场机制这只“看不见的手”,在人人追求自身利益最大化的基础上可以达到全社会资源的最优配置。囚犯困境对此提出了新的挑战。

(二)重复剔除的占优策略均衡

在每个参与人都有占优策略的情况下,占优策略均衡是非常合乎逻辑的。但遗憾的是在绝大多数博弈中,占优策略均衡是不存在的。不过,在有些博弈中,我们仍然可以根据占优的逻辑找出均衡。

智猪博弈(boxed pigs)是博弈论中的另一个著名的例子。假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有8个单位的猪食进入猪食槽,供两头猪食用。两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择,它必须付出如下代价:第一,它需要收益相当于两个单位的成本;第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到7个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到5个单位的猪食,小猪吃到3个单位的猪食。

智猪博弈的收益矩阵如表10-3所示。表中的数字表示不同选择下每头猪所能吃到的猪食数量减去按按钮的成本之后的净收益水平。

表10-3 智 猪 博 弈 的 收 益 矩 阵

小猪

按按钮 等待

大猪 按按钮

等待
3,1 2,4

7,-1 0,0

从表9-3中不难看出,在这个博弈中,不论大猪场选择什么策略,小猪的占优策略均为等待。而对大猪来说,它的选择就不是如此简单了。大猪场的最优策略必须依赖于小猪的选择。如果小猪选择等待,大猪的最优策略是按按钮,这是,大猪能得到个单位的净收益(吃到4个单位猪食减去2个单位的按按钮成本),否则,大猪的净收益为0;如果小猪选择按按钮,大猪的最优策略显然是等待,这时大猪的净收益为7个单位。换句话说,在这个博弈中,只有小猪有占优策略,而大猪没有占优策略。

那么这个博弈的均衡解是什么呢?这个博弈的均衡解是大猪选择按按钮,小猪选择等待,这是,大猪和小猪的净收益水平分别为2个单位和4个单位。这是一个“多劳不多得,少劳不少得”的均衡。

在找出上述智猪博弈的均衡解时,我们实际上是按照“重复剔除严格劣策略”(iterated elimination of strictly dominated strategies)的逻辑思路进行的。该思路可以归纳如下:首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策略组合为止。剩下的话这个惟一的参与人组合,就是这个博弈的均衡解,称为“重复剔除的占有策略均衡”(iterated dominance equilibrium)。所谓“严格劣策略”(strictly dominated strategies)是指:在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。

由表10-3可以看出,无论大猪选择什么策略,小猪选择按按钮,对小猪是一个严格劣策略,我们首先加以剔除。在剔除小猪按按钮这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的策略。在大猪这两个可供选择的策略中,选择等待对大猪是一个严格劣策略,我们再剔除新博弈中大猪的严格劣策略等待。剩下的新博弈中只有小猪等待、大猪按按钮这一个可供选择的策略,就是智猪博弈的最后均衡解,从而达到重复剔除的占优策略均衡。

智猪博弈听起来似乎有些滑稽,但智猪博弈的例子在现实中确有很多。例如,在股份公司中,股东都承担着监督经理的职能,但是,大小股东从监督中获得的收益大小不一样。在监督成本相同相同的情况下,大股东从监督中获得的收益明显大于小股东。因此,小股东往往不会象大股东那样去监督经理人员,而大股东也明确无误地知道小股东会选择不监督(这是小股东的占优策略),大股东明知道小股东要搭大股东的便车,但是大股东别无选择。大股东选择监督经理的责任、独自承担监督成本是在小股东占优选择的前提下必须选择的最优策略。这样以来,与智猪博弈一样,从每股的净收益(每股收益减去每股分担的监督成本)来看,小股东要大于大股东。

(三)纳什均衡

前面我们讨论了占优策略均衡和重复剔除的策略均衡。但是在现实生活中,还有相当多的博弈,我们无法使用占优策略均衡或重复剔除的策略均衡的方法找出均衡解。例如,在房地产开发博弈中,假定市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略优于另一种策略,也不存在严格劣策略:如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。研究这类博弈的均衡解,需要引人纳什均衡。

纳什均衡是指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。纳什均衡是完全信息静态博弈解的一般概念,构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略。也就是说,没有一种策略严格优于纳什均衡策略(注意:其逆定理不一定成立),更为重要的是,许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,却存在纳什均衡。

与重复剔除的占优策略均衡一样,纳什均衡不仅要求所有的博弈参与人都是理性的,而且,要求每个参与人都了解所有其他参与人都是理性的。

在占优策略均衡中,不论所有其他参与人选择什么策略,一个参与人的的占优策略都是他的最优策略。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。因此,占优策略均衡一定是纳什均衡。在重复剔除的占优策略均衡中,最后剩下的惟一策略组合,一定是在重复剔除严格劣策略过程中无法被剔除的策略组合。因此,重复剔除的占优策略均衡也一定是纳什均衡。

下面我们以博弈论中经常提到的性别战(battle of the sexes)为例,说明纳什均衡解。谈恋爱的男女通常是共度周末而不愿意分开活动的,这是研究问题的前提。但是,对于周末参加什么活动,男女双方往往各自有着自己的偏好。假定某周末,男方宁愿选择观看一场足球比赛,而女方宁愿去逛商店。再进一步假定:如果男方和女方分开活动,男女双方的效用为0;如果男方和女方一起去看足球赛,则男方的效用为5,而女方的效用为1;如果男方和女方一起去逛商店,则南男方的效用为1,女方的效用为5。根据上述假定,男女双方不同选择的所有结果及其效用组合如表10-4所示。

表10-4 性 别 战 的 收 益 矩 阵

女 方

看足球 逛商店

男 方 看足球

逛商店
5,1 0,0

0,0 1,5

在这个博弈中剔除两个严格劣策略以后,剩下的新博弈中,无法剔除严格劣策略。因此是一个纳什均衡。这里有两个解,即男女双方一起去看足球赛和一起去逛商店。除非有进一步的信息,如男方或女方具有优先选择权,否则,我们无法确定男女双方在上述博弈中会作出什么样的选择。

以上我们讨论了完全信息静态博弈。本节的以下部分,我们讨论完全信息动态博
第2个回答  2013-12-02
纳什均衡