【数学建模算法】(21)对策论(上)

如题所述

第1个回答  2022-07-19

对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。

在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为 对策行为 。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。
先看一个大家都熟悉的例子。

表1 各种情况对应的判刑年数

我们从这个问题中看一看对策问题的基本要素

在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用 表示局中人的集合.如果有 个局中人,则 。一般要求一个对策中至少要有两个局中人。在例 1 中,局中人是 两名疑犯。

一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人 ,都有自己的策略集 。一般,每一局中人的策略集中至少应包括两个策略。

再一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若 是第 个局中人的一个策略,则 个局中人的策略组

就是一个局势。全体局势的集合 可用各局中人策略集的笛卡尔积表示,即:

当局势出现后,对策的结果也就确定了。也就是说,对任一局势, ,局中人 可以得到一个赢得 。显然, 是局势 的函数,称之为第 个局中人的赢得函数。这样,就得到一个向量赢得函数 。
本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中去。

零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
设局中人Ⅰ,Ⅱ的策略集分别为:

当局中人Ⅰ选定策略 和局中人Ⅱ选定策略 后,就形成了一个局势 ,可见这样的局势共有 个。对任一局势 ,记局中人Ⅰ的赢得值为 ,并称:

为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定假定对策为零和的,故局中人Ⅱ的赢得矩阵就是 ,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成:

从 中可以看出,若局中人Ⅰ希望获得最大盈利30,需采用策略 ,但此时若局中人Ⅱ采用策略 ,局中人Ⅰ采取策略
时,最坏的赢得结果分别是:



其中最好的可能为 。如果局中人Ⅰ采取策略 ,无论局中人Ⅱ采取什么策略,局中人Ⅰ的赢得君不悔少于2.
局中人Ⅱ采取各方案的最大损失为 , ,和 。当局中人Ⅱ采取策略 ,其损失不会超过2。注意到在赢得矩阵矩阵,2即是所在航中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减少损失,成这样的局势为对策的一个 稳定点 稳定解

给定一个对策 ,如何判断它是否有鞍点呢?为了回答这一问题,先引入下面的极大极小原理。

具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是
的情况。由于矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解,下面我们引进零和对策的混合策略。

设局中人Ⅰ用概率 选用策略 ,局中人Ⅱ用概率 选用策略 , ,记 ,则局中人Ⅰ的期望赢得为 ,简单记:

使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问题的特殊情况,相当于以概率 1 选取其中某一策略,以概率 0 选取其余策略。

解:双方可选择的策略集分别是:
轰炸机Ⅰ装炸弹,Ⅱ护航。
轰炸机Ⅱ装炸弹,Ⅰ护航。

赢得矩阵 , 为 方采取策略 而 方采取策略 时,轰炸机轰炸 方指挥部的概率,由题意可计算出:



即赢得矩阵:

易求得 。由于 ,矩阵 不存在鞍点,应当求最佳混合策略。

现设 以概率 取策略 ,以概率 取策略 ; 以概率 取策略 ,以概率 取策略 。

记零和对策 的解集为 ,下面三个定理是关于对策解集性质的主要结果: