6 9.3.1囚犯的困境 这个损失矩阵具有所谓的囚犯的困境结构。囚犯的困境来源于这样一个假设:假定有两 个同案犯发现他们已经被关进了各自的牢房。如果他们都不与警察合作,他们将受到中等程 度惩罚:如果有一个囚犯提供另一个囚犯犯罪的证据而另一个囚犯没有提供该囚犯犯罪的证 据,那么,前者将受到较轻的惩罚,而后者将受到严厉的惩罚:如果双方都提供了对方犯罪 的证据,那么,两个犯人都将受到严厉的惩罚。很显然,对于这两个囚犯来说,最好的结局 是他们相互协作。然而,就个别人来说,有很强的诱惑导致损失惨重。 囚犯的困境现象在现实问题常常出现,尤其是在做广告的时候。到密歇根州北部的 Mackinac岛的唯一线路是在Mackinaw市的渡口坐渡船前往。有三家公司Sheplers、Arnold Line和Star Line从事摆渡生意。当你坐车接近Mackinaw市的时候,你也许注意到在离摆渡 码头还有一英里的地方,每家公司在路边都有一个或多个出售自己公司船票的小亭子。如果 你是经常往来该岛的人,你会直接把车开到有显著标记的码头空地并停好车,并在上渡船之 前买一张票(不允许任何汽车进入Mackinac岛)。由于没有预定的座位,提前在小亭子买票没 有什么意义。然而,如果你是头一次到Mackinac岛去,当你看到“提前买票绝对保险”的标 语时,你就有可能到一个公司的小亭子那里预先买一张船票。有经验的人是不会在这种小亭 子预先买票的。如果一个公司没有这样的小亭子,而他的竞争对手有这样的小亭子,那么这 个公司就可能失去头一次访问该岛的数量可观的顾客群体。 这种情况同样在我们的例子中也存在。对于这个例子,如果A不作广告,而B作广告, 那么,A可赢利1美元,而B可赢利5美元。如都不作广告,总的赢利可以达到最大化。当 然,如果有一方知道另一方不作广告,那么他(他认为他有这样的观察能力)必然会做广告。 最后,我们设法将损失表中的数据都变成严格的正数(这样做非常有用)。如果我们将 所有的数据都加上一个常数,那么求出的结果与原来的结果实质上一样。图9.2是通过对图 9.1中全部加上+6而得到。 图9.2非常数总和两人博弈 公司A 无广告 中等广告 高广告
6 9.3.1 囚犯的困境 这个损失矩阵具有所谓的囚犯的困境结构。囚犯的困境来源于这样一个假设:假定有两 个同案犯发现他们已经被关进了各自的牢房。如果他们都不与警察合作,他们将受到中等程 度惩罚;如果有一个囚犯提供另一个囚犯犯罪的证据而另一个囚犯没有提供该囚犯犯罪的证 据,那么,前者将受到较轻的惩罚,而后者将受到严厉的惩罚;如果双方都提供了对方犯罪 的证据,那么,两个犯人都将受到严厉的惩罚。很显然,对于这两个囚犯来说,最好的结局 是他们相互协作。然而,就个别人来说,有很强的诱惑导致损失惨重。 囚犯的困境现象在现实问题常常出现,尤其是在做广告的时候。到密歇根州北部的 Mackinac 岛的唯一线路是在 Mackinaw 市的渡口坐渡船前往。有三家公司 Sheplers、Arnold Line 和 Star Line 从事摆渡生意。当你坐车接近 Mackinaw 市的时候,你也许注意到在离摆渡 码头还有一英里的地方,每家公司在路边都有一个或多个出售自己公司船票的小亭子。如果 你是经常往来该岛的人,你会直接把车开到有显著标记的码头空地并停好车,并在上渡船之 前买一张票(不允许任何汽车进入 Mackinac 岛)。由于没有预定的座位,提前在小亭子买票没 有什么意义。然而,如果你是头一次到 Mackinac 岛去,当你看到“提前买票绝对保险”的标 语时,你就有可能到一个公司的小亭子那里预先买一张船票。有经验的人是不会在这种小亭 子预先买票的。如果一个公司没有这样的小亭子,而他的竞争对手有这样的小亭子,那么这 个公司就可能失去头一次访问该岛的数量可观的顾客群体。 这种情况同样在我们的例子中也存在。对于这个例子,如果 A 不作广告,而 B 作广告, 那么,A 可赢利 1 美元,而 B 可赢利 5 美元。如都不作广告,总的赢利可以达到最大化。当 然,如果有一方知道另一方不作广告,那么他(他认为他有这样的观察能力)必然会做广告。 最后,我们设法将损失表中的数据都变成严格的正数(这样做非常有用)。如果我们将 所有的数据都加上一个常数,那么求出的结果与原来的结果实质上一样。图 9.2 是通过对图 9.1 中全部加上+6 而得到。 图 9.2 非常数总和两人博弈 公司 A 无广告 中等广告 高广告
7 2 3 无广告 2 7 公司B 5 4 有广告 6 以后,我们就用图9.2的数据。 9.3.2选择一个策略 我们希望我们自己的选择满足: ⅰ.某种程度上说我们的竞争对手无法预料: ⅱ.除了竞争对手无法预料以外,力争我们的期望利润达到最高。 因此,我们再一次利用随机或混合策略的方法。由于我们的决策是随机的(例如,借助 于投掷一个钱币),满足(①没有什么问题。又由于我们对货币的偏爱,这也导致我们尽量满足 (i)。 对于这个例子,我们定义,a2,a分别为A选择"无广告","适度广告"和"大量广告"的 概率。类似地,b1和b2分别表示B选择"无广告"和"有广告"的概率。那么,A将如何选择, a和a3,B将如何选择b1和b2? 对于一个双矩阵博弈来说,困难之处是如何定义一个解,使得双方都达到最优。当然, 我们可以定义一个稳定的策略。一个稳定的策略具有这样的特性:假设已知B对b,和b2的 选择,A不会去改变am,a和as的概率。同样,假设已知A对于a,a和a的选择,B不会 去改变b,和b2的概率。如果一个策略满足:没有局中人愿意单方面地去改变他或她的决策, 这样的策略有时就称为一个Nsh均衡点。一个双矩阵博弈问题可以有多个稳定策略。 关于A的一个稳定策略我们可以预先知道些什么呢?有些a的值可能是0,有些a的值 可能大于0。有一个不太显然但很重要的结论:对于一个稳定策略来说,如果a>0,A的任 何替代选择的期望损失应该大于原来的期望损失。如果这个条件不能得到满足,那么,在某 一个选择下,A就可以通过增加对应期望损失较小的概率,减少对应期望损失较大的概率, 使得A的总期望损失有所减少。我们用VA表示A的期望损失。同样,=0也暗示:如果
7 公司 B 无广告 2 2 3 4 1 7 有广告 5 1 4 5 5 6 以后,我们就用图 9.2 的数据。 9.3.2 选择一个策略 我们希望我们自己的选择满足: i. 某种程度上说我们的竞争对手无法预料; ii. 除了竞争对手无法预料以外,力争我们的期望利润达到最高。 因此,我们再一次利用随机或混合策略的方法。由于我们的决策是随机的(例如,借助 于投掷一个钱币),满足(i)没有什么问题。又由于我们对货币的偏爱,这也导致我们尽量满足 (ii)。 对于这个例子,我们定义 al, a2, a3 分别为 A 选择"无广告","适度广告"和"大量广告"的 概率。类似地,b1 和 b2 分别表示 B 选择"无广告"和"有广告"的概率。那么,A 将如何选择 al, a2 和 a3,B 将如何选择 b1 和 b2? 对于一个双矩阵博弈来说,困难之处是如何定义一个解,使得双方都达到最优。当然, 我们可以定义一个稳定的策略。一个稳定的策略具有这样的特性:假设已知 B 对 b1 和 b2 的 选择,A 不会去改变 al, a2 和 a3 的概率。同样,假设已知 A 对于 al, a2 和 a3 的选择, B 不会 去改变 b1 和 b2 的概率。如果一个策略满足:没有局中人愿意单方面地去改变他或她的决策, 这样的策略有时就称为一个 Nash 均衡点。一个双矩阵博弈问题可以有多个稳定策略。 关于 A 的一个稳定策略我们可以预先知道些什么呢?有些 ai 的值可能是 0,有些 ai 的值 可能大于 0。有一个不太显然但很重要的结论:对于一个稳定策略来说,如果 ai > 0,A 的任 何替代选择的期望损失应该大于原来的期望损失。如果这个条件不能得到满足,那么,在某 一个选择下,A 就可以通过增加对应期望损失较小的概率,减少对应期望损失较大的概率, 使得 A 的总期望损失有所减少。我们用 VA 表示 A 的期望损失。同样,ai = 0 也暗示:如果