首页>猫头鹰万花筒制作方法 > 第六十六夜 机制博弈

第六十六夜 机制博弈

目录

“猫头鹰的万花筒(..)”

基于频率的适应机制(具体原理分析见博弈论)。

我们选择策略时往往是博弈的过程,很多同一事件的选择策略都基于频率,当选择某一策略的个体增多时,那么采取这个策略所能带来的收益将会下降。

例如,性别。

当男性在群体中占多数时,女性采取的择偶策略就会比女多男少的群体中收益大。

这是一个动态平衡的过程,自然选择总是倾向于博弈各方动态平衡,否则这个系统最终会被淘汰。

例如密西西比河中的太阳鱼,雄鱼有三种不同的择偶策略,每一种策略都有存在的合理性,并且相互之间是博弈关系。

一种是抚养策略,一种是潜藏策略,一种是拟态策略。

潜藏者体态很小,它可以偷偷找准时机让雌鱼排出的卵子受精而不被抚养者发现。

拟态者外观与雌鱼难分,也可以容易让卵子受精而不让抚养者发现,它们之间是竞争关系,但它们都必须要依赖抚养者,这个系统动态平衡。

如果任意一方数量超出,对它们的繁殖都会产生负面结果。

例如,当潜藏和拟态数量增多,这是雄性潜在进化方向,因为这是代价最小的繁殖策略。

但问题是,抚养者数量就会变少,雌鱼没有稳定的生存繁殖场所,不会排卵,而且数量众多的潜藏者和拟态者在雌鱼周围扰动,加剧雌鱼不安感,也让抚养者四处奔波疲于奔命,所有策略都失效了,他们都不能繁殖后代。

雄鱼为了达到繁殖目的,只有再次改变策略,采取代价更高的抚养者策略,系统再次达到平衡。

博弈论案例一

囚徒困境。

在博弈论中,一个著名例子是由塔克给出的"

囚徒困境"

(prisonersdilemma)博弈模型。

该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:

如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年。

如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择"

坦白"

总是最优的。

显然,根据对称性,B也会选择"

坦白"

,结果是两人都被判刑8年。

但是,倘若他们都选择"

抵赖"

,每人只被判刑1年。

四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

但是,"

坦白"

本章未完,点击下一页继续阅读



返回顶部