有很大差距,而这已经是所有恶意策略中最高分。令人信服结果表明,好人在这个博弈中可以胜出。
阿克塞尔罗德另个术语则是“宽容”。个宽容策略只有短期记忆。虽然它也采取报复行为,但它会很快遗忘对手劣迹。“针锋相对”便是个宽容策略,面对背叛时它毫不手软,但之后则“过去让它过去”。第十章中“斤斤计较者”则是个完全相反例子。它记忆持续整个博弈,永不宽恕曾经背叛过它对手。在阿克塞尔罗德竞赛中,有个策略与“斤斤计较者”完全相同,由位名叫弗里德曼(Friedman)选手提供。这个“善良”而绝不宽恕策略结果并不算佳,成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意,它不愿意打破相互背叛恶性循环,因此无法取得很高分数。
“针锋相对”并不是最宽容策略。们还可以设计个“两报还报”(TitforTwoTats)策略,允许对手连续两次背叛后才开始报复,这似乎显得过分大度坦荡。阿克塞尔罗德算出,只要在竞赛中有“两报还报”策略存在,它便定会获得冠军,因为它可以有效避免长期互相伤害。
于是,们算出赢家策略两个特点:善良与宽容。这几乎是个乌托邦式结论:善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招,认为这可能得到高分。即使那些提交“善良”策略专家,也未曾敢如“针锋相对”般宽容。所有人都对这个结论十分惊讶。
阿克塞尔罗德又举办第二次竞赛。这次他收到62个策略,再加上随机策略,总共便有63个策略。这次,博弈中回合数不再固定为200,而改为开放式不定数(之后会解释这做理由)。们依然将得分评判为基准分“永远合作”分数百分比,不过现在基准分需要更为复杂计算,并不再是固定600分。
第二次竞赛程序员们都得到第次竞赛结果,还收到阿克塞尔罗德对“针锋相对”与善良与宽容策略获胜分析。这做是为让参赛者们能从某种方向上解比赛背景信息,来权衡自己判断。事实上,这些参赛者分成两种思路。第种参赛者认为,已经有足够证据证明善良与宽容确实是获胜因素,他们便随即提交善良与宽容策略。位参赛者约翰·梅纳德·史密斯(JohnMaynardSmith)提交个最为宽容“三报还报”(TitforThreeTats)策略。另组参赛者则认为,既然对手们已经读过阿克塞尔罗德分析,估计都会提交善良宽容策略。他们于是便提交恶意策略,以期在善意对手中占到便宜。
然而,恶意再次没有得到好报。阿纳托尔提交“针锋相对”策略再次成为赢家,获得满分96%。而善意策略又再次赢恶意策略。前15名中只有个策略是恶意策略,而倒数15名中只有个是善意策略。然而,最为宽容、可以在第次竞赛中胜出“两报还报”策略,这次却没有成功。这是因为本次竞赛中有些更为狡猾恶意策略,它们善
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。