自私的基因第十二章好人终有好报

有很大差距，而这已经是所有恶意策略中最高分。令人信服结果表明，好人在这个博弈中可以胜出。

阿克塞尔罗德另个术语则是“宽容”。个宽容策略只有短期记忆。虽然它也采取报复行为，但它会很快遗忘对手劣迹。“针锋相对”便是个宽容策略，面对背叛时它毫不手软，但之后则“过去让它过去”。第十章中“斤斤计较者”则是个完全相反例子。它记忆持续整个博弈，永不宽恕曾经背叛过它对手。在阿克塞尔罗德竞赛中，有个策略与“斤斤计较者”完全相同，由位名叫弗里德曼（Friedman）选手提供。这个“善良”而绝不宽恕策略结果并不算佳，成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意，它不愿意打破相互背叛恶性循环，因此无法取得很高分数。

“针锋相对”并不是最宽容策略。们还可以设计个“两报还报”（TitforTwoTats）策略，允许对手连续两次背叛后才开始报复，这似乎显得过分大度坦荡。阿克塞尔罗德算出，只要在竞赛中有“两报还报”策略存在，它便定会获得冠军，因为它可以有效避免长期互相伤害。

于是，们算出赢家策略两个特点：善良与宽容。这几乎是个乌托邦式结论：善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招，认为这可能得到高分。即使那些提交“善良”策略专家，也未曾敢如“针锋相对”般宽容。所有人都对这个结论十分惊讶。

阿克塞尔罗德又举办第二次竞赛。这次他收到62个策略，再加上随机策略，总共便有63个策略。这次，博弈中回合数不再固定为200，而改为开放式不定数（之后会解释这做理由）。们依然将得分评判为基准分“永远合作”分数百分比，不过现在基准分需要更为复杂计算，并不再是固定600分。

第二次竞赛程序员们都得到第次竞赛结果，还收到阿克塞尔罗德对“针锋相对”与善良与宽容策略获胜分析。这做是为让参赛者们能从某种方向上解比赛背景信息，来权衡自己判断。事实上，这些参赛者分成两种思路。第种参赛者认为，已经有足够证据证明善良与宽容确实是获胜因素，他们便随即提交善良与宽容策略。位参赛者约翰·梅纳德·史密斯（JohnMaynardSmith）提交个最为宽容“三报还报”（TitforThreeTats）策略。另组参赛者则认为，既然对手们已经读过阿克塞尔罗德分析，估计都会提交善良宽容策略。他们于是便提交恶意策略，以期在善意对手中占到便宜。

然而，恶意再次没有得到好报。阿纳托尔提交“针锋相对”策略再次成为赢家，获得满分96%。而善意策略又再次赢恶意策略。前15名中只有个策略是恶意策略，而倒数15名中只有个是善意策略。然而，最为宽容、可以在第次竞赛中胜出“两报还报”策略，这次却没有成功。这是因为本次竞赛中有些更为狡猾恶意策略，它们善

第十二章好人终有好报 · 2（3 / 4）

限时狩猎

我的女友是恶女

三千鸦杀

这个炮灰我罩了！[快穿]

默读

春日喜鹊