自私的基因第十二章好人终有好报

知情地坚持“合作”，也便只能付出“失败者代价”，得到0分。而“老实人探测器”则能得到最高成绩5分。但在下步里，“针锋相对”开始报复，复制对手上步行动，打出“背叛”牌。而“老实人探测器”则盲目地继续原本设定程序，复制对手上步“合作”牌。于是它只能获得0分，而“针锋相对”则得到5分。再下步，“老实人探测器”极其不公正地又开始报复，“背叛”“针锋相对”。反之亦然。在每轮交替报复回合里，双方各自平均获得2.5分（5分与0分平均值）。这依然低于双方持续双向合作所能轻而易举获得3分（这也是本章前文中尚未解释“特殊情况”原因）。于是，当“老实人探测器”与“针锋相对”开始博弈，双方都未能获得两个“针锋相对”博弈时所得分数。而如果“老实人探测器”互相对弈，其结果只可能更坏，因为这种以牙还牙冤冤相报可能开始得更早。

让们再来考虑另个叫“愧疚探测器”（RenwrsefulProber）策略。这个策略有点类似于“老实人探测器”，但它还加以主动终止循环于双方间交互背叛。这便需要种比“针锋相对”或“老实人探测器”更长记忆。“愧疚探测器”能记住自己是否刚刚主动“背叛”，或者只是为报复。如果是后者，它便“愧疚地”让对手得到次反击机会，而不加以报复。这便将此循环报复行为终结在萌芽状态。如果你在想象中旁观“愧疚探测器”与“针锋相对”博弈，你会发现可能循环报复行动不攻自破。博弈中大部分时间都采取互相合作，使得双方都能获得相应高分。在与“针锋相对”博弈中，“愧疚探测器”能获得比“老实人探测器”更高分数，但依然没有“针锋相对”与自己对弈分数高。

阿克塞尔罗德竞赛里还有些比“老实人探测器”与“愧疚探测器”更为复杂策略，但它们平均分都比“针锋相对”低。事实上最失败策略（除随机）是最复杂那个，作者为“匿名”。这个作者引发些饶有兴趣猜测：五角大楼高层？中央情报局首脑？国务卿基辛格？阿克塞尔罗德自己？们也许永远也不会知道。

不是每个策略细节都值得研究，这本书也不谈计算机程序员创造力。但们可以给这些策略归类，并检验这些类别成功率。阿克塞尔罗德认为，最重要类别是“善良”。“善良”类别指是那些从不率先背叛策略。“针锋相对”便是其中个例子。它虽然也采取“背叛”行动，但它只在报复中这做。“老实人探测器”与“愧疚探测器”也偶尔采取“背叛”，但这种行为是主动起意挑衅，属于恶意策略。这场竞赛中15个策略中，有8个属于“善良”策略。令人吃惊是，策略中前8名也是这8个善意策略。“针锋相对”平均分504.5分，是们600分基准分中84%，个很好分数。其他“善良”策略所得分数要比“针锋相对”少些，从83.4%到78.6%不等。排名中接下来分数则是由格雷斯卡普（Graaskamp）所获得66.8%，与高分们

第十二章好人终有好报 · 2（2 / 4）

苍白爱情

你比北京美丽

相爱未遂

你却爱着一个烧饼

凡人修仙之仙界篇

重生之大涅槃