找回密码
 注册

最优策略是如何产生的

2014-7-18 20:00| 发布者: masato_xyw| 查看: 250| 评论: 0

摘要: 在互联网这个原始丛林中:最优策略是如何产生的呢?艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化 ...

在互联网这个原始丛林中:最优策略是如何产生的呢?

 

艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。

 

艾克斯罗德做了一个实验,邀请多人来参加游戏,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。

 

第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的”一报还一报”(tit for tat)。

 

这个程序的特点是:

 

第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。

 

艾克斯罗德还发现,得分排在前面的程序有三个特点:

 

第一,从不首先背叛,即”善良的”;

 

第二,对于对方的背叛行为一定要报复,不能总是合作,即”可激怒的”;

 

第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即”宽容性”。

 

为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是”一报还一报”。

 

艾氏总结这次游戏的结论是:第一,”一报还一报”仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是”不善良的”,后15名中,只有1个总是合作的是”善良的”。可激怒性和宽容性也得到了证明。

 

此外,好的策略还必须具有的一个特点是”清晰性”,能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。”一报还一报”就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度


支持

反对

最新评论

招标网平台地图|Archiver|手机版|机械设计招标网 ( 京ICP备17072296号-4 )

GMT+8, 2024-9-29 05:02

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

返回顶部