论坛首页 海阔天空版 读书

书摘:美德的起源(2)

浏览 1417 次
精华帖 (0) :: 良好帖 (0) :: 灌水帖 (0) :: 隐藏帖 (0)
作者 正文
最后更新时间:2007-10-08
意大利歌剧作曲家普契尼(Puccini)在其歌剧《托斯卡))) ( Tosea )中让女主人公面临了一场生死抉择。警察局长斯卡皮亚(Scarpia)将托斯卡的男友卡瓦拉多西(Cavararossi )判了死刑,但他又向托斯卡提供了一个救男友的机会—如果她愿意与自己共度良宵,他便下令让行刑队行刑时使用空弹壳。托斯卡最后决定假装同意斯卡皮亚的要求,等他下达命令后便用匕首将其杀死。于是她真的这样做了,但最终却
发现斯卡皮亚也同样欺骗了她,行刑队用的是真枪实弹,卡瓦拉多西早已命丧黄泉。托斯卡最后自杀身亡,歌剧以三人的死亡而告终。

尽管剧中人物的表现是真实的,但托斯卡和斯卡皮亚实际上做了一个著名的游戏。它是数学中极为难解的一个分支,在生物学和经济学之间架起了桥梁,也是所有游戏中最为人所知的一个。这一游戏对近些年来让人兴奋的一项科学发现具有重要意义,它教会我们如何解释人与人之间的友善行为。尽管托斯卡和斯卡皮亚结局都很悲惨,但他们的做法恰恰符合博弈论学者的预测。这到底是怎么回事呢?

这一游戏被称做“囚徒的困境”。只要个人私欲与集体利益发生冲突时,囚徒困境的游戏规则就都会发生作用。如果托斯卡和斯卡皮亚都履行自己的承诺,二者就都会从中获益:托斯卡挽救了男友的生命,警察局长也可以得到她。但作为自私的个体,他们两人都盘算着让对方履行承诺而自己另谋打算,这样自己无疑会获利更多:托斯卡既可救出自己的情人同时又保住了贞操,而对斯卡皮亚来说,他既可占有托斯卡又除掉了自己的对手。

囚徒的困境所呈现给我们的是一个严酷的事实—自私自利者之间如何建立起不受禁忌、道德约束及良心谴责的协作关系。私欲如何能引导人们与社会、与他人为善?这一游戏之所以叫做囚徒的困境,是因为通常情况下人们都以囚徒做例子来说明这一现象。两名囚犯都在犹豫是否要出卖同伴,因为这样自己就可以在监狱里少待几年。困境也就由此产生了:如果两人建立起攻守同盟,谁都不欺骗对方,警察最终就会对他们从轻发落。因此拒不交待对两人来说都是最好的办法,但同样,如果一方欺骗了另一方自己就会从中得利。

为什么呢?我们先把囚徒的事放到一边。假如现在你正和另一个人玩一个简单的点数游戏。如果你们两人合作(“拒不交代”),每人将得3分(这叫做“奖赏”);如果相互欺骗,每人得1分(作为“惩罚”);但如果一人遵守攻守同盟而另一人叛变,结果是前者得零分(这是“傻瓜蛋的下场”),后者得5分(即“诱惑”)。看来,如果你的同伴出卖你,你最好也交待他的罪行,这样你至少可以得1分而不至于亏得太多。

但是,如果你的同伙拒不交待,你仍然最好选择坦白,因为这样你就可以得5分,比两人都不交待时得的还要多。因此无论另一个人怎样,坦白交待是你的导. . .。当然,就像这一规则所说的,最后你们两人都不合算,因为背叛后每人只能得1分,而若坚持攻守同盟你们两人就都能得3分。

你可别让你的道德领你误入歧途,你们两人都品德高尚、都与对方合作跟这一问题毫不相关。我们现在探讨的是在道德真空中如何从逻辑上选择“最佳”的行动方案,而不是讨论怎样做是“正确”的。这样说来,答案就是“欺骗”。此时自私自利最为合情合理。

    广义上说的“囚徒的困境”原理实际上早就被古人所理解。霍布斯当然对此很清楚,卢梭也不例外,他曾粗略叙述过一个内容更为复杂的版本,人们可以在其著名的猎捕牡鹿的小故事中发现这一段描述
团体协作的文字。首先在你脑海中勾勒出一幅原始人外出打猎的场面,接着他写道:

外出猎鹿时,每个人都很清楚自己必须守住自己的岗位。但此时如果一只野兔突然从某人身边跑过,我们敢说他肯定会毫不顾忌地前去追赶,因为只要捉到自己的猎物就行,他才不管给别人带来什么损失呢!

现在我们来详细解释一下卢梭的理论。假设部落中的所有人都共同前去猎鹿,他们站成一个圈,将牡鹿栖息的灌木丛团团围住,然后慢慢向里逼近,牡鹿惊醒后便开始向外逃窜,此时如果大家同心协力,牡鹿就会被离它最近的猎手杀死。但是,假设在这一过程中有一个猎手看见一只野兔,而且肯定能将其捕获,那么由于他离开岗位,牡鹿便从包围圈的这个缺口中逃走了。这对捉到野兔的猎手来说无所谓,因为他这下有肉吃了,但其他人却白白赔了一副空肚肠。有利于个人私利的决定便有损于集体,看来社会成员之间的协作不过是一纸空文(愤世嫉俗的卢梭甚是凄凉地说道)。

猎捕牡鹿游戏的现代版本来自美国物理学家道格拉斯·霍夫斯塔特(Dougtas Hofstadter),他将此游戏称为“狼的困境”。现在让20个人各自坐在相互隔离的20个房间中,每个人手边都有一个按钮。10分钟内如果没人按按钮,每个人将得到1000美元;但一旦有人忍不住先动手,那此人将得到100美元,但其他人将分文无收。如果你是个聪明人,你肯定会按兵不动,等着去拿那1000美元的奖金;但如果你再聪明一点,你就会想到某个傻瓜蛋会在10分钟内按动按钮,如果果真如此,你最好抢先动手;如果你比其他人都聪明,你肯定会想到其他一些明白人也能猜想出你所分析的,也会按动按钮,此时你最好也别犹豫,赶紧动手。正如陷人困境的囚徒一样,逻辑分析将你也引入集体性灾难之中。

尽管这一思想早己出现,但直到1950年,加利福尼亚RAND公司的麦利尔·弗拉德(Merril Flood)和麦尔温·德莱塞(MelvinDresher)才第一次将其设计成为一种游戏。几个月之后,普林斯顿大学的艾尔伯特·塔克(Albert Tucker)便将其演绎成为囚徒的故事。正如弗拉德和德莱塞所说的,囚徒的困境其实是身边许多人的困境。从广义上讲,当你受到某种诱惑去做一件事情,但同时也知道如果人人都去做的话将产生极其恶劣的后果的时候,你其实就已成了困境中的囚徒。(数学领域中对“囚徒的困境”有严格的定义:当“诱惑”大于“奖赏”,“奖赏”多于“惩罚”,“惩罚”优于“傻瓜蛋的下场”时,就产生了所谓的“囚徒的困境”,当然,如果“诱惑”极大,游戏规则将会发生变化。)如果世界上没有偷车贼,那么每辆车就都没必要上锁,而且大量用于办理保险、购买安全装置等诸类事物的时间和金钱都可以省下来另作他用,每个人都可以从中受益。但在这样一个大家相互信任的世界,如果有人违反社会契约偷了一辆车,他会得利更多。同样,如果每个渔民都少打一点鱼,那么每个渔民都不至于出海时两手空空,但是如果每个人都拼命捕捞,那些替他人考虑的渔夫最终将为别人的自私付出自己的一份收获。所以说我们每个人都是为了满足个人私欲而在牺牲集体利益。

非常奇怪,热带雨林居然就是“囚徒的困境”的产物。雨林中的树木都是靠消耗集体的能源使自己长成参天大树,它们只顾自己长大却从不繁殖小树。如果树木之间能联合起来清剿所有的大树并且规定所有树木最高只能长到十英尺,那大家都会分享到充足的能源。然而,它们根本做不到。

将复杂的生命简化为一项愚蠢的游戏,这正是经济学家臭名昭著的原因之一。但问题的关键不在于如何将生活中的所有真实问题一股脑儿塞进“囚徒的困境”这个小盒子里,而是在集体与个人利益发生冲突时如何建立起一个解决冲突的理想模式。有了这一模式,人们就可以对其进行检验,一旦发现让人震惊的例外情况,便又可返回到现实中来看看这一模式是否已发挥作用。

实际上已经有人做过此类事情,(尽管有些理论家拼死拼活,挣扎着不愿回到现实中来。)20世纪60年代,许多数学家开始疯狂寻找出路,打算从这一令人沮丧的困境中解脱出来,他们不愿接受背叛是最明智的做法这一事实。他们不断向外界表示他们已经找到了出路,这些人中最惹人注目的一个是尼戈尔·霍华德(Nigel Howard )1966年他重新解释了“囚徒的困境”,他认为背叛只是人们内心的想法和动机,并不是真正的行动。但正如其他学者所预料的,霍华德的解决办法最终证明只不过是一种明智的想法,实际情况根本不是他想像的那样。只要考虑到游戏开始前所讲述的条件,我们就会看出实行合作根本不合逻辑。

许多人都对这一结论深恶痛绝,其原因并不是它的内涵与人们的道德标准格格不人,而是在于它根本不符合生活中的真实情况。人类社会中的协作现象极为常见,人与人之间相互信任是社会与经济生活的基础。难道这不符合逻辑吗?难道我们非得无视自己的本能才与别人友好相处吗?犯罪行为要付出代价吗?难道只有别人给你钱你才肯与他真诚相待吗?

到了20世纪70年代,“囚徒的困境”这一理论开始成为经济学家的眼中钉,因为它表明长期以来经济学家一直将私欲视为一切的基础这一做法是大错特错。如果说这一游戏论证了在面临相同困境时自私是个体最明智的做法的话,那只能证明假设本身并不完善。人类并不总是以自己为中心,因此为人处世的驱动力也不见得非得是个人私欲,也可能是集体利益。看来,两百年间一直建立于个人私欲之上的古典经济学只是捕风捉影了。
博弈论的一个主要分支产生于1944年,其创始人是匈牙利人约翰·凡·诺伊曼(Johnny von Neumann),一个富于思想、具有超人智慧的天才。他的博弈论成为数学的一个分支,极其符合经济学这门“沉闷科学”①的要求,因为博弈论只在那些将个人决定依赖于他人行动的地方流行。像二加二这样的简单运算当然无须依赖环境,但要进行资产买卖则确实需要考虑自身以外的诸多其他因素,尤其要注意他人的决定。但是,即便是在这时候,也可能有一种万能钥匙,不管别人如何行动你都能稳操胜券。要想在现实生活中找到这样的万能钥匙—比如打算进行投资—可能比登天还难,但这并不意味着就没有可能。博弈论的关键就在于要从整个世界的缩影中寻找答案,寻找世界通用的万能处方。这一点在得名于普林斯顿大学数学家约翰·纳什((John Nash,他于1951年发表其理论,但由于长期受精神分裂症的摧残,直到1994年他才接受诺贝尔奖)的“纳什平衡论”( Nash equi-librim)中得到广泛关注。当每一参与者都对他人的选择做出最佳回应,而且每个人都满意于自己的决定时就出现了纳什平衡论中所描述的局面。

此处以彼得·哈默斯坦(Peter Hamrnerstein)和雷哈德·塞尔顿( Reinhard Selten)发明的一种游戏为例。有两个人,一个叫康拉德,另一个叫尼科。现在他们两人要分一笔钱。先由康拉德来决定他们是将钱五五分(公平)还是一九分(不公平);然后轮到尼科来决定是分一大笔钱还是一小笔钱。如果康拉德采用的是不公平分法,他将得到九倍于尼科的数目;如果尼科决定分一大笔钱,两人都将得到十倍于分一小笔钱的数目。无论如何,康拉德的钱都比尼科的多得多,但尼科却毫无办法。如果他选择一小笔钱,当然对康拉德没什么好处,但同时这也等于跟自己过不去,因此即便他真的这样做了,也连出口气的目的都没达到。根据纳什的均衡论,康拉德必然采用不公平分法,而尼科也必定要选择一大笔钱。当然对于尼科来说这不是最好的结果,但却是没办法中的最好的办法。当然最好的结果并不一定非得通过纳什平衡论来获得。事实远非如此。纳什平衡论常常使其中一个或两个人都无法满意,而且无论谁改变做法都无济于事。囚徒的困境就是这样一种游戏。两个新手初次玩这一游戏的时候,结果只能出现纳什平衡论:二者都会欺骗对方


  鹰与鸽

后来的一项试验推翻了上述结论,试验表明,三十年来人们从囚徒的困境中得出的结论一直都是错的。只要多次重复这一游戏你就会发现,满足私欲并不是明智的决定。

具有讽刺意味的是,弗拉德和德莱塞其实在发明游戏时就想到了解决这一困境的办法,只是随后就将其忘了个一干二净。两人差不多一开始就发现了一个让人吃惊的现象。他们让两个同事阿尔门·阿尔契安和约翰·威廉斯将这一游戏重复一百次,前提是只分一小笔钱,结果出人意料,两人居然都倾向于相互合:100次中合作次数多达50次。两人在游戏过程中各自做了记录,记录中两人都承认自己让步是为了诱惑对方在下次的交易中能以恩相报—直到游戏马上结束时他们才露出真面目,每个人都想赶快出手多捞一点。看来如果游戏一直在固定的两人中间重复,则两人都倾向于彼此友好相待,而不是相互欺骗。

阿尔契安一威廉斯之间的“锦标赛”很快就被遗忘了。但无论是谁,只要玩这一游戏,他们都不会遵守逻辑上的规则,而是通力合作。这一协作倾向并没有被真正理解,人们轻率地将其视为不明智之举,觉得有时人确实会莫名其妙地对别人特别好。有两位博弈论学者曾写道:“一般玩家还不至于考虑得那么周全,那么讲究策略,他们还不至于精打细算,分析出DD(即相互欺骗)是惟一明智的防卫策略。”看来我们还是太笨了,根本算计不过来。

20世纪70年代,一位生物学家重新发现了阿尔契安一威廉斯厉理,他的名字叫约翰·梅纳德·史密斯(John Maynard Smith),是一位生物工程学家。他虽然在此之前从未听说过囚徒的困境,但他发劝生物学可以同经济学一样充分利用博弈论为其服务。他认为,既然老于逻辑推论的个体会按博弈论的预测采取最佳对策,那自然选择也会赋予各种生物本能地采取同样的策略。也就是说,在游戏中既可以遮过有意识的逻辑推理也可以通过进化历史来选择纳什平衡论作为塌佳对策。除了人类个体之外,自然选择同样可以做出这一抉择。梅纽德·史密斯将这一进化产生的本能称做“进化稳定策略”( evolution-ary stable strategy),只要生物按这一策略行事就绝不会亚于采取其他战略的同类。

梅纳德·史密斯举的第一个例子就是要探求动物之间在打斗中为什么通常不置对方于死地。他假设在老鹰与鸽子之间进行着一场比赛。大致相当于囚徒困境中“欺骗者”的老鹰可以轻易击败一只鸽子,但它却在与另一只鹰的撕打中被弄得遍体鳞伤。而相当于囚徒困境中“合作者”的鸽子在遇到另一只鸽子时则可平安无事,虽然它不可能与鹰抗衡。但是,如果反复进行上述游戏,鸽子的柔顺本性就会变得越来越有用,复仇将成为最成功的策略,因为一旦鸽子碰到一只伤痕累累的老鹰时它本身就成了强壮有利的复仇者。一会儿我们将更为详细地讨论这一问题。〔右〕

当时的经济学家根本就没注意到梅纳德·史密斯的理论,因为他的实验是在生物学界进行的。然而就在20世纪70年代末期,经济学界出现了危机—电脑开始用它们冷酷、坚硬但极合乎逻辑的大脑来进行囚徒的困境的游戏,像那些愚蠢无知之徒一样,电脑也倾向于与对方合作。于是乎警钟开始响彻整个数学界。1979年,一位名叫罗伯特.阿克谢罗德(Robert Axelrod)的年轻政治学家设计了一种游戏用来探究协作互惠的逻辑。他让人们选择某种计算机程序,然后让这一程序与其他程序、与自身、与其他一个随机程序分别进行游戏测试,共进行200次。随后对每个程序打分。

共有14人分别选择了复杂程度不同的14个程序,让大家都感到吃惊的是那些“脾气随和”的程序做得最好。八个最佳程序中没有一个选择“欺骗”,而且正是那个最随和也最简单的程序得分最高。曾做过钢琴师并对核对抗极感兴趣的加拿大政治学家阿纳托尔·拉博泡特(Anatol Rapoport)可能是现今在世的对囚徒的困境最有研究的一位,他设计了一种名叫“以牙还牙”( Tit-for-tat)的程序,程序开始时实行合作,然后亦步亦趋,对方采取什么行动它就采取什么行动。以牙还牙实际上也就是梅纳德·史密斯报复对策的另一版本。

阿克谢罗德又进行了另一项测试,他让人们选取某些程序与“以牙还牙”程序进行比试,62个程序参加了比试,最终居然还是后者大获全胜,这一次它又居于榜首。阿克谢罗德在他的书中解释道:

它之所以能独占鳌头是因为这项程序具有友好、忍让、清晰明了而又善于报复这几项特征。它的友好态度可以避免使自己陷入不必要的麻烦;它善于报复,这样可以使对方不敢肆意欺骗;它的忍让大度能够很快恢复双方间的互惠合作;它清晰明了,对方很容易理解其意图,由此维持了长期的协作关系。

阿克谢罗德的下一项实验是将各种策略放入“适者生存”的竞争中,这就是在此之后众所周知的“模拟生命”的例子之一。计算机可以轻松地对自然选择这一生物进化的主要动力进行模拟,诸多设计出的软件生物像自然界的动物生息繁衍一样在计算机屏幕这一狭小的范围内竞争生存空间。按照阿克谢罗德的阐释,不成功的策略渐渐被挤向屏幕边缘,那些强有力的软件生物占据了屏幕的中心位置。由此引发了一系列有趣的事件。首先,那些恶毒的家伙以牺牲其他善良天真的“生物”为基础得到发展壮大。只有像“以牙还牙”这样的复仇者才能与之抗衡。但是渐渐的,随着“猎物”的减少,它们彼此之间开始针锋相对,由此它们的数量也开始慢慢减少。“以牙还牙”现在成为主要生存者,它又一次主宰了战场。
   
最后更新时间:2007-10-09
2.蝙蝠的亲兄弟
    阿克谢罗德觉得生物学家可能会对他的发现感兴趣,于是他与一位就任于密歇根大学的同事取得了联系,他的这位同事不是别人,正是威廉·汉密尔顿。他所说的立刻让汉密尔顿想起以前的一个类似发现。十多年前,哈佛大学一位名叫罗伯特·特里弗斯(Robert Trivers)的生物学研究生向汉密尔顿提交了一篇论文,文中特里弗斯假设动物和人类常常受到私欲的驱使,但他发现实际生活中他们却又常常合作。他认为这一现象的原因之一就是“互惠互利”,说得更清楚一些就是,你为我挠痒痒,我也得为你挠。只要得到的比付出的多,人和动物都愿意帮助对方,因为将来有一天你也会得到他的帮助,这样对双方来说都有利可图。如此看来,群居动物绝不是利他主义者,相反,他们可能时时都在相互交换自己需要的利益。在汉密尔顿的激励下,特里弗斯后来发表了一篇引发一系列关于动物互惠利他争论的文章,并在文中举了许多颇有说服力的例子。实际上,特里弗斯已将囚徒的困境作为论据反复用来论证自己的观点,而且他还猜测到一对个体之间互动关系持续时间越长,它们互助协作的可能性也就越大。他实际上那时已经发现了“以牙还牙”原理

如今在十年之后,汉密尔顿终于得到了来自数学界的证据来证明特里弗斯观点的力量所在。于是,为了引起生物学家对“以牙还牙”理论的关注,阿克谢罗德和汉密尔顿合写了一篇题为《协作关系的进化》
( The Evolution o f Cooperation)的文章,立即引起人们的极大兴趣,大家纷纷开始在动物界中寻找真正的例子。

事例不久便找到了。1983年,从哥斯达黎加返回加州的生物学家杰拉尔德·威尔金森(Gerald Wilkinson)带回了一个有些让人毛骨惊然的协作事例。他对昼伏夜出的吸血蝙蝠进行了观察研究,这种生物白天栖息在树洞中,晚上则外出搜寻大个的猎物,它们常常鬼鬼祟祟地附在猎物身上从伤口处吸食它们的血液。但这种食物来源极不稳固,它们常常空腹而归,不是找不到猎物就是找到猎物但无法大餐一顿。对于那些成年蝙蝠来说情况稍好一点,十天晚上大概只有一天会没有食物;但那些小蝙蝠可没那么幸运,三天中就有一天晚上空腹而返,接连两天饿肚皮是常有的事。如果60小时都没有吸到动物血液,它们就很可能因饥饿而亡了。

然而幸运的是,一旦找到食物,吸血蝙蝠就会大餐一顿,然后再回涌一些给另一只蝙蝠当点心。这一慷慨大方的行为使吸血蝙蝠陷人了“囚徒的困境”:相互照应的蝙蝠群体比那些只顾自己的群体易于生存,但是同样,只顾自己填饱肚皮的家伙要比那些只知给予却得不到回报的蝙蝠更能保全自身。

由于蝙蝠常常在固定的地方栖息,而且可能很长时间不换居所—有时长达18年,因此蝙蝠个体彼此都非常了解,正如阿克谢罗德在计算机上所演示的,它们可以反复进行这一游戏。顺便说一句,蝙蝠与邻居的关系并不太密切,因此裙带关系并不能解释彼此间的慷慨之举。威尔金森发现,它们似乎也遵循着“以牙还牙”的原则。一只刚刚给予他者食物的蝙蝠此时会得到受恩者的回报;同样,如果上次拒绝了他者,这次它也同样会遭到拒绝。看来每一只蝙蝠好像都非常精明,善于盘算,这可能也就是它们乐于相互间梳理羽毛的目的所在。蝙蝠在相互整理羽毛时特别关注对方肚子附近的地方,因此一只吃得肚子鼓鼓的蝙蝠根本无法逃过对方的眼睛。这次欺骗了别人,下回他也会同样遭到欺骗。互惠互利原则统治着整个蝙蝠群体。

非洲的黑长尾猴也遵循类似的互惠互利原则。如果播放一只长尾黑猴喊叫求.助的录音,另一只曾受恩于它的同伴会立即做出回应。但若两只猴子关系密切,听到呼救的一只就不会太在意陷于困境的朋友是不是曾帮过自己。看来,正如博弈论所表明的,“以牙还牙”机制只适用于在互不相干的个体中建立协作关系。婴儿理所当然地接受母亲的喂养,无须用笑容和顺从来换取;同样,兄弟姐妹之间也不必有恩必报。但是,两个不相干的个体相处时每人却都在时时刻刻算计着对方欠了自己多少。

“以牙还牙”机制运作的主要条件是必须有稳固、频繁的交往关系。两者之间越是偶然随意的交往,产生良好合作关系的可能性就越小。特里弗斯发现珊瑚礁中存在着的一种特殊现象恰好能证明上述条件的正确性,这一现象就是各清洁点的存在。珊瑚礁中有许多固定的地点,附近海域的大鱼,包括食肉鱼类,都定期到这些地方来让小鱼和虾为自己清洗身上的寄生虫。

这一清洁过程对热带鱼类来说至关重要。至少有45种鱼和6种虾在珊瑚礁中担当清洁工的角色,其中有些鱼虾就以此获得食物为生,大多数“清洁工”都长有区别于其他鱼类的鳞片,大鱼就是靠它们的颜色和独特的游动姿态来辨认以前的“雇工”。各种鱼类都来光顾,有的来自公海,有的来自珊瑚礁底部的藏身之处,有的则变换身上的颜色向“清洁工”发出信号。对于这些大鱼来说这项服务好像至关重要,许多鱼都会花大量时间前来搞个人卫生,有时甚至与觅食花的时间差不多,尤其是受伤或生病的时候,它们一天会来好几次。如果“清洁工”从珊瑚礁中全部搬走,此处的海洋生态就会立即发生变化—鱼类数量减少,而且随着寄生虫的迅速繁殖,越来越多的鱼会伤口感染、受到病痛的折磨。

小鱼得到食物,大鱼身体干净,双方都有利可图。但是,“清洁工”常常与大鱼的食物个头差不多,它们在大鱼的嘴中自由进出,在大鱼的腮中任意穿梭,好像总与死神擦肩而过。其实非但“清洁工”们能平
安无事,大鱼还会小心相待,在将要离开时示意小鱼这次清洁可以结束,“清洁工”们看到信号随即离去。鱼类需要清洁的本能非常强,特里弗斯曾就此引用了一个例子。一条四英尺长的石斑鱼已在鱼缸里长了六年,每次有人将其他鱼扔进鱼缸时它都会毫不犹豫一口将其吞下肚。但奇怪的是人们第一次把清洁鱼扔进鱼缸时它就大张着嘴和腮欢迎它的到来,而且更为奇怪的是它身上根本没有寄生虫。

让人不解的地方就在于为什么大鱼面对这么多好吃的而不美餐一顿?它们完全可以在享受一番服侍之后再吃一顿点心。如果果真这样,它们就成了囚徒困境中的欺骗者,正如欺骗极少发生一样,它们也不会那么傻。比方说你去问一个道德是非感极差的纽约人,为什么他要付钱给一个非法移民来的清洁女工,而不是用完后便将其解雇然后下周再找一个,他可能会回答说:因为好的清洁工很难找。大鱼肯手下留情绝不是出于仁义道德,它们绝不会想到其他鱼找不到清洁工该怎么办,它们这样做是因为它们知道找顿饭吃远比找个好“清洁工”容易得多。还有一点就是大鱼可以在同一块珊瑚礁中的同一位置找到同一个“清洁工”,它们有时甚至几年都不换居所。大鱼与小鱼之间如此长久的友好往来对维持互惠互利关系的平衡极为重要。一次险些丧命的交易自然会引发下一次的欺骗,而长久反复的友好往来则能促进协作关系的发展。大家都过着流浪生活的外洋中是绝不会有寄生虫清洁点的。

阿克谢罗德还叙述了一个一战中西线存在的现象做例子。由于战争陷人僵局,双方不得不在同一地方对峙,这样一来,驻扎在同一地方的两个兵团之间有了频繁接触的机会,正如囚徒困境的游戏重复多次所得的结果一样,双方由一触即发的对立渐渐变成了协作关系。实际上,一战期间西线上确实有许多盟军与德军在对峙许久后达成非官方休战协定。双方通过沟通达成共识,为无意中的违约行为向对方道歉,并表示愿意维持相对的和平状态-—双方的高级统帅对这一切均一无所知。休战协定仅仅靠简单的复仇意识得以维持。一方若有欺骗行为对方就会以火力突袭进行报复。有时这样的报复行动会逐步升级,像报血仇一样到了无法控制的地步。盟军和德军的做法酷似“以牙还牙”机制,它有助于协作关系的产生,但同时也冤冤相报。战争中一旦这样的休战协定被发现,双方的将领们都会采取对这一问题最简单最有效的补救措施,那就是频繁换防,这样双方还来不及建立起互惠互利的协作关系就被派往他处了。

当然,正如一战的事例所展示的,“以牙还牙”也有它的阴暗面。如果双方起初就都处于有利位置,它们之间从此就会友好合作下去。但如果其中一方无意或草率行事欺骗了对方,那无尽的相互指责、报复便由此开始,谁也别想自此安宁。正如西西里、16世纪苏格兰边境、古希腊和现代亚马逊印第安人之间的派系血仇所证明的那样,冤冤相报正是“以牙还牙”的真正含义。下面我们将看到,“以牙还牙”并不是
走遍天下包治百病的灵丹妙药。

以上所说的一切证明了一件事:在社会生活中互惠互利似乎是人性中不可或缺的一部分,是我们的本能。我们无须认真分析推理就知道要“以德报德”,更无须别人教导如何去做。随着一天天成熟起来,我们自己就学会了如何利用这一原则,使之渐渐在心中根深蒂固。这是为什么呢?因为大自然选择了这一机制帮助我们从社会生活中获取更多对自己有益的东西。
   
0 请登录后投票
最后更新时间:2007-10-09
〉它之所以能独占鳌头是因为这项程序具有友好、忍让、清晰明了而又善于报复这几项特征。它的友好态度可以避免使自己陷入不必要的麻烦;它善于报复,这样可以使对方不敢肆意欺骗;它的忍让大度能够很快恢复双方间的互惠合作;它清晰明了,对方很容易理解其意图,由此维持了长期的协作关系。

看到这里我笑了。。。。。什么样的程序是可以被界定成拥有这么复杂的性格?故事编得不错目前人类对AI的研究貌似还不足以达到这个程度?是不是真的要冒出一段这么浪漫的?
   
0 请登录后投票
最后更新时间:2007-10-09
别看昏头了,这里讲的是策略特质而非AI人格。

我的感觉,将“优先合作的报复者”推上最成功策略的舞台,必要的前提就是拥有对于对手的记忆和评估,可以针对不同的策略采取不同的对策。
换句话说,只有对方是可以辨认,可以记忆,面临长期持续的共同课题的时候,合作才是正确的选择。
囚徒困境的初始叙述,实际上暗示了这是一锤子买卖,即使出卖对方以后也不会遭到报复,而一旦失败则一无所有无法接受,在这种环境下,欺骗对方自然是最佳策略,毋庸置疑。
因为在这里,“关系”本身就是一个参数。自己和对方强制性的关联究竟有多紧密?包括主观上的意愿和客观的环境,只有这种关联程度突破某个指标之后,选择合作才能够成为明智的抉择。
这就是在社会常识上是理所当然显而易见,到了数学家那里变成了旷世奇观的例子。
从这个角度来讲,现代社会越来越自由化个体化孤独化,人际关系越来越一次性简化,所以道德沦丧显然是不可避免的。我一直想不明白的是,将原来注重合作的道德正确的人际关系看作一种秩序,一种能量,那么现在这个秩序破坏了之后,能量究竟流到哪里去了?究竟有没有一个敌人,一个NHK在破坏我们从中得益?(笑)
   
0 请登录后投票
最后更新时间:2007-10-09
akane 写道
〉它之所以能独占鳌头是因为这项程序具有友好、忍让、清晰明了而又善于报复这几项特征。它的友好态度可以避免使自己陷入不必要的麻烦;它善于报复,这样可以使对方不敢肆意欺骗;它的忍让大度能够很快恢复双方间的互惠合作;它清晰明了,对方很容易理解其意图,由此维持了长期的协作关系。

看到这里我笑了。。。。。什么样的程序是可以被界定成拥有这么复杂的性格?故事编得不错目前人类对AI的研究貌似还不足以达到这个程度?是不是真的要冒出一段这么浪漫的?


The Evolution of Reciprocal Altruism
Robert L. Trivers
The Quarterly Review of Biology, Vol. 46, No. 1 (Mar., 1971), pp. 35-57

http://links.jstor.org/sici?sici=0033-5770(197103)46%3A1%3C35%3ATEORA%3E2.0.CO%3B2-S
这就是老外经典论文格式的好处之一,文献和索引既是一张继续深入的地图,同时也是一张百年老店的招牌.不管观点对不对,起码来说靠编故事就能上生物学季刊的可能性为0.这或许也是人类进化稳定后的一种策略吧,呵呵.
   
0 请登录后投票
最后更新时间:2007-10-09
以牙还牙是不是说明有种记忆在里头?但是记忆可靠吗?比如石头剪子布的游戏,我这把出石头,你知道我下把出什么吗?总觉得猜测人的心理就和石头游戏一样,是不可琢磨的。我出石头,你出剪刀,下把你不能认为我仍然出石头而出布,因为我可能会知道你的想法而出剪刀,然后你还是可以想到。。。这样无限递归下去。
哪位能对这样的情况作点解释么?呵呵。我认为猜测人的心理是不可能的,因为双方都可以思考,这是一个无限的过程。
   
0 请登录后投票
最后更新时间:2007-10-09
tianya 写道
以牙还牙是不是说明有种记忆在里头?但是记忆可靠吗?比如石头剪子布的游戏,我这把出石头,你知道我下把出什么吗?总觉得猜测人的心理就和石头游戏一样,是不可琢磨的。我出石头,你出剪刀,下把你不能认为我仍然出石头而出布,因为我可能会知道你的想法而出剪刀,然后你还是可以想到。。。这样无限递归下去。
哪位能对这样的情况作点解释么?呵呵。我认为猜测人的心理是不可能的,因为双方都可以思考,这是一个无限的过程。

简单说
囚徒困境之所以被成为困境,是因为双方都知道合作会有更好的结果,但博弈论仍然驱使他们不合作
所以这里说的“以牙还牙”就很容易理解了:
如果对方一贯合作,我方就采取合作的态度
如果对方有欺骗的行为出现,我方就坚决不合作,最多拼个鱼死网破
   
0 请登录后投票
最后更新时间:2007-10-09
好文章,受益良多
   
0 请登录后投票
最后更新时间:2007-10-09
这几天很忙,没时间认真看T1的贴子。
   
0 请登录后投票
论坛首页 海阔天空版 读书

跳转论坛:
JavaEye推荐