按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
在一个合理的学习机制吗?也就是说,错误的预测不要紧,但有没有办法改进这个预测,以至于下次能作出更好的预测?在酒吧问题上,可以说没有这样的一个改进机制。
酒吧问题所反映的是这样一个社会现象,正像阿瑟教授说的那样,我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。
生活中有很多例子与这个模型是相同的。比如社会上经常举行的所谓大众评选活动,如全社会进行的“十佳运动员”评选活动,电影爱好者的“百花奖”的评选活动。在这些投票过程中,对于每个投票者的激励是:他如果“正确地”选中某些人,比如“十佳运动员”的评选,不仅要选中10个人,而且顺序也要正确,那么投票者将获得某种奖励。但是如何才能选中“正确的”人选呢?有“正确的”人选吗?得票多的就是“正确的”吗?严格地说:得票最多的是第一名(比如“十佳运动员”中的第一),得票次之的是第二名(如“十佳”运动
员中的第二名),等等。因此,投票者能够选中的话,或者说被他提名的能够当选的话,关键是猜测到别人的想法。猜测对了,你就能获奖;猜测错了,你则不能获奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁不应该选上的问题,而是投票的人相互猜测的结果(在这个过程中当然舆论的导向作用是很大的,它似乎告诉人们某某人是其他许多人所要选的)。这个例子与酒吧问题的结构是大众评选活动一样的,只不过在评选上是一次性的,没有过去的历史让我们来归纳而已。这明显是博弈问题。另外一个例子是,每年高校招生或研究生报名都呈现出混沌现象,考生通过各种渠道弄清以往专业的报名情况,因为一个简单的道理是:如果报名的人太多,竞争太强,被录取的可能性就低。考生一般根据以往几年的情况来推测当年报名的情况,然而这会造成不准确预测。当考生看到以往几年报名的人很多时,他会想下次人还很多,因而他不敢报名。一旦大多数考生这么想,下次报名的人反而少了;反之,则又多。这与酒吧问题有一致的结构。
少数者博弈及其应用:
股票买卖与交通拥挤问题在本书的导言中我们给出了少数者博弈(Minority Game)的简单模型:失火时面对两个门,你将如何选择。现在我们来介绍这个模型。
少数者博弈是改变了形式的酒吧问题,是由一位定居瑞士的名叫张翼成的中国人在1997年提出的。张教授祖籍河南,科大毕业后80年代初去了瑞士,现在瑞士的弗莱堡大学(University of Fribourg)任教。他提出的少数者博弈影响很大,现在很多物理学家、博弈论专
家研究这个问题。比如,2000年9月在中国科技大学召开的“经济物理学高级研讨班及金融复杂性国际学术讨论会”上许多学者作的报告就是围绕这个问题的。
少数者博弈可以运用于股票市场。每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于“卖”股票的位置,而你处于“买”的位置,股票价格低,你就是赢家;而当你处于少数的“卖”股票的位置,多数人想“买”股票,那么你持有的股票价格将上涨,你将获利。而股民采取什么样的策略则多种多样,而策略的得出完全是根据他们以往的经验归纳出来的,因而类似于这里的少数者博弈的情况。但是物理学家对少数者博弈研究的结论能否用来指导股民在股票市场上搏杀,本人不得而知。
不过本人认为,少数者博弈中一个特殊的结论不具有普遍意义,即:记忆长度长的人未必一定具有优势,因为,如果确实有这样的方法的话,在股票市场上,人们利用计算机存储的大量的股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将争抢着去购买存储量大即硬盘空间大以及计算速度快的计算机了,在实际中人们还没有发现这是一个炒股票必定赢的方法。
交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤,选择行车路线也是不断的博弈过程。在交通高峰期间,司机面临两条路的选择时,往往要选择没有太多车的路线行走,此时他宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据以往的经验来判断哪条路更好走,而所有司机都不愿意在塞车的道路上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一个少数者博弈问题。
当然在司机行车的少数者博弈问题中,司机经过多次的选择和学习,许多司机往往能找到规则性,这是以往成功和失败的经验教训给他的指引,但这不是必然有效的规则性。在这个过程中,司机的经验和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能有效避开高峰路段;有的司机喜欢冒险,宁愿选择短距离的路线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,等等。最终的路线的拥挤程度就由不同特点和不同经验的司机的选择所构成。
对称的人群为什么会出现破缺性的行动?
——盲目的学习人们拥有的知识是其行动的基础。在上面的酒吧问题中,每个行动者面对的信息是一样的,但每个人所用的预测方法是不同的,即他们所归纳出的预测公式是不同的(这也就是为什么我们说这种归纳没有合理的基础的原因)。然而,尽管如此,对整体人群来说,平均去酒吧的人数占总人数的60%。对每个人来讲,他的预测与行动独立于其他人将要作出的选择——因为假定他们之间没有信息交流。可以这么说,60%两边是对称的。
还有另外一种非对称的情况。我们假定,人们没有足够的知识以支撑自己的行动。如果对可选择的策略或行动没有任何知识,此时行动者的行为就会出现盲目性。但是由于人本身具有学习的天性,快速的学习过程就发生了。让我们看一个例子。
这是一个心理学上的例子:有一群人鱼贯进入一个房间,拿一瓶饮料喝。在他们面前有多种饮料,假定是3种,房间很黑,每个人无法通过视觉判定饮料的质量,当然更无法看清品牌,也就是说,3种饮料给他们呈现的是同样的视觉图像。此时的选择会是怎样的结果呢?
通过实验发现,人们会将特别“偏爱”一种饮料,即几乎所有人都选择一种饮料,而不是3种饮料平均被选取。这里他们所“偏爱”的并非是特定的,在不同的人群中做同样的实验,出现的情况是一样的,只不过每一次被大多数人选取的饮料会不同。此时被选取的饮料具有非对称性。
按通常的情况,假定饮料给每个人呈现同样的视觉图像,人群会出现对称性选择,即每个人会在所给定的几种饮料中随机选取。而由于群体的存在,即使不同的人对某种颜色有偏爱——我们假定人们可看到颜色,每个人的偏爱也会被抵消掉。对群体来说,每种饮料被选取的可能性是一样的。
出现选择的非对称性完全是由于人们的选择行动之间的相互作用。其实这是微妙的,同时是不合理的学习过程。第一个人选取饮料可以说是随机的,在备选的几种饮料中选取完全是任意的,但是接着的人对饮料的选取则不是任意的。由于看到第一个人选择了某种饮料,他会认为第一个人的选取是有根据的,从而也会选择第一个人所选取的饮料。后面的人也会这样想。于是第一个人对某种饮料的选取会传递下去,并且这个过程中越到后面的人越有理由相信选择该种饮料是有根据的。这就是为什么所有的人都倾向于选择一种饮料。
这就是为什么出现非对称的选择结果了。这种传递不是通过语言,而是通过对前面人的选择行动的观察。这是一个学习目的学习过程,并且是一个没有理由的学习过程,也就是说这样的学习过程是没有根据的。
这个心理学上的实验。反映了人们之间互动的情况。这个盲目的跟随现象或者说盲目的学习现象在现实生活中处处可见。
蜈蚣博弈的悖论
倒推法是分析完全且完美信息下的动态博弈的有用工具,在第四章我们分析言语博弈中“威胁”或“承诺”是否可信时,已给出了一个倒推法例子。我们看到,倒推法符合我们的直觉。然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。