博弈:一个巴掌拍不响
博弈是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。
对弈者可以分析自己与对手的利弊关系,从而确立自己在博弈中的优势,因此有不少博弈理论可以帮助对弈者分析局势,从而采取相应策略,最终达到取胜的目的。博弈的类型分为:合作博弈、非合作博弈、完全信息博弈、非完全信息博弈、静态博弈、动态博弈等。
很多人可能都知道5个海盗分金币的故事,有一天他们抢到100个金币,于是几个人决定通过抽签来决定分金币的顺序,他们分别是1、2、3、4、5。
首先由1号提出分配方案,然后5人表决,只有超过半数人同意,方案才能通过,否则他将被扔进大海喂鲨鱼。
当1号死后,由2号提方案,4人表决,只有超过半数人同意时,方案才通过,否则2号同样被扔进大海。
以此类推……
如果这些海盗都能够理智地分析自己的得失,并做出正确的选择,那么海盗1如何才能保证自己不被扔到海里喂鲨鱼,并能使自己获得更多的金币?
这是一个聪明人之间的精心计算的问题,海盗1独得97块金币,不给2号海盗,给3号海盗1块,给4号海盗或5号海盗2块。可以写成(97、0、1、2、0)或者(97、0、1、0、2),只有这样才能保全自己。有人会说,海盗1这样的分配方案会使自己直接被扔到海中喂鲨鱼,其实不然,事情有它存在的前提条件,那就是5个海盗都非常聪明。谁都不愿意自己被喂鲨鱼,那他们就要想好怎样才能保全自己的生命。
让我们来分析一下,如果1到3号都直接被淘汰,那接下来4号也就只有喂鲨鱼的份,所以4号会全力地支持3号,同样3号知道4号一定会投自己的票,那3号就会大胆地提出自己独吞这100块金币的方案,对4、5号海盗一毛不拔。但同样道理,2号海盗也会料到3号海盗的方案,他会提出(98、0、1、1)的分配方案,不给3号海盗,给4号和5号海盗各1块金币。这样一来,对4号和5号海盗来说,比让3号海盗不分配给他们反而还能让每人都得到一块金币,这也就会让4号和5号都投2号海盗的票,不希望他去喂鲨鱼。然而最占先机的还要属1号,只要他得到3票赞成,就可稳操胜券。如果他给3号海盗1块金币,给4号或5号海盗2块金币——这肯定要比2号海盗给得多,那么,除了他自己的1票之外,他还能得到3号海盗以及4号或5号海盗的支持。这样1号的方案一定会通过,也使他得到了97块金币的最大收益。
1号海盗的这个方案看起来似乎是自寻死路,但实际上非常精确。然而他的方案的成功要有一定的前提,那就是每个海盗都工于算计,能够准确地预测到分配过程中每一步骤将会发生的变化;而且能多得1块就绝不少得,能得到1块也绝不放弃。他们用自己的生命来做赌注,这也是一门文化,被称为博弈。
博弈是一门古老的文化。《世本》中说,“乌曹作博”,乌曹乃是夏代著名的能工巧匠。在几千年来,传乘的历史娱乐文化中,从围棋、象棋到麻将、纸牌,一直到各种各样的体育彩票等游戏都是博弈文化。经过长期的演变,博弈更发展为一门学问,被广泛应用于经济生活中,称为“博弈论”。博弈自身存在着基本的要素和规则,参与人、行动、信息、策略、支付(效用)、结果和均衡,形成了它的基本概念,其中参与人、策略和支付是对博弈的基本要素的描述,而行动和信息是“构件”,参与人、行动和结果统称为“博弈规则”。
构成博弈的这些要素和规则都有着具体的含义。参与者是博弈论中最基本的概念,也被称为局中人,是指选择自己的行为以使效用最大化的决策主体;行动是指参与人在博弈的某个时点的决策变量;信息是指参与人在特定时刻有关变量值的知识;策略是指参与人在给定信息情况下的行动规则,它规定在什么时候选择什么行动;支付是指在一个特定的策略集合中,参与人得到的确定的效用水平或指参与人得到的期望效用水平;结果主要是指均衡策略组合、均衡行动组合、均衡支付组合等;均衡:是指所有参与人的最优策略集合。
在市场的激烈竞争中要掌握主动权。正如1号海盗,他看起来最有可能喂鲨鱼,但他先发制人,牢牢掌握着其他人的心理,主动出击,结果不但消除了死亡威胁,还获得了最大的收益。作为最安全的5号,他根本不用担心被扔进大海,还有可能坐收渔人之利,但他也只能接受前者的施舍,看人家的脸色,最终可能会一无所获。同时,在竞争中还要讲求一定的规则。如果没有规则的约束,那么任何一个问题都会有千变万化的解答方式,这样即使再有智慧的人也不会给出理想的答案。就像这5个海盗一样,他们不是通过胡乱抢劫和打闹来分取金币,而是讲规则,动脑子玩智慧,凭智力赚取最大收益。这几个海盗的智慧分金告诉我们,在竞争中要保持头脑清醒,要善于分析得失,学会满足,否则可能一无所获;是自己的就要尽最大努力去争取,但在利益最大化得不到保障的情况下,应选择最有可能实现的利益。
博弈是一种无限期重复的智力游戏,同一个博弈被无限期重复多次。由于在无限期重复博弈中,报复的机会总是存在的,所以,每个参与者都不会采取违约或欺骗的行为,合作的均衡解是存在的。
大众定理,又译作“无名氏定理”,对于它的原创者已经无法追溯。它的产生就在于无限重复的博弈中。博弈存在很多的平衡点,有无数种行为规则可以支持合作行为。在正常的平衡状态中,可观察到的行为可以完全相同,即博弈双方相互合作,不玩欺骗,实现博弈双方的合作。也就是大众定理。合作背后的行为规则可能大不相同,但使其形成的因素却是多方面的,有可能是双方都信奉仁厚的恕道主义或者双方都很理性,也有可能是因为双方都以报复相威胁。这些行为规则上的区别,在正常的平衡状态中是看不出来的,只有在非正常情况下,或在与外人的交往中才会表现出来。
要点回顾
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。
帕累托最优:大家好才是真的好
帕累托最优是指资源分配的一种理想状态,假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托改进或帕累托最优化。
帕累托最优回答的是效率问题。从社会福利角度出发,用效率来评价总体经济运行有其合理性,因为如果资源配置未达到帕累托最优,那么,总有一些人能改善境况而没有人会受损,也就是说,社会福利总量肯定能上升,那么通过一种恰当的分配或补偿措施,能使所有人的境况都有所改善。
经常打牌的人比较清楚赢牌的两个条件:首先是技术类型的,就是要与自己的搭档好好配合,从战术上赢;其次就是手上一定要有一副好牌。事实上,当我们拿到手里一副牌,就已经拥有了一整套的资源。要想赢得这局,首要的是如何控制这把牌的使用,怎么去扣底牌,怎么配对子,怎么出小牌和大牌。当拿到一把牌,就要合理地配置它们,让它们提高使用效率,为胜利出力。唐僧带领徒弟们不远万里要去的地方是芸芸众生都很想去的乐土,因为据说在那里所有的灵魂都可以享受快乐。最主要的是那里众人平等,每个人都可以圆满地过完一生。不错,这里所说的社会确实是个众生平等的理想社会。
在经济的世界里,也有对如此理想社会的憧憬与向往。众所周知,经济学讲究的是实际,经济学家们希望的理想世界是资源利用要注重它的公平性与效率性。在衡量优劣时将“效率”与“公平”结合起来,就产生了“帕累托最优”这样一个概念。“帕累托最优”概念出现在注重资源效率与公平结合的研究中。
帕累托最优(Pareto Efficiency),又叫帕累托效率,它指的是一种资源分配的状态,在这种状态里,在不使任何人的处境变坏的条件下,已经不可能再使某些人的处境变得更好。通俗地讲,帕累托最优是指一个人已经处于这样一种极限状态:除非损害别人,否则就不能让自己变得更好。从这里我们可以知道,帕累托最优是在寻求一个理想世界,这个世界主要由效率和公平构成。帕累托最优来源于一位著名经济学泰斗的名字,他就是意大利的为弗雷多·帕雷斯。发展到现在,这个概念被普遍用来衡量经济制度等是否合理。
还有一个与之相关的概念叫“帕累托改进”:它是指在没有使任何人处境变坏的前提下,使得至少一个人的处境能变得更好。要注意,“帕累托最优”指的是一种状态,“帕累托改进”指的是一种变化。
举个例子,某篮球馆要举行一场CBA篮球赛,整个球场能坐5000人,在比赛哨声吹响之前,有4900人入场。
很显然该篮球馆在此时此刻不在“帕累托最优”状态,还有100个座位空着,需要再有100名球迷入场,那时所有的座位满座,而且每个观众都可以看到球赛,这样它才能达到处境更好的状态,那么整个填充座位,增加球迷人数的这一过程就叫作“帕累托改进”。但是另一种情况出现就不同了,那就是,篮球馆里已经来了5000名观众,然后又有500名观众进来,这些新来没座位的观众可以心满意足地看到自己喜欢的球赛,从他们的角度来说“自己的处境变好”,但是从另外5000名球迷的角度来说,处境就不那么好了,超出规定人数的500名球迷会影响他们看球的环境和心情。火车等交通工具也是如此,在座位尚未坐满的情况下,正好有对应的乘客上来,那么就可以进入“帕累托最优”状态,一旦在坐满后又上来旅客,那么整个交通工具上的旅客安全就难以保障了。
前面我们说过,“帕累托改进”的特点是自己变好,同时又不使他人变差。“帕累托改进”式的行为常常不被阻挠,就是因为它不威胁另一部分人的利益。中国在建设过程中,曾推行的分田到户、联产承包责任制等土地政策的实现非常顺利,原因就在于它们在保障农民利益的同时也没有伤害其他行业的利益。
假如不符合“帕累托改进”的标准,让一些人获得好处,而其他人却受到了损害,那么事情实施的时候就会受到阻挠。
在经济上,假如某个制度并不算帕累托最优,它就需要来一次“帕累托改进”。某公司可以在不使竞争对手利益受损情况下争取本公司利益,就是实施了“帕累托改进”。如果甲、乙两公司都进行“帕累托改进”并谈判交易,结果常常是令人满意的双方获利。
我们必须清醒地认识到,帕累托最优其实是一种假设中的完美化状态,在真正的现实经济世界中,它几乎不大可能存在。而与之相应的,“帕累托改进”也需要很苛刻的条件,那就是不伤害哪怕一个人的利益,在真实的世界里,这个要求不可能达到。鉴于此,专家们设定了比较现实的标准,它被称为“卡尔多——希克斯改进”,它的特点是,如果在一种变革中,受益者所得到的利益足以弥补受损失者的损失,那么这种变革就是卡尔多——希克斯改进。这种标准的目光很长远,它所关注的是某项经济措施是否能在一个不短的时间内增长全社会的经济利益。这项经济政策也许在实施之始损害了一些人的利益,但是到后期阶段,随着它提高整个社会的生产效率,这些被损害利益的人们将从中得到补偿。我们目前社会的改革大部分都可以归为卡尔多——希克斯改进。
要点回顾
帕累托最优里面藏着无尽的宝藏,这让它在经济学领域备受青睐。它包含着自由平等的精神、公平公正的道德诉求以及对优劣进行评价的效率标准。所以人都没有利己损人的举措,于是社会发展的前景就是人类期盼的共同富裕。
比较优势:良马不一定胜劣马
如果一个国家在本国生产一种产品的机会成本(用其他产品来衡量)低于在其他国家生产该产品的机会成本,则这个国家在生产该种产品上就拥有比较优势。
生产技术是国际贸易的基础,在这些国际贸易的流通中存在相对差别,也就产生了相对成本的差别。每个国家都应根据“两利相权取其重,两弊相权取其轻”的原则,这就要在生产中集中资源,并出口其具有“比较优势”的产品,进口其具有“比较劣势”的产品,才能创造更多的利益。
有一位优秀的厨师叫皮特,他非常热衷于自己的厨师事业,退休之后依然经常去朋友家中,为他们的“派对”活动贡献自己的厨艺。在生活中,皮特先生很注重整洁,家中永远都是干干净净的。可人们从没见他做过家务,他把所有收拾房屋的工作都交给临时工来处理,大多数人都会觉得,临时工的工作质量远远不如皮特先生自己完成得好。于是周围的朋友就问皮特先生:“你为什么不自己做呢?雇佣的临时工的工作质量还不如你自己的好。”可皮特先生回答:“我这样做就不合算了。”
皮特先生说出了为什么不合算的理由。他是从经济学中的“机会成本”和“比较优势”两个概念上进行分析的。
首先要知道什么是绝对优势理论?
在很早以前,英国古典经济学的奠基人亚当·斯密提出了贸易理论,即各国以生产成本的绝对差异为基础,发挥各自的优势进行国际分工,并通过自由贸易增进共同利益的国际贸易理论,这就是绝对优势理论。作为厨师的皮特清楚地知道时间概念,他如果自己花费1小时的时间整理家务,那么从事厨师的时间就会耽误了1小时。其实不论你去做家务,还是去做厨师所花费的时间都是一样的,同样的1小时,就看哪个能给你带来更多的利益。
皮特先生和临时工同做一件工作的机会成本大小进行比较,这就是比较优势。我们来具体地分析一下,同做一件家务,就按皮特先生的效率要比临时工的高来计算,皮特先生花费1小时能够清理好家务,而临时工需要1.5小时,也就是说皮特先生在做家务方面占有绝对优势。我们再看皮特先生做厨师的利益所得,假如他每小时的工钱是50美元,临时工若是不到皮特先生家里做临时工,而是到一些餐厅打工,他们只能做一些简单的杂务,每小时的工钱也就是10美元。那么,皮特先生做1小时的家务,就要放弃1小时当厨师的收入,即50美元,即皮特先生的机会成本为50美元。而临时工做1.5小时的家务就要放弃到其他餐厅里的1.5小时的工作收入,即15美元,即临时工做同样家务的机会成本为15美元。
从上面的分析计算来看,做同一个家务,皮特先生若是自己做就需要50美元的机会成本,临时工却只需15美元的机会成本就够了。由此可见,机会成本小的临时工才有比较优势,也就是在做家务上请临时工比皮特先生自己做要有比较优势。
在现代的市场经济中,无论是个人与个人之间的贸易,还是国家与国家之间的国际贸易,都不存在绝对优势,只有比较优势。在1小时家务这个例子中,如果皮特先生是以低于50美元而高于10美元的价格雇佣临时工做家务,就能让皮特先生和临时工都能从中获得自己的利益,即工钱利益。如果皮特先生雇佣临时工做1.5小时的家务,每小时工钱15美元,1.5小时合计22.5美元。这样,皮特先生就能多用1小时的时间去做厨师,即能赚50美元,除了支付临时工的22.5美元之外,他还能剩下27.5美元。相反,临时工在其他餐厅打工每小时比这要少赚5美元,1.5小时就能多赚7.5美元。
从上述工资利益来看,他们先从事自己比较有优势的事情,然后又相互交换,使双方的收入都得到了增加。从这一原则出发,我们就容易理解皮特先生为什么不自己做家务,而是请临时工来帮忙了。
贸易是双方互通有无,这是大多数人对贸易的理解,他们都认为强势的一方在贸易中总是欺负弱势的一方,而弱势的一方在贸易中一定处于劣势。但事实上,这样的看法是错误的,并不科学。在贸易中强势的一方尽管生产率高,工作效率高,有绝对优势,但它也并不是完美无缺的,虽然弱势的一方生产率低,工作效率低,没有绝对优势,但从不同角度上去分析它都能找到自己的比较优势。
齐国的大将田忌很喜欢赛马,有一次,他和齐威王约定,要进行一场比赛。他们商量好,把各自的马分成上、中、下三等。比赛的时候,要上马对上马,中马对中马,下马对下马。由于齐威王每个等级的马都比田忌的马强得多,所以比赛了几次,田忌都失败了。田忌觉得很扫兴,比赛还没有结束,就垂头丧气地离开赛马场,这时,田忌抬头一看,人群中有个人,原来是自己的好朋友孙膑。孙膑招呼田忌过来,拍着他的肩膀说:“我刚才看了赛马,威王的马比你的马快不了多少呀。”孙膑还没有说完,田忌瞪了他一眼:“想不到你也来挖苦我!”孙膑说:“我不是挖苦你,我是说你再同他赛一次,我有办法准能让你赢了他。”田忌疑惑地看着孙膑:“你是说另换一匹马来?”孙膑摇摇头说:“一匹马也不需要更换。”田忌毫无信心地说:“那还不是照样得输!”孙膑胸有成竹地说:“你就按照我的安排办事吧。”
齐威王屡战屡胜,正在得意扬扬地夸耀自己的马匹的时候,看见田忌陪着孙膑迎面走来,便站起来讥讽地说:“怎么,莫非你还不服气?”田忌说:“当然不服气,咱们再赛一次!”说着,“哗啦”一声,把一大堆银钱倒在桌子上,作为他下的赌钱。齐威王一看,心里暗暗发笑,于是吩咐手下,把前几次赢得的银钱全部抬来,另外又加了一千两黄金,也放在桌子上。齐威王轻蔑地说:“那就开始吧!”一声锣响,比赛开始了。孙膑先以下等马对齐威王的上等马,第一局田忌输了。齐威王站起来说:“想不到赫赫有名的孙膑先生,竟然想出这样拙劣的对策。”孙膑不去理他。接着进行第二场比赛。孙膑拿上等马对齐威王的中等马,获胜了一局。齐威王有点慌乱了。第三局比赛,孙膑拿中等马对齐威王的下等马,又战胜了一局。这下,齐威王目瞪口呆。比赛的结果是三局两胜,田忌赢了齐威王。还是同样的马匹,由于调换一下比赛的出场顺序,发挥了比较优势,就得到转败为胜的结果。
绝对优势和比较优势是两个不同的概念,在贸易的过程中双方都不会有绝对的生产优势,只能说有自己的比较优势。贸易所创造的利益是双方的,不会只属于某一个方面,这就是现在经济的全球化,让世界的各个国家都能得到基本的利益。
要点回顾
比较优势理论在加速社会经济发展方面所起的作用是不容置疑的。它对国际贸易理论的最大贡献是,首次为自由贸易提供了有力证据,并从劳动生产率差异的角度成功地解释了国际贸易发生的一个重要起因。直到今天,这一理论仍然是许多国家,尤其是发展中国家制定对外经济贸易战略的理论依据。
囚徒困境:见到绝对劣势就放弃
两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己的最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外的因素(出卖同伙会受到报复等),而无法完全以执法者所设立的利益(刑期)作考量。
一天,警察抓获了两个重要的嫌疑犯,但他们并没有掌握实实在在的证据,没办法量刑,嫌疑犯将只受到很轻的惩罚。所以,聪明的警察想出了一个很好的办法,在审讯的时候将两个人犯分离,然后分别对每个人进行审讯。这个小故事其实也是一个经典的经济学悖论。
我们来看一下警察是怎么对这两个犯人说的。
警察告诉罪犯:你承认罪行,而你的同伙沉默,那么你将马上获得自由,他将被判10年监禁,同样道理,如果你的同伙认罪,而你保持沉默,那你将被判10年,他将自由;如果你们两个人都认罪,那你们两个人将被判5年监禁;如果你们都沉默,你们每个人只会坐1年牢,原因是证据不足。
我们仔细想一下就会发现,这两个嫌疑犯可能面临的监禁分别是10年、5年、1年和0年。从犯人的角度来说,没有一个人愿意生活在10年的漫漫铁窗生涯中,他们都希望马上自由。但是,获得自由的关键是两个人一起做出选择后的结果,即需要两人共同来达成:因为每个人最终的刑期并不是由他自己决定的。我们自己也可以设身处地,将自己置于嫌疑犯的角度去考虑,这时我们就会发现其中有许多奥妙,同时还能体会到有关人性的问题。
在现实中,经济学家只会从事件的发展中寻找蕴藏的“博弈论”原理。经济学理论普遍认为,利益的最大化是市场中的每一个个体都希望得到的。然而,我们众所周知一句老话“无商不奸”,生意场上的人都是非常精明的,都希望利益最大化。站在嫌疑犯A的角度考虑当然希望自己“坦白从宽”,而B“抗拒从严”,可是B肯定也会这么想。退而求其次这是多年的“社会经验”,刑期最短的就是1年,这是最好的选择,但这需要两个人都得沉默,这样做也是冒了极大的风险(因为B有可能会招供)。一般来说,两个人都会决定自己招供,这样就避开了10年牢狱,最多也就是坐5年牢,也就避开了去奢求一年的指望而带来10年的痛苦。
“两人共坐5年牢”的结果,在博弈论中被称为“纳什均衡”。它的定义如下:
如果有几个局中人参与博弈,并给这些人提供一定的策略条件,所有人都会选择自己的最优策略,充分使自己的效用最大化,这就让所有人形成了一个策略组合。纳什均衡由所有参与人的最优策略组成,并且在给定其他人策略的情况下,没有人有足够的理由来打破这种均衡。在面对牢狱之苦的恐惧中,两名嫌疑犯都希望自己所得到的刑期是最短的,他们也都知道对方将要采取的策略(其他人的策略已经给定),结果产生了一种均衡,这种均衡是他们中任何一名嫌疑犯都无力打破的。这一经典的案例被称之为“囚徒困境”,后来也被作为博弈论的重要课题之一,正是这一论断的出现使人们彻底改变了对市场和竞争的看法。
前边所说的“纳什均衡”中的纳什是一个天才的数学家,在经济博弈论领域,他提出的“纳什均衡”在非合作博弈理论中起着核心作用,直到今天,这一概念依然是博弈论的研究基础。而纳什是划时代的贡献者,他患有精神分裂症,坚定的毅力使他战胜了病魔,并坚持研究他的博弈论,取得了举世瞩目的成果。
“囚徒困境”在我们眼中看来并不是一个最佳的结果。然而,它的存在与西方经济学理论却是非常符合的。亚当·斯密被誉为经济学圣人,在他的《国富论》中有句名言:“一个人通过追求自身利益,常常会比他实际上想做的那样能更有效地促进每天学点经济学社会利益。”这是一个意味深长的话题!对我们来说,在市场经济的竞争中,所有参与者都从利己的目的出发,而最终全社会将达到利他的效果。简单来说,就是“人人都为自己好,社会就会变更好”。但是“囚徒困境”却对斯密的这一说法提出了有力挑战:对两个嫌疑犯来说,在斯密精神的指导下完全为了自己好,但大家却都不是最好的。1年监禁这一最有利的结果没有出现,两个囚徒损人而不利己,而以此为题的悖论也就出现了。实际上,从一定的意义上来说,西方经济学的基础也正是因这个悖论的出现而动摇了。如果在“囚徒困境”中,嫌疑犯之间通过一定手段相互串供(经济学上要文雅一些,称之为“合作”),这样就能让他们得到最好的利益;从另一个角度来考虑,同伴如果很讲意气,他们首先替对方着想时,也能共同获得最短时间的监禁。这样一来,案件的发展就变得深刻了:当我们每个人都为自己的利益而为之,那么最终会导致所有人的不利,唯有大家一起合作,保证多人获得最大的利益,形成所谓的“双赢局面”——但这个结论不是简简单单就能做到的,它本身蕴涵着人性的本质,这就决定它的困难性。
如果在真实的生活中将“囚徒困境”和“纳什均衡”运用开来,那么在社会、经济、政治、管理和日常生活的各个方面,存在的司空见惯的博弈现象就会展现在我们面前。
当我们走进各大商场,就会经常遇到各种各样的家电价格大战,电视、电脑、手机……无一不疯狂甩卖,以期占据市场。消费者也从中受益,但从另一个角度看,厂家价格大战的结局却往往构成一个“纳什均衡”。
正如上面所说,它就像“囚徒困境”的结果,损人而不利己,最终谁都没有钱赚,甚至还濒临破产。
因此,价格战对厂商而言无疑意味着自己扼杀了自己的生命。所以正确的解决方法应该是厂商采取合作的态度,共同建立行业协会等方式避免这种没有意义的价格大战。
案例“囚徒困境”对我国的“环境污染问题”也有很好的适用性。现如今,很多企业很清楚环境污染的危害,但他们在利益的诱惑下不愿意解决这个问题,甚至在很多情况下被迫放弃污染治理。这都有着它们形成的先决条件。如果政府没有严格的管制,让所有企业都去追求利润的最大化,这一定会以牺牲环境为代价而换取一时的利益收获。如果有一部分企业家有清醒的头脑,能看到未来的危机,并自愿投资治理污染,那么他的生产成本一定会增加,使产品在市场上的价格有所提高,最终会因成本高、价格昂贵,而失去在市场上的竞争力,导致破产。也是这一先决条件让所有的企业最终都会进入“纳什均衡”状态。长期以来,我国乡镇企业因为盲目发展和扩大生产规模都造成了严重的环境污染,也是属于这种情况。所有参与人都清楚,从长远上看,这种“纳什均衡”是非常有害的,它必将导致个人、企业,乃至整个国家陷入“囚徒困境”的陷阱。但在政府加强了污染管制后,企业都投入了成本以有效降低污染,他们都在“治污”上采取了合作的姿态,转变了有害的结果,并获得了与高污染时期同样的利润,环境也因此而得到改善。
要点回顾
每个参与者都是利己的,即都寻求最大自身利益,而不关心另一个参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己的意愿选择策略。
笼中猪博弈:多劳不一定多得
一头大猪和一头小猪,踩踏板的猪会把猪食弄下来,可是先吃到猪食的却是别的猪。
假设猪圈里有两头猪:一头大猪,一头小猪。由于猪圈被建造得很长,在猪圈的一端是饲料的出口和猪食槽,另一端安装有一个踏板,用来控制猪食的供应。猪每踩一下踏板,猪圈另一端的猪食槽就会有10个单位的食物落下,供两头猪食用。
但是当猪在踩踏板后再跑到食槽这端,这段路程需要消耗相当于2个单位饲料所带来的能量。并且由于踏板离猪食槽比较远,踩踏板的猪与另一头猪相比要晚到猪食槽前,从而它吃食的数量也会减少。
假设两头猪一同去踩踏板,然后再一起跑到猪食槽前吃食,那么,大猪就会吃到7个单位的猪食,小猪则会吃到3个单位的猪食,把从踏板到猪食槽中间的劳动耗费各减去2个单位,大猪净得5个单位猪食,而小猪仅获得1个单位的猪食。
如果大猪去另一端踩踏板,小猪在另一端的猪食槽前等着先吃,大猪赶过去后再吃,大猪会吃到6个单位的猪食,小猪会吃到4个单位猪食。将大猪去踩踏板路途中付出的劳动耗费2个单位减掉,大猪净得4个单位猪食,小猪由于没有去踩踏板,也就没有劳动耗费,实得仍是4个单位的猪食。
如果小猪去踩踏板,大猪在另一端的猪食槽前等着先吃,小猪在踩完踏板后再赶过去吃,由于大猪先吃,会吃掉9个单位的猪食,而小猪只能吃到1个单位的猪食,将踩踏板所消耗的2个单位的猪食再减去,小猪反而要净亏损1个单位,即实得-1个单位猪食。
如果两头猪都不去踩蹋板,其结果是谁都没有猪食可吃。两头猪的所得均是0。那么,这两头猪分别会采取怎样的策略呢?
可想而知,对小猪来说,它当然要采取“搭便车”的策略,也就是舒舒服服地等在猪食槽边。因为在它看来,无论大猪会不会去踩踏板,自己不踩踏板总是最佳选择。
反观大猪,大猪知道由于小猪有等待这个占优策略,即小猪是不会去踩踏板的。
大猪此时如果选择等待,则一份猪食也得不到;如果选择踩踏板还将会得到4个单位的猪食,所以,对大猪来说,等待就是它的劣势策略,自己亲自去踩踏板总比不踩强,只好亲力亲为,不知疲倦地奔忙于踏板和食槽之间。
这在博弈论中被称为著名的智猪博弈。
从上面的故事中,我们了解到智猪博弈是一个“多劳并不多得,少劳也不少得”的均衡。它的结论是,处在一个双方公平、公正、合理和共享竞争资源的环境中,有时占优势的一方最终得到的结果却有悖于他的初始理性。这种情况在经济生活中也比比皆是。很多人都想争着做那只坐享其成的小猪,只想以最小的付出得到最大的回报。
例如,某种新产品刚刚上市,其性能和功用还不被人所熟识,在其推广的过程中,也只有生产能力和销售能力都比较强的大企业才会花费大量的资金进行铺天盖地的产品介绍活动和广告轰炸,而中小企业却不会这么做。出现这一结果的原因与智猪博弈的故事有着相同的道理。
大企业正是故事中提到的“大猪”,而中小企业则是故事中提到的“小猪”。作为“小猪”的中小企业完全没有必要做出头鸟,自己投入大量资本做产品宣传,而只要跟随在“大猪”(大企业)的后面,待大企业的广告宣传为新产品打开销路,并逐步形成市场后,这时,和大企业相类似的产品也会顺利销售,更能赚取一定的利润。这也是为什么占有大部分资源者要承担更多义务的原因所在。
很多生产保健品的公司也存在这种现象,当某家大公司研发出一种养生保健品,并通过宣传得到大家的认可后,一些小公司也会在最短的时间内推出一种与之功能类似的养生保健品,其结果同样会有好的收益。对没有办法与强者抗衡的中小企业而言,可以选择等待为最佳策略。
对大企业而言,当小企业不断地发展壮大在竞争中确实对自己构成了一定的威胁时,大企业就要采取有力的措施。例如生产相似的产品,大企业以超低的价格卖给消费者,而小企业却接受不了这样的价格,可想而知,小企业将面临着怎样的危机。这时小企业的领导就会清楚地知道,他们在什么样的规模水平之下才是可以被大公司容忍的,否则就会招致大公司强有力的甚至是摧毁性的回击。
在社会的经济体系中,存在着很多实力不同的公司,有实力雄厚的大公司,也有力求先生存而后发展的中小企业,对同一行业却实力不同的投资者来说,怎样做好“小猪”,或者如何避免成为“大猪”都应该成为企业在运作过程中要高度重视的问题。
要点回顾
高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。
格雷欣法则:劣币驱逐良币
16世纪英国伊丽莎白铸币局局长托马斯·格雷欣(Thomas Gresham)通过观察提出:消费者保留储存成色高的货币(undebased money)(贵金属含量高),使用成色低的货币(debased money)进行市场交易、流通。此后,这个定理也被广泛用于非经济学的层面。
在铸币时代,当那些低于法定重量或成色的铸币——“劣币”进入流通领域之后,人们就倾向于将那些足值货币——“良币”收藏起来。最后,良币将被驱逐,市场上流通的就只剩下劣币了。
在一个繁华的都市中,有两个做面包加工的师傅,他们的店面分别安在了城南和城北最繁华的地段,除了自己负责加工外,还负责销售。第一位师傅做的面包不仅松软香甜,而且馅料又多,可称得上是美味。其价位也很合适,对顾客更是童叟无欺;而另一位面包师傅,卖的面包不仅馅料少得可怜,而且又干又硬,还经常缺斤短两,有时甚至在天黑以后,还会把变质的面包卖给顾客,但价格却比第一位师傅便宜了近一半。对顾客来说,哪一家的面包才能成为他们选购的对象呢?如果是知道真相的人,或许他们会异口同声地回答,第一位师傅的面包肯定会大卖。其实,事实上却并非如此,为什么呢?这就要引出格雷欣法则。
格雷欣法则也被称为格雷欣定律,它是一条经济法则,也称劣币驱逐良币规律,可以解释为:在双本位货币制度的情况下,两种货币同时流通时,如果其中之一发生贬值,其实际价值相对低于另一种货币的价值,而实际价值高于法定价值的“良币”将被普遍收藏起来,以至于会渐渐地从市场上消失,最终被彻底地驱逐出流通领域,实际价值低于法定价值的“劣币”将会在市场上泛滥成灾。
在我们的生活中,或许大部分人都有过这样的经历,当自己钱包内的钱既有新币又有旧钱币时,可能大家都十分愿意先把旧钱花出去,而留下“新票”。道理很简单,就是出于对新钱的偏爱,这种偏爱正是格雷欣法则的萌芽。
格雷欣法则是以托马斯·格雷欣爵士(1519年-1579年)的姓氏命名的。格雷欣是英国著名的金融家、慈善家,皇家证券交易所及格雷欣学院正是由他创建的,他对货币与交易方面的事宜有着独到的见解,因此被英国女王伊丽莎白一世聘请为改革货币制度的顾问。自从1558年格雷欣提出了这个法则之后,他就变成了货币史上的风云人物。
自从人类给金银以一定的币值时,格雷欣法则就开始发挥其作用了。从古罗马时代开始,人们就习惯性地从金银钱币上切下一角,这就意味着在货币充当买卖媒介的时候,货币的价值含量降低了。当古罗马人渐渐地发现货币的质量越来越轻,并且知道了货币变轻的真相时,就会将足值的金银货币积存起来,而专门使用那些不足值的货币。时间一长,那些坏钱自然而然地就把好钱从流通领域里给排挤出去。为了使这种现象得到控制,政府发行了带锯齿的货币,每枚足值货币的边缘都有一个细小的沟槽。如果是货币边缘的沟槽被锉平了,那么,这枚货币就很可能被别人动过手脚。
就拿金银币来说,金银的开采成本和市场供求之间并非完全同步变化的,因此当金相对于银而言更加贵重时,人们必然就会对更具价值的金进行储存而使用相对价值不高的银,因为在交换时是用法定比价而非实际比价来计算的。若银和金相比,银更贵重时,那么金就变成了劣币,而银就成了良币。
当进入了纸币的流通时代之后,货币的不足值性就愈发变得清晰了,国家也必须用更强有力的手段来杜绝假币的出现。与此同时,一部分学者对格雷欣法则也有了一些质疑。
这个问题的根源就是劣币驱逐良币并不是在竞争的前提条件下产生的。每一套货币的发行都是由国家强制人民来接受的,尽管付款的一方十分乐意使用劣币,可收款的一方却不会心甘情愿地接受,只有在国家能够确保收款方接受的劣币能继续流通时,劣币才能够得以继续存在,而这条规律才能够继续起到一定的作用。
也就是说,一个国家如果滥用发行货币的权力,通过“劣币驱良币”的手段来抢夺民间财富,这个过程就可以说成是政府在消费自己信誉的过程。
当这个消费过程达到一定极限时,民众也有可能会拒绝接受这种货币,通过自由的选择使货币自发地建立起一个新规则。
格雷欣定律在货币、金融领域内是十分著名的定律,不仅如此,在商业领域内也具有一定的泛化倾向,就像本文开头所讲的卖面包的例子。至此,人们就用这一法则来泛指价值不高的东西会把价值较高的东西挤出流通领域,这主要指的是假冒伪劣产品通过很多渠道向正牌商品挑战,并且具有膨胀、蔓延的趋势。例如在软件市场上,当一些经济秩序和相关的法规约束还不完善时,或不能很好地协调工作时,盗版软件就会对正版软件的制作、销售等起到一定的影响和冲击,从而对软件业的健康发展产生危害。这种趋势雷同于“劣币驱逐良币”,可叫作“盗版驱逐正版”,这是一种非正常的市场状态。
不仅经济领域如此,在其他社会领域上,这种现象也比比皆是。
要点回顾
一个健康的社会里,应该有一个良好的秩序和约束体制,禁止出现劣币和良币之分,这样才能杜绝劣币驱逐良币的现象发生。
位置博弈:人以群分,物以类聚
只要条件允许,商家都会选择“扎堆”经营,选择“相依为邻”,我们可以把这种现象看成是由公正的市场竞争形成的合理结果,这就是许多商业中心形成的原因,在博弈论里叫作位置博弈。
如果任何一个地段的地理位置及各方面条件都一样,那么,没有任何一个商家会把自己安置在某条路的一头或其他偏僻的地方。
我们经常会看到,在城市各种各样的街道上,总是有一些地段上的商店非常拥挤,形成一个繁荣的商业中心区;而另外一些地段却很冷清,没几家商业店铺,就像大家都挤在同一个地方“扎堆”做生意一样。更有意思的是,做相同或相近类型生意的商家常常会离得更近,比如卖服装的和卖服装的离得最近,而卖菜的和卖菜的却总是近邻,就像我们常常看到的那样:肯德基和麦当劳总是如影随形。还有人观察到,一条街上如果有两三家超市,那么,这几家超市往往“彼此为邻”,如果它们能稍微分散地布置于街上,肯定会为市民购物提供很大的便利。但是他们还是宁愿挤在一起,哪怕资源浪费也在所不惜。
位置博弈理论可以用一个简单的博弈模型来解释。
假设,有一条笔直的公路连接着A市与B市之间的交通,每天都有许多车辆在这条公路上行驶,而且车流量在公路上是均匀分布的。如果有A、B两家快餐店,它们都要在这条公路上选择一个位置开店。一般来说,司机总愿意到离自己最近的快餐店买食物。按照这样的原则,从资源的最佳配置角度上来看,两家快餐店应当分别开在1/4和3/4的地方是最优的。在这种均匀散布的情况下,任何一家快餐店都会拥有一半的顾客量,同时对开车的人而言,车辆到快餐店的总距离是最短的。这是一个对大家都好的最佳方案。
不过,这两家快餐店都十分精明,只要它们的手段合法,总是希望自己的生意红火,至于别人生意的好坏则和自己无关。从经济学角度来讲,它们的行为是具有经济理性的。出于此种理性,其中一家分店的负责人在选址时必然会想到:我如果把店铺从3/4的地方向左移一点,则1/4点之间的中点就不再是1/2点处,而是在1/2点的靠左边一点。也就是说,一旦这样移位,这家就会夺取另一家的部分顾客,对其单方面而言这肯定是一个很好的主意。当然,另一家也不甘示弱,它自然也会想到把自己的店铺由1/4点处向右移动,以此来争取更多的顾客。
可想而知,这样一来,双方博弈的结果就是将店铺设在1/2中点附近,达到纳什均衡状态,它们不仅紧挨着,而且相安无事地做生意。
我们如果将条件放宽,并非两家快餐店而是许多家快餐店,就极易分析并得出结果,这些快餐店依旧会在1/2的地方设店以达到纳什均衡。也就是说,更多的快餐店会在这个1/2的“宝地”开门营业,那么,“聚居”的结果就是形成一个“快餐街”甚至“快餐城”。
同样的道理,超市、服装城、鞋城及其他所有类型的商家,都有可能以这样的博弈而聚居在一起,形成富有特色的商业中心。
美国加利福尼亚葡萄酒产业集群就是一个典型的例子。它包括了680家葡萄酒酿造厂和几千位葡萄种植业主。此外,支持葡萄酒生产与种植的企业也很多,包括葡萄储存、灌溉收割设备、桶与标签等的供应者,以及数量庞大的葡萄酒出版物等。
再看看意大利皮具、时装聚集区,这个聚集区包括著名的鞋业公司,比如费拉加摩公司与古奇公司,以及许多专业化的鞋类配件、机器、模子、设计服务公司等。它是由多条相互联系的产业链组成的,形成了一个十分完善的结构。实际上,在中国的许多地区也开始形成了这样的经济聚集区,较为有名的有广东中山小榄的音响产业集群、山东寿光的蔬菜批发市场、浙江绍兴的纺织产业群、浙江义乌的小商品市场等。可以说,这些聚集区的兴起已成为中国经济的一大亮点。
要点回顾
位置博弈充分利用了对手选择策略的思考,从而省去了很多选址的精力,是一种搭便车理论,在社会上的实例随处可见。
猎鹿博弈:不要一个人战斗
古代两个猎人,单干只能打到兔子,合作能猎到鹿,因此只有合作才能获得最大的利益。
两个猎人自己单独行动,得到的结果是最不利的,我们要学会与他人合作,不能单独战斗,因为一个人的力量与团队的力量相比是有限的。从社会学中我们知道,在处于人类文明之初的原始社会,人们生存的主要方式就是狩猎。博弈论中有一个著名的“猎鹿模型”说的就是两个猎人一起猎鹿的故事。
有一天,村庄里的两个猎人在一起去狩猎的途中,发现了一只梅花鹿。于是两人商量对策,商量的结果是:只有他们俩齐心协力,共同对付这只鹿时,才能得到它。如果猎鹿的时候突然有一只兔子从他们其中一人的身边蹿过,而这个人转身去抓兔子,这人就会得到兔子,但鹿也就因此被吓跑了。两人共同得到一只鹿的效用与分别得到一只兔子的效用相比要大得多。从中我们可以看出一共有4种方案供选择,每一行都代表一种博弈的结果:
第一行,猎人甲和乙都去抓兔子,结果是猎人甲和乙都能吃饱4天;第二行,猎人甲去抓兔子,猎人乙去猎梅花鹿,结果是猎人甲可以吃饱4天,乙则一无所获;第三行,猎人甲去猎梅花鹿,猎人乙去抓兔子,结果是猎人甲一无所获,猎人乙可以吃饱4天;第四行,猎人甲和乙共同合作抓捕梅花鹿,结果是两人平分猎物,都可以吃饱10天。
(1)如果双方都把猎鹿作为选择的对象,其效用为1,(猎鹿,猎鹿)具有帕累托最优,是深入合作的最佳结果。
(2)如果双方都选择了猎兔,即双方没有合作,(猎兔,猎兔)称为风险上策均衡。
(3)如果其中的一人选择了猎鹿,而对方则把猎兔作为选择目标,即对方不守信用,背叛了原来的协议。那么,选择猎鹿者将一无所获,选择猎兔者将保证得到一定效用。
从以上的分析中,我们可以看到,在这个博弈里,根据纳什均衡原理,应用博弈论中的“严格劣势删除法”,最终,有两个结论对他们来说是比较好的:要么分别打兔子,每人吃饱4天;要么合作,每人吃饱10天。当然人的思想充满了变数,到底哪一种策略最终会被采取就不是纳什均衡所能决定的了,比较[1,1]和[X,X]两个纳什均衡,显而易见的是,两人共同去猎捕梅花鹿比分别去抓兔子可以让每个人多吃6天。从经济学的角度来看,合作猎鹿的纳什均衡比分头抓打兔子的纳什均衡具有帕累托优势。与[X,X]相比,[1,1]不仅有整体福利改进,而且每个人都得到福利改进。
对平常人而言,学会与别人合作,可以相互取长补短,互相协助朝着一个目标使劲,最大地实现大家的价值。
对领导来说,他不只是下属的领导,他们之间更重要的是合作,只有在下属的配合下才能完成重大的任务,对于下属力所不及的事情,领导要协助、指导其努力完成。合作出金,这也是企业的成功之路。
对企业而言,企业与企业之间通过合作经营,形成资源共享的机制,才能在激烈的竞争中立于不败之地。
对国家而言,形成战略合作伙伴关系,才能时刻洞悉世界的瞬息万变,实现民族的崛起和国家的富强。
在生活中,合作的重要性举不胜举,然而可惜的是对于这一点,还是有很多人认识不到,仍然将“自立自强”的品质形而上学起来。坚持地认为只有自己亲自动手才能成功,其结局往往是一败涂地。
正如我们所熟知的火箭队,其中让人佩服的明星数不胜数,例如麦蒂。2007年,在季后赛首轮迎战爵士之前,麦蒂曾发表过著名宣言——“一切看我的!”不过最后的结果却是爵士连赢7场系列赛。
当然,对于当年的失误,无数的冷言冷语纷纷向麦蒂袭来。然而,对于无数球迷的嘲讽,麦蒂却显得异常冷静,他在讲话中说:“我没办法控制它,我只能用行动来回答那些问题,我会做我该做的,球迷的嘲讽影响不了我,当我年轻时或许会有点恼火,但是现在在江湖上,我已经闯荡很久了。”
在2008年开赛前,麦蒂的言行已有所改变,这次,他真正意识到了团体,他说,“这是一项团体运动。”“我们要像一支球队那样去比赛、去竞争。我不是一个人,这就是我要和大家说的,不要让我一个人战斗。”
麦蒂的球技很糟吗?答案是否定的,没有人会认为他的球打得不好,但是个人英雄的形势似乎并没有起到什么作用。
一个人的战斗是很难取胜的,战争一旦开始,我们不仅需要有强大的后勤支援,还需要有人提供各种设备等。在生活中,我们更离不开朋友、家人甚至是陌生人的帮助,在你意志低落的时候,很可能别人的一个眼神都可以给予你极大的鼓励。我们都是社会中的人,如果只是单独的存在可能什么都做不了,更何况是生存,千万不要认为自己什么都能做,想着一个人能解决所有的问题,因为你不是万能的神。
我们每个人都是社会的成员,社会的发展需要大家一起努力,共同推进社会的进步。没有人能主宰世界,我们只有团结起来才能发挥更大的力量,共同创造世界的辉煌。一个企业要想在市场中打开一片属于自己的天地,就必须团结公司成员的力量,开拓创新,与时俱进,这样,这个公司才会不断地发展、不断地壮大。团结的力量就显而易见了。
如今是市场经济时代,市场经济属于广泛的交往经济,这就需要与形形色色的人进行合作;如今是竞争的时代,只有通过合作才有能力成为市场上的佼佼者;如今更是全球一体化的时代,要走向国际,就需要高超的合作能力,没有合作能力,想适应这个时代谈何容易。只有善于与别人合作,也乐于与别人合作,才能成为优秀的成功者,也只有这样才使得他们发挥出千百倍于自己的能量,干出一番伟大的事业。
1904年夏天,世界博览会即将在美国的路易斯安那州举行,在博览会举行的前夕,一个制作糕点的小商贩向政府申请想在会议期间设摊营业。幸运的是,他的申请得到政府的允许并要求他在会场的外面出售薄饼。几天下来,他的薄饼生意实在是坏透了。而和他相邻的一位卖冰激凌的商贩的生意却火得不得了,在很短的时间内,他就卖出了许多冰激凌。就这样,他用来装冰激凌的小碟子很快就不够用了。
这可怎么办?卖薄饼的商贩有一副热心肠,他见状后,就把自己的薄饼卷成锥形,递给他,让它来盛放冰激凌。卖冰激凌的商贩看到这个方法不错,于是,向他订购了大量的薄饼,很多的锥形冰激凌便进入客商们的手中。出乎他们意料的是,客商们对这种锥形的冰激凌十分看好,而且被评为“世界博览会的真正明星”。从此,这种锥形冰激凌受到了大家的青睐,这就是现在的蛋卷冰激凌。它的发明被人们称为“神来之笔”。有的人还作了这样的假设,如果两个商铺不是相邻的,或许今天我们能不能吃上蛋卷冰激凌都是个未知数。
两个小商贩的简单合作,不仅达到了共赢,而且还为我们的世界创造了如此美味的经典。我们是否也应对自己进行一下反思呢?自己是否也和很多只要合作就可以创造奇迹的机会擦肩而过呢?一个人的能力和时间都是有限的,凡事靠自己、完全不用别人帮助的人是不会走很远的。一根筷子折断十分容易,一棵树木也构不成森林。只有学会与他人合作,才能将自己的力量千百倍地放大,就像杠杆一样,撬动磐石。
如今是广泛合作的时代,我们唯有适应时代的要求。“三个臭皮匠,顶个诸葛亮。”这句俗语充分地说明:只有运用合力,善于合作,才有强大的力量,从而把事业做大、做强。这就迫切需要我们每个人在工作、事业中都应具备协调、协作能力。
要点回顾
一个人做事情所影响的范围十分有限,一个人能调动的资源也屈指可数。要想干出一番大事业,就要学会与人合作。
酒吧问题:历史会骗人
这是美国人阿瑟教授提出的,用来否定经济主体或行动者(agents)的行动是建立在演绎推理基础之上的一个有趣的理论。
酒吧问题是指每个周末都想去酒吧活动的客人,因为大家都觉得当日酒吧会爆满,因而有大部分人选择留在家里,所以使酒吧因没人光顾而留有大量空位。该理论表明,做出正确预测的方法是要先知道其他人是如何做出预测的,再决定自己的选择。
酒吧问题是美国著名经济学家阿瑟教授于1994年提出的。基本模型是:假设有100个人都非常喜欢泡酒吧,每个周末这些人都要决定是去酒吧还是待在家里。但是酒吧的座位是有限的,如果去的人多了,在酒吧里的人就会感到不舒服。这个时候,就会有许多人选择留在家里,因为他们留在家里要比去酒吧更舒服些。
假定酒吧的座位是60个,如果有人预测去酒吧的人多于60个,那么他就会选择不去;相反就去。那么,这100个人该如何做出去还是不去的选择呢?此博弈的前提条件做了限制,即每个参与者面临的信息仅仅是过去去酒吧的人数,所以他们只能依据过去的历史数据,归纳出这次行动的策略。他们没有别的信息可以参考,更没有信息可以交流。
也就是说,如果大多数人预测去酒吧的人数大于60,做出不去的决定,则酒吧里的人就会非常少,此时他们的预测就错了。反之,若大多数人预测去酒吧的人数少于60,做出去的决定,那么酒吧里的人就会非常多,此时他们的预测也是不对的。
所以,正确的预测应当是知道别人是怎样预测的。但是,去不去酒吧的预测却完全是凭借自己的经验和判断。在此问题中,每一个人在预测时所面临的信息来源都是相同的,只是以前的历史数据或是自己以往的经验,而每个人又都没有办法知道其他人是怎样做出预测的,所以,基本上不存在正确的预测,因为这些经验其实根本没有用。
有趣的是,阿瑟教授在现实和计算机模拟的两种实验中,却得到了两个两个完全相反的结果。
在现实实验里,实验对象的预测呈现出规律的波浪状形态。尽管不同的博弈者采用了不同的策略,可其中共同点在于这些预测都是用归纳法来进行的。我们完全可以将实验的结果视为现实中大部分理性人做出的选择。在该实验里,更多的博弈者是依据上次别人做出的选择而做出此次的预测。但是,这个预测已被实验证实,其在大部分情况下是错误的。在这一层面上说明,此种预测是一个非线性的过程。
在计算机模拟实验里,阿瑟教授却得出了另外一个结果。刚开始,去酒吧的人数并无一个固定的规律,但经过一段时间之后,去和不去的人数之比接近60.40。虽然每个人不会固定地属于去或者不去的人群,可是该系统的这个比例是没有变化的。若将计算机模拟实验视为更全面、更客观,那么其模拟的结果可看做是普遍规律。
其实,如果我们仔细观察,就会发现,在现实生活中,有许多例子和该模型的道理是相通的。比如股票买卖、交通拥挤及足球博彩等问题都是此模型的延伸,这些问题都是“少数人博弈”,都是由选择决定的结果,而与历史数据和经验并没有多少关系。
比如在股票市场上,所有股民都在猜测其他股民的行为,而努力和大部分股民不一样。大部分股民如果都处于卖股票的位置,而你处于买股票的位置,股价低,则你就是赢家。当你是少数卖股票的人之一,大部分人都想买股票,则你持有的股票价格将上涨,你就会获得利润。
现实生活中,股民采用的策略是各种各样的,他们会依据过去的经验来归纳自己的策略。在这种情况下,也可以用少数人博弈来解释股市博弈。
在少数人博弈理论里还有一个特殊的结论,即记忆时间较长的人不一定具有优势。因为若的确有这种方法,那么股市中的人们利用计算机存储的大量股票历史数据来炒股,就必定能赚到钱。但事实上,人们尚未发现这是一个炒股必赢的方法。
城市交通也可以看成是一个“少数人博弈”。现在,城市的道路越来越多、越来越宽,可是交通却越来越拥挤。在这种情况下,司机如何选择行车路线就成了一个复杂的少数人博弈问题。也可以看成司机的选择会决定道路的拥堵或是通畅。
假设在交通高峰期时,司机往往会宁肯多开一段路程选择车不多的路线,也不愿在路近堵车的地段焦急地等待。这时,司机只能依据过去的经验来判断哪条路更好走。当然,每个司机都不愿在堵车的路上行走,所以他们此时都必须要对其他司机的选择进行考虑。
在这里,很多司机经过多次的选择与实践,常常能发现一定的规则,这是过去成功与失败的经验及教训给他们的指引,但这并不一定就是有效的规则。
在此过程中,司机的经验与其个人的性格起着重要的作用。有的司机因为经验丰富,就能够躲开塞车的路段;有的司机因为经验不足,常常无法有效地避开高峰路段;有的司机喜欢冒险,所以会选择短距离的路线;有的司机因为比较保守,所以就会选择有较少塞车且比较远的践线,等等。
这样一来,司机对路线的选择就决定了路线的拥挤程度。
要点回顾
在所有博弈者都有变数和调整的预测中,每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何做出预测,因此所谓正确的预测几乎不可能存在。
零和博弈:自己的幸福建立在他人的痛苦之上
指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
自己的幸福是建立在他人的痛苦之上,二者的大小完全相等,因而双方都想尽一切办法以实现“损人利己”。零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。
有两个经济学家,边在马路上散步,边讨论经济问题。甲经济学家看见了一堆狗屎,思索着对乙经济学家说:“你吃了这堆狗屎吧,我给你100万块钱。”乙经济学家犹豫了一会儿,但还是经受不住诱惑,吃了那堆狗屎,当然,作为条件,甲经济学家给了他100万块钱。过了一会儿,乙经济学家也看见了一堆狗屎,就对甲经济学家说:“你吃了这堆狗屎吧,我也给你100万块钱。”甲经济学家犹豫了一会儿,但还是经受不住诱惑,吃了那堆狗屎。当然,作为条件,乙经济学家把甲给他的100万元钱还了回去。
故事还没有完……
走着走着,乙经济学家忽然缓过神来,对甲说:“不对啊,我们谁也没有挣到钱,却吃了两堆狗屎……”
零和游戏的内容如下:两人对弈,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为-1分。则若A获胜次数为N,B的失败次数必然也为N。若A失败的次数为M,则B获胜的次数必然为M。这样,A的总分为(N-M),B的总分为(M-N),显然(N-M)+(M-N)=0,这就是零和游戏的数学表达式。
零和博弈属于非合作博弈,是指博弈中甲方的收益必然是乙方的损失,即各博弈方得益之和为零。在零和博弈中,各博弈方决策时都以自己的最大利益为目标,结果是既无法实现集体的最大利益,也无法实现个体的最大利益。除非在各博弈方中存在可信性的承诺或可执行的惩罚作保证,否则各博弈方中难以存在合作。
“零和游戏”之所以被广受关注,主要是因为人们发现,在社会的方方面面都有与“零和游戏”类似的局面,胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。这和我们所说的“快乐守恒定律”类似,“有人快乐,就必定有人失落”,也就是“快乐必须要建筑于别人的痛苦之上”。从个人到国度,从政治到经济,似乎无不验证了世界正是一个宏大的“零和游戏”场。世界是一个封闭的体系,财富、资源、机会都是有限的,个别人、个别地域和个别国度财富的增添必定意味着对其他人、其他地域和国度的抢夺,整个社会的利益并不会因此而增加一分。而在这个过程中的赢和输是相互消长的,也就是你赢的就是别人输的。
要点回顾
在这个合作的年代,到处都讲究双赢,但并不是每一个双赢的愿望都能得到一个美满的答复。合作与竞争的矛盾永远存在着;公平与效率的博弈永远不会在人类社会消亡。
非零和博弈:大家好,才是真的好
非零和博弈是一种合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。
非零和博弈是指博弈中各方的收益或损失的总和不是零值的博弈,处在这种状况时,自己所得并不与他人的所失大小相等,自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。这种理论与“零和游戏”正好相反。
在零和游戏中,游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远为零;非零和游戏则是在游戏中通过一定的条件求得双赢或者共赢,其前提条件就是“相互信任和信息充分沟通”。
20世纪以后,人类在经过了太多这种结果为“零”的博弈之后,“零和游戏”观念正被“双赢”观念所取代。人们已开始认识到,胜与败的结局已不再是几家欢乐几家愁,取而代之的是通过有效合作,双方皆大欢喜的“双赢”局面。
但要想从“零和游戏”走向“双赢”,就要求各方都具有真诚合作的精神和勇气,在合作中不要耍小聪明,不要占别人的小便宜,要遵守游戏规则。否则,“双赢”的局面就不可能出现,最终吃亏的还是合作者自己。
随着时代的进步和观念的改变,人们正逐渐摆脱“零和游戏”原理,朝着“双赢”方向迈进。无论是对个人还是对企业来说,遵循和掌握双赢或多赢法则至关重要。
遵循双赢法则,实际上是要求企业必须树立起这样的观念:要共同向市场要钱,而不是向合作者。任何企业都不可能包打天下,都需要多种合作者。合作可以发挥整体效应,增强你的竞争能力。但要想与人顺利合作,就必须让别人也“赢”才行。只想自己赢,不让别人赢,永远都不会拥有真正的合作伙伴,这样的企业迟早会自食损人利己的恶果。
这个世界正处于“瞎子背跛子”共同前进的多赢时代。“双赢”是一种策略,也是一种艺术。多懂得一些生活中的“双赢术”,在自己获得收益的同时也能给别人带来益处。事物是相互消长、互为因果的。人们常因建设自己而造就别人,又因别人的造就而改变自己。在这种改变中,不能忘记的是它的初始。顽固地坚持自私的利益,只能导致不可逆转的分裂。互相敌对和互相损害意味着共同的失去,而共同努力、共同协作,才能得到共同的好处。
美国时代周刊著名撰稿人罗伯特·赖特在其名著《非零和年代——人类命运的逻辑》中,为全世界展示出一个崭新的视野:人类命运的昌盛必然要懂得从零和年代走向非零和年代。
竞争是市场经济的核心行为,竞争无处不在,关键是怎样去面对竞争和参与竞争。企业间的竞争并非零和游戏,一位参与者的收获,对其他参与者不一定是坏消息。企业之间应该通过建立竞争和合作关系,靠服务社会共同做大市场蛋糕,实现双赢、多赢。一个公平、公正、有效、有序的市场竞争环境,不但有助于行业的可持续发展,而且对整个社会的和谐发展也将产生重要的促进作用。
生物学上有一种“共生”现象,许多不同种类的动物或植物、微生物能够和谐地生活在一起。大海里有一种俗称清道夫的小鱼经常挖出大鱼嘴里的寄生虫和食物碎屑,填饱自己的肚皮。这样一来,清道夫鱼吃饱了,大鱼的嘴也被清理得一干二净。这种双方互惠的关系被称为“互利共生”。而非零和博弈就是一种互利共生。
在信息科技迅猛发展的今天,“竞争”的含义在于“竞”而不是“争”,“竞”是本质,就是学习、追赶的意思。企业之间是这样,国家之间也是如此。
现在,由于人类对资源有了一种全新的认识,特别是一些不可再生资源,如果用完了之后就没有了。所以,现在人类对资源的优化配置的呼声越来越高了。同时,随着经济的发展,经济主体之间的联系越来越紧密,相互依存的关系越加明显。人们传统的观念认为社会充满是竞争的,并且认为竞争的双方除了竞争之外就不可能再有合作的可能。
但是,现在人们的观念开始不断转变,传统的所谓“竞争”社会正逐步迈向相互促进、合作共赢的“竞合”社会。企业与合作伙伴共同发展,已成为一种新的经济运作模式的主导趋势。实际上这种新的经济运作模式体现出一种合作主义,所谓合作主义,就是把市场就是“战场”、市场就是“赌场”的观念变为市场就是“合作场”“双赢场”的观念。一些国际著名企业倡导的不是“我之所得就是你之所失”的零和博弈思想,而是互补和合作的非零和博弈思想。
比如Intel和微软:Intel的技术,即芯片,发展速度越快,微软的新的软件才能运行得越好,同样,微软的软件发展得越好、越先进,Intel的芯片才能真正有用武之地。这就是相互促进的关系。
要点回顾
如果我们不希望自己失败,就一定要帮助别人成功。任何一家企业,只有有竞争对手存在,才会有危机感,而这种危机感正是它不断发展的源泉。
斗鸡博弈:狭路相逢勇者胜
两只公鸡正在战斗,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但这样必然要面对两败俱伤的结果。这就是人们常说的斗鸡博弈。
双方争斗,有两种情形,一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这个人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退。
《博弈思维》中曾举了这样一个例子:一只红公鸡与一只白公鸡在斗鸡场上比斗。这时如果两只公鸡都选择前进,结果是两败俱伤,双方都得-2;如果一只公鸡前进,而另一只公鸡后退,则选择前进的公鸡得1,而选择后退的公鸡得-1;如果两只公鸡都选择后退,则两只公鸡都得-1,但没有两只公鸡都选择前进受到的损失大。
在这里面存在两个纳什均衡点:红公鸡前进,白公鸡后退;或者是白公鸡前进,红公鸡后退。但关键问题是谁前进,谁后退?
如果在某种较量中,只有唯一的一个纳什均衡点,那么其结果就是可以预测的,它们之间唯一的纳什均衡点就是我们预测的结果。但如果在某种较量中存在两个或者两个以上的纳什均衡点,那我们就无法确定会出现哪一个结果。斗鸡博弈就属于后者,我们无法准确预测其结果,不能确定谁前进、谁后退。斗鸡博弈在日常生活中非常普遍。比如,警察与游行者相遇,最好有一方退下来。
再比如,收债人与债务人之间的博弈类似于斗鸡博弈:假如债权人A与债务人B双方实力相当,债权债务关系明确,B欠A100元,金额可协商,若合作达成妥协,A可获90元,减免B债务10元,B可获10元。如一方强硬、一方妥协,则强硬方收益为100元,而妥协方收益为0;如双方强硬,发生暴力冲突,A不但收不回债务还受伤,医疗费用损失100元,则A的收益为-200元,也就是不仅100元债收不回,反而倒贴100元,B则损失了100元。
因此,A、B各有两种战略:妥协或强硬。每一方选择自己最优战略时都假定对方战略给定:若A妥协,则B强硬是最优战略;若B妥协,A强硬将获得更大收益。于是双方都强硬,企图获100的收益,却不曾考虑这一行动会给自己和对方带来负效益100。再比如现在买房,一般工薪阶层常采用的按揭供房,就常使购房者陷入进退两难的斗鸡博弈中。
按揭供房大致是这样一种情况:首先,购房者与开发商之间确定一个房屋购买价,然后开发商、购房者与银行订立一个三方协议,购房者先交给开发商部分首付款(可以是全部购房款的30%或20%),剩余购房款由银行先付给开发商,然后购房者在与银行确定的还款期限内分期将本金和利息还给银行。这是一个三方均得益的方式。
但是,一旦房价或购房者的收入产生波动,就会让购房者陷入一个进退两难的困局之中——当房地产行业出现泡沫,政府强制下调房价,使得房价跌破当初的买入价并看不到上涨的希望时,“房奴”们就面临着继续按揭供房还是停止按揭供房的两难选择:继续按揭,就等于不断地将钱扔进水里,但停止按揭,那以前的房款就等于是打水漂了。
要点回顾
当两个强者在对抗冲突的时候,最要考虑的是如何让自己更占据优势,力争得到最大的收益,而确保损失最小。实际上是实力决定胜负。就算都不后退,是两败俱伤的局势,实力强、力气大的一方的胜算必然大一些。
聚合中文网 阅读好时光 www.juhezwn.com
小提示:漏章、缺章、错字过多试试导航栏右上角的源