取行动。等到彼此发现对方做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期很可能竭力反扑,不过,等到那时,在这个日新月异的世界上说不定已经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。
这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对于第2章讨论的相继行动的博弈,每个参与者不得不向前展望,估计对手的反应,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性的推理链:“假如我这么做,另一个参与者会那么做——若是那样,我会这么反击”,依此类推。
而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”。诀窍在于怎样破解这个循环。
夏洛克·福尔摩斯(Sherlock
Holmes)和他的死对头、罪恶魔头莫里亚蒂(M噢riarty)教授擅长这类推理,对此我们一点都不觉得惊讶。正如福尔摩斯在《最后的问题》里告诉华生(Watson)的:“我要说的其实已经在你的脑海闪过。”他说。
“那么我的答案大概也已经在你的脑海闪过。”我答道。
你就和华生医生一样,大概也在揣摩福尔摩斯怎么未卜先知。听完我们的解释,我们希望你会同意这其实相当简单。
你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你不要把其他参与者的未知行动视做天气那样,具有与个人无关的不确定性。上班之前,《时代》的编辑可能收听天气预报,知道今天下雨的概率是40%,他大概会利用这个信息去决定要不要带一把雨伞去上班。但《新闻
周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外一回事。
区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟《时代》的编辑自己一样。①
即便一个编辑不可能真的观察到另一个杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定它现在一定在做什么。
①
有些人相信,自然界也是一个策略博弈的参与者,而且心肠狠毒,整天想着怎样破坏我们早已定下的计划,以从中取乐。比如,当你听说下雨的概率是40%,这意味着,有六成概率是你带了雨伞上班而老天爷又没有下雨,另有四成机会则是你忘带雨伞而老天爷偏偏下起雨来。
在第2章,我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略。这就是我们的法则1:向前展望,倒后推理。在这一章,事情不会那么简单。不过,关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两个简单概念:优势策略与均衡。与第2章一样,我们也会通过简单的例子解释这些概念和法则。
1 .优势策略
在棒球比赛里,假如一方已经有两个人出局,而又打出三个坏球和两个好球,那么,任何一名进攻上垒的球员都必须在下一次投球的时候跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况下,攻垒球员怎么做无关紧要。假如击球手碰不到球,要么出现第四个坏球而攻垒球员成功上垒,要么出现第三个好球而这一局结束。假如投球手投出界外球,攻垒球员只消退回原先所在的垒。假如这是一个擦棒球而又被接住,那么这一局就结束了。不过,有一种情况跑动攻垒占有优势,即假如击球手将投球击到界外,那么攻垒球员就有很好的机会上垒或者得分。
我们认为,在这种局面下,跑动攻垒就是优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决策就会变得非常简单;他可以选择这个优势策